Modelo Fuerza Deportiva
Modelo Fuerza Deportiva
Modelo Fuerza Deportiva
NOTA TÉCNICA
Contenido
1 Motivación _______________________________________________________ 3
2 El modelo de fuerza deportiva _________________________________________ 3
2.1 Supuestos del modelo ____________________________________________ 3
2.2 Críticas al modelo _______________________________________________ 4
2.3 Formulación ___________________________________________________ 4
2.4 Estimación de los parámetros del modelo ______________________________ 5
3 Predicción de resultados _____________________________________________ 6
3.1 Probabilidad de la diferencia de goles _________________________________ 6
3.2 Probabilidad del signo ____________________________________________ 6
3.3 Ejemplo numérico _______________________________________________ 6
Copyright 2010, Bayes Inference S.A.
Título Modelo de fuerza deportiva
Asunto
Categoría NOTA TÉCNICA
Edición 2010/05/31 16:20:00
Claves fútbol, equipo, partido, resultado, gol, modelo, parámetro, fuerza,
probabilidad, factor campo, varianza, esperanza, previsión
Distribución Exclusiva al cliente
La presente Nota Técnica ha sido creada por Bayes Inference, S.A., en adelante Bayes. En
consecuencia, su contenido y diseño es de la exclusiva propiedad de Bayes,
correspondiéndole los derechos de titularidad que se derivan de la misma.
2
1 Motivación
La necesidad de representar el fútbol mediante un modelo matemático surgió en la
compañía en los años 90 ante el escaso grado de acierto de la modelación tradicional de los
resultados deportivos, basada en variables dummies, a la hora de explicar y prever
comportamientos sociales como las ventas de un diario deportivo, las llamadas a un call-
center, los pedidos de comida rápida, etc.
Pronto se observó que las variables que recogían la victoria, el empate o la derrota de un
equipo, aun ponderadas por el resultado, presentaban serias deficiencias, ya que no tenían
en cuenta:
El nivel deportivo del rival.
El estado de la competición.
La evolución temporal de los equipos implicados.
Lo anterior motivó el desarrollo de un modelo que diera solución a los problemas planteados
y ayudara a mejorar cómo influyen los resultados deportivos en multitud de aspectos del
comportamiento humano.
3
2.2 Críticas al modelo
Los anteriores supuestos constituyen un conjunto de limitaciones o restricciones que
conllevan las siguientes críticas al modelo:
No tiene en cuenta otros factores objetivos que pueden influir en la fuerza deportiva,
tales como: los jugadores que participan en cada partido, el presupuesto anual del club, el
número de aficionados que acuden a ver el partido, la meteorología, etc.
Al ser constante por equipo, la fuerza no permite recoger el diferente estado anímico que
puede tener un equipo en las diferentes competiciones en las que participa, o la diferente
intensidad con la que puede jugar en función de la fase en que se encuentre dentro de
una competición.
La suma de las fuerzas de todos los equipos es igual en todos los momentos temporales,
ya que es un juego de suma cero; esto impide la comparación del nivel colectivo entre dos
épocas diferentes. Sin embargo, sí permite realizar comparaciones geográficas para
determinar, por ejemplo, si la liga española es más fuerte que la holandesa, o viceversa.
No permite establecer un factor campo diferente por equipo o, más concretamente, por
estadio, de manera que todos los equipos tienen la misma ventaja por jugar en casa.
Además, este parámetro es constante en el tiempo, no evoluciona.
El parámetro de innovación del modelo es constante, por lo que no depende del tiempo
transcurrido desde el último partido que jugó un equipo. Parece lógico suponer que
cuanto mayor sea este tiempo, más innovación introducirá el resultado en las fuerzas, ya
que puede dar lugar a un mayor número de eventualidades: una lesión, un fichaje, etc.
No tiene en cuenta factores subjetivos como que pueden influir en el resultado, como el
estado anímico de los jugadores (en función, por ejemplo, de lo que haya en juego en el
partido en cuestión), el cansancio de los jugadores (que dependerá del número de
partidos que hayan jugado en la temporada o del tiempo de descanso desde el último
partido jugado), etc.
2.3 Formulación
Sean , , respectivamente, las fuerzas deportivas de los equipos a y b en el momento
t, y el factor campo. Sea, además, , el resultado del enfrentamiento de los equipos a y b
en el momento t y en el campo de a. La formulación del modelo es:
, = − + +
1,
~0,
. : = , − = +
2
∇ = 1 −
3
La ecuación [1] describe el resultado, visto como diferencia de goles, entre un equipo a que
actúa como local y un equipo b que actúa como visitante como la diferencia de sus
respectivas fuerzas deportivas a las que se les suma el factor campo, más un término de
error. Partidos jugados en campo neutral tienen, naturalmente, un factor campo nulo.
La ecuación [2] define la diferencia de goles desde la perspectiva de cierto equipo a. Éste
puede actuar como local o como visitante. De ahí que la variable µ t se define como:
4
− , #$ %& = 1
= "−' + (,
#$ %& = 0 ∧ %* = 1+ 4
− , #$ %& + %* = 0
donde L(i)=1 indica que i es local y L(i)=0 indica que x no es equipo local.
Diferenciando [2] tenemos que:
∇ = ∇ + ∇
5,
Si igualamos las partes derechas de [2] y [3] tenemos que:
∇ = 1 − θ
/0 6.
O, lo que es lo mismo:
= /0
+ 1 − θ
/0 = /0
+ 1 − θ' , − 23 , 4( 7,
donde el resultado esperado se define como:
23 , 4 = , −
= − + 8,
La interpretación de [7] es muy intuitiva: la fuerza de un equipo después de jugar un partido
es igual a su fuerza antes de jugar más un factor de innovación resultante de multiplicar el
complementario del parámetro de memoria por el error que comete el modelo en la
previsión del resultado.
Utilizando [2], [7] puede reescribirse de forma alternativa como:
= 1 − θ /0
+ θ/0
8.
partido es igual a su fuerza antes de jugar, en una proporción , más el resultado corregido
La interpretación de [8] es igualmente inmediata: la fuerza de un equipo después de jugar un
El parámetro de memoria, .
El factor campo, c.
La desviación típica de los residuos, .
La muestra utilizada para estimar los parámetros anteriores está formada por los partidos
oficiales de:
Clubes: las principales ligas, copas y competiciones internacionales europeas desde 1998.
Selecciones: la principal competición de cada continente –Eurocopa, Copa América, Copa
Asiática, Copa de África, Copa de Oro de la CONCACAF y Copa de Oceanía–, los mundiales
y las fases de clasificación de dichos torneos, todos ellos desde 1992.
5
En total, más de 100.000 partidos han sido utilizados en la estimación de los parámetros,
dando como resultado los siguientes valores:
El parámetro de memoria es de 0,98.
El factor campo c es de 0,5. En los mundiales se aplica un factor campo diferente al
anfitrión, juegue como local o como visitante, igual a 1,12 goles.
La desviación típica de los residuos es de 1,78.
3 Predicción de resultados
El modelo propuesto posee capacidad predictiva. La distribución de probabilidad de la