Cómo funciona el modelo Poisson para predecir partidos de fútbol
Las casas de apuestas tienen equipos de analistas trabajando a tiempo completo. Tienen acceso a los mismos datos que tú, más los datos que no son públicos, más años de calibración de sus propios modelos. Competir contra ellos mirando más vídeos o siguiendo a mejores periodistas deportivos no va a funcionar. La única forma realista de tener ventaja es tener un modelo matemático más preciso en determinados mercados o situaciones específicas.
El modelo Poisson aplicado al fútbol lleva décadas siendo la base de los sistemas de predicción más serios. No porque sea perfecto, sino porque captura algo real: los goles en fútbol tienen propiedades estadísticas que se ajustan sorprendentemente bien a la distribución de Poisson.
Por qué Poisson funciona para el fútbol
La distribución de Poisson describe la probabilidad de que un evento ocurra un número determinado de veces en un intervalo, cuando ese evento es raro y los intentos son independientes entre sí. Los goles en fútbol cumplen ambas condiciones de forma aproximada: son eventos poco frecuentes (la media europea ronda 1.4 por equipo por partido) y cada ocasión de gol es relativamente independiente de la anterior.
La fórmula es P(k goles) = e⁻λ × λᵏ / k!, donde λ es el número esperado de goles. Si un equipo tiene λ = 1.5, la probabilidad de que marque exactamente 2 goles es e⁻¹·⁵ × 1.5² / 2! ≈ 25.1%. Esto permite calcular la distribución completa de posibles resultados para cualquier partido.
El modelo bivariate combina las distribuciones de ambos equipos para generar una matriz de probabilidades donde cada celda es P(goles local = i, goles visitante = j). Sumando las celdas correctas obtienes la probabilidad de victoria local, empate, victoria visitante, Over/Under 2.5, BTTS, cualquier mercado que quieras.
Cómo se calcula λ: ataque, defensa y media de liga
El número esperado de goles de cada equipo no es simplemente su media de goles marcados. Se construye a partir de tres factores: la fuerza atacante del equipo que marca, la debilidad defensiva del equipo que encaja, y la media de goles de la liga.
La fórmula es λ = (ataque_local × defensa_visitante × media_liga) × factor_campo. Si el Manchester City tiene un índice atacante de 1.8 y juega en casa contra un rival con índice defensivo de 1.2, sus goles esperados serán significativamente superiores a la media de la liga. El factor campo añade típicamente un 10-15% de ventaja al equipo local según el historial de la liga.
Estos índices se recalculan con los últimos 20 partidos de cada equipo, separando rendimiento en casa y fuera. Un equipo que marca mucho en casa pero poco fuera tendrá índices atacantes distintos para cada escenario.
La corrección Dixon-Coles: el problema con los resultados de baja puntuación
El modelo Poisson estándar tiene un fallo bien documentado: subestima la frecuencia de resultados como 0-0 y 1-1, y sobreestima 1-0 y 0-1. Esta desviación sistemática fue identificada y corregida por Dixon y Coles en 1997.
La razón intuitiva es que en resultados muy ajustados, los equipos cambian su comportamiento tácticamente. Un 0-0 en el minuto 85 genera un patrón de juego diferente a un 2-0. Esto viola ligeramente la hipótesis de independencia del modelo Poisson. La corrección aplica un factor de ajuste a los resultados {0-0, 1-0, 0-1, 1-1} para compensar esta distorsión.
Además de Dixon-Coles, el modelo aplica un coeficiente de calibración para empates de 1.10, porque los datos históricos del fútbol europeo muestran consistentemente que los empates ocurren ligeramente más a menudo de lo que predice el modelo Poisson puro.
Ponderación temporal exponencial
No todos los partidos valen igual. Un partido de hace seis meses debería tener menos peso que uno de la semana pasada, especialmente en fútbol donde los equipos cambian significativamente durante la temporada.
El modelo usa ponderación exponencial con una vida media de aproximadamente 70 días. Esto significa que un partido de hace 70 días tiene la mitad del peso que uno reciente. Un partido de hace 140 días tiene un cuarto del peso. Esta calibración refleja el ritmo al que los equipos cambian su nivel de rendimiento real.
Regresión bayesiana a la media
Un equipo recién ascendido con 4 partidos jugados tiene estadísticas muy ruidosas. Cuatro victorias de 4-0 no significa que sea el mejor equipo del mundo; puede ser simplemente varianza. Sin un mecanismo de corrección, el modelo generaría predicciones extremas para equipos con pocos datos.
La regresión a la media funciona como un “prior” bayesiano: cuantos menos partidos tiene un equipo, más se aproxima su estimación a la media de la liga. Con 20 partidos, el prior tiene poco peso. Con 3 partidos, tiene mucho. Los puntos de datos mostrados en la interfaz (●●● = más de 12 partidos, ●● = 6-12, ● = 1-5) reflejan exactamente este nivel de confianza en el modelo.
Las capas de ajuste sobre el modelo base
El Poisson bivariate es el núcleo, pero sobre él se aplican varias capas de ajuste que mejoran la precisión en situaciones específicas.
xG Understat
Los Expected Goals miden la calidad real de las ocasiones generadas, no solo los goles marcados. Un equipo que ha marcado 10 goles con xG de 14 probablemente ha tenido mala suerte en remates; el modelo lo incorpora gradualmente. Con menos de 12 partidos de xG disponibles, se hace una interpolación entre los datos de xG y el modelo puro; con más de 12, el xG tiene peso completo.
Fatiga
Un equipo que jugó hace 3 días tiene capacidad física reducida. El modelo aplica un multiplicador que reduce los goles esperados del equipo fatigado. Equipos con más partidos en los últimos 14 días o con menos días de descanso reciben una penalización en su estimación ofensiva.
Forma reciente
Los últimos 5 partidos generan un FormScore de 0 a 15 puntos. Ese score normalizado ajusta los goles esperados en un ±6%: un equipo en racha positiva tiene ligeramente más λ, uno en racha negativa tiene menos. No es un ajuste masivo, pero en situaciones límite puede cambiar si una apuesta tiene EV positivo o negativo.
Head to Head
Con al menos 5 enfrentamientos directos disponibles, el modelo combina las predicciones del modelo base con el historial H2H en una proporción 75/25. Algunos rivales tienen dinámicas específicas que el modelo general no captura, y el H2H las recoge parcialmente.
IA Gemini para lesiones y contexto
Google Gemini 2.0 Flash con Google Search analiza en tiempo real las noticias sobre lesiones, rotaciones y estado del equipo antes de cada partido. Si el delantero titular está lesionado y la prensa lo ha publicado, la IA lo detecta y aplica un multiplicador de ajuste sobre las probabilidades finales. Esto es especialmente valioso en partidos de competición europea, donde la información está dispersa en medios de distintos países.
El sistema de estrellas
Las apuestas candidatas tienen dos sistemas de clasificación paralelos. El primero basado en probabilidad del modelo: ★ si el modelo asigna ≥55% de probabilidad, ★★ si ≥63%, ★★★ si ≥72%. El segundo basado en valor esperado real (EV): ★ si EV ≥5%, ★★ si EV ≥7%, ★★★ si EV ≥10%.
Ambos sistemas son independientes. Puedes tener una apuesta con ★★★ de probabilidad pero sin EV porque el mercado ya ha puesto las cuotas correctas. O puedes tener ★ de probabilidad pero ★★★ de EV porque el mercado ha subestimado groseramente esa probabilidad. Las apuestas más interesantes son las que puntúan alto en ambos.
Lo que el modelo no puede hacer
Sería deshonesto no reconocer las limitaciones. El modelo no predice lesiones de último minuto que no han salido en prensa. No captura decisiones tácticas confidenciales del entrenador. No sabe que un equipo tiene la moral hundida después de una semana complicada en el vestuario.
El fútbol tiene alta varianza inherente. Un resultado con 75% de probabilidad falla el 25% de las veces por definición. El modelo no garantiza resultados individuales; lo que garantiza, si está bien calibrado, es que a largo plazo las apuestas con EV positivo generan rentabilidad. La diferencia entre un apostador rentable y uno que pierde no está en acertar más; está en apostar consistentemente con ventaja real.
Para más detalle técnico sobre la metodología, puedes consultar la página Cómo funciona.
Artículos relacionados
Accede a las predicciones del modelo
Modelo Poisson + IA Gemini, cuotas de 10+ casas comparadas y alertas ★★★ diarias. Primeros 7 días gratis.
Empezar 7 días gratis →