Si el equipo A tiene un 20% de posibilidades de ganar cualquier juego y el equipo B tiene un 55% de posibilidades de ganar cualquier juego, ¿cuáles son las probabilidades de ganar un juego entre A y B?

Preámbulo:

No hay una forma única de determinar eso. Sabiendo que el jugador X vence al jugador B el 66% del tiempo y el jugador Y vence al jugador Z el 66% del tiempo, ¿cuáles son las probabilidades de que el jugador X venza al jugador Z?

Nuestra intuición es que el jugador X debería vencer al jugador Z más del 66% del tiempo. Pero tal vez el jugador X es el jugador Rock, el jugador Y es el jugador Tijeras y el jugador Z es el jugador Paper.

Entonces, la primera suposición que nuestro modelo tiene que hacer es que la habilidad subyacente del jugador es transitiva. De lo contrario, no puede inferir los resultados esperados entre dos jugadores a partir de sus resultados reales contra otro conjunto de jugadores.

La mayoría de los sistemas de clasificación suponen que el rendimiento de un jugador es una distribución de probabilidad con un valor esperado igual a su “habilidad real”. Luego puede modelar el resultado de una coincidencia como un evento aleatorio: si S (A) es la distribución de A y S (B) es la distribución de B, una ganancia para A sucedería con P (S (A)> S (B))

La elección de la distribución de probabilidad es algo arbitraria, debes elegir una que modele “suficientemente bien” los resultados reales de tu juego. La distribución normal y la distribución logística son dos opciones comunes.

Estimación usando ELO:

Podemos usar Elo Win Probability Calculator para calcular la probabilidad usando los supuestos comúnmente utilizados en los torneos de ajedrez.

Nuestro escenario es que el equipo A tiene una tasa de ganancia esperada del 20% contra el campo, y el equipo B tiene una tasa de ganancia esperada del 55% contra el campo. Al conectar 0.2 y 0.55 en el campo “Puntuación esperada del jugador 1”, descubrimos que el equipo A tiene un ELO 240 puntos más bajo que el campo, y el equipo B está 36 puntos por encima del campo.

Ahora borramos todos los campos y conectamos una diferencia de 276 (240 + 36) en “Calificación 1” y “Calificación 2”, por ejemplo 1036 y 760 (que representan una diferencia de +36 y -240 a un campo promedio de 1000). Eso nos da un resultado esperado de aproximadamente el 83% para el equipo B y el 17% para el equipo A. Observe que los valores difieren ligeramente si alternamos entre la distribución Normal y la logística. Observe también que el valor esperado es el mismo si elige otros valores para la Calificación 1 y 2, siempre que su diferencia sea 276 (como 2276 versus 2000)

Como curiosidad final, en mi ejemplo introductorio entre los jugadores X, Y y Z, el jugador X tendría un puntaje esperado de aproximadamente 79% frente al jugador Z.

Cualquier respuesta a esta pregunta va a contener fundamentalmente algunos supuestos.

Log5 es una forma decente de combinar este tipo de evidencia.

Log5 – Wikipedia

Tu fórmula no es lo suficientemente dura. Considere si A gana el 99% de sus juegos y B gana el 1% de sus juegos. Es de esperar que A solo pierda realmente cuando está jugando con grandes oponentes (por ejemplo, tal vez el oponente gana el 95%) del tiempo. Pero tu modelo predice que contra un oponente del 1%, A solo gana el 99% del tiempo. Además, contra un oponente del 50%, solo ganan alrededor del 66% del tiempo.

Log5 dice que A tiene un 17% de posibilidades de ganar ese juego contra un oponente ligeramente superior al promedio.

En el contexto de los deportes o cualquier tipo de competencia, esto realmente no se aplica porque las posibilidades de que cualquier equipo gane contra otro depende de la fuerza de los dos equipos, no de la probabilidad.

Para empezar, la probabilidad total, sin empate, de que alguien deba ganar también debe sumar un 100%, ya que no hay un posible tercer resultado. Es imposible que dos equipos se combinen por solo un 75% de posibilidades de ganar un juego.

En segundo lugar, el porcentaje de victorias no es una probabilidad. Digamos que un equipo tiene un récord de 12-10 para la temporada (aproximadamente el 55%), esto no significa que tenga un 55% de posibilidades de ganar el próximo juego; significa que han ganado el 55% de sus partidos anteriores contra otros equipos.

Estas probabilidades no son estáticas. Si su próximo partido es contra un equipo realmente pobre, esa probabilidad aumenta. Si su próximo partido es contra un equipo realmente bueno, esa probabilidad disminuye.

Entonces, utilizando los equipos de la NBA como ejemplo, digamos, los Lakers del año pasado (récord final: 17–62, 20.7% de victoria) jugaron un partido contra los Trail Blazers del año pasado (récord final: 44–38, 53.7% de victoria). Estoy usando estos equipos porque su récord de temporada final está bastante cerca del escenario que presentaste, en el transcurso de una temporada completa. Durante un juego, oficialmente, las líneas de Vegas fueron +525, lo que significa que las casas de apuestas tenían un porcentaje de victorias cercano al 90%. Como eran un equipo débil que jugaba con un equipo superior al promedio, las posibilidades de ganar del equipo débil son inferiores a su propio porcentaje de victorias.

Sin conocer un montón de factores, es imposible simplemente tomar dos porcentajes de dos equipos y generar fácilmente un porcentaje de qué equipo ganará.

Se supone que habrá un resultado, es decir, A gana o B.

Entonces, la probabilidad que estás buscando = A gana y B pierde + A pierde y B gana

= 0.2 * 0.45 + 0.8 * 0.55 = 0.53 o 53% de probabilidad de un resultado.

No puedes sumar esos dos porcentajes en este enfrentamiento. Si esos números deben tomarse literalmente, entonces solo hay un 75% de posibilidades de que uno de esos equipos gane, y dado que no estamos considerando juegos empatados, no creo que esta sea la pregunta que está haciendo.

Por otro lado, si pronostica la probabilidad de ganar de un equipo en general, existe una condición no expresada: el equipo A tiene un 20% de posibilidades de ganar contra el oponente promedio que enfrentarán . Si decimos que un equipo tiene un 20% de posibilidades de ganar, y quedan quince juegos en la temporada, podríamos asumir razonablemente que ganarán tres juegos. Los tres juegos que ganan probablemente no serán cuando se enfrenten a los mejores equipos de la liga.

Tampoco hay forma de traducir los porcentajes de ganancias del caso general al caso específico. Si tengo un equipo del 20% cuyo único punto fuerte es un juego de carrera fantástico, y tengo un equipo del 55% que está muy bien redondeado pero tiende a tener una defensa de carrera débil, entonces el equipo “desvalido” podría ser un favorito para Gana ese juego específico.

Como A tiene un 20% de posibilidades de ganar cualquier juego y un juego entre A y B es un juego, concluimos que A tiene un 20% de posibilidades de ganar el juego entre A y B. De la misma lógica, concluimos que B tiene Un 55% de posibilidades de ganar el juego.

Si interpretamos un “empate” como un caso en el que ni A ni B ganan, entonces esta situación es imposible.