Predicciones en apuestas deportivas: adelanto a la Superbowl

Me gustó mucho el extracto del estudio “A Review of Data Mining Techniques for Result Prediction in Sports“ (EN) del que se hacía eco Javier Pastor en Xataka (ES), y que viene como anillo al dedo para un artículo específico sobre el sector de apuestas, más después del partido de la Superbowl americana.

superbowl

Y me parece interesante porque señala precisamente los dos puntos donde por lo general estos sistemas de predicción acaban fallando. A saber:

La minería de datos, un método ampliamente aceptado para predecir o explicar eventos, es una herramienta apropiada para este propósito. Varias técnicas de minería de datos tales como ANN, árboles de decisión, métodos bayesianos, regresión logística, SVM o métodos de lógica borrosa se han empleado para predecir resultados de partidos en los últimos años.

Hemos evaluado la literatura disponible al respecto y hemos detectado dos grandes retos. El primero, la baja precisión de las predicciones hace que destaque la necesidad de realizar más investigaciones para obtener predicciones más fiables. La segunda, la falta de un conjunto general y coherente de estadísticas fuerza a los investigadores a recolectar datos de sitios web deportivos. La diferencia en los conjuntos de datos utilizados hace difícil que los investigadores comparen sus resultados con los de otros estudios previos y lleva a conclusiones confusas.

Algo de lo que ya hablamos la semana pasada con la entrada Inteligencia colectiva como predictora de eventos: Resulta complicado predecir algo irracional de forma racional. Porque un partido de fútbol es irracional, por mucho que queramos analizar los condicionantes racionales involucrados (situación del equipo, historial de jugadores, partidos anteriores, clima,…). El segundo no hace más que señalar las deficiencias de un sistema basado en engullir información de forma compulsiva, y todos los problemas que vienen asociados a esta limitación.

Al final, encontraremos casos con un alto grado de acierto, por la sencilla razón que compulsando todos los datos quizás puedas tener una ligera ventaja a la hora de predecir el resultado. Pero es tan ligera que se verá afectada por cualquier estímulo irracional, sea la suerte, sea la situación desconocida de cada jugador, el peso de entrenamiento que lleven,…

A la hora de la verdad, estos métodos ayudan a desequilibrar mínimamente la balanza, de tal manera que si todo saliera como debería salir (o al menos haya fuerzas semejantes en los dos puntos), el resultado más favorable será uno. Y pese a todo, cualquier pequeño estímulo en otra dirección arrojará el resultado contrario.

¿U os habíais creído que en tal caso, las casas de apuestas seguirían funcionando? :).