Salvador Carmona Nicolás Pérez

Una filtración, el análisis de 26.000 partidos y millones de simulaciones sobre el juego de varios tenistas. Así es como la BBC y BuzzFeed han conseguido desvelar los patrones que existen detrás de los posibles amaños. Esta investigación se desarrolló durante quince meses y ha combinado los métodos de indagación clásicos del periodismo con el reporterismo de datos: la extracción, el procesamiento y análisis automatizado de grandes cantidades de información. A continuación explicamos cómo se llevó a cabo este trabajo.

Los documentos filtrados, conocidos como The Fixing Files, son el resultado de una investigación iniciada por la Asociación de Tenistas Profesionales (ATP) hace ya siete años. A pesar de que estas pesquisas revelaban que existían evidencias sobre el amaño de partidos, los jugadores implicados nunca recibieron castigo alguno.

La tesis que sostenían los investigadores se resume en que varios jugadores habrían sido sobornados para dejarse perder. Varios sindicatos del juego en Rusia e Italia se habrían aprovechado de esta circunstancia realizando apuestas sospechosas por las que ganaron cientos de miles de euros.

Los hechos relatados ponen de manifiesto su modus operandi. Por ejemplo, en el caso de los grupos rusos: “Cuando tres o más cuentas rusas apuestan a un partido, siempre se cumple el patrón de que en ese partido está jugando un jugador ruso”, reza el texto. Y continúa: “No existe ninguna duda de que estas cuentas reciben información filtrada, al menos, la relativa a los jugadores rusos”.

Bajo estos indicios, el periodista de datos de BuzzFeed News John Templon realizó su propio estudio para descubrir aquellos partidos en donde se podría haber producido la trampa.

Para ello, lo primero que Templon hizo fue extraer las probabilidades que elaboran las casas de apuestas de 26.000 partidos profesionales de tenis entre 2009 y 2015 a través del portal de internet oddsportal.com. En ellas se mide qué posibilidades tiene un jugador de ganar o perder. Las casas de apuestas elaboran estas probabilidades al principio del partido y van variando a lo largo del juego según dónde se concentren los envites. Por lo tanto, si una cuota varía mucho desde el inicio del partido, suele significar que un gran volumen de personas ha decidido apostar su dinero al mismo resultado.

De esta forma, si existe una gran diferencia entre la cuota inicial y la final (Templon estipuló como “grande” mínimo un 10%), existía la posibilidad de que ese partido estuviera amañado. Templon se basó en la búsqueda de valores inusuales (outliers) para encontrar cifras que sobresalían del patrón establecido y así conducir su investigación. 

A través de los datos analizados se podía observar que los apostantes depositaban grandes cuantías de dinero contra ciertos jugadores. Como algunos de los tenistas tendían a perder más de lo que las casas de apuestas predecían originalmente, los autores del estudio decidieron continuar la investigación de una forma más profunda. Para estimar cuántas veces deberían de perder los encuentros en cuestión, hicieron un millón de simulaciones por jugador.

El algoritmo que Buzzfeed utilizó en su investigación.

Gracias a este análisis, Templon encontró 15 tenistas que perdían partidos donde los usuarios apostaban grandes cantidades de manera muy frecuente. De esos jugadores, cuatro tenían patrones cuanto menos raros: perdían todos estos encuentros donde los apostantes se dejaban su dinero. Esta situación era sorprendente dadas las cuotas originales de las casas de apuestas, donde la probabilidad de que estos jugadores perdieran esos partidos era de menos de 1 entre 1000.

Los patrones de las apuestas como tal no son una forma de constatar el amaño de partidos. Al no tener más evidencias sobre el amaño de partidos como pudieran ser detalles de cuentas bancarias, los dos medios anglosajones decidieron no publicar los nombre de los tenistas bajo sospecha. Los jugadores pueden no cumplir las expectativas en un match por una serie de razones más allá del fraude (cansancio, lesiones, mala suerte…), y a veces esto puede coincidir en un partido donde grandes cantidades de dinero son apostadas. Pero los autores recalcan la rareza de que esto ocurra: “Según las simulaciones, este jugador debería de perder este número de partidos menos de 1 entre 7500 veces, basado en las cuotas iniciales de las casas de apuestas”.

En el periodismo deportivo estas técnicas más científicas pueden servir para denunciar amaño de partidos. En el fútbol los arreglos de resultados suele ser común en ligas exóticas o categorías inferiores al fútbol de élite. En Primera División ha habido varios casos donde equipos han cobrado primas por ganar o perder, pero suelen ser casos para no perder la categoría, ergo ajenos a casas de apuestas.

Ligas como la LFP tienen unidades de investigación para evitar este tipo de fraudes, pero no siempre descubren este tipo de prácticas. La publicación Buzzfeed ha conseguido a través del periodismo de datos dar transparencia a algo normalmente considerado como oscuro, las apuestas deportivas. La práctica de analizar largos sets de datos por parte de medios de comunicación puede servir como una forma de extracción de exclusivas al igual que lo es el reporterismo tradicional.

Parte del análisis ha sido publicado por BuzzFeed como un ejercicio de transparencia. Los documentos liberados incluyen todos los datos anonimizados de los partidos estudiados (no se muestra ni el torneo ni el partido ni los jugadores involucrados), así como el algoritmo que utilizaron para hallar los patrones que ponían de manifiesto un posible amaño de partidos. Estos documentos se pueden encontrar en Github, una plataforma de desarrollo colaborativo de software para alojar proyectos.

Noticias relacionadas