Coincidiendo con la cercanía del mayor evento del futbol a nivel mundial, la XXII edición de la Copa Mundial de Futbol que este año se celebra en Qatar desde el próximo 20 de noviembre, me gustaría hablaros en este post sobre datos y fútbol. Y es que a día de hoy, el tipo y calidad del dato en la industria del deporte es uno de los temas de mayor preocupación a los que se enfrenta un Data Scientist en el día a día en un club o empresa líder del sector. 

Para empezar, decir que existen dos tipos fundamentales de datos en el mundo del fútbol: eventing y tracking 

Dato de eventing

El dato de eventing, al que estamos cada vez más acostumbrado, viene a explicar todo lo que sucede en torno a la pelota mediante la anotación de cada acción por parte de diferentes operadores que están viendo el partido. El factor humano en este tipo de dato es muy sensible, existiendo posteriormente correcciones de otros operadores para minimizar este error. Empresas líderes en este tipo de dato son Opta, StatsBomb, Insta, Wyscout, … facilitando a los analistas un sinfín de datos que tendrá que interpretar en base a su conocimiento futbolístico. 

Dato de tracking

Por otro lado, tenemos el dato de tracking, que viene a explicar lo que sucede en el campo cada segundo y con cada jugador a través de cámaras de seguimiento óptico ubicadas en los estadios. El software de reconocimiento de objetos instalado en estas cámaras es capaz de rastrear y trazar objetos y personas en movimiento dentro del campo de juego. Este rastreo es traducido a coordenadas 3D que permiten saber la posición (x, y, z) del balón y de cada jugador 25 veces por segundo. Posteriormente, esta información es procesada para crear datos físicos y de posición, sin la necesidad de que los jugadores lleven los dispositivos GPS. 

Imagen extraída de SkillCorner

La alta granularidad y el elevado coste de la tecnología óptica hace que aún el acceso al dato posicional esté limitado a un número reducido de privilegiados. Sin embargo, el tracking es una de las muchas áreas en las que se está trabajando en la actualidad, alcanzando avances para desarrollar tecnología barata accesible a otros. 

Parece obvio que el dato posicional (tracking) viene a aportar el contexto necesario a lo que ocurre sobre el campo, es decir, a los eventos del balón (eventing).  Y, además, analizar variables que midan el rendimiento físico de los jugadores, como distancias recorridas, velocidades o aceleraciones, ayudando así a prevenir posibles lesiones, por ejemplo.  

El dato posicional (tracking) viene a aportar el contexto necesario a lo que ocurre sobre el campo, es decir, a los eventos del balón (eventing)

Los algoritmos de aprendizaje profundo que detectan automáticamente cada acción generan datos y situaciones del juego que no seríamos capaces de entender únicamente por el video. Los datos necesitan del contexto para ser entendidos, es por eso por lo que es necesario incorporar los clips de vídeos relevantes asociados a cada momento, tal y como hace la empresa Bepro, cuya misión es democratizar este tipo de tecnología para que club o federación pueda acceder a las herramientas de análisis de los partidos, y que recientemente ha anunciado que la selección de México está utilizando su sistema de tracking óptico durante su stage en Girona en su preparación para el Mundial 2022, buscando esa ventaja competitiva mediante el análisis de video de los partidos y de sus eventos. 

Vemos por tanto que el tracking óptico no se limita únicamente a datos físicos, ya que permite entender lo que ocurre en el campo durante los 90 minutos, siendo beneficiado también el análisis táctico. Entender los movimientos del balón, detectar los espacios y al hombre libre y mucho más se puede conseguir a través de esta nueva tecnología que, de forma combinada con el video, viene a minimizar las dudas en torno al juego, permitiendo un análisis del fútbol más profundo tanto cuantitativamente como cualitativamente.  

Desde PiperLab, analizaremos cada uno de los partidos de la selección de Luis Enrique durante su andadura en el Mundial, con el objetivo de ofrecer un mejor entendimiento del partido a través de un dato contextualizado y visualizaciones atractivas. Se complementará este análisis futbolístico con las reacciones en Twitter que provoque el minuto a minuto del partido analizado

Por último, anunciamos que esta no será la única colaboración que tendrá Bepro durante el Mundial de Qatar. Desde PiperLab, analizaremos cada uno de los partidos de la selección de Luis Enrique durante su andadura en el Mundial, empezando por el estreno de la selección el próximo 23 de noviembre contra Costa Rica. Gracias a los informes postpartido que generará el equipo de Bepro, se realizará un análisis más profundo de los eventos con y sin balón. El objetivo será ofrecer un mejor entendimiento del partido a través de un dato contextualizado y visualizaciones atractivas. 

Conociendo las emociones que provoca el fútbol y, en particular, la selección española, acostumbrada a mucha disparidad de opiniones, se complementará este análisis futbolístico con las reacciones en twitter que provoque el minuto a minuto del partido analizado. ¿En qué instantes del partido hubo una mayor interacción? ¿Se puede vincular a algún evento del partido? ¿Qué jugador aparece en mayor número de menciones? Estas preguntas y más, son algunas de las que intentaremos dar respuesta en los próximos posts.