La moda del dato en el deporte
En el mundo del rendimiento deportivo, como en todos los ámbitos de la vida, parece que las cosas funcionan por modas. En estos momentos, el trending topic de las tendencias para mejorar nuestros resultados es el uso de un volumen importante de datos, el BIG DATA.
El desarrollo de la inteligencia artificial en otros sectores productivos e industriales lleva a aplicar esos métodos a otros campos en los que se pueda sacar rentabilidad. Pero esta moda no es nueva, como suele ocurrir con todas las modas. La aplicación de los métodos del business intelligence al deporte ya se ha realizado desde hace años en especialidades en las que ya se entendía que los grandes clubes tienen más de empresa que de entidad puramente deportiva.
Fue la película Moneyball la que nos puso en la pista de este tipo de aplicaciones. Ante la necesidad de exprimir al máximo sus posibilidades, los Oackland Athletics en 2002, con uno de los presupuestos más bajos de la competición, optaron por la aplicación de estos métodos a la hora de confeccionar su plantilla, chocando en un principio con la metodología tradicional de los ojeadores, basados, fundamentalmente, en sus apreciaciones personales.
Pero para que la utilización de los datos en el análisis en los deportes de equipo pueda aportar algo relevante a la tarea del entrenador, es necesario que se cumplan dos criterios básicos.
Calidad y cantidad de datos para el análisis
El primero de ellos es la CALIDAD DE LOS DATOS. Esta propiedad debe venir definida por algunas características concretas, como son la fiabilidad del dato, tanto a nivel intraobservador como interobservador. Estas condiciones aseguran que un observador tome siempre el mismo dato cuando analiza la misma situación en distintas ocasiones y que distintos observadores valorando la misma acción incluyen el mismo dato.
Un segundo aspecto sería la validez del dato, lo que significa que ese registro que estamos anotando recoge lo que realmente indica.
Y una vez asegurada la calidad del dato, es importantísimo la CANTIDAD DE DATOS. Cualquier análisis basado en un estudio estadístico debe construirse sobre un volumen importante de datos. No es suficiente con los valores de un partido.
El uso de datos en balonmano
¿Cuál es la situación en el balonmano? Pues desde luego, que es desalentadora. Si nos comparamos con otros deportes observamos que estamos varios pasos por detrás en este tipo de información. El fútbol, el baloncesto, el voleibol, el béisbol, son ejemplos que nos permiten ver las posibilidades que aporta este tipo de trabajos al rendimiento de los equipos.
Si nos centramos en la calidad del dato, las estadísticas que aportan algunas competiciones muestran numerosos errores que pueden venir de una escasa fiabilidad interobservadores y anulan la posibilidad de usar esos datos, a menos de que se haga una comprobación particular de los mismos. Y en cuanto a la cantidad, el panorama todavía es peor. Sólo hace falta rastrear un poco por las páginas oficiales de las diversas competiciones nacionales para comprobar que, en los pocos casos que hay estadísticas oficiales, estas se basan en unas variables muy concretas.
La necesaria autoconstrucción de datos
Pues si no tenemos los datos necesarios, ¡desechemos los análisis estadísticos! Creo que todos hemos entrenado en más de una ocasión sin tener los medios idóneos y nos las hemos ingeniado para conseguir nuestros objetivos. Pues aquí debemos hacer lo mismo. En la actualidad, existen numerosas posibilidades en el mercado que nos permiten construir un sistema de categorías muy completo con la posibilidad de extraer los registros en formatos apropiados para su trabajo en hojas de cálculo. Por lo tanto, ya es cuestión nuestra avanzar en este terreno.
Recientemente leí un artículo donde se comentaba que, en el futuro, los datos que generen un evento deportivo no tendrán propiedad intelectual. Y eso tiene su lógica. Porque lo realmente importante, NO ES EL DATO, es la información que podemos sacar relacionando esos datos, de ahí la importancia del volumen de datos.
¿Cualquier dato vale?
En mi opinión, en muchas ocasiones y desde el punto de vista del entrenador, creo que esa información no se enfoca de manera adecuada. Normalmente, lo que se hace al analizar unas estadísticas es buscar la normalización. Se compara el resultado de un jugador o de un equipo respecto a la media, se hace un ranking de los mejores en un valor concreto, se confrontan nuestros valores respecto a los equipos que ganan más partidos o los que tienen mejor rendimiento fuera de casa.
Sin embargo, esta manera de enfocar el análisis estadístico pierde de vista una cuestión fundamental: cada jugador y cada equipo es distinto y, por tanto, pueden llegar a rendir al máximo utilizando distintos medios. Esto es fácilmente entendible si comparamos el juego de Roger Federer y Rafael Nadal. Caminos distintos para obtener la excelencia en ambos casos.
Por eso tiene mucha más utilidad evaluar la eficiencia que la eficacia en el rendimiento deportivo. Si ponemos en un circuito una moto GP y un ciclista y medimos su eficacia en el parámetro de la velocidad, el resultado es claro. La moto GP es clara vencedora. Pero ¿todos tenemos una moto GP para competir? ¿No me interesará como entrenador saber si mi equipo ha rendido al máximo con los medios que tenemos? Si la respuesta a esta última pregunta es sí, debes saber que tienes que medir la eficiencia de tu equipo, es decir, conocer cuál es el rendimiento que sacas a los medios de los que dispones.
Medir la eficiencia, no la eficacia
Para superar este problema, hace tiempo que se viene utilizando en otros deportes un método que proviene del mundo empresarial, en dónde buscan continuamente la máxima eficiencia. Bajar un punto los niveles de rendimiento de una multinacional puede suponer millones de euros de pérdidas.
El análisis de datos envolvente (Data Envelopment Analysis, DEA) busca evaluar el nivel de eficiencia basado en varios valores de entrada o imputs que nos dan un valor de eficiencia (output). Este método se ha aplicado con frecuencia para decidir los fichajes en deportes como el baloncesto americano, el béisbol o el fútbol. A ciertos valores de tipo técnico, táctico o físico que nos puedan interesar, se le añade el salario del jugador y podemos saber que jugadores tienen un mismo rendimiento con un menor salario, resaltando el hecho de que la valoración del rendimiento particular se hace respetando el estilo de juego propio gracias a un determinado modelo matemático. Por tanto, eso me permite saber qué jugadores necesito para el modelo de juego concreto que usa mi equipo.
Valoración de la eficiencia en jugadores
En 2013 publiqué junto a J.L. Ruiz el artículo “Data Envelopment Analysis and Cross-Efficiency Evaluation in the Management of Sports Teams: The Assessment of Game Performance of Players in the Spanish Handball League”, en el que se hacía un análisis de los laterales de la liga ASOBAL para conocer sus niveles de eficiencia, dando como resultado que sólo 10 jugadores alcanzaron el máximo nivel de eficiencia. Y cada uno de ellos lo consiguió con un tipo de juego distinto.
Entre los jugadores que alcanzaron la eficiencia, observamos distintos porcentajes en la contribución a esa excelencia de las distintas parcelas del juego. Víctor Hugo tenía una contribución de goles desde 9 metros del 67.01% (del 100% que supone la excelencia) y un 0,8% de goles de contraataque. Por otro lado, otro de los jugadores eficientes, Eduardo Gurbindo consiguió su nivel con un 2,96% de goles desde 9 metros y un 35,84 % de goles de contraataque. Y ambos jugadores alcanzaron el máximo de eficiencia. Si yo como entrenador quiero que mi equipo juegue a un ritmo muy alto de contraataques ¿me interesaría conocer esta información a la hora de fichar un jugador?
Mejorar los jugadores no eficientes
Pero ¿qué hacemos con los jugadores no eficientes? Pues este método indica cuanto se alejan de su eficiencia, respetando siempre su modelo de juego propio, y en que aspectos debería mejora para alcanzar el máximo nivel. Por ejemplo, Bicanic, un jugador cercano a los niveles máximos de eficiencia (obtuvo un 1,0452 cuando la eficiencia máxima es 1) presentaba un valor de 0,39 en los goles de 6 metros, cuando el valor que debería tener en esa parcela para alcanzar la eficiencia debería haber sido de 1,08 (y así con todos los valores). Esto nos da una información muy clara de qué debe mejorar ese jugador para alcanzar la eficiencia.
Un trabajo similar pero referido al rendimiento de los equipos lo publicamos en 2013, “Game performance versus competitive performance in the world championship of handball 2011”.
Este tipo de análisis nos asegura respetar las características específicas de cada jugador y de cada equipo para valorar su rendimiento, permitiéndonos tomar mejores decisiones a la hora de seleccionar jugadores y saber cuáles son los aspectos que deben mejorar para mejorar su rendimiento.
De ahí la importancia de medir la eficiencia y no tanto la eficacia.