¿Cómo usar las habilidades de la ciencia de datos en el análisis deportivo? ¿Cuáles son algunos ejemplos específicos?

Los científicos de datos generalmente tienen habilidades sólidas en tres áreas: estadística, programación y comunicación. Mis colegas y yo en Datascope respondemos regularmente preguntas relacionadas con el deporte (a veces para clientes, pero principalmente por diversión) mediante el análisis de datos deportivos con diversas habilidades y técnicas en estas tres áreas. Aquí hay un puñado de proyectos específicos de ciencia de datos que hemos abordado en los deportes.

Estadística

  • Entonces me estás diciendo que hay una posibilidad …
    Para estimar la posibilidad de que un Datascoper gane su grupo de brackets de la NCAA, utilizamos un enfoque basado en datos para simular el torneo para encontrar su probabilidad porcentual estimada de ganar.
  • ¿Son precisas las proyecciones de fútbol de fantasía de ESPN?
    Para determinar si las proyecciones de fútbol de fantasía de ESPN son precisas o no, utilizamos las proyecciones históricas de ESPN para obtener una estimación inicial del error absoluto medio. Mi colega también necesitaba comprender la importancia estadística y las habilidades de programación.
  • ¿Qué sitio tiene las mejores proyecciones de fútbol de fantasía?
    Queríamos averiguar qué sitio tiene las mejores proyecciones de fútbol de fantasía. Para hacerlo, realizamos análisis sobre las proyecciones históricas de 7 sitios web populares. Necesitábamos una comprensión del error estándar, los intervalos de confianza, los histogramas y el arranque para este análisis.

Programación

  • Construyendo el mejor equipo de la NBA ( Construye tu equipo de la NBA )
    Utilizando datos de un análisis de jugadores de la NBA mal pagados, un Datascoper creó una herramienta que le permite elegir el mejor equipo de la NBA estableciendo la configuración de su equipo deseado y el grupo salarial. Saber codificar era necesario para construir la interfaz de usuario interactiva.

Comunicación (p. Ej., Visualización de datos)

  • ¿Quién es el jugador más mal pagado de la NBA?
    Para determinar el jugador de la NBA más mal pagado en función de las ganancias compartidas y el salario actual, fue útil construir una pequeña visualización de los datos. Un gráfico interactivo fácil de usar de los salarios actuales y las ganancias compartidas muestra cuánto se paga o se paga de menos a cada jugador. Elegir la visualización correcta permite a los científicos de datos ver cómo los puntos de datos están relacionados entre sí y nos ayuda a compartir los resultados del análisis de una manera fácil de digerir.

Si está dispuesto a sumergirse en este tema, hay un MOOC increíble en edX con el objetivo de explorar la relación entre las matemáticas y los deportes.

Echale un vistazo:

  • Cómo Sports Data Analytics está trastornando el juego de nuevo
  • Dean Smith: un entrenador adelantado a su tiempo

Hola, he creado paquetes de 2 R que usan conjuntos de datos de cricket y se aplican

ciencia de datos y visualización de datos

  1. cricketr – Paquete R que utiliza datos de cricket de ESPN Cricinfo – ¡Presentamos cricketr! : Un paquete R para analizar el rendimiento de los jugadores de cricket
  2. yorkr – Utiliza los datos de yaml de Cricsheet Cricsheet – Presentación del paquete de cricket yorkr: Parte 1- ¡Golpeado por puro ritmo!

Echar un vistazo.

Recientemente comencé un blog donde publiqué cosas relacionadas con la aplicación del aprendizaje automático y la ciencia de datos para las predicciones de cricket. He hecho lo siguiente y los resultados han sido bastante buenos.

  • Predecir el puntaje de un bateador de cricket usando el aprendizaje automático.
  • Predecir el resultado de un partido.
  • Predecir el próximo wicket en un partido T20.

Puede ver estas publicaciones en mi blog si lo desea. Pero estos son algunos ejemplos que tienen el aprendizaje automático y la ciencia de datos aplicados en un deporte.

Donde el cricket se une al análisis

Lo he usado muchas veces. El primero fue un jugador / gerente de equipo en mi adolescencia. Llevaría un registro de los hábitos de cada bateador y corredor de base en la liga como receptor (y estadístico para el equipo de niños) y trataría de posicionar a todos en los lugares ideales dada la distribución de los golpes de diferentes lanzamientos y hábitos de robo. También lo usé bastante en el fútbol: realiza un seguimiento de los tiros desde diferentes posiciones en el campo, distribución de tiros, tiros bloqueados, pendientes / colinas del campo, condiciones del campo durante el juego … Teníamos un equipo talentoso y aprovechamos los datos para ganar dos estados campeonatos

Desde mi adolescencia, lo he usado en marzo Madness y enfrentamientos SEC varias veces (solo por diversión y en piscinas familiares). Hay algunos datos realmente interesantes por ahí y algunos análisis realmente geniales que se pueden hacer, desde la agrupación (mapeador de TDA) hasta la predicción en cada juego (bosque aleatorio, regresión aumentada …).

Estaba leyendo sobre una nueva disciplina de análisis deportivo que permitirá a los equipos utilizar datos para poder predecir y prevenir lesiones en el campo. Encontré algunas investigaciones en línea y encontré un curso en línea que enseña sobre metodología / práctica de Sports Injury Analytics

Parece haber sido pensado por alguien que trabajó con Tottenham Hotspur de BPL.

Están sucediendo cosas muy interesantes y novedosas en el mundo de Sports Analytics.

Data Science se utiliza tanto en el campo para las decisiones de juego como en la oficina principal para el desarrollo del equipo. Se usa para determinar horarios de práctica e incluso se usa para determinar cómo almacenar puestos de venta. Consulte este artículo para obtener más información sobre estos ejemplos y otros, Cómo la ciencia de datos se cruza con la analítica en el deporte – Skilledup.com