Met technologie en data-analyse naar de overwinning in de National Football League

Christopher
Patzanovsky

Hoe het gebruik van gegevens en Machine Learning NFL-coaches kan helpen hun teams beter te begrijpen en te coachen

Stel je de laatste vijftien minuten van de Superbowl voor, een titanengevecht van bijna vier uur. De spelers van de National Football League (NFL) hebben bloed, zweet en tranen vergoten. Zich na zo’n uitputtingsslag meteen verdiepen in de analyses van de wedstrijd, is voor een NFL coach ongelofelijk vermoeiend. Maar dat is buiten onze nieuwe generatie datawetenschappers van UHasselt gerekend.

Hun baanbrekend onderzoek biedt een gloednieuw, levendig dashboard aan dat onze vermoeide NFL coach kan helpen de wedstrijd te analyseren. Dit handige hulpmiddel heeft een arsenaal aan nieuwe metrieken om de prestaties van zijn spelers juist en accuraat te kunnen inschatten en stelt ook doelgericht verbeterpunten voor.

American football players tackling each other and falling on top of each other

De dag van vandaag is data-analytics niet meer weg te denken uit de professionele sport. Nieuwe gegevens en statistieken bieden enorm veel inzichten in de prestaties van individuele spelers en het team. Hierdoor kunnen coaches kort op de bal spelen en hun tactieken en strategieën tijdens de wedstrijd aanpassen. Zulke onmiddellijke aanpassingen geven het team een competitief voordeel waardoor het een neuslengte voor blijft op hun tegenstanders. Het spel ontwikkelt zich voortdurend. Net zoals spelers op zoek zijn naar nieuwe manieren om betere atleten te worden, hun fysieke conditie te verbeteren, effectievere manieren te vinden om te regenereren, zo proberen coaches nieuwe strategieën uit te vinden en data-analytics is hierbij van onschatbare waarde.

Hoe Computers ‘zien’

NFL Next Gen Stats en Amazon's Web Services meten de exacte x- en y-coördinaten, snelheid, versnelling en oriëntatie van elk van de 22 spelers en de football elke tiende van een seconde tijdens een spel. De datacollectie tijdens de eerste acht weken van het NFL-seizoen 2021 overstijgt 8,3 miljoen gegevens.

Met deze gegevens ontwikkelde UHasselt een machine learning algoritme om een betere analyse mogelijk te maken van Defensive Linemen en Offensive Linemen, door een nieuwe metriek te creëren die de hoeveelheid druk beschrijft die een Defensive Lineman creëert, en in staat is om de beweging te voorspellen die de speler in de volgende tiende van een seconde zal maken.

Info box:
  • Quarterback: de belangrijkste aanvaller, staat achter de linie en coördineert het spel
  • Defensive Linemen: de spelers die proberen de Quarterback te bereiken en te tackelen, de meest kritieke speler
  • Offensive Linemen: de spelers die de Quarterback proberen te beschermen tegen de Defensive Linemen

Hoe computers leren

Om een machine learning algoritme voorspellingen te laten doen, moet het eerst leren van eerdere gegevens. De gegevens van de eerste zeven weken van het NFL-seizoen 2021 worden gebruikt om vervolgens voorspellingen te doen over het achtste seizoen. Het algoritme wordt getraind met behulp van gegevens van elke afzonderlijke speler én of elk van deze "scenario's" wel of niet heeft geresulteerd in het creëren van druk door een speler op de quarterback. Op basis van deze miljoenen datapunten kan het algoritme een nieuw scenario nemen dat het nog nooit eerder heeft gezien en op basis van de opgedane kennis een optimale strategie voorstellen om druk te creëren zodat de bal in hun kamp komt. Het algoritme is dus in staat om nauwkeurig de hoeveelheid druk in procenten te bepalen die elke speler op de quarterback creëert, met een indrukwekkende nauwkeurigheid van bijna 90%.

Hetzelfde algoritme kan vervolgens worden gebruikt om de exacte locatie te voorspellen waar een speler zich in de volgende tiende van een seconde zal bevinden. Deze nieuwe positie kan dan worden ingevoerd in het eerste algoritme om de druk te bepalen die de speler zou hebben gecreëerd als hij de voorspelde beweging had voltooid. Dit drukpercentage wordt de voorspelde bewegingsdruk (Predicted Motion Pressure, PMP) genoemd en kan direct worden vergeleken met de werkelijk gecreëerde druk. Als de werkelijke druk hoger is dan de PMP, kan de beweging van de speler als goed worden beschouwd, omdat hij meer druk creëerde dan werd aangenomen op basis van het gegeven scenario en dit kan betekenen dat de speler de juiste intuïtie had en de situatie correct heeft beoordeeld. Op dezelfde manier, als de PMP hoger is dan de werkelijke druk, kan de beweging van de speler als slecht worden beschouwd. Op deze manier kan de coach de prestatie van het hele team beoordelen op elk moment van de wedstrijd en zo tot nieuwe inzichten komen.

Graph displaying the pressure and PMP for one play, peaking towards the end of the play

De voorspelde druk en PMP van Tennessee Titans' Harold Landry op één wedstrijd tegen de Indianapolis Colts, met een gemiddelde druk van 17,39% en een piekdruk van bijna 70%. Dat zijn voorspelde druk veel hoger was dan zijn PMP laat zien dat hij zijn voorspelde druk enorm overtrof, met een verschil tussen de twee staLsLeken van 3.1508, waarmee hij 160 van de 36362 geregistreerde plays scoorde, erg succesvol dus.

Visualisatie helpt concepten beter begrijpen

UHasselt ontwikkelde met behulp van HTML en JavaScript een dashboard om de gegevens te visualiseren. Voor elke wedstrijd van week 8 van het NFL-seizoen 2021 wordt een top-down animatie van de wedstrijd getoond, samen met een animatie van de druk die door de hele verdediging op de Quarterback is gecreëerd. Elke speler die betrokken is bij het creëren van druk kan vervolgens worden gekozen om verder te worden geanalyseerd, samen met de vergelijking van hun gecreëerde druk en PMP.

Data visualisatie is zeer belangrijk omdat het een geweldig hulpmiddel is voor de beoogde eindgebruiker om de ontwikkelde concepten beter te begrijpen. In dit geval kunnen de coaches dit dashboard gebruiken om niet alleen de prestaties van hun spelers cijfermatig te bekijken, maar ook visueel te begrijpen wat de externe omstandigheden van elke wedstrijd waren, of wat leidde tot een bepaalde prestatie van een speler.

Dit dashboard is van groot nut voor zowel spelers als coaches, omdat het een revolutie teweeg brengt in de analyse van spelersprestaties zowel nadat de wedstrijd is gespeeld maar voornamelijk vanwege strategische wedstrijdplanning vóór de wedstrijd. Benieuwd hoe dit werkt? Bekijk het onder deze link: http://week8dashboard.x10.mx/

Bibliografie

  1. Norman, J. (2018, January 4). Football Still Americans’ Favorite Sport to Watch. Gallup. https://news.gallup.com/poll/224864/football-americans-favorite-sport-w…

  2. NFL. (2023, February 27). Super Bowl LVII total viewing audience estimated at 200 million. NFL. https://www.nfl.com/news/super-bowl-lvii-total-viewing-audience- estimated-at-200-million

  3. Marca. (2023, March 4). Super Bowl sets new ratings record outside the US: Which countries are watching NFL the most?. Marca. https://www.marca.com/en/nfl/ 2023/03/04/6403a874e2704e19348b45c0.html

  4. NFL. (2023). NFL Next Gen Stats. NFL Operations. https://operations.nfl.com/gameday/ technology/nfl-next-gen-stats/

  5. Wilkinson, S. (1993). Football: Winning Offense. Sports Illustrated.

  6. Saal, J.A. (1991). Common American Football Injuries. Sports Med 12, 132–147. https://doi.org/10.2165/00007256-199112020-00005

  7. Maiese, K. (2008). The Merck Manual Home - Health Handbook. Merck Publishing

  8. Belson, K. (2014, January 30). Concussions Show Decline Of 13 Percent, N.F.L. Says. The New York Times. https://www.nytimes.com/2014/01/31/sports/football/nfl-reports-concussi…

  9. James, G., Witten, D., Hastie, T., Tibshirani, R. (2021). An Introduction to Statistical Learning: With Applications in R. (2nd ed. pp. 39-42). Springer

  10. Karpick, V. (2023). Completions Added Through Suppression of Pressure. NFL Big Data Bowl 2023. https://www.kaggle.com/code/vincentkarpick/completions-added-through-su…

  11. National Strength and Conditioning Association. (2017). Factors Determining Quickness: Anticipation. NSCA. https://www.nsca.com/education/articles/kinetic-select/factors-determin…

  12. Ozanian, M., Badenhause, K. (2020, September 10). The NFL’s Most valuable Teams 2020: How Much Is Your Favorite Team Worth?. Forbes. https://www.forbes.com/sites/ mikeozanian/2020/09/10/the-nfls-most-valuable-teams-2020-how-much-is-your-favorite- team-worth/

Universiteit of Hogeschool
Universiteit Hasselt
Thesis jaar
2023
Promotor(en)
Dr. Dirk Valkenborg