Wissen

Daten im Fußball: Wie die Analyse von Bewegungen helfen kann

Teil 1 einer Miniserie über Datenanalyse im Fußball

Technologie & Equipment
Der Blick aus einem Raum auf ein Fußballfeld, auf dem gerade die deutsche Nationalmannschaft trainiert.
    • In professionellen Ligen wird jede einzelne Spielaktion – teils automatisiert, teils manuell – aufgezeichnet und kann in Form von Positions- und Eventdaten abgerufen und analysiert werden.
    • Während erste Analyseansätze basierend auf händisch erzeugten Daten ins letzte Jahrhundert zurückreichen, ist das Feld der Auswertung von automatisch akquirierten Positionsdaten auf dem Vormarsch.
    • Basierend auf diesen Daten sollen Metriken, wie z. B. Packing oder Expected Goals definiert werden, die als sogenannter Key-Performance-Indikator eine Aussage über den wahrscheinlichsten Ausgang des Spiels erhält.
    • Der derzeit einzige valide Key-Performance-Indikator ist die Anzahl der erzielten Tore im Vergleich zu den kassierten.
    • Aufgrund der Komplexität des Spiels und der erhobenen Daten sind Visualisierungen wie Heatmaps oder Density-Maps ein wichtiges Tool zur verständlichen Darstellung. 

Abstract

Die Analyse von Bewegungsdaten hält im Fußball längst Einzug. Dabei können Daten Auskunft über die gezielte Gegneranalyse zur Spielvorbereitung, die Optimierung von Scouting-Vorgängen sowie die Überwachung und Steuerung von Trainingsprozessen liefern. Die Aufbereitung der Daten beruht auf teils manuellen Verfahren wie der Bestimmung von Spielereignissen und auf automatisierten Verfahren, die mittels modernen Kamerasystemen Positionsdaten von Spielern aufzeichnen. Gleichzeitig ist es eine Herausforderung aussagekräftige Parameter aus einer immensen Datenmenge zu gewinnen und für das Trainerteam verständlich zu visualisieren. Der nachfolgende Beitrag besteht aus einer Miniserie, die sich im ersten Teil bedeutsamen Key-Performance-Indikatoren und im zweiten Teil der Analyse des Pressings widmet. 

Der Anfang – Bewegungsdaten im Fußball

Schon längst gehört zur Analyse eines Fußballspiels auch die Auswertung von computerbasierten Daten. Bereits in den Fünfzigerjahren des letzten Jahrhunderts wurde händisch gezählt, wie viele Pässe vor einem Tor in der ballbesitzenden Mannschaft gespielt wurden, ohne dass der Gegner zwischenzeitlich an den Ball kam. In den Siebzigerjahren folgte dann die Analyse von technisch-taktischen Handlungen einzelner Spieler. Heutzutage bieten Unternehmen wie beispielsweise OPTA, Chyron Hego und STATS detaillierte Statistiken schon während des Spiels an. Ein Großteil der präsentierten Daten beruht auf dem manuellen Aufzeichnen von Spielereignissen wie z. B. der Anzahl an Torschüssen, Pässen, Ecken, Fouls und dem Ballbesitz. Darüber hinaus gibt es automatisierte Verfahren, die die Positionsdaten aller Spieler durch moderne Kamerasysteme mit 25 Punkten pro Sekunde aufzeichnen und dadurch Rückschlüsse auf das taktische Verhalten und die Interaktion mit dem gegnerischen Team zulassen. Gleichzeitig führen die eingesetzten Technologien zu großen Datenmengen zu jedem Wettkampf. Ein Ziel der Datenanalyse ist es, aus der Datenflut sogenannte Key-Performance-Indikatoren zu kreieren und anschließend zu evaluieren, ob diese einen maßgeblichen Einfluss auf die Erfolgschancen einer Mannschaft haben. Vereine wie die TSG Hoffenheim sind bereits in der Lage ihren Tagesablauf in Spiel und Training basierend auf solchen Technologien zu optimieren. Im folgenden Link wird dargestellt wie die TSG dies gemeinsam mit ihrem Partner SAP, sowie mit Unternehmen wie der Sportec Solutions GmbH durchführt.
Bisher wenig Beachtung wurde dabei auf die Analyse des Pressings gerichtet. Eine Studie aus dem Jahr 2017 von Gennady Andrienko und Kollegen hat anhand von Positionsdaten aus der Bundesliga (bereitgestellt von der Sportec Solutions GmbH) ein interaktives visuelles Analysetool entwickelt, welches eine detaillierte Aufbereitung des Pressingverhaltens erlaubt (Teil 2 der Miniserie) [1]. Hinführend zu dieser Thematik geben die Autoren einen Überblick über die historisch, wissenschaftlich gestützte Entwicklung des Datentrackings (Teil 1 der Miniserie).

Analyse von Spielereignissen

Zur Analyse von Spielereignissen können verschiedene Techniken zum Tragen kommen. In Bezug auf die Analyse von Pässen haben Forscher beispielsweise den Zusammenhang von Passdistanzen und dem Torerfolg untersucht, die Motive für Pässe analysiert oder typische Zuspielmuster zwischen Spielerpaaren während Angriffshandlungen identifiziert. Ein Indikator, der verhältnismäßig gut das Ergebnis von Spielen vorhersagen kann, ist der sogenannte H-Indikator [2]. Um ihn zu berechnen, nutzen Forscher die Methoden der sogenannten Graphentheorie. Hier ist ein Graph eine Menge von Punkten (Knoten), die durch Linien (sog. Kanten bzw. Bögen) miteinander verbunden sind. Die Graphentheorie kommt beispielsweise auch bei der Berechnung von Routen in Navigationssystemen zum Einsatz, um die kürzeste Strecke zwischen zwei Punkten zu finden. Beim Fußball berechnet der H-Indikator dabei einen Wert, der das Passverhalten einer ganzen Mannschaft bewertet. Bei der Berechnung fließen beispielsweise Pässe zwischen Spielern, sowie Pässe über verschiedene Bereiche des Platzes ein. Aber nicht nur Pässe stehen im Mittelpunkt bei der Analyse von Spielereignissen. Das System SoccerStories generiert bereits im Jahr 2013 automatisch visuelle Zusammenfassungen von einzelnen Spielphasen, die Spielereignisse wie z. B. lange Bälle, Eckbälle, Flanken und Torschüsse in einfacher Form visuell darstellen [3].

Laufwege visualisieren

Nicht nur Spielereignisse, auch Positionen und Positionsänderungen von Spieler und Ball können mit Hilfe von GPS-basierten Positionserfassungssystemen erkannt und analysiert werden. Dadurch kann beispielsweise das physiologische Anforderungsprofil einer Spielposition bestimmt werden und die genaue Laufleistung (u. a. Gesamtlaufdistanz, Höchstgeschwindigkeit, Geschwindigkeitsprofile) sowie das generelle Bewegungsverhalten (stehen, gehen, traben, sprinten) der einzelnen Spieler ermittelt werden. Die physische Leistung einzelner Spieler wird beispielsweis darüber bestimmt, wie viel Strecke in welcher Geschwindigkeit in spezifischen Spielsituationen zurückgelegt wird. Ein anderer Ansatz zeigt, dass über eine geometrische Zerlegung des Spielfelds in einzelne Rechtecke errechnet werden kann, welcher Spieler welchen Raum kontrolliert und welchen Raum er vor allen anderen Spielern erreichen kann. Meistens wird das über die Position des Spielers berechnet. Ein Spieler kontrolliert alle Punkte auf dem Feld, denen er zu gegebenem Zeitpunkt am nächsten ist und somit als ehestes erreichen kann. Betrachtet man wichtige Spielfeldzonen wie das Angriffsdrittel, ergeben sich aussagekräftige Verteilungswerte über die Raumkontrolle einer Mannschaft.

Häufig eingesetzt werden auch sogenannte Heatmaps, die meist über Punkte die Verteilung der Spieler beider Mannschaften, die Bewegung einzelner Spieler oder des Balls auf dem Spielfeld darstellen. Eine Heatmap, die beispielsweise nur den Ballbesitz über die Zeit darstellt und nicht die Positionen und die Laufwege der Spieler berücksichtigt, kann Aufschluss über die Spielstrategie einer Mannschaft liefern. Dieser Ansatz lässt auch Rückschlüsse zu, ob die Leistung einer Mannschaft innerhalb des vorab erwarteten Bereichs liegt, oder ob sie ein atypisches taktisches Verhalten aufweist. 

Spielsysteme interpretieren

Auch über andere Methoden kann die Analyse von Daten helfen, die taktische Ausrichtung von Mannschaften zu verstehen. Beispielsweise ist es möglich die gleichzeitige Bewegung mehrerer Spieler bei Spielstart oder Angriffshandlungen zu visualisieren und über mehrere Spiele hinweg zu vergleichen, um typische Muster und wiederkehrende kollektivtaktische Maßnahmen zu identifizieren. Andererseits können auch einzelne Spieler identifiziert werden, die als Schlüsselspieler den Takt des Spiels vorgeben und eine Mannschaft maßgeblich beeinflussen.
Zudem kann eine Analyse der vertikalen und horizontalen Abstände der Spieler zueinander oder zum geometrischen Schwerpunkt der Mannschaft – Centroid-Methode – Aufschluss darüber geben, wie gut das vorgegebene Spielsystem eingehalten wird und welche Interaktion zwischen Spielergruppen besteht [4]. So zeigte sich beispielsweise, dass die Geschwindigkeit, mit der sich Spielformationen in Breite und Tiefe auffächern und bei Ballverlust wieder verdichten in der ersten Spielhälfte generell höher ist. 
Darüber hinaus können Spielsysteme und Spielerrollen aus Positionsdaten erschlossen werden. Forscher von Disney Research, einem Netzwerk an Forschungsstätten, die durch die Walt Disney Firma finanziert werden, haben hierfür ein Verfahren geschaffen. Dieses ermöglicht es, kurz- und längerfristige Rollen sowie Rollentausch zwischen zwei oder größeren Gruppen von Spielern zu identifizieren [5]. Darüber hinaus ermöglicht dieser Ansatz es, den Spielstil einer Mannschaft oder untypische taktische Verhaltensweisen zu erkennen. Auch zeigen Untersuchungen mit diesem Verfahren, Unterschiede in dem Verhalten von Heim- und Auswärtsmannschaften auf.

Pass- und Torchancen

Aus der kombinierten Betrachtung von Positions- und Eventdaten kann festgestellt werden, wann Pässe und Torschüsse im Spiel mit einer höheren Wahrscheinlichkeit zu einem erfolgreichen Abschluss führen. Forscher schlagen Ansätze vor, die die Erfolgswahrscheinlichkeit von Torchancen abhängig von der Spielsituation (Positionsangriff, Konter, Eckball, Strafstoß etc.), Schussposition, Spielgeschwindigkeit, Abstand der Verteidiger sowie dem Zusammenspiel mit den umliegenden Spielern berechnet – z. B. Expected Goals [6]. 

Big Data

Derzeit werden Positions- und Eventdaten in nahezu allen professionellen Ligen der Welt erhoben, sodass man in Summe mittlerweile von Big Data sprechen kann. Die Analyse dieser Daten wird auch in Zukunft die gezielte Gegneranalyse, die Optimierung von Scouting-Vorgängen und die Überwachung und Steuerung von Trainingsprozessen weiter vervollkommnen.

Weiterführende Informationen zu diesem Thema folgen in Teil 2 der Miniserie "Daten im Fußball".

Die Inhalte basieren auf der Originalstudie "Visual analysis of pressure in football.", die 2017 im "Data Mining and Knowledge Discovery " veröffentlicht wurde. Die Studie wurde in einem Gemeinschaftsprojekt zwischen dem Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, der Sportec Solutions GmbH - dem offiziellen Datenlieferanten der Bundesliga und verschiedenen Universitäten durchgeführt.

Literatur

  1. Andrienko, G., Andrienko, N., Budziak, G., Dykes, J., Fuchs, G., von Landesberger, T., & Weber, H. (2017). Visual analysis of pressure in football. Data Mining and Knowledge Discovery, 31(6), 1793-1839.

    Studie lesen
    1. Andrienko G, Andrienko N, Budziak G, Dykes J, Fuchs G, Landesberger T von, et al. Visual analysis of pressure in football. Data Min Knowl Discov [Internet]. 2017;31(6):1793–839. Available from: http://link.springer.com/10.1007/s10618-017-0513-2

    2. Cintia P, Giannotti F, Pappalardo L, Pedreschi D, Malvaldi M. The harsh rule of the goals: Data-driven performance indicators for football teams. In: 2015 IEEE International Conference on Data Science and Advanced Analytics (DSAA) [Internet]. IEEE; 2015 [cited 2019 Mar 13]. p. 1–10. Available from: http://ieeexplore.ieee.org/document/7344823/

    3. Perin C, Vuillemot R, Fekete J-D. SoccerStories: A Kick-off for Visual Soccer Analysis. IEEE Trans Vis Comput Graph [Internet]. 2013 Dec [cited 2019 Mar 13];19(12):2506–15. Available from: http://ieeexplore.ieee.org/document/6634087/

    4. Frencken W, Poel H de, Visscher C, Lemmink K. Variability of inter-team distances associated with match events in elite-standard soccer. J Sports Sci [Internet]. 2012 Aug [cited 2019 Mar 13];30(12):1207–13. Available from: http://www.ncbi.nlm.nih.gov/pubmed/22788797

    5. Bialkowski A, Lucey P, Carr P, Yue Y, Sridharan S, Matthews I. Large-Scale Analysis of Soccer Matches Using Spatiotemporal Tracking Data. In: 2014 IEEE International Conference on Data Mining [Internet]. IEEE; 2014 [cited 2019 Mar 13]. p. 725–30. Available from: http://ieeexplore.ieee.org/document/7023391/

    6. Lucey P, Bialkowski A, Monfort M, Carr P, Matthews I. “Quality vs Quantity”: Improved Shot Prediction in Soccer using Strategic Features from Spatiotemporal Data. 9th Annu MIT Sloan Sport Anal Conf [Internet]. 2015;1–9. Available from: http://www.sloansportsconference.com/?p=15790