Wissen

Big Data im Fußball gezielt nutzen

Positions- und Spielereignisdaten richtig auswerten und visualisieren

Bewegungsanalyse & Biomechanik
Technologie & Equipment
Im Wintertrainingslager der Nachwuchs-Nationalmannschaften (U 16, U 17) wird ein Spiel aufgezeichnet, um die Daten später zu analysieren.
    • Der Prototyp kombiniert per GPS und Kamera erfasste Daten mit manuell erfassten Spieldaten für die Spielanalyse.
    • Mithilfe von neuesten Data Mining-Techniken werden die Merkmale herausgefiltert, die bezogen auf die jeweilige Anforderung der Spielanalyse am aussagekräftigsten sind.
    • Datenvisualisierungstools sollen Trainern helfen, die Frage nach dem Warum in der Spielanalyse zu beantworten.
    • Selbstlernende Algorithmen erhöhen die automatisierte Klassifizierung von ausgelesenen Spielereignissen.
    • Praxisbeispiele aus der Spielanalyse – Einzelspieler, Viererkette – werden angeführt.
Abstract

Positions- und Spielereignisdaten liefern Trainern und Scouts Unmengen an Informationen. Um sie gezielt nutzen zu können, gilt es in der Datenflut aussagekräftige Parameter und Muster zu finden und diese so zu visualisieren, dass sie die Spielanalyse verbessern. Dafür benötigt es computerbasierte Verfahren. Das semi-automatische Visual Analytics-Tool will Datenanalysten ein flexibles Analyse-Instrument bieten. Es ermöglicht, Daten zu bestimmten Spielereignissen zu klassifizieren und benutzerdefiniert aufzubereiten. Ein selbstlernender Algorithmus erhöht die automatisierte Klassifizierung von Spielereignissen. Die Entwickler haben den Prototypen in der Praxis auf verschiedene Anwendungsfälle wie der Einzelspieleranalyse, der Beurteilung der Viererkette und dem Auslesen von Torschüssen getestet.

Mit Data Mining-Techniken die Nadel im Heuhaufen finden

Fußball ist mit seinen 22 Einzelakteuren ein äußerst dynamisches Spiel. GPS- und kamerabasierte Datentracking-Technologien zeichnen räumlich-zeitliche Bewegungsdaten der Spieler auf und liefern ein dichtes Netz an Informationen. Ungefiltert, unstrukturiert und unverarbeitet nützt die komplexe Datenflut wenig. Richtig durchsucht und ausgewertet, birgt sie jedoch immense Erkenntnisgewinne, versprechen Datenanalysten. Eine visuell gestützte Datenanalyse soll dabei helfen, die Spielanalyse für Trainer zu vereinfachen und dazu beitragen, die Frage zu klären, warum ein Team gewonnen oder verloren hat.

Beispielsweise zielt die Einzelspieleranalyse darauf ab, Schlüsselspieler zu identifizieren oder die Leistung eines Spielers an Hand von messbaren Leistungsparametern ins Verhältnis zu Mitspielern zu setzen. Auf Mannschafts- oder Gruppenebene kann es u. a. darum gehen, dass Umschaltspiel zu beurteilen oder die Qualität des Abwehrverbunds zu bewerten. So kann die Analyse der Viererkette in einer Defensivsituation helfen, das Stellungsspiel zu beurteilen oder aber der Wechsel von Offensivspiel in die Defensive nach einem Ballverlust wichtige Hinweise für die Mannschaftsleistung liefern.

Ziel der Studienautoren ist es, die umfangreiche Datenanalyse von Spieldaten zu automatisieren und mittels Visualisierungstools anwenderfreundlich aufzubereiten.

Daten gezielt auf verschiedenen Ebenen auswerten

Das Visual Analytics-Tool setzt darauf, aus der Datenflut mithilfe von Data Mining-Techniken die Merkmale herauszufiltern, die bezogen auf die jeweilige Anforderung der Spielanalyse am aussagekräftigsten sind. Auf diese Weise identifiziert das Tool interessante Spielereignisse und entscheidende Spielsituationen. Dabei können verschiedenen Ebenen betrachtet werden: die Leistung eines einzelnen Spielers oder mehrerer Spieler sowie verschiedene Spielereignisse. Grafisch aufbereitet, sind die Visualisierungen interaktiv so angelegt, dass der Anwender sein Feedback unmittelbar in den Data-Mining-Prozess zurückspielen kann. Der Trainer erhält so zeitnah einen echten Wissensvorsprung: Er kann die Leistung situativ analysieren und direkt reagieren.

Einzelspieleranalyse

Die Einzelspieleranalyse fokussiert sich auf Leistungsparameter und auf Spiel-bezogene Merkmale eines einzelnen Spielers. Sie entsprechen drei Kategorien:

  • Individuelle Merkmale (z. B. Koordinaten und Geschwindigkeit),
  • Spiel-bezogene Merkmale (z. B. Entfernung zum Ball),
  • Spielereignisse (z. B. Torschuss, Ballannahme oder Foul).
Das Analyse-Tool durchsucht die aufgezeichneten Daten nach Verhaltens- und Bewegungsmustern eines Spielers und gliedert sie in verschiedene Phasen, die als numerische Zeitreihen dargestellt werden (s. ABB. 01). Mittels Clustering werden dann ähnliche Phasen ausgemacht. Parallele Koordinaten (Visualisierungsverfahren mehrdimensionaler Strukturen) tragen dazu bei, die Verteilung der Werte einzelner Merkmale in den jeweiligen Clustern zu interpretieren. So lassen sich zum Beispiel Spielmacher identifizieren oder der Einfluss von Schlüsselspielern auf den Spielverlauf bewerten.Wie aktiv ist ein Stürmer und wie ist er in das Offensivspiel eingebunden? Antworten auf diese Fragen lieferte der Praxistest. Datengrundlage war ein Profi-Fußballspiel. Für die Analyse eines Stürmers wurden die Merkmale Geschwindigkeit, Bewegungsrichtung (x- und y-Dimension), Entfernung zum nächsten Gegenspieler und Entfernung zum Ball selektiert, klassifiziert und so geclustert, dass aussagekräftige von nicht-aussagekräftigen Daten unterschieden werden konnten.

Die Geschwindigkeitsverläufe der Einzelspieler zeigen eine hohe Synchronität. Es gibt Phasen mit hoher Geschwindigkeit (blau) und Phasen mit nahezu keiner Geschwindigkeit (rot).
Spielergruppenanalyse, sind alle auf der Höhe?

Das Tool soll es auch ermöglichen, Spieler vergleichend zu betrachten und die Spielanlage sowie die Spielgrundlage datentechnisch zu analysieren, um die taktische Ausrichtung von Mannschaften zu bewerten. So lassen sich typische Muster oder wiederkehrende kollektivtaktische Spielhandlungen ausmachen. Beispielhaft vorgestellt wurde der Anwendungsfall der Viererkette – denkbar wären auch andere Defensivformationen –, bei der das Zusammenspiel zwischen den vier Abwehrspielern entscheidend dafür ist, wie sicher eine Mannschaft in der Verteidigung agiert.

Für den Anwendungsfall gilt es zunächst ein Leitbild zu definieren. Es wird angenommen, dass sich alle vier Abwehrspieler bestenfalls in einer Ideallinie parallel zur Torlinie des Spielfeldes und – im Hinblick auf die Abseitsfalle – alle auf der gleichen Höhe befinden [1]. Um die Qualität dieser Abwehrformationen bewerten zu können, würde an sich die Berechnung des durchschnittlichen Abstands der Spieler von der Ideallinie reichen (s. ABB. 02). Weil es aber verschiedene Angriffssituationen gibt, die ein anderes Verhalten erfordern, braucht es eine etwas komplexere Beurteilung.

Das Visual Analytics-Tool unterscheidet Angriffe situativ anhand folgender Kriterien: Solange der Abstand zwischen Ball und Tor größer als 22 Meter ist, sollte die Viererketten auf der Ideallinie agieren. Befindet sich der Ball näher am Tor, muss zwischen einem Angriff von der Mitte und einem Angriff von der Seite unterschieden werden. Angriffe von der Seite sollten mit einer seitlichen, sichelförmigen Verschiebung beantwortet werden (hier wird die Krümmung zwischen Außen- und Innenverteidiger berechnet). Gleichwohl sind die Abstände zwischen den Verteidigern wichtig. Zu große Abstände bieten Passlücken und wenig Absicherung des eigenen Mitspielers (weiteres grundlegendes Verhalten der Viererkette).

Im Praxisfeldtest konnte die Viererkette unmittelbar im Kontext von torgefährlichen Situationen analysiert werden (s. ABB. 02).

In der Abbildung (A) besitzt die Viererkette nur sehr geringe Abweichungen (grau) von der Ideallinie (schwarz). In der Abbildung (B) sind deutlich größere Abstände (gelb) der Viererkette von der Ideallinie zu verzeichnen.
Spielereignis-basierte Analyse, trainiere den Algorithmus

Um Spielereignisse wie Torschüsse, Torvorlagen, Flanken oder Fouls in den Blick zu nehmen, verfolgt die analysierte Studie zwei Ansätze. Zunächst werden die Zeitpunkte von bedeutsamen Spielereignissen manuell bestimmt. Um künftig diesen Auswahlprozess automatisiert ablaufen zu lassen und dabei keine wichtigen Ereignisse in der Spielanalyse zu verpassen, wurde ein Verfahren angewandt, das unter anderem mithilfe neuronaler Netze und Entscheidungsbäumen die Daten selbständig klassifiziert. Vereinfacht ausgedrückt, wird der automatisierte Auswahlalgorithmus anhand der Struktur bzw. der Merkmale der manuell ausgewählten Spielereignisse selbstlernend „trainiert“. 

Im Praxistest wurde der Torschuss als bedeutsames Spielereignis einer praktischen Analyseanwendung unterzogen. Als wichtigste Merkmale, die das Ereignis datentechnisch beschreiben, wurden die x-Position (vertikale Nähe zum Tor), der vertikale Abstand innerhalb der Mannschaft (in gefährlichen Situationen ist dieser Abstand größer als üblich) und die Anzahl der Gegenspieler identifiziert. Anhand dieser Merkmale und des zuvor trainierten Auswahlalgorithmus ist es gelungen, „gefährliche Situationen“ und zusätzliche Ereignisse mit Torschüssen zu erkennen, die in den ursprünglichen Spieldaten zuvor nicht markiert worden waren. Durch diese Rückkopplung zwischen händisch und automatisch generierten Daten konnte die Datenqualität verbessert und mehr torgefährliche Ereignisse in die Klassifizierung eingebracht werden.

Experten-Feedback

Noch ist das Visual Analytics-Tool ein Prototyp. Einer ersten praktischen Erprobung mit verschiedenen Anwendungsfällen hat das semiautomatische System – nach Überzeugung der Entwickler – standgehalten. Gerade in puncto Zeit bietet es einen Vorteil gegen über einer manuellen Analyse. Ob die eingesetzte Datenvisualisierung auch praxistauglich ist, sollte ein Experte, der beim FC Bayern München arbeitet, beurteilen. Sein Fazit: Überwiegend positiv, wenngleich das Lesen von Flächengraphen im Vergleich zu Liniendiagrammen einiger Übung bedarf. Dann allerdings biete die Visualisierungstechnik vor allem bei solchen Betrachtungen Vorteile, wenn das gleiche Merkmal über mehrere Spieler hinweg verglichen wird (s. ABB. 01). Auch die Sichtbarkeit der Synchronität einer Mannschaft in bestimmten Merkmalen wie Geschwindigkeit oder Beschleunigung, unterstützt durch entsprechende Farbwechsel sei vielversprechend.

Literatur

  1. Sacha, D., Stein, M., Schreck, T., Keim, D. A., & Deussen, O. (2014, October). Feature-driven visual analytics of soccer data. In 2014 IEEE conference on visual analytics science and technology (VAST) (pp. 13-22). IEEE.
    1. Chapman, S., Derse, E., & Hansen, J. (2008). Soccer coaching manual. Los Angeles: LA84 Foundation.