25.12.14

Ein Torwartranking der Bundesliga - und ist es überhaupt sinnvoll?

Seit Saisonbeginn sammle ich Statistiken zu den Torhütern der österreichischen Bundesliga. Weil gerade Weihnachten ist und wegen der herausragenden Analyse Manuel Neuers auf Spielverlagerung soll heute ein Blick auf die Hinrunden-Leistungen von Gulácsi & Co. geworfen werden.

Der Stand in der Torwart-Analytik


So, wie man generell defensive Leistungen noch nicht wirklich gut mit Statistiken messen kann, ist auch der Stand bei Torhütern nicht viel besser. Von der allgemeinen Presse wird, wenn überhaupt einmal die Quote an parierten Bällen  oder gar einfach die Gegentorzahl genannt, und auch die Analytik-Blogger im Internet haben noch nicht viel Nennenswertes herausgefunden. Grob gesagt weiß man, dass man nichts weiß. Oder zumindest kaum etwas: Die Parierquote ist, wie Chancenverwertungsraten bei Stürmern, nicht besonders konsistent. Nicht einmal, wenn man die Werte an die Qualität der Schusspositionen anpasst (=Expected Goals) und den Keeper daran misst, wie viele Gegentore er weniger kassiert hat als erwartet, erhält man Werte, die von einer Saison zur nächsten gut wiederholbar sind. 11tegen11 hat das sogar zur Überschrift bewogen, man solle Torhüter niemals an seinen Paraden beurteilen.

Ganz so extrem stellt sich die Situation wohl nicht dar. Erstens haben meist, wie auch in der Neuer-Analyse oder bei differentgame, in der Tat die vermeintlich besten Torhüter zumindest langfristig die besten Werte. Zweitens müsste man "nur" eine aussagekräftige Kennzahl entwickeln, und abgewehrte Schüsse würden sicherlich etwas aussagen, schließlich sind sie das Kerngeschäft eines Torwartes. Colin Trainor von statsbomb hat versucht, in ein Expected-Goals-Modell zu implementieren, wo der Ball die Torlinie passieren würde (wenn er sie passierte). Intuitiv geurteilt ist das völlig richtig, denn Schüsse ins Kreuzeck sind sicherlich schwerer zu halten als jene genau in die Mitte.

09.09.14

Interessantes zu Defensivstatistiken

Grundsätzlich gibt es auf Bullenstats zwar keine Werbung (in Form von Anzeigen), aber auf einen bisher relativ unbekannten, aber interessanten Blog möchte ich dennoch hinweisen:

Auf everyteamneedsaron werden auf Englisch statistische Analysen zur (defensiven) Performance von Innenverteidigern gemacht. Autor Mark Thompson hat in letzter Zeit sowohl versucht herauszufinden, welche Metriken für einen Innenverteidiger wichtig sind, als auch (überlicksweise) konkrete Spieler als "beachtenswert" (to watch) eingestuft. Vor allem bezüglich der Theorie könnte es zu Überraschungen kommen.
Und so wie es auch wir an dieser Stelle machen, lernen auch Mark und seine Leser mit jeder weiteren Analyse dazu.

Zwischenbilanz: Torschussbeteiligungen beim FC Liefering

Weil gerade Länderspielpause ist, und nachdem in der Ersten Liga jeder schon gegen fast jeden gespielt hat, bietet sich eine gute Möglichkeit, eine kleine Zwischenbilanz darüber zu ziehen, wer beim FC Liefering wie oft an den Torschüssen beteiligt war.
Der FC Liefering eignet sich dafür besonders gut. Das "B-Team" von Red Bull Salzburg führt nicht nur die Punkte-, sondern auch die Torschusstabelle an: Laut Daten von Opta Sports kommt Liefering auf bisher rund 13,8 nicht geblockte Schüsse pro Spiel, was um 22% mehr sind als der zweitbeste "Schützenverein" Austria Lustenau erreichte.
Die hohe Schusszahl ist in zweierlei Hinsicht ein Vorteil für die Analyse: Erstens zeigt sie, dass man eine erfolgreiche Mannschaft bzw. deren Spieler analysieren darf, und Erfolg ist natürlich immer einfacher zu analysieren als Misserfolg. Zweitens bedeuten mehr Schüsse eine größere Stichprobe, und aus größeren Stichproben kann man natürlich immer sicherere Schlüsse ziehen.

Nichtsdestotrotz gleich zu Beginn die Warnung. Obwohl das vorhandene Untersuchungsmaterial das größte aller Erste Liga-Clubs ist, kann man dennoch nicht von sicheren Thesen die Rede sein. Aber wir werden den weiteren Saisonverlauf beobachten und sehen, wie sich das Bild verändert.
Ein kleiner Disclaimer noch: Die folgenden Statistiken behandeln fast ausschließlich offensive Leistungen.

01.08.14

Glück, waghalsige Prognosen und Qarabag-Salzburg 2:1

Eine detaillierte statistische Spielanalyse ist angesichts der eher undetaillierten Statistiken auf uefa.com zwar nicht möglich, aber ein paar Gedanken und Fakten möchte ich dennoch loswerden.

War ein Heimsieg Qarabags im Vorhinein zu erwarten?


Geht es nach den österreichischen Medien und generell der österreichischen Öffentlichkeit, müsste diese K.o.-Duell eine klare Sache zugunsten des österreichischen Meisters werden. Ohne konkrete Beweise darlegen zu können, lautete der Grundtenor, dass Salzburg bekanntlich in die Champions League wolle und dass daher alles andere als ein Sieg eine enorme Enttäuschung wäre. Und gegen einen Klub aus Aserbaidschan müsse man in der momentanen Verfassung ohnehin drüberfahren.

16.07.14

Kader und Neuzugänge für 2014/15 - Goalimpact

Kurz bevor die Saison 2014/15 in Österreich beginnt, kann man sagen, dass der Kader von Red Bull Salzburg überaus komplett ist. Lediglich, wenn noch ein Spieler seinen Wechselwunsch äußern würde, müssten Ralf Rangnick und Adi Hütter sowie das Scouting-Team noch einmal aktiv werden: Für jeden der Abgänge wurde schon ein positionsgetreuer Nachfolger verpflichtet, und unter diesen Abgängen befindet sich kein Stammspieler der Saison 2013/14. Auch mit Kevin Kampl hat man den Vertrag kürzlich verlängert. Wie wertvoll das Halten der Stammelf wirklich ist, soll mit dieser Kaderanalyse aufgezeigt werden. Ein weiterer wesentlicher Punkt ist die Vorstellung der Neuzugänge.

All das soll mit Hilfe des Goalimpacts geschehen, der von Jörg Seidel entwickelt wurde. Zunächst soll ein herzlicher Dank dafür an ihn ausgerichtet werden, dass er großzügigerweise mir die Werte und Karriereverläufe des Salzburger Kaders zur Verfügung gestellt hat. Wer sich genauer für die Methodik interessiert, soll sich den ersten Teil des Artikels über den WM-Kader der Schweiz und/oder Jörgs eigene Beschreibungen durchlesen. Hier soll nur eine kürzere Fassung folgen.

06.07.14

Mané - Kampl - Sabitzer - Burgstaller

Hinweis: Diese Analyse basiert fast ausschließlich auf den Leistungsdaten der Spieler, mit all den Vor- und Nachteilen einer solchen Analyse. Um bei Sabitzer einen subjektiven "Eye Test" durchzuführen, habe ich zu wenige spiele von Rapid Wien gesehen. Wenn jemand eine fundierte Erklärung für die eine oder andere Überraschung parat hat, kann er diese gerne im Kommentarbereich kundtun. Eventuell werden solche Erklärungen sogar noch nachträglich in den Artikel hineineditiert.

Vor wenigen Wochen hat Red Bull Salzburg seinen Kader mit Offensivspieler Marcel Sabitzer verstärkt. Wir wollen uns aber nicht mit der unkonventionellen Vertragskonstellation, mit der Salzburg den Spieler von Rapid Wien losgeeist hat, beschäftigen, sondern vor allem mit seiner Qualität. Die Grundlage dafür sollen Sabitzers statistischen Spieldaten aus der Saison 2013/14 sein. Um einen Vergleich zu ermöglichen, wird er mit seinen zukünftigen Mitspielern Sadio Mané und Kevin Kampl verglichen, die er möglicherweise 2014/15 einige Male im offensiven Mittelfeld ersetzen wird. Zwar steht seit Kurzem fest, dass auch Kampl noch bis einschließlich der kommenden Saison in Salzburg bleiben wird, aber zumindest ein bisschen Rotation wird es wohl dennoch geben.

24.06.14

Über erfolgreiche, halberfolgreiche und nicht erfolgreiche Aktionen


Wirft man einen Blick auf einen Spielbericht und auf die Übersicht über die taktischen Spieldaten, bekommt man neben vielen absoluten Zahlen wie abgegebene Torschüsse, Flanken etc. auch diverse Erfolgsquoten zu sehen. Diese Prozentwerte erhält man, indem man die Anzahl der gelungenen Aktionen durch jene der Aktionen insgesamt dividiert. Dabei setzen sich die Aktionen insgesamt aus erfolgreichen du nicht erfolgreichen Aktionen zusammen. Beispiele hierfür wären die Passquote (angekommene Pässe/gespielte Pässe), die Zweikampfquote (gewonnene Zweikämpfe/geführte Zweikämpfe) oder die Chancenverwertung (Tore/Chancen).

Momentan unterscheidet man also nur zwischen den beiden Polen "gelungene Aktion" und "nicht gelungene Aktion". Die Frage, die sich ein Interessierter stellen muss, lautet: Gibt es wirklich nichts zwischen erfolgreich und nicht erfolgreich? Ist bspw. ein Pass, der zum Mitspieler kommt, automatisch erfolgreich?

10.06.14

Der WM-Kader der Schweiz

Da die Fußballweltmeisterschaft 2014 in Brasilien bevorsteht, soll sie auf auch Bullenstats zumindest einmal zum Thema werden. Dabei erscheint keine Gelegenheit passender, als mithilfe von Daten von GoalImpact  den Kader der Schweiz zu analysieren. In einem Projekt hat GI-Erfinder Jörg Seidel verschiedensten Bloggern seine Daten zu Verfügung gestellt, damit diese den Kader der jeweiligen Nation beschreiben. Dankenswerterweise darf auch Bullenstats ein Teil des Projektes sein.
In diesem Exkurs sollen aber nicht nur auf die 23 Schweizer WM-Teilnehmer zur Geltung kommen, sondern auch die faszinierende Grundidee des GoalImpact sowie nicht berücksichtigte Schweizer Fußballer. Und hinsichtlich letzterem ist der Exkurs plötzlich gar kein so großer mehr.

31.05.14

Analyse der Gegentore - Teil 2

Nachdem zuletzt auf Teamebene die Gegentore  unter die Lupe genommen wurden, soll heute die Spielerebene folgen. Dabei sind die beiden Hauptkriterien: Wie viele Fehlerpunkte hat ein Spieler "erzielt" und wie schwer war ein durchschnittlicher Fehler? Als Maß für die Fehleranfälligkeit wird das Verhältnis zwischen Fehlerpunkten (FP) und Gegentoren (GT), bei denen der Spieler auf dem Platz stand, verwendet. Die Schwere der Fehler wird durch die Fehlerpunkte (FP) pro Fehlerzahl (FZ) dargestellt.
Damit annähernd die Spieler verglichen werden, die tatsächlich miteinander vergleichbar sind, sind die Spieler in vier Positionskategorien aufgeteilt: Verteidigung, defensives Mittelfeld, offensives Mittelfeld und Angriff.

28.05.14

Analyse der Gegentore - Teil 1

Nach der bisher vorherrschenden Theorie soll nun ein erster praktischer Artikel erfolgen. Der Fokus soll zunächst auf dem Negativen liegen: Es geht um die Gegentore, die Red Bull Salzburg in der Saison 2013/14 in der Bundesliga kassiert hat. Der erste Teil soll vornehmlich vom ganzen Team handeln. Teil 2 wird sich auch mit Einzelspielern beschäftigen.

Die Daten habe ich allesamt selbst aufgezeichnet. Dabei dürfte sich auch die eine oder andere Ungereimtheit eingeschlichen haben. Besonders bei subjektiven Beurteilungen von Abwehrfehlern haben sich mit ziemlicher Sicherheit der eine oder andere Fehler eingeschlichen.

12.05.14

Der Umgang mit Statistiken

Bevor man Statistiken verwendet und analysiert, muss man erst einmal wissen, was man dabei beachten muss.

09.05.14

Wozu überhaupt Fußballstatistiken?

Bevor man Statistiken verwendet und analysiert, muss man erst einmal wissen, wieso man diesen Schritt gehen will.

Zu Beginn eine wichtige Sache, die es zu klären gibt: Ich werde mich nicht mit Statistiken beschäftigen wie "Red Bull Salzburg hat seit 2002 kein Heimspiel gegen die SV Ried verloren" oder (noch absurder) "Red Bull Salzburg hat 2013/14 100% seiner Spiele gegen Bayern München gewonnen, was sonst nur Real Madrid geschafft hat". Es soll darum gehen, was auf dem Platz passiert. Wie sagte es Otto Rehhagel: "Die Wahrheit liegt auf dem Platz." Und dieser Wahrheit will ich mich mit Zahlen zumindest annähern.
Warum aber mit Zahlen?

Wozu überhaupt Statistiken im allgemeinen Leben?


Eigentlich müsste die von Natur aus vorhandene Wahrnehmung des Menschen doch ausreichen, ihm schon genug Informationen liefern?
Der Grund, weshalb wir dennoch auf Messwerte bauen, ist einfach: Während Empfindungen häufig subjektiv sind, bestechen Zahlen durch ihre Objektivität. Sofern keine Mess- oder Ermittlungsungenauigkeit vorliegt, bieten sie eine ziemlich korrekte Wiedergabe der Situation. Die Wahrnehmung mit der Verarbeitung im Gehirn ist zwar auch extrem wichtig, aber sie ist von Mensch zu Mensch verschieden und lässt sich außerdem recht leicht manipulieren.
 Wenn man beispielsweise irgendetwas unbedingt erkennen will (wie Fehler bei einer Arbeit eines anderen), wird man dabei erfolgreich sein. Und zwar selbst dann, wenn es sich objektiv um gar gesehen kein wesentliches Merkmal handelt. Und laut Soccernomics werden beispielsweise blonde Spieler von Scouts, die sich noch kein genaueres Bild von einer Mannschaft gemacht haben, bevorzugt. Einfach deshalb, weil ihr Aussehen heraussticht und weil das Aussehen die am schnellsten feststellbare Information ist..

Ein Beispiel für die Symbiose zwischen Wahrnehmung und Zahlen ist der Vorgang einer ärztlichen Behandlung: Abgesehen von Routine-Kontrollen sucht man vorwiegend dann den Arzt auf, wenn man die (subjektive) Empfindung hat, dass etwas nicht ganz in Ordnung ist. Nur wegen des Gefühls des Patienten wird jedoch noch kein Arzt ein Medikament verschreiben oder gar eine Operation erwägen; Der Patient könnte sich schließlich auf das Problem versteifen und somit etwas wahrnehmen, was gar nicht ist (=Hypochondrie). Problematisch ist in diesem Fall vor allem, dass keine andere Person mit ihrer einfachen Wahrnehmung prüfen kann, ob die Sorgen berechtigt sind.
Dafür benötigt man eine nähere Untersuchung, deren Ergebnis häufig irgendein numerischer Wert ist, beispielsweise der Pulsschlag, der Laktatwert im Blut oder die Gehirnaktivität.

Des Weiteren können mit statistischen Aufzeichnungen auch längerfristige Trends eruiert werden. Aus eigener Erfahrung kann ich sagen, dass sich Daten wie der Zeitpunkt des ins Bett Gehens oder die Menge an konsumiertem Fleisch nicht lange in der Erinnerung halten. Führt man hingegen über längere Zeit Buch über diese nicht schwer zu erhebenden Sachen, bekommt man einen ziemlich guten Eindruck von der Wahrheit, und man kann etwaige Vorwürfe mit einem stichhaltigen Beweis abschmettern.

Und wozu Statistiken im Sport?


Auch das ist relativ einfach erklärt: Im Sport geht es fast immer darum, die besten Teilnehmer eines Wettkampfes herauszufinden. Und solange man die Leistung eines Sportler nicht irgendwie quantifiziert, wird man kaum zu einer ordnungsgemäßen Rangliste kommen.
Ein Prototyp ist die Leichtathletik: Das Motto dieser Sportart lautet "Höher, Schneller, Weiter", und bei allen drei Dingen handelt es sich um Basisgrößen der Physik (nämlich Zeit und Strecke). 

Doch der Drang nach Objektivierung ist so groß, dass selbst Sportarten wie Eiskunstlauf Wertungssysteme eingeführt haben, obwohl das Ziel nicht so klar zu beschreiben ist wie das der Leichtathletik. Jeder Auftritt erhält von Juroren eine Note. Diese ist zwar wiederum subjektiv, doch da sie durch sichtbare Merkmale zustande kommt, ist diese Herangehensweise durchaus vertretbar.

Im Fußball ist das Maß für den Sieger eines Spiels glücklicherweise einfacher (wenn auch nicht immer; siehe hier): Wer mehr Tore schießt, gewinnt das Spiel. Dafür gibt es in der Tabelle 3 Punkte. Bei Gleichstand nach 90+x Minuten erhalten beide Teams je einen Punkt.
Somit müsste es doch schon genügen: Man hat ein objektives Maß dafür, wer gewinnt. Das Wichtigste ist also abgedeckt. Und über den Rest, wie Leistungen eines Spieler oder Spielverlauf, kann man sich doch auch mit Hilfe der reinen Beobachtung schlau machen.

Und wozu detaillierte Statistiken im Fußball?


Dafür gibt es 3 triftige Gründe: Erstens ist es eben doch nicht so einfach wie es im letzten Satz beschrieben ist: Jeder Leser hat sicherlich schon einmal eine Diskussion mit einem Fan der gegnerischen Mannschaft erlebt, in der das Thema war, welche Mannschaft nun den Sieg eher "verdient" hätte. Es kommt nicht einmal selten vor, dass bei den Interviews nach dem Spiel beide Trainer den verdienten Sieg für ihr Team beanspruchen. Dabei bringen beide Seiten ihre durch die "Vereinsbrille" gefärbte Ansicht ein, und letztlich kommt es zu keinem Konsens. Um diesen zu erreichen, hätten die Diskussionsteilnehmer ihre Beobachtungen durch konkrete Videoaufnahmen untermauern müssen. Oder mit Statistiken.

Zweitens ist die Torstatistik ungenau. Ohne diese Tatsache wären Diskussion über Verdientheiten eines Sieges gar nicht möglich. Ein Tor ist im Fußball halt ein eher seltenes Ereignis (es passiert in den Profi-Ligen Europas rund 2,5-3 Mal pro Spiel), weswegen der Zufallsfaktor für ein einzelnes Spiel relativ groß ist. Oft entscheidet schon ein einziges Ereignis (=Tor) die Partie gegen ein Team, das die gegnerische Mannschaft über 90 Minuten an die Wand gespielt hat. Schon einfache Torschuss-/chance - Werte können wesentlich bessere Auskünfte über Mannschaftsstärken bringen.

Die Ungenauigkeit der Torstatistik lässt sich übrigens in Zahlen fassen: Laut Andreas Heuer ist die Tordifferenz eines Einzelspiels zu 86% (!) durch den Zufall bestimmt. Zwar hat er im gleichen Kapitel keine Vergleichswerte anderer Kenngrößen wie Ballbesitz oder Torschüsse genannt, aber bei einem so hohen Zufallsanteil ist zumindest ein kleiner Blick über den Tellerrand sinnvoll.
Außerdem ist laut dem Buch "Der Fußball, die Wahrheit" bei 45% aller Tore eine zufällige Aktion (also ein schwerer Fehler des Gegner, Treffer via Latte etc.) im Spiel, bei allgemeinen Ballkontakten liegt der Wert hingegen nur bei 35%.  

Das dritte Argument ist, dass nicht nur das Endresultat (=die Tordifferenz) interessant ist, sondern auch, wie es zustande gekommen ist. Dies äußert sich in den angesprochenen Diskussionen über den Spielverlauf, die Einzelpieler etc. Unter anderem solche Fragen können mithilfe der Spieldaten beantwortet werden. Weiters bieten sie auch Rückschlüsse auf den Spielstil einer Mannschaft an. Statistiken können also Informationen ans Licht bringen, die ohne Daten im Schatten geblieben wären.

Fazit


Ich hoffe, es ist klarer geworden, wieso eine detaillierte statistische Erfassung des Fußballs absolut Sinn macht. Zusammengefasst kann die menschliche Wahrnehmung allein einfach nicht 45 Minuten durchgehend ein 105 *68 Quadratmeter großes Spielfeld nicht bewusst im Auge behalten, und die Tore allein sind speziell für kurze Zeiträume zu sehr vom Zufall "infiziert", um mit ihnen allein eine saubere Analyse durchführen zu können.

Nichtsdestotrotz können auch andere statistische Kenngrößen irren. Ohne eine richtige Interpretation sind die Werte nichts wert, und für das richtige Verständnis benötigt man wieder die Beobachtung des Spieles. (mehr zur richtigen Interperation wird's im nächsten Beitrag geben.) Wie bei der Patienten-Geschichte ist also auch im Fußball eine Symbiose von subjektiver Wahrnehmung und Messwerten die beste Lösung.

03.05.14

Einleitende Worte

In etwas mehr als einer Woche wird die Bundesligasaison 2013/14 zu Ende sein.  Red Bull Salzburg hat die Saison sowohl von der ergebnistechnischen Seite (man achte auf den Vorsprung auf den Zweitplatzierten) als auch mit seinem Spielstil dominiert. Insbesondere wegen der taktischen Qualitäten, die sich in enorm aggressivem Angriffsfußball geäußert haben und die Roger Schmidt der Mannschaft in 2 Jahren implementiert hat, wird diese Saison den Salzburger Fans lange in Erinnerung bleiben - und nicht nur diesen.

Somit gibt es eigentlich genug zu analysieren. Interessante Fragen wären beispielsweise: Wie kann man die Leistungsstärke des neuen Meisters in Zahlen ausdrücken? Decken die Statistiken womöglich sogar bisher unbeachtete Stärken auf? Wer oder was hat sich im Vergleich zu 2012/13 verbessert?

Abgesehen von diesen Salzburg-bezogenen Aspekten werden auch immer wieder theoretische Artikel zu lesen sein, in denen mehr oder weniger innovative Wege der Analyse erklärt und dokumentiert werden. Sie sollen auch als vor- oder Nachbereitung von praktischen Analysen dienen. Im Bezug darauf könnten immer wieder kurze Erklärungen von mathematischen Instrumenten, die bei einer Analyse verwendet werden sollen, auftauchen. In der Regel sollte es aber nicht um Berechnungsweise oder mathematischen Hintergrund gehen, sondern darum, wie man die Ergebnisse richtig interpretiert. Schließlich ist für das Verständnis der Untersuchungen ebenfalls nur Letzteres gefordert.

Doch nicht nur in Salzburg wird Fußball gespielt: Um mehr über die genauen Eigenschaften von Kennwerten zu wissen, muss man über den Tellerrand hinausblicken und auch statistische Analysen der ganzen Österreichischen Bundesliga oder anderer europäischer Ligen durchführen. Daher können von Zeit zu Zeit auch allgemeine Artikel erscheinen.

Für die Auswertungen werden ausschließlich öffentlich zugängliche Daten benutzt. Die primären Datenquellen, also die Quellen der Daten über Red Bull Salzburg, sind am rechten Rand zu finden.

Für Diskussionen steht der Kommentarbereich zur Verfügung. Alle Fragen und konstruktiven Beiträge sollen hier ihren Platz finden, damit die Fragen und Einwände übersichtlich bleiben und von allen gelesen werden können. Man kann nicht nur mit verschiedenen Internetbenutzerkonten, sondern auch anonym kommentieren.