25.12.14

Ein Torwartranking der Bundesliga - und ist es überhaupt sinnvoll?

Seit Saisonbeginn sammle ich Statistiken zu den Torhütern der österreichischen Bundesliga. Weil gerade Weihnachten ist und wegen der herausragenden Analyse Manuel Neuers auf Spielverlagerung soll heute ein Blick auf die Hinrunden-Leistungen von Gulácsi & Co. geworfen werden.

Der Stand in der Torwart-Analytik


So, wie man generell defensive Leistungen noch nicht wirklich gut mit Statistiken messen kann, ist auch der Stand bei Torhütern nicht viel besser. Von der allgemeinen Presse wird, wenn überhaupt einmal die Quote an parierten Bällen  oder gar einfach die Gegentorzahl genannt, und auch die Analytik-Blogger im Internet haben noch nicht viel Nennenswertes herausgefunden. Grob gesagt weiß man, dass man nichts weiß. Oder zumindest kaum etwas: Die Parierquote ist, wie Chancenverwertungsraten bei Stürmern, nicht besonders konsistent. Nicht einmal, wenn man die Werte an die Qualität der Schusspositionen anpasst (=Expected Goals) und den Keeper daran misst, wie viele Gegentore er weniger kassiert hat als erwartet, erhält man Werte, die von einer Saison zur nächsten gut wiederholbar sind. 11tegen11 hat das sogar zur Überschrift bewogen, man solle Torhüter niemals an seinen Paraden beurteilen.

Ganz so extrem stellt sich die Situation wohl nicht dar. Erstens haben meist, wie auch in der Neuer-Analyse oder bei differentgame, in der Tat die vermeintlich besten Torhüter zumindest langfristig die besten Werte. Zweitens müsste man "nur" eine aussagekräftige Kennzahl entwickeln, und abgewehrte Schüsse würden sicherlich etwas aussagen, schließlich sind sie das Kerngeschäft eines Torwartes. Colin Trainor von statsbomb hat versucht, in ein Expected-Goals-Modell zu implementieren, wo der Ball die Torlinie passieren würde (wenn er sie passierte). Intuitiv geurteilt ist das völlig richtig, denn Schüsse ins Kreuzeck sind sicherlich schwerer zu halten als jene genau in die Mitte.

Der Erfolg war mäßig: Selbst wenn man 250 Schüsse aufs Tor als eine Gruppe nimmt, was circa zwei vollen Saisons entspricht, und sie zu dann mit der nächsten, gleich großen Gruppe vergleicht, sind die Werte der über/unter Erwartung gehaltenen Schüsse eher inkonsistent, zumindest wenn man es mit abgegebenen Schüssen bei Stürmern vergleicht: Bei Trainor lag der Korrelationskoeffizient r zwischen 0,4 und 0,46, bei Alex Olshansky im Link bei ca. 0.66 (Achtung: Im Diagramm im verlinkten Text ist r^2 angeschrieben!).

(Anmerkung: Die Konsistenz über längere Zeit ist deswegen so wichtig, weil eine Kennzahl einigermaßen gleich bleiben sollte, wenn sie wirklich etwas über die Qualität eines Spielers aussagen will. Schließlich ändern sich die Stärken und Schwächen nicht einfach von heute auf morgen. Variationen in kurzen Zeiträumen sind zwar normal, jeder kann einmal einen schlechten Tag oder einfach eine Pechsträhne haben. Über längere Zeit sollten sich diese Anomalien aber ausgleichen. und je länger diese Zeit, desto mehr Ausgleich müsste stattfinden.

Die Konsistenz wird meist mit dem Korrelationskoeffizienten r gemessen: Dabei beobachtet man, wie sehr sich die Werte aus Zeitraum 1 mit jenen aus Zeitraum 2 ähneln. Wären absolut perfekte Vorhersagen möglich, wäre r=1. Bei gar keinem Zusammenhang zwischen zwei Datenliste ist r=0. 

Mit r kann man aber auch den Zusammenhang zwischen zwei unterschiedlichen Variablen prüfen, beispielsweise den Gegentoren und der Parierquote, (s.u.). In diesem Fall sind auch negative Korrelationen möglich, wenn gilt: Je mehr von Variable X, desto weniger von Variable Y.)

Immerhin sind "ExpG2" von statsbomb ein klarer Schritt in die richtige Richtung, denn sie waren im Vergleich klar besser als die reine Parierquote, mit der wir Vorlieb nehmen müssen. 

Die verwendeten Kennzahlen


Damit wären wir schon mittendrin in den Metriken, die wir hier verwenden: Die erste ist die ohnehin jedem bekannte Parierquote:

 PQ = Schüsse gehalten/(Schüsse gehalten+Gegentore).

Um die Zahl an Gegentoren zu minimieren, müssen sie jedoch nicht nur Schüsse parieren, sondern sie im Idealfall schon in der Entstehung verhindern: 
Eine Möglichkeit, dies zu tun ist das Abfangen und Wegfausten von Flanken. Wie schon bei den Schüssen muss dabei eine Erfolgsquote berechnet werden, denn an der Anzahl an Flanken in den Strafraum hat der Torwart noch weniger Anteil als an der an Schüssen. Außerdem sind gefaustete Flanken weniger Wert als abgefangene Bälle, weil bei einer Faustabwehr nicht unbedingt die eigene Mannschaft in Ballbesitz ist. Deswegen werden gefaustete Flanken als halberfolgreiche Aktionen gewertet. Die Formel für die Flankenquote lautet somit:

FlQ = (Flanken gefangen + 0,5*Flanken gefaustet)/(Flanken gefangen + 0,5*Flanken gefaustet + Flanken erfolgreich)

Zwei Hinweise: Das "erfolgreich" ist natürlich aus Sicht der angreifende Mannschaft zu verstehen. Und die erfolgreichen Flanken habe ich wie die Ballsicherungen selbst aus den Taktiktafeln der Bundesliga extrahiert. Dabei habe ich nur Flanken (die eventuell als Torschussvorlagen oder Assists aufscheinen) gezählt, die der Torwart abwehren hätte können, also nur jene mit Ziel im und kurz vor dem Fünfmeterraum.
(Alle anderen Daten stammen aus den Spielerstatistiken der Bundesliga).

Die dritte Kenngröße, die wir uns ansehen werden, sind die Ballsicherungen. Das sind jene Aktionen, bei denen der Torwart abgesehen von Schüssen oder Flanken auf den Ball zukommt (oder umgekehrt) und ihn sich schnappt. Auch anderweitige Defensivaktionen wie Klärungen oder Interceptions werden zu Ballsicherungen in die Wertung genommen, sie sind jedoch in der klaren Minderheit. In dieser Kategorie müsste Neuer besonders stark sein, wenn wir Daten über ihn hätten, besonders bei Ballsicherungen außerhalb des Strafraums.
Der Nachteil an Ballsicherungen ist, dass wohl einige Aktionen einfließen, bei denen der Torwart weder eine großartige Antizipation oder physisch Eigenschaft unter Beweis stellen muss, sondern einfach nur die Arme ausstrecken muss. Gerade wenn die angreifende Mannschaft trotz geringer Offensivpräsenz den Ball irgendwie nach vorne passt, können solche "wertlosen" Ballsicherungen auftreten,
Die Formel für die Ballsicherungsquote lautet:

BsQ = Ballsicherungen/(Ballsicherungen+Schüsse aufs Tor)

Erneut muss man den Output zwingend in Relation dazu setzen, wie viel Arbeit der Torwart hat. Die Schüsse, die aus Tor zugekommen sind, dürfte eine relativ gute Annäherung sein. 

Die drei angeführten Metriken kann man zu einer Art "Gesamtstärke" eines Torwartes kombinieren. Die konventionellste Lösung dafür ist wohl das einfache arithmetische Mittel. Die resultierende Zahl nenne ich vorerst "Fangquote" (FaQ), auch wenn sie auch nicht gefangene Bälle berücksichtigt:

FaQ = (Parierquote+ Flankenquote + Ballsicherungsquote)/3

Für Gewichtungen haben wir noch zu wenig aussagekräftiges Datenmaterial. Auf den bisherigen Stand werden wir zwar noch schauen, aber jetzt soll nach der ganzen Theorie endlich Praxis folgen:

Wer ist der beste Torhüter der Bundesliga?


Zugegeben wage ich es auch mit den Statistiken nicht, diese Frage zu beantworten. Dafür habe ich jeden einzelnen zu wenig selbst beobachtet und weiß zu wenig über die Aussagekraft. Aber sehen wir einmal, wer von den 10 meisteingesetzten Torhütern die beste Fangquote hat:




Alexander Kofler vom WAC liegt voran! Gemeinsam mit Martin Kobras von Altach dominiert er alle drei Teilkategorien: Kobras liegt je einmal auf Rang eins, zwei und vier, Kofler ist gar zwei Mal Erster und einmal "nur" Dritter. Besonders bei Flanken ist Kofler bisher eine Klasse für sich,

Von der Papierform her mögen Kofler und Kobras überraschen, aber wenn man sich die Tabellenplatzierungen ihrer Klubs Wolfsberg und Altach vor Augen führt, passen einem die Werte schon besser ins Bild. Andere Ergebnisse sind überraschender: Beispielsweise liegen die relativ hoch gehandelten jungen österreichischen Torhüter Heinz Lindner und Cican Stankovic im Ranking nur auf den Plätzen 8 und 9. Stankovic weist bei Schüssen und Flanken durchaus ordentliche Werte auf (Platz 6 bzw. 5), wird aber von Ballsicherungen hinuntergezogen. Um zu wissen, ob das seltene Mitspielen des zukünftigen Torhüters von Red Bull Salzburg seinem Team wirklich schadet, müsste man ihn beobachten. Lindner hat sich in der Hinrunde bei Schüssen (Platz 10) und Flanken (Platz 8) unten angesiedelt.

Péter Gulácsi liegt im Mittelfeld der Torhüter-Tabelle. Dass er nicht ganz vorne liegt, wo man prinzipiell wohl jeden Spieler des FC Red Bull Salzburg erwarten könnte, bestätigt den Eindruck, den die wohl meisten Beobachter in den vergangenen Wochen von ihm bekommen habe: Er wirkt beileibe nicht mehr so sicher wie noch in der Saison 2013/14. Die Ballsicherungen, bei denen er immer noch den dritten Rang belegt, sind am ehesten seine Stärke. Sowohl bei der Flanken, als auch der Parierquote scheint er dagegen nur als Siebenter auf.
Das richtig vernichtende Urteil für den Ungarn fällt die Fangquote allerdings, wenn man nur das 2. Saisonviertel, also die Spiele 10-18, betrachtet: In dieser Wertung findet man ihn auf dem letzten Platz... Im ersten Saisonabschnitt war es immerhin noch der dritte gewesen. In jeder der einzelnen der drei Kennzahlen hat Gulácsi nachgelassen. Sein Fehler in der CL-Qualifikation gegen Malmö (oder eine andere Ursache) hat ihn wohl so sehr mitgenommen wie kaum einen anderen Salzburger. An den ersten 6 Spieltagen, also bis kurz vor dem Scheitern in der Qualifikation, hat er bei der Fangquote noch einen überragenden Wert von 84,4% erreicht. (dazu muss man natürlich sagen, dass alle statistischen Werte des Torhüters auch von den Feldspielern, die bis dahin extrem gut verteidigt hat, abhängig sind.)
Was den Statistiker daran freut, ist die Tatsache, dass der Abfall der Fangquote mit einem deutlichen Anstieg der Gegentore, konkret mit einer Verdoppelung von 0,88 pro Spiel auf 1.67, einherging. Insofern dürfte die Fangquote zumindest keinen absoluten Blödsinn erzählen.

Übrigens hat Gulácsi von Viertel zu Viertel die Position quasi mit Thomas Vollnhofer von Wr.Neustadt getauscht: Ersterer ist von 3 auf 10 gefallen, zweiterer von 10 auf 4 aufgestiegen. An seinem letzten Platz im Gesamtranking ändert es zwar nichts, dennoch hat sich Vollnhofer diametral zum Ungarn in allen Teilbereichen klar verbessert, und auch bei ihm machten sich diese Verbesserungen bei den Gegentoren bemerkbar (von 3,11 pro Spiel auf 1.0!). Hinzuzufügen ist allerdings, dass er im 2. Viertel nur 6 der möglichen Einsätze verbuchen konnte, wodurch seine Werte noch unsicherer sind als bei den Mitbewerbern.

Bevor wir noch weitere Thesen über die diversen Schlussmänner aufstellen, prüfen wir erstmal, wie sehr man den Daten überhaupt schon trauen kann:

Die Konsistenz


Angesichts der eben besprochenen, rapiden "Leistungs"-Änderungen von Gulácsi und Vollnhofer kann man sich schon vorstellen, wie instabil die Werte von 9 Spielen sind.  Stellen wir konkret die Resultate eines Spielers in den beiden Vierteln gegenüber und werfen einen Blick auf die Korrelationskoeffizientenr:

Metrik Fangquote Parierquote Flankenquote Bs-Quote
r -0.128 -0.293 -0.279 0.443

Was wir sehen, sind überwiegend negative Korrelationen. Je besser ein Torwart also im ersten Saisonviertel war, desto schlechter war er im zweiten! (wenngleich die Korrelationen nicht stark negativ sind; -1 wäre das Minimum.) Die reelle Qualität eines Torhüters kann man also kaum von den Werten nach 9 Spielen ablesen, denn sie macht wohl  kaum solch große Sprünge. Vielmehr könnten die Statistiken in kurzen Zeiträumen die derzeitige Form wiedergeben - oder es ist einfach Zufall, ob der Torwart in den ausgewählten 9 Spielen seine besten oder schlechtesten Leistungen auspackt.
Diese Schwankungen könnten sich in längeren Bewertungszeiträumen ausgleichen, sodass man letztlich doch aussagekräftigere Werte bekommt. Ob das schon nach 18 Spielen (=einer halben Saison) der Fall ist, werden wir erst am Ende der Saison erfahren, wenn wir die erste mit der zweiten Saisonhälfte vergleichen können. Es wird zumindest interessant sein, ob sich die Korrelationen denen von Trainor (oben verlinkt) annähern, und wie sich die drei Teilmetriken in Relation zueinander schlagen. Auch die Korrelationen der verbleibenden Viertel zueinander werden beachtenswert werden.

Die positive Überraschung bezüglich der Konsistenz ist der Ballsicherungsquote. Als einzige der "Quoten" bringt sie eine positive Korrelation heraus, und mit 0.44 ist sie schon auf einem Level angelangt, wo man sagen kann: "Werte aus dem 1. Viertel haben sich im 2. bestätigt". Das hängt wahrscheinlich (auch) damit zusammen, dass Ballsicherungen von Torhütern 3 Mal so häufig sind wie abgefangene Flanken oder parierte Torschüsse. Somit konnte sich der Zufall schon besser ausmitteln. Wie schon gesagt, muss man weitere Untersuchungen abwarten.

Übrigens besteht auch zwischen den Gegentoren im ersten und jenen im zweiten Viertel eine relativ starke negative Korrelation (-0,44). Daran erkennt man, dass sich selbst bei einer normalerweise eher zuverlässigen Kenngröße wie den Gegentoren nach 9 Runden noch so einiges finden muss, (Ohne die Ausreißer Gulácsi und Vollnhofer wäre r zwar nicht mehr negativ, mit 0,02 aber auch kaum positiv).

Der Zusammenhang mit den Gegentoren


Wie schon bei Vollnhofer und Gulácsi angesprochen, sollte sich eine hohe Fangquote grundsätzlich in der Anzahl an Gegentoren reflektieren. Schließlich fährt ein Keeper den Großteil seiner Aktionen mit dem Ziel, dass der Ball möglichst selten die Torlinie passiert. Wir werden, erneut mit dem Korrelationskoeffizienten, kontrollieren, ob dieser Zusammenhang nach 18 Runde vorhanden ist.

Metrik Fangquote Parierquote Flankenquote Bs-Quote
r -0.734 -0.312 -0.595 -0.849

In diesem Fall sind negative Korrelationen erwünscht: Je höher die Quote, desto weniger Gegentore. Glücklicherweise bekommen wir diese, und sie sind sogar relativ stark. Die Korrelation der Ballsicherungsquote zu den Gegentoren nimmt sogar fast "ungesunde" Ausmaße an. Damit ist gemeint, dass es zu bezweifeln ist, dass der starke Zusammenhang nur vom gut ballsichernden Torwart ausgeht. Es könnten auch "dritte Faktoren" dahinterstecken, also beispielsweise, dass Torhüter in Spitzenmannschaften besser von der Abwehrreihe unterstützt werden oder, dass gute Mannschaften generell einen Spielstil pflegen, der sowohl den Gegentor- als auch den Ballsicherungswerte entgegenkommt.
Das sei an dieser Stelle angesprochen: Von derartigen Einflüssen sind prinzipiell die allermeisten Statistiken - so auch die anderen Torwartstatistiken - betroffen. Man kann sie nur schwer stichhaltig detektieren oder gar ausschalten. Dafür wäre sehr viel weitere Untersuchung vonnöten, Theoretisch müsste man überhaupt jeden Torhüter ein Mal in jede Mannschaft stecken. 

Insgesamt sind die Ergebnisse aber überaus erfreulich und nähren die Hoffnung, dass die Zahlen nicht völlig bedeutungslos sind. Gerade der Wert bei der Fangquote, die ja der Mittelwert aus den drei anderen ist, sieht gut aus. Die Daten von einem Saisonviertel mögen zwar noch nicht allzu viel Allgemeingültiges über die wahre Qualität aussagen, aber das tun Gegentore ja auch nicht. Was man jedoch feststellen kann, ist, dass eine laut den Zahlen gute Torhüterleistung mit der Gegentorquote korreliert.  

Fazit


Damit lassen wir es auch wieder gut sein. Die Stichprobe ist noch zu klein, um anhand der Korrelationsergebnisse Gewichtungsfaktoren in die Fangquote einzubauen oder um Theorien aufzustellen (bspw. könnte einen die letzte Tabelle darauf hinweisen, dass das Verhindern (=> Flanken- und Ballsicherungsquote) von Torschüssen wichtiger sei als das Parieren (=> Parierquote)). Aber solche Schlüsse wären zum jetzigen Stand ziemlich haltlos. Dieser Artikel war ja ohnehin vielmehr als Einführung und "erstes Kennenlernen" gedacht. Man kann gespannt darauf warten, inwieweit sich bisherige Untersuchungsergebnisse bestätigen.

Ähnliches trifft auf die Torhüter zu. Bei Alexander Kofler ist die Perspektive durchaus positiv, denn er hat seine sehr guten Zahlen in beiden Vierteln und allen Teilaspekten konsequent durchgezogen. Die meisten seiner Torhüterkollegen waren - teils großen - Leistungsschwankungen unterworfen, ihre Werte am Ende der Saison werden hoffentlich ein stabileres Bild auf sie werfen. Wie stabil die momentanen Werte einer Halbsaison überhaupt sind, werden wir ohnehin frühestens am Saisonende erfahren, wenn bekannt ist, inwiefern sich die Zahlen der kommenden, zweiten Halbsaison ähneln.

Zu den Kennzahlen sei abschließend gesagt, dass sie einerseits wohl in die richtige Richtung wirken. Andererseits muss ganz klar konstatiert werden, dass sie den für Statistiken üblichen Schwächen unterliegen: Sie bewerten eher den Torwart als Teil des "Systems Mannschaft" als den Torwart als individueller Spieler. Ich denke nicht, dass ein Manuel Neuer trotz seiner Klasse hinter einer indisponierten Defensive  noch Weltklasse-Werte verbuchen würde. Wenn die generischen Angreifer laufend auf ihn zuliefen und die Flanken und Steilpässen unter so wenig Abwehrdruck stattfinden, dass er keine Chance hätte, sie zu fangen oder auf andere Art zu klären, sähe er so blöd aus wie Lionel Messi in einem Team mit Mittelfeldspielern, die selten den Ball verarbeiten können und sich auch nicht gut freilaufen.

Anpassungen an die Anforderungen, die wirklich an den Torwart gestellt werden, wie etwa die Einberechnung der Schussposition, Art der Chancenentstehung etc, bei Expected Goals, sind auf Sicht unumgänglich. Da wir aber nicht das nötige Datenmaterial dafür haben, werden wir vorerst bei der den beschriebenen Metriken bleiben und das Beste daraus herausholen.


2 Kommentare:

  1. Sehr interessanter Artikel! Schade, dass schon lange kein neuer Artikel erschienen ist.

    AntwortenLöschen
    Antworten
    1. Danke für die Rückmeldung!
      Ja, ich würde auch lieber mehr schreiben. Leider habe ich gerade andere zu viele andere Sachen zu tun, sodass ich nicht einmal dazu gekommen bin, den Kommentar zu veröffentlichen (auch wenn es rein vom Zeitaufwand her überhaupt kein Problem wäre). Sorry!

      Aber kann dir sagen, dass ich zumindest schon genügend konkrete Ideen für Artikel habe!

      Löschen