17 september 2014 In de media

Vitesse is de grootste pechvogel in de Eredivisie, NAC de sterkste starter

Na de eerste vijf speelronden in de Eredivisie is het voor veel mensen het ideale moment om voorzichtige conclusies over het nieuwe seizoen te trekken.
PSV is weer titelkandidaat (al valt het te bezien hoe de komende 6-8 weken zonder Memphis Depay gaan verlopen), PEC Zwolle begint net als vorig seizoen ijzersterk. Cambuur doet het bovengemiddeld goed, Feyenoord heeft haar zaken nog niet op orde en voor Heracles, Dordrecht en Go Ahead gaat het misschien wel een lang en zwaar jaar worden.

Al die conclusies die ik hierboven heb beschreven heb ik kunnen doen op basis van de meest primaire en belangrijke statistiek die we hebben: de stand. Aangezien op het eind van het seizoen het aantal punten (en wellicht het doelsaldo) van doorslaggevende waarde is, is het niet vreemd dat we op deze manier conclusies trekken en clubs met elkaar vergelijken. Niet alleen door de analytici op tv, maar vooral door de fans. Zo zullen er genoeg mensen in Rotterdam-Noord momenteel beweren dat Excelsior de club van Rotterdam is.

Het probleem met de stand, echter, is dat het slechts op twee specifieke momenten in het seizoen een betrouwbare statistiek is: na 17 speelronden en na 34 speelronden. Immers, op die momenten heeft elke ploeg elke tegenstander eenzelfde aantal keer getroffen. Toch blijven er na elke speelronde conclusies getrokken worden op basis van verschillende resultaten en verschillende speelschema’s. Zo zullen bijvoorbeeld veel mensen die nu naar de stand kijken zeggen dat AZ het beter doet dan Vitesse, ook al heeft de club uit Arnhem een veel zwaarder speelschema gehad in het begin van dit seizoen dan de Alkmaarders.

Zoals ik al zeg, aan het eind van het seizoen is de stand met recht de statistiek die we gebruiken om alle teams met elkaar te vergelijken. Echter, door het seizoen heen is er behoefte aan een andere statistiek die alle teams op een eerlijke manier met elkaar weet te vergelijken. Een statistiek die niet alleen de eigen prestaties meeneemt, maar ook kijkt naar de zwaarte van het speelschema.

Aan de andere kant van de oceaan hebben ze daar een oplossing voor. Doordat de meeste Amerikaanse sportcompetities bestaan uit een groepensysteem met aan het eind een play-offtoernooi, ontbreekt daar de mogelijkheid om tijdens het seizoen de resultaten af te zetten in één stand met alle ploegen. De statistiek die vooral in college sports (sporttoernooien door universiteitsteams) toegepast wordt om op die manier teams met elkaar te vergelijken die ongelijke speelschema’s hebben gespeeld heet RPI: de Rating Percentage Index. Voordat ik deze statistiek en de berekening ervan uitleg, zal ik kort uitleggen hoe competities in Amerikaanse college sports in elkaar steken.

De meest populaire college sport in de Verenigde Staten is zonder enige twijfel American Football. In de FBS, de hoogste divisie van het college football, doen maar liefst 128 verschillende universiteiten mee om de titel. Toch spelen alle teams per seizoen een absurd laag aantal wedstrijden: gemiddeld zo’n 11 à 12. Om dit te begrijpen is het belangrijk de historie van de FBS te begrijpen.

Alle teams zijn in de eerste plaats aangesloten bij een conference, een bond die alle verschillende sporttoernooien voor haar aangesloten universiteiten organiseert. Elke conference bestaat uit een verschillend aantal universiteiten dat vaak een geografische of culturele overeenkomst deelt. In plaats van het spelen om het nationale kampioenschap speelt elk team in de eerste plaats om het winnen van haar eigen conference.

Omdat veel conferences nog van voor de Tweede Wereldoorlog stammen, is het winnen van de titel om de eigen conference vaak vanwege haar tradities en historische lading vele malen belangrijker dan het winnen van het nationale kampioenschap. Buiten het spelen van wedstrijden in de eigen conference (er zijn er momenteel tien in de FBS met elk gemiddeld twaalf aangesloten universiteiten), speelt elk team ook een twee- tot drietal wedstrijden búiten haar conference. Wedstrijden tegen deze teams worden door beide universiteiten onderling afgesproken en niet door de conferences zelf. De reden hiervoor: het behalen van een hogere ranking in de polls.

De polls is een van de vreemdste manieren om teams tegen elkaar af te zetten. De polls is een lijst waarin de 25 beste teams wekelijks worden gepresenteerd door een comité van trainers, sportjournalisten en hoge functionarissen binnen enkele toonaangevende universiteiten. Deze ranking wordt dus volledig subjectief samengesteld. Belangrijk voor het verkrijgen van een hogere ranking (en daarmee op het eind van het seizoen een uitnodiging om deel te nemen aan de play-offs voor het nationale kampioenschap) is niet alleen het winnen van je wedstrijden, maar vooral het winnen van sterke tegenstanders.

De wedstrijden die een ploeg buiten haar conference organiseert tegen andere universiteiten geschiedt daarom op basis van verschillende factoren: niet alleen moet de tegenstander financieel aantrekkelijk zijn en dus een vol stadion trekken, ook moet de tegenstander op de eerste plaats te kloppen zijn, maar op de tweede plaats vooral een zo hoge sportieve status hebben dat het verslaan enkele gefronste wenkbrauwen teweegbrengt in de polls. Kortom: de taak van een universiteit in het college football is niet alleen zorgen dat het zoveel mogelijk wedstrijden wint, maar ook dat de 11 à 12 uit de mogelijke 127 tegenstanders sterk genoeg zijn om in de polls opgenomen te worden en uitgenodigd te worden voor de play-offs.

Omdat college football de meest populaire sport van alle college sports is, is ook dat systeem zo verwrongen van traditie en groot geld dat het wijzigen van de vreemde structuur enorm stroef verloopt. Toch wordt de beweging om meer eerlijkheid en transparantie in het uitgenodigd worden voor de play-offs elk jaar groter. Het gevolg hiervan is dat in de kleinere college sports, zoals onze soort voetbal, niét gekozen wordt voor een subjectief rankingssysteem. In tegenstelling tot het uitnodigen van slechts de vier beste universiteiten tot een mini-playofftoernooi voor het nationale kampioenschap, kwalificeren zich alle winnaars van de verschillende conferences, plus een groot aantal andere universiteiten dat op basis van een mathematische formule het beste seizoen heeft gedraaid. In totaal spelen er 48 universiteiten daar een afvaltoernooi met een grote op tv uitgezonden finale. Iedereen blij.

De mathematische formule die in Amerika is verzonnen om daar uit een warboel aan universiteiten en bonden tóch een zo sterk mogelijk play-offtoernooi te creëren zonder de traditionele structuur van de verschillende conferences in de war te gooien is dus de RPI. De RPI is een formule die drie factoren in haar berekening meeneemt:

  1. Het eigen winstpercentage (WP)
  2. Het gemiddelde winstpercentage van alle tegenstanders (OWP)
  3. Het gemiddelde OWP van alle tegenstanders (OOWP)

Uitgeschreven is de formule als volgt:
RPI = (WP + (2 x OWP) + OOWP) / 4

In deze formule worden dus niet alleen de eigen prestaties meegenomen, maar vooral de resultaten van je tegenstanders. Op deze manier wordt niet alleen bepaald hoe goed een team heeft gespeeld, maar vooral de waarde van die overwinningen. De formule beloont dus ploegen die van sterkere tegenstanders winnen en bestraft ploegen die alleen maar de makkelijke wedstrijden winnen.
Voordat ik de RPI’s van de achttien Eredivisieploegen toon, leg ik kort even uit hoe elke factor berekend kan worden:

Winning Percentage:
WP = (W + (1/2G)) / (W + G + V)

Hierbij geldt dat W staat voor het aantal overwinningen, G voor het aantal gelijke spelen en V voor het aantal verliespartijen. Een gelijkspel geldt in feite als halve overwinning.
Voorbeeld: Heerenveen heeft tot dusver driemaal gewonnen, eenmaal gelijkgespeeld en een verliespartij geleden. De WP is dus (3 + (1/2 x 1)) / (3 + 1 + 1) = 0,700. In normale mensentaal heeft Herenveen dus 70% van haar wedstrijden gewonnen.

Opponents’ Winning Percentage:
OWP  = ( WP1 + WP2 + WP3 … ) / S

Hierbij geldt dat elke WP staat voor het WP van alle tegenstanders die een team ontmoet heeft. Heeft een team tweemaal tegen dezelfde ploeg gespeeld, dan wordt het WP van die ploeg ook tweemaal meegenomen. Belangrijk is dat in het WP van de tegenstander niet de wedstrijd tegen de ploeg waarvan het RPI berekend wordt meegenomen wordt. S staat voor het aantal gespeelde wedstrijden.
Voorbeeld: Heracles speelde tot dusver tegen AZ, Groningen, Cambuur, Excelsior en Ajax. Die ploegen behaalden respectievelijk uit de overige vier wedstrijden die zij dit seizoen hebben gespeeld (de wedstrijd tegen Heracles dus niet meegerekend) 1, 2, 3, 1½ en 2 overwinningen. De OWP is dus ((1/4) + (2/4) + (3/4) + (1½/4) + (2/4)) / 5) = 0,475. Kortom, De tegenstanders van Heracles hebben dit seizoen slechts 47,5% van al hun wedstrijden gewonnen.

Opponents’ Opponents’ Winning Percentage:
OOWP = (OWP1 + OWP2 + OWP3 …) / S

Het OOWP is in feite dus het gemiddelde van de OWP’s van alle tegenstanders.
Voorbeeld: PSV speelde tot dusver tegen Willem II, NAC, Ajax, Vitesse en Zwolle. De OOWP van PSV is ((0,450 + 0,650 + 0,425 + 0,700 + 0,525) / 5) = 0,560.
Ik heb alle WP’s, OWP’s en OOWP’s van de achttien Eredivisieteams berekend en daaruit de RPI kunnen herleiden. De resultaten zie je hieronder:
 


In de eerste tabel is de huidige stand in de Eredivisie te zien met daarachter de overwinningen, gelijke spelen, verliespartijen, WP’s, OWP’s, OOWP’s en tot slot de RPI’s. In de tweede tabel staan alle ploegen gerangschikt naar hun RPI. Uit deze tabel kan niet alleen afgelezen hoe goed alle ploegen het tot nu toe doen, maar vooral wat de relatieve waarde van hun overwinningen zijn.

Zo zijn in positieve zin de opvallendste ploegen NAC en Vitesse. De Arnhemmers staan momenteel op de voorlaatste plaats in de Eredivisie met vier punten uit een mogelijke twintig, maar speelden tot dusver wel tegen de huidige nummers 1, 2, 3, 5 en 9 en had daarmee achteraf gezien het moeilijkste speelschema.

Van NAC, dat met de nummers 1, 2, 8, 9 en 16 vier ploegen uit het linkerrijtje trof (waar het momenteel zelf nog instaat ook), kan voorzichtig gezegd worden dat het de best presterende ploeg uit de Eredivisie is: ook al verloor het met 6-1 van PSV (doelsaldo wordt niet meegenomen in de RPI), de overwinning op Zwolle in de vierde speelronde (dat daarmee haar enige verlies leed) wordt groots beloond in de tabel. De overwinningen op Dordrecht en Excelsior vertaalt de RPI ook in een positief percentage: zo is het veel belangrijker je wedstrijden te winnen van laaggeklasseerde ploegen dan een enkele uitschieter te hebben tegen een ploeg uit de top van de ranglijst.

De negatieve namen in de RPI zijn Ajax, Groningen en AZ. Dit heeft precies te maken met wat ik net hierboven beschreef: te wisselvallige resultaten tegen de ploegen waar je van tevoren van verwacht te winnen. Dit is af te lezen uit de beroerde notering van AZ, dat drieënhalve week nog in Tilburg verloor van Willem II, een op papier zwakkere tegenstander. Bij Ajax zit de lage RPI vooral in het relatief makkelijke speelschema (getuigende de OWP van 0,425). Zo speelden de Amsterdammers al tegen de twee staartploegen uit de stand (beiden winst), maar wist het geen punten te pakken tegen (sub)toppers PSV en Groningen.

Zo is de RPI vooral tijdens het seizoen een handige statistiek om te kijken naar de daadwerkelijke waarde van overwinningen en nederlagen van de achttien Eredivisieploegen. Bovendien is het in staat het werkelijke verhaal achter bepaalde noteringen uit te leggen.

Zo hoeven fans van Vitesse zich nog geen zorgen te maken over een weggegooid seizoen: een reeks makkelijke wedstrijden ligt aan de horizon. Zolang niet alle ploegen een vergelijkbaar speelschema hebben afgewerkt, kan de RPI laaggeklasseerde ploegen een bemoedigende schouderklop geven en ploegen die bovenin meedraaien een waarschuwende vinger geven. En wat zou het ook, het stelt meer mathematisch ingestelde Feyenoorders in staat hun club nog steeds als de club van Rotterdam te beschouwen.

Deballenjongen

Hoofdsponsor: