De anatomie van het Tijd-Orakel

Voorspellingen voor het Europees Kampioenschap voetbal vind je in alle kleuren en smaken: van nattevingerwerk van experten, over enquêtes onder lezers tot voorspellingen gebaseerd op de droge cijfers. De Tijd kiest voor dit laatste en onderzoekt of de statistieken beter kunnen voorspellen dan onze lezers.

Hier doen we uit de doeken hoe het Tijd-Orakel aan zijn voorspelling komt dat de Rode Duivels de halve finales halen en uit welke cijfers het dit besluit.

Schaken is de basis

Als startpunt voor het statistisch model wordt een rangschikking opgesteld met alle deelnemende landen. Hierbij wordt gebruik gemaakt van de zogenaamde Elo-puntentelling, een systeem uitgewerkt door de Amerikaanse schaker Arpad Elo. Elo vond een systeem uit waarbij schaakspelers na elke wedstrijd punten uitwisselen: de verliezer verliest punten aan de winnaar. Maar het systeem houdt ook rekening met de relatieve kracht van de tegenspelers: een overwinning tegen een laag gerangschikte speler levert maar weinig punten op voor een topspeler.

Vertaald naar het voetbal: een overwinning tegen Liechtenstein of Andorra levert de Rode Duivels maar weinig punten op. Sterker zelfs: omdat de puntentelling ook rekening houdt met het doelpuntensaldo kan een 1-0 overwinning tegen Andorra de Rode Duivels zelfs punten kosten.

Onze ranking neemt alle ooit gespeelde wedstrijd in rekening, maar laat recente wedstrijden uiteraard harder doorwegen. Ook houdt het model rekening met het thuisvoordeel van elke ploeg.

De kansen per wedstrijd

De scores van de landen op de ranglijst worden dan vertaald naar voorspellingen voor individuele wedstrijden. Hiervoor wordt het verschil tussen de Elo-scores van de twee ploegen als basis genomen. Er wordt aangenomen dat een verschil van 400 punten betekent dat de hoogst gerangschikte ploeg 10 maal meer kans heeft om de wedstrijd te winnen. Hiervoor wordt deze formule gebruikt:

Laten we als voorbeeld de openingswedstrijd van de Rode Duivels nemen. Het verschil tussen de Elo-scores van de Rode Duivels en de Azzurri bedraagt 77 punten. Als we dit in de formule invoeren, zien we dat de kans op winst voor Italië gelijk is aan:


%

De kans op winst voor de Rode Duivels wordt zo 61 procent.

Dit kunnen we voor elk paar van teams uitrekenen. Als ploeg A Elo-punten heeft en ploeg B Elo-punten, dan heeft ploeg A % kans op winst en ploeg B %.

Maar uiteraard is een gelijkspel ook mogelijk. Het model neemt daarvoor het historisch gemiddelde van gelijke spelen en verhoogt de kans op een gelijkspel nog als de Elo-scores van de ploegen dicht bij elkaar liggen. Zo komt het model voor België - Italië uit op 47 % kans voor winst van de Belgen, 27 % kans voor winst van de Italianen en 26 % kans op een gelijkspel.

Van wedstrijden naar het hele tornooi

Nu de kansen voor elke wedstrijd zijn ingeschat, kunnen de kansen voor het hele verloop van het tornooi worden ingeschat. Hiervoor worden de uitslagen van alle wedstrijden honderden keren gesimuleerd.

Laten we als voorbeeld de groepsfase van de Rode Duivels nemen. Als we de groepsfase 100 keer simuleren, zullen de Rode Duivels 47 keer als winnaar uit de bus komen tegen de Italianen, 27 keer zal de wedstrijd op een gelijk spel eindigen en 27 keer zullen de Italianen winnen. Deze simulatie wordt nu uitgevoerd voor alle wedstrijden, waarna voor elke groep 100 keer een eindklassement opgemaakt wordt. Bij 100 simulaties van de groep van de Belgen, slaagden de Rode Duivels er zo 91 keer in zich te plaatsen voor de achtste finales. 9 keer op 100 beten ze echter in het stof.

Deze simulatie kunnen we voor elk van de 6 groepen laten lopen, om tot de volgende kansen op het bereiken van de achtste finales te komen:

Zo wordt het ook gemakkelijk om de kansen op groepswinst te bepalen: we hoeven van alle simulaties voor elk team maar het aantal keer te tellen dat het team als eerste in de groep eindigde. Dat geeft het volgende resultaat:

Goed, maar wie wordt er nu Europees kampioen?

Voor elk van de achtste finales, kwartfinales, halve finales en uiteindelijk de finale wordt een kansberekening gemaakt op basis van de formule hierboven beschreven. De ploeg met de hoogste kans op winst volgens de formule kwalificeert zich in deze simulatie voor de volgende ronde.

Dit zijn de kansen op eindwinst voor alle teams:

De berekende kansen zijn uiteraard sterk afhankelijk van de uitslagen van de wedstrijden op het Europees Kampioenschap. De resultaten van de wedstrijden op het tornooi worden gebruikt voor het actualiseren van de Elo-scores van de ploegen. Na iedere wedstrijd worden daarom de Elo-scores opnieuw berekend, worden de simulaties uitgevoerd en worden alle berekende kansen aangepast. De actuele kansen op het bereiken van de tweede ronde en op eindwinst kan u steeds hier bekijken.