Onderzoek, mei 2026
Laat ChatGPT je WK-poule niet invullen: hij voorspelt dezelfde wedstrijd twee keer met een andere uitslag.
Door Peter Neef, oprichter Pouletips.nl. Test uitgevoerd op 1 mei 2026 met identieke prompts naar ChatGPT, Claude en Gemini, in twee stappen.
Gepubliceerd
AI tegen AI: het WK 2026 in cijfers
ChatGPT, Claude en Gemini, identieke prompt, 1 mei 2026.
| Stap | Wedstrijden | Unaniem | Minstens 1 wijkt af | Oneens over winnaar |
|---|---|---|---|---|
| Stap 1: open prompt (geen loting) | 66 | 19 | 47 | 23 |
| Stap 2: met FIFA-loting + puntentelling | 72 | 20 | 52 | 18 |
Ik werk overdag met data en eindigde jarenlang bovenin de kantoorpoule door odds van bookmakers door te rekenen. In februari 2026 automatiseerde ik die werkwijze in een rekenmodel: pouletips.nl. Dat ik dit jaar gevraagd zou worden of AI dat ook gewoon kon, had ik niet zien aankomen.
Op 1 mei stuurde ik dezelfde opdracht naar drie chatbots tegelijk: ChatGPT, Claude en Gemini. Voorspel alle 72 groepswedstrijden van het WK 2026. Het eerste antwoord van ChatGPT bevatte Ivoorkust-Curaçao 2-0. Vier regels later, in hetzelfde antwoord: Ivoorkust-Curaçao 1-0. Beide keren met Ivoorkust thuis. Door deze dubbel-voorspelling ontbraken twee andere wedstrijden in dezelfde groep volledig: Duitsland-Ivoorkust en Ecuador-Curaçao.
Een chatbot die zichzelf binnen één antwoord tegenspreekt over dezelfde wedstrijd. En dan vroeg ik me af: hoe ziet dit eruit als je de officiële loting en de puntentelling letterlijk meegeeft? Antwoord: nog steeds drie verschillende WK-poules.
Drie chatbots, drie verschillende WK-poules
Geen loting meegegeven. Claude en Gemini voorspelden alle 72 wedstrijden, ChatGPT miste er zes. Daardoor konden 66 wedstrijden tussen alle drie chatbots vergeleken worden. Daarnaast voorspelde ChatGPT zes wedstrijden binnen één antwoord twee keer, vijf daarvan met een afwijkende uitslag.
unaniem dezelfde uitslag
Op slechts 19 van de 66 vergelijkbare wedstrijden gaven alle drie chatbots precies hetzelfde antwoord.
minstens één AI wijkt af
Op ruim 70% van de vergelijkbare wedstrijden was er ten minste één chatbot die een andere score gaf dan de andere twee.
oneens over wie er wint
Op ruim 1 op de 3 wedstrijden gaf de ene chatbot 'thuis wint', terwijl een andere op 'gelijk' of 'uit wint' uitkwam.
Wedstrijden die ChatGPT in één antwoord twee keer voorspelde:
- Duitsland - Ecuador: 2-1 én 1-2
- Curaçao - Ivoorkust: 2-0 én 1-0
- Uruguay - Spanje: 1-1 én 1-2
- Saoedi-Arabië - Kaapverdië: 1-1 én 2-1
- Engeland - Kroatië: 2-1 én 1-1
- Panama - Ghana: 1-1 én 2-1
Ook met maximale hulp blijft het schimmig
Toen de officiële loting, wedstrijdvolgorde én puntentelling letterlijk in de prompt geplakt werden, gaven alle chatbots wel alle 72 wedstrijden. Toch geven ze nog steeds verschillende WK-poules. Tijdens het WK vergelijken we de live stand met stap 2 (alle 72 wedstrijden compleet vergelijkbaar tegen Pouletips).
unaniem dezelfde uitslag
minstens één AI wijkt af
oneens over winnaar (1 op 4)
Voorbeelden: drie chatbots, drie verschillende scores
Op 6 wedstrijden gaven alle drie chatbots een andere score. Hieronder de wedstrijden waarop dat opviel.
| Wedstrijd | ChatGPT | Claude | Gemini |
|---|---|---|---|
| Brazilië - Marokko | 2-0 | 2-1 | 3-1 |
| Zweden - Tunesië | 1-1 | 2-1 | 2-0 |
| België - Egypte | 2-0 | 2-1 | 3-1 |
| Tunesië - Japan | 1-1 | 0-2 | 1-2 |
| Panama - Kroatië | 1-2 | 0-2 | 0-3 |
| Bosnië-Herzegovina - Qatar | 2-1 | 2-0 | 1-1 |
Alle 72 wedstrijden, vier voorspellers
De volledige vergelijking. Pouletips is het Poisson-model met live bookmaker-odds, doorgerekend over 10.000 toernooi-runs. Dit is de versie waarop de live tracker tijdens het WK is gebaseerd. Filter op type onenigheid.
| Datum | Groep | Wedstrijd | Pouletips | ChatGPT | Claude | Gemini |
|---|---|---|---|---|---|---|
| 2026-06-11 | A | Mexico - Zuid-Afrika | 1-0 | 2-0 | 2-0 | 2-1 |
| 2026-06-12 | A | Zuid-Korea - Tsjechië | 0-1 | 1-1 | 1-1 | 1-1 |
| 2026-06-12 | B | Canada - Bosnië-Herzegovina | 1-0 | 1-1 | 1-1 | 2-1 |
| 2026-06-13 | D | Verenigde Staten - Paraguay | 1-0 | 2-1 | 2-1 | 2-0 |
| 2026-06-13 | B | Qatar - Zwitserland | 0-2 | 0-2 | 0-2 | 0-2 |
| 2026-06-14 | C | Brazilië - Marokko | 1-0 | 2-0 | 2-1 | 3-1 |
| 2026-06-14 | C | Haïti - Schotland | 0-2 | 1-2 | 0-2 | 0-2 |
| 2026-06-14 | D | Australië - Turkije | 0-1 | 1-1 | 1-2 | 1-2 |
| 2026-06-14 | E | Duitsland - Curaçao | 3-0 | 3-0 | 3-0 | 4-0 |
| 2026-06-14 | F | Nederland - Japan | 1-0 | 2-1 | 2-1 | 2-1 |
| 2026-06-15 | E | Ivoorkust - Ecuador | 0-1 | 1-1 | 1-1 | 1-1 |
| 2026-06-15 | F | Zweden - Tunesië | 1-0 | 1-1 | 2-1 | 2-0 |
| 2026-06-15 | H | Spanje - Kaapverdië | 3-0 | 3-0 | 3-0 | 3-0 |
| 2026-06-15 | G | België - Egypte | 1-0 | 2-0 | 2-1 | 3-1 |
| 2026-06-16 | H | Saudi-Arabië - Uruguay | 0-1 | 1-2 | 0-2 | 1-2 |
| 2026-06-16 | G | Iran - Nieuw-Zeeland | 1-0 | 2-0 | 2-0 | 2-0 |
| 2026-06-16 | I | Frankrijk - Senegal | 1-0 | 2-1 | 2-1 | 2-0 |
| 2026-06-17 | I | Irak - Noorwegen | 0-1 | 0-2 | 0-2 | 0-3 |
| 2026-06-17 | J | Argentinië - Algerije | 1-0 | 3-0 | 2-0 | 2-0 |
| 2026-06-17 | J | Oostenrijk - Jordanië | 1-0 | 2-0 | 2-0 | 3-0 |
| 2026-06-17 | K | Portugal - DR Congo | 2-0 | 2-0 | 2-0 | 3-0 |
| 2026-06-17 | L | Engeland - Kroatië | 1-0 | 2-1 | 1-1 | 2-1 |
| 2026-06-18 | L | Ghana - Panama | 1-0 | 2-1 | 2-1 | 2-0 |
| 2026-06-18 | K | Oezbekistan - Colombia | 0-1 | 1-2 | 0-2 | 1-2 |
| 2026-06-18 | A | Tsjechië - Zuid-Afrika | 1-0 | 2-1 | 2-1 | 1-0 |
| 2026-06-18 | B | Zwitserland - Bosnië-Herzegovina | 1-0 | 2-1 | 2-1 | 2-0 |
| 2026-06-19 | B | Canada - Qatar | 1-0 | 2-0 | 2-0 | 3-0 |
| 2026-06-19 | A | Mexico - Zuid-Korea | 1-0 | 2-1 | 2-1 | 2-0 |
| 2026-06-19 | D | Verenigde Staten - Australië | 1-0 | 2-1 | 2-1 | 2-1 |
| 2026-06-20 | C | Schotland - Marokko | 0-1 | 1-1 | 1-2 | 1-1 |
| 2026-06-20 | C | Brazilië - Haïti | 2-0 | 3-0 | 3-0 | 4-0 |
| 2026-06-20 | D | Turkije - Paraguay | 1-0 | 2-1 | 2-1 | 1-1 |
| 2026-06-20 | F | Tunesië - Japan | 0-1 | 1-1 | 0-2 | 1-2 |
| 2026-06-20 | F | Nederland - Zweden | 1-0 | 1-1 | 2-1 | 1-1 |
| 2026-06-20 | E | Duitsland - Ivoorkust | 1-0 | 2-1 | 2-1 | 2-0 |
| 2026-06-21 | E | Ecuador - Curaçao | 1-0 | 2-0 | 2-0 | 3-0 |
| 2026-06-21 | H | Spanje - Saudi-Arabië | 2-0 | 2-0 | 2-0 | 3-1 |
| 2026-06-21 | G | België - Iran | 1-0 | 2-1 | 2-1 | 2-0 |
| 2026-06-22 | H | Uruguay - Kaapverdië | 1-0 | 2-0 | 2-0 | 2-0 |
| 2026-06-22 | G | Nieuw-Zeeland - Egypte | 0-1 | 1-1 | 0-2 | 0-2 |
| 2026-06-22 | J | Argentinië - Oostenrijk | 1-0 | 2-1 | 2-1 | 2-1 |
| 2026-06-22 | I | Frankrijk - Irak | 2-0 | 3-0 | 3-0 | 4-0 |
| 2026-06-23 | I | Noorwegen - Senegal | 1-0 | 1-1 | 2-1 | 2-1 |
| 2026-06-23 | J | Jordanië - Algerije | 0-1 | 1-1 | 0-2 | 0-2 |
| 2026-06-23 | K | Portugal - Oezbekistan | 2-0 | 2-0 | 2-0 | 3-0 |
| 2026-06-23 | L | Engeland - Ghana | 1-0 | 2-0 | 2-0 | 3-0 |
| 2026-06-24 | L | Panama - Kroatië | 0-1 | 1-2 | 0-2 | 0-3 |
| 2026-06-24 | K | Colombia - DR Congo | 1-0 | 2-1 | 2-1 | 2-0 |
| 2026-06-24 | B | Zwitserland - Canada | 1-0 | 1-1 | 1-1 | 1-1 |
| 2026-06-24 | B | Bosnië-Herzegovina - Qatar | 1-0 | 2-1 | 2-0 | 1-1 |
| 2026-06-25 | C | Schotland - Brazilië | 0-1 | 1-2 | 0-2 | 0-2 |
| 2026-06-25 | C | Marokko - Haïti | 1-0 | 2-0 | 2-0 | 3-0 |
| 2026-06-25 | A | Tsjechië - Mexico | 0-1 | 1-2 | 1-2 | 1-2 |
| 2026-06-25 | A | Zuid-Afrika - Zuid-Korea | 0-1 | 1-1 | 1-2 | 1-2 |
| 2026-06-25 | E | Ecuador - Duitsland | 0-1 | 1-2 | 1-2 | 1-2 |
| 2026-06-25 | E | Curaçao - Ivoorkust | 0-1 | 0-2 | 0-2 | 0-3 |
| 2026-06-26 | F | Japan - Zweden | 1-0 | 1-1 | 1-1 | 1-2 |
| 2026-06-26 | F | Tunesië - Nederland | 0-1 | 0-2 | 0-2 | 0-3 |
| 2026-06-26 | D | Turkije - Verenigde Staten | 0-1 | 1-1 | 1-1 | 1-2 |
| 2026-06-26 | D | Paraguay - Australië | 1-0 | 1-1 | 1-1 | 1-2 |
| 2026-06-26 | I | Noorwegen - Frankrijk | 0-1 | 1-2 | 1-2 | 1-2 |
| 2026-06-26 | I | Senegal - Irak | 1-0 | 2-0 | 2-0 | 2-0 |
| 2026-06-27 | H | Kaapverdië - Saudi-Arabië | 0-1 | 1-1 | 1-1 | 1-1 |
| 2026-06-27 | H | Uruguay - Spanje | 0-1 | 1-1 | 1-2 | 1-2 |
| 2026-06-27 | G | Egypte - Iran | 1-0 | 1-1 | 1-1 | 1-1 |
| 2026-06-27 | G | Nieuw-Zeeland - België | 0-1 | 0-3 | 0-2 | 0-3 |
| 2026-06-27 | L | Panama - Engeland | 0-2 | 0-3 | 0-3 | 0-4 |
| 2026-06-27 | L | Kroatië - Ghana | 1-0 | 2-1 | 2-1 | 2-1 |
| 2026-06-28 | K | Colombia - Portugal | 0-1 | 1-1 | 1-1 | 1-1 |
| 2026-06-28 | K | DR Congo - Oezbekistan | 1-0 | 1-1 | 2-1 | 1-1 |
| 2026-06-28 | J | Algerije - Oostenrijk | 0-1 | 1-1 | 1-1 | 1-1 |
| 2026-06-28 | J | Jordanië - Argentinië | 0-2 | 0-3 | 0-3 | 0-3 |
Vier redenen waarom AI-chatbots hier slecht in zijn
1. Geen actuele bookmaker-odds
Bookmakers verwerken wereldwijd miljarden euro's per WK-wedstrijd en updaten hun odds bij elke blessure of selectie-aankondiging. Dat is de meest geïnformeerde inschatting die er bestaat. Een chatbot is getraind op tekst van maanden of jaren geleden en ziet die markten simpelweg niet.
2. Puntentelling in de prompt, maar niet doorgerekend
In stap 2 stond de puntentelling van Voetbalpoules.nl letterlijk in de prompt (10 punten voor exacte score, 7 voor juiste winnaar plus 1 team goed, 5 voor alleen de winnaar). Toch koos Gemini structureel voor scores als 4-0 en 5-0, scores die op een WK zelden voorkomen en weinig punten opleveren. Een conservatieve 1-0 had statistisch meer opgeleverd. Een chatbot ziet de regels, maar rekent ze niet door.
3. Hoge zekerheid bij gebrekkige kennis
De drie chatbots presenteerden hun voorspellingen met dezelfde stelligheid. Geen waarschuwing dat ze het wel eens bij het verkeerde eind kunnen hebben, geen kanspercentage. Voor een poule waar elke punt telt, is dat een serieus probleem.
4. Interne inconsistentie
ChatGPT gaf in stap 1 voor zes wedstrijden binnen één antwoord twee voorspellingen (vijf met een afwijkende uitslag). Het bekendste voorbeeld: Ivoorkust-Curaçao eerst 2-0, vier regels later 1-0. Het model herkent niet eens dat het zichzelf tegenspreekt, en miste daardoor zes andere wedstrijden volledig.
"LLMs hebben geen weet van de betekenis van woorden, dus ook niet hoe je tot een voorspelling komt. LLMs functioneren op basis van de correlatie tussen woorden, dus ze kunnen wel woorden aan elkaar plakken die redelijk overkomen, maar ze doen dat niet gebaseerd op inzicht."
Wat ik in plaats daarvan doe
Pak de actuele bookmaker-odds voor een wedstrijd. Zet die om naar kansen per uitslag via een Poisson-verdeling. Reken voor elke denkbare voorspelling uit hoeveel punten die je verwacht oplevert, gegeven de puntentelling van jouw poule. Het hele toernooi 10.000 keer doorrekenen via Monte Carlo. De voorspelling met de hoogste verwachte opbrengst wint: niet de meest waarschijnlijke score, maar de score die in deze specifieke puntentelling het slimst is.
Dat is wat Pouletips automatisch doet voor alle 104 WK-wedstrijden, per poule-platform apart. Niet omdat AI dom is, maar omdat het de verkeerde gereedschappen heeft voor dit specifieke klusje.
Live tijdens het WK: AI tegen rekenmodel
Vanaf 11 juni 2026 tot het einde van het toernooi houd ik op deze pagina de stand bij. Per speeldag de behaalde punten van Pouletips, ChatGPT, Claude en Gemini, volgens de Voetbalpoules.nl-puntentelling.
Of een rekenmodel het echt beter doet dan drie AI-chatbots, blijkt niet uit een backtest van twaalf jaar geleden. Wel uit dit toernooi, transparant en in real-time.
Live tracker activeert bij aftrap van WK 2026.
Methodologie en reproduceerbaarheid
Datum experiment: 1 mei 2026.
Modellen: ChatGPT (GPT-5.3 Instant), Claude (Opus 4.7 Medium), Gemini (3.1 Pro). Per chatbot een verse conversatie, identieke prompt.
Twee stappen:
- Open prompt: "Voorspel alle 72 groepswedstrijden van WK 2026, rekening houdend met de puntentelling van Voetbalpoules.nl." Geen loting meegegeven, om te testen wat een gewone gebruiker terugkrijgt. Resultaat: Claude en Gemini gaven alle 72 wedstrijden, ChatGPT miste er zes; daardoor zijn 66 wedstrijden tussen alle drie chatbots vergelijkbaar. ChatGPT voorspelde daarnaast zes wedstrijden binnen één antwoord twee keer, vijf daarvan met een afwijkende uitslag.
- Met loting: de officiële FIFA-loting, de wedstrijdvolgorde én de puntentelling letterlijk in de prompt geplakt. De wedstrijd-van-de-dag-bonus (spelers wijzen vooraf per speeldag één wedstrijd aan waarop de punten dubbel tellen) is als strategie-element nog niet meegenomen. Resultaat: alle 72 wedstrijden vergelijkbaar, maar nog steeds 18 keer een andere winnaar.
Pouletips-voorspellingen: Poisson-model op basis van gemiddelde bookmaker-odds, het hele toernooi 10.000 keer doorgerekend via Monte Carlo, omgezet naar verwachte puntenopbrengst per uitslag volgens de Voetbalpoules-puntentelling. Live op pouletips.nl/wk-2026/voetbalpoules/.
Bron-data: de complete tabel met alle 72 wedstrijden per voorspeller staat in de Excel hierboven. Prompts en ruwe chatbot-antwoorden zijn op aanvraag beschikbaar via info@pouletips.nl.