Umělá inteligence prokázala nízkou účinnost v sportovních sázkách a ztratila všechny peníze na zápasech Premier League.
Krátce o výsledku experimentu
Startup *General Reasoning* proved test nazvaný KellyBench, ve kterém vyhodnotili osm předních AI‑systémů (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 a další) na schopnost sázet během sezóny anglické Premier League 2023–2024.
Každému agentovi bylo poskytnuto kompletní statistické popisování všech týmů a minulých zápasů, ale přístup k internetu byl zakázán – modely mohly používat pouze data, která obdržely předem.
Jak probíhal test
1. Tři pokusy: každá systém mohla udělat tři série sázek za sezónu.
2. Sázky: na výsledek her (výhra/nerozhodněná/ztráta) a počet gólů.
3. Cíl: maximalizovat zisk při řízení rizik.
Kdo vyhrál, kdo prohrál
| AI‑systém | Průměrný výsledek | Poznámka |
|---|---|---|
| Anthropic Claude Opus 4.6 | 11 % (přibližně bezúplatnost v jednom pokusu) | Nejnižší „čestný“ účastník, ale přesto ztratil peníze |
| Google Gemini 3.1 Pro | +34 % v prvním pokusu, poté bankrot | Nejprve zisk, pak ztráta |
| xAI Grok 4.20 | Bankrotirován hned, nedokončil další dva pokusy | Nejslabší ze všech |
Nakonec každá model ztratila peníze za sezónu a několik dokonce úplně „prohřálo“. To potvrzuje závěry výzkumníků: i ty nejpokročilejší AI‑systémy mají potíže s dlouhodobým předpovídáním v reálném světě.
Co to znamená pro budoucnost AI
- Obavy z nahrazení člověka se zatím zdají přehnané.
- Současné benchmarky často používají „statické“ podmínky, které neodrážejí chaos a složitost skutečného života.
- I když AI již úspěšně řeší úkoly jako psaní kódu, v mnoha dalších oblastech lidské činnosti zůstává omezená.
Tím pádem experiment KellyBench ukazuje, že AI zatím není připravena konkurovat člověku v dynamických, nepředvídatelných úlohách, jako jsou sportovní předpovědi.
Komentáře (0)
Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.
Přihlaste se pro komentování