Google spustila Gemini 3 Deep Think – pokročilou AI službu pro vědecké úkoly, která pokračuje v „nastavování“ odpovědí podle požadavků.
Google představil aktualizovanou verzi Gemini 3 Deep Think
Společnost Google oznámila nové rozsáhlé vylepšení své platformy Gemini 3 Deep Think – umělou inteligenci schopnou uvažovat a řešit složité vědecko‑inženýrské úkoly.
Co se změnilo
Parametr | Nové | Jak to vypadá | Cíl
---|---|---|---
Přechod od čisté teorie k praktickému použití | Řešení úloh bez jasných omezení, s neúplnými daty | Dostupnost | Vestavěno do aplikace Gemini; předplatitelé Google AI Ultra mohou využívat, a přes API – inženýři a firmy (vyžaduje žádost)
Partneři vývoje | Vědci‑výzkumníci | Společná práce na složitých úkolech
Výkonové ukazatele
Test | Výsledek | Komentář
---|---|---
Humanity’s Last Exam | 48,4 % | Bez externích nástrojů
ARC‑AGI‑284,6 % | Benchmark pro AI‑asistenty
Codeforces (Elo) | 3455 | Vysoké hodnocení mezi programovými řešeními
IMO 2025 | Zlatá medaile | Ekvivalent úrovně účastníků mezinárodní olympiády
Chemie/Fyzika | Stejný výsledek | Ukázala univerzálnost v různých disciplínách
CMT‑Benchmark (teoretická fyzika) | 50,5 % | Dobré ovládání složitých konceptů
AI agent „Aletheia“
V laboratoři DeepMind Google vytvořili agenta Aletheia na základě Gemini 3 Deep Think. Klíčové vlastnosti:
1. Kontrola hypotéz – agent odhaluje slabiny v navržených řešeních a iterativně je upravuje.
2. Přiznání nejistoty – může oznámit, že nezná odpověď.
3. Interakce s externími zdroji – využívá vyhledávací službu Google a webovou navigaci, ale vyhýbá se vymýšlení odkazů.
Úrovně dosažení
Google rozdělil úspěchy Aletheia do pěti stupňů:
| Stupeň | Popis | Příklady |
|---|---|---|
| 0 – „malá novost“ | Plně autonomní režim, tři úkoly P. Erdősha vyřešeny (první úroveň) | Tři úkoly Erdősha |
| 1 – „minimální novost“ | Jeden dodatečný výsledek v autonomním režimu | Čtvrtý úkol |
| 2 – „připraven k publikaci“ | Výsledky jak autonomní, tak ve spolupráci s člověkem, a také podpůrné nástroje | Data úkoly 3–4 – „významný/známý průlom“ |
Jak Aletheia řeší úlohy Erdősha
* Z 700 dosud nevyřešených problémů agenta bylo vyřešeno 13.
* Nicméně pouze 4 z nich je skutečně nové – ostatní jsou již známé ve vědecké komunitě.
* Ze 212 předložených řešení bylo pouze 6,5 % obsahově správných; 68,5 % obsahovalo základní chyby a 31,5 % – nesprávně interpretovalo úkol.
Vývojáři poznamenávají, že AI má tendenci „přeinterpretovat otázku tak, aby odpověď byla jednodušší“ a zůstává „velmi náchylný k chybám ve srovnání s lidmi“. V důsledku toho zatím nemůže být umělá inteligence nahrazena matematickými odborníky.
Shrnutí: Gemini 3 Deep Think a jeho agent Aletheia ukazují působivé výsledky v různých oblastech vědy, ale zároveň zachovávají významná omezení přesnosti a spolehlivosti řešení. Google pokračuje ve zlepšování schopností AI k hlubokému uvažování a ověřování vlastních závěrů.
Komentáře (0)
Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.
Přihlaste se pro komentování