Google spustila Gemini 3 Deep Think – pokročilou AI službu pro vědecké úkoly, která pokračuje v „nastavování“ odpovědí podle požadavků.

Google představil aktualizovanou verzi Gemini 3 Deep Think

Společnost Google oznámila nové rozsáhlé vylepšení své platformy Gemini 3 Deep Think – umělou inteligenci schopnou uvažovat a řešit složité vědecko‑inženýrské úkoly.

Co se změnilo
Parametr | Nové | Jak to vypadá | Cíl
---|---|---|---
Přechod od čisté teorie k praktickému použití | Řešení úloh bez jasných omezení, s neúplnými daty | Dostupnost | Vestavěno do aplikace Gemini; předplatitelé Google AI Ultra mohou využívat, a přes API – inženýři a firmy (vyžaduje žádost)
Partneři vývoje | Vědci‑výzkumníci | Společná práce na složitých úkolech

Výkonové ukazatele
Test | Výsledek | Komentář
---|---|---
Humanity’s Last Exam | 48,4 % | Bez externích nástrojů
ARC‑AGI‑284,6 % | Benchmark pro AI‑asistenty
Codeforces (Elo) | 3455 | Vysoké hodnocení mezi programovými řešeními
IMO 2025 | Zlatá medaile | Ekvivalent úrovně účastníků mezinárodní olympiády
Chemie/Fyzika | Stejný výsledek | Ukázala univerzálnost v různých disciplínách
CMT‑Benchmark (teoretická fyzika) | 50,5 % | Dobré ovládání složitých konceptů

AI agent „Aletheia“
V laboratoři DeepMind Google vytvořili agenta Aletheia na základě Gemini 3 Deep Think. Klíčové vlastnosti:

1. Kontrola hypotéz – agent odhaluje slabiny v navržených řešeních a iterativně je upravuje.
2. Přiznání nejistoty – může oznámit, že nezná odpověď.
3. Interakce s externími zdroji – využívá vyhledávací službu Google a webovou navigaci, ale vyhýbá se vymýšlení odkazů.

Úrovně dosažení
Google rozdělil úspěchy Aletheia do pěti stupňů:

Stupeň	Popis	Příklady
0 – „malá novost“	Plně autonomní režim, tři úkoly P. Erdősha vyřešeny (první úroveň)	Tři úkoly Erdősha
1 – „minimální novost“	Jeden dodatečný výsledek v autonomním režimu	Čtvrtý úkol
2 – „připraven k publikaci“	Výsledky jak autonomní, tak ve spolupráci s člověkem, a také podpůrné nástroje	Data úkoly 3–4 – „významný/známý průlom“

Jak Aletheia řeší úlohy Erdősha
* Z 700 dosud nevyřešených problémů agenta bylo vyřešeno 13.
* Nicméně pouze 4 z nich je skutečně nové – ostatní jsou již známé ve vědecké komunitě.
* Ze 212 předložených řešení bylo pouze 6,5 % obsahově správných; 68,5 % obsahovalo základní chyby a 31,5 % – nesprávně interpretovalo úkol.

Vývojáři poznamenávají, že AI má tendenci „přeinterpretovat otázku tak, aby odpověď byla jednodušší“ a zůstává „velmi náchylný k chybám ve srovnání s lidmi“. V důsledku toho zatím nemůže být umělá inteligence nahrazena matematickými odborníky.

Shrnutí: Gemini 3 Deep Think a jeho agent Aletheia ukazují působivé výsledky v různých oblastech vědy, ale zároveň zachovávají významná omezení přesnosti a spolehlivosti řešení. Google pokračuje ve zlepšování schopností AI k hlubokému uvažování a ověřování vlastních závěrů.

Google spustila Gemini 3 Deep Think – pokročilou AI službu pro vědecké úkoly, která pokračuje v „nastavování“ odpovědí podle požadavků.

Related news

Google Gemini získalo 750 milionů měsíčních aktivních uživatelů a zanechalo ChatGPT jen na malé vzdálenosti od lídra.

Nothing představila beta-verzi Essential Apps – platformu pro tvorbu miniaplikací pomocí umělé inteligence

Microsoft vysvětlila, proč jsou zablokovány účty VeraCrypt a dalších otevřených služeb – kvůli nedbalosti jejich tvůrců

Aplikace Meta✴ AI obsadila páté místo v App Store po spuštění Muse Spark

Komentáře (0)

Přihlaste se pro komentování

Google spustila Gemini 3 Deep Think – pokročilou AI službu pro vědecké úkoly, která pokračuje v „nastavování“ odpovědí podle požadavků.

Related news

Google Gemini získalo 750 milionů měsíčních aktivních uživatelů a zanechalo ChatGPT jen na malé vzdálenosti od lídra.

Nothing představila beta-verzi Essential Apps – platformu pro tvorbu miniaplikací pomocí umělé inteligence

Microsoft vysvětlila, proč jsou zablokovány účty VeraCrypt a dalších otevřených služeb – kvůli nedbalosti jejich tvůrců

Aplikace Meta✴ AI obsadila páté místo v App Store po spuštění Muse Spark

Přihlaste se pro komentování

Google spustila Gemini 3 Deep Think – pokročilou AI službu pro vědecké úkoly, která pokračuje v „nastavování“ odpovědí podle požadavků.

Google Gemini získalo 750 milionů měsíčních aktivních uživatelů a zanechalo ChatGPT jen na malé vzdálenosti od lídra.

Nothing představila beta-verzi Essential Apps – platformu pro tvorbu miniaplikací pomocí umělé inteligence

Aplikace Meta✴ AI obsadila páté místo v App Store po spuštění Muse Spark