Google oznámila Gemini 3.1 Flash‑Lite jako „nejrychlejší a nejúspornější představitel své řady“.
Google představuje Gemini 3.1 Flash‑Lite – úsporný a rychlý model umělé inteligence
Společnost Google oznámila spuštění nové verze modelu Gemini 3.1 Flash‑Lite, který je prezentován jako nejpřístupnější v řadě Gemini z hlediska nákladů i výkonu.
* Optimalizace pro velká data – algoritmus je speciálně nastaven na efektivní zpracování rozsáhlých datových sad.
* Náklady na použití – 0,25 $ za milion vstupních tokenů a 1,50 $ za milion výstupních tokenů.
Předběžná verze je již k dispozici:
- pro vývojáře prostřednictvím Gemini API v Google AI Studio;
- pro firemní klienty – v Vertex AI.
Rychlost a kvalita
UkazatelGemini 3.1 Flash‑LiteGemini 2.5 FlashČas do prvního tokenu2,5‑krát rychlejší—Výstupní rychlost o 45 % vyšší—Kvalita odpovědi podobná/vyšší—
Nízká latence činí model zvláště atraktivním pro aplikace v reálném čase: od chatbotů po interaktivní rozhraní, kde reakce musí být okamžitá.
Výsledky testů
* ELO‑rating na Arena.ai – 1432 bodů.
* GPQA Diamond – 86,9 %.
* MMMU Pro – 76,8 %.
V těchto zkouškách Gemini 3.1 Flash‑Lite překonal modely stejné úrovně a dokonce některé větší předchůdce (např. Gemini 2.5 Flash) v rozumování a multimodálním zpracování.
Flexibilita a škálovatelnost
Vývojáři mohou přizpůsobit hloubku modelu svým potřebám – důležitý faktor pro vysokofrekvenční pracovní zatížení.
Algoritmus je optimalizován pro:
- překlad velkých objemů textu;
- moderování obsahu, kde cena má nejvyšší prioritu.
Je vhodný i pro generování uživatelských rozhraní (UI), dashboardů, modelování a také pro výzkum na základě složitých dotazů.
Celkově: Gemini 3.1 Flash‑Lite kombinuje úspornost, rychlost a spolehlivou kvalitu, což z něj činí cenný nástroj jak pro jednotlivé vývojáře, tak pro firemní klienty hledající AI‑řešení s nízkou latencí a vysokým výkonem.
Komentáře (0)
Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.
Přihlaste se pro komentování