Alibaba spouští kompaktní modely Qwen 3.5, které běží přímo na notebookech a převyšují ekvivalenty od OpenAI.
Alibaba Qwen 3.5 – nová série kompaktních AI modelů
V rámci svého oddělení umělé inteligence Alibaba oznámila uvedení řady modelů Qwen 3.5, které slibují „malý rozměr + vysokou účinnost“. Ve srovnání s americkými ekvivalenty ukazují lepší přesnost při menším objemu paměti.
| Model | Velikost | Klíčové vlastnosti |
|---|---|---|
| Qwen 3.5‑0.8B | 0,8 mld parametrů | „Miniaturní“ a „rychlý“, určený pro prototypy a mobilní zařízení s omezenou autonomií |
| Qwen 3.5‑2B | 2 mld | Podobně jako 0.8B, ale mírně výkonnější |
| Qwen 3.5‑4B | 4 mld | Multimodální, kontextové okno 262 144 tokenů; vhodný pro lehké agentní řešení |
| Qwen 3.5‑9B | 9 mld | Schopen rozumět a překonávat OpenAI gpt‑oss‑120B (13,5× více parametrů) a dosahuje úrovně postgraduálního logického myšlení |
Všechny modely jsou dostupné pod licencí Apache 2.0, což umožňuje jejich použití v komerčních projektech a další trénink podle potřeby.
Co je nového v architektuře?
Alibaba se vzdala klasických Transformerů a použila hybridní schéma:
* Gated Delta Networks (GDN) – zajišťují vysokou propustnost a nízké zpoždění.
* Mixture‑of‑Experts (MoE) – řeší problém omezené paměti typické pro malé modely.
Díky tomu může Qwen 3.5 pracovat s multimodálními tokeny ihned, místo aby „přidával“ generátory obrázků k textovým modelům, jak to dělaly předchozí generace. V důsledku toho verze 4B a 9B dokážou rozpoznávat UI prvky a počítat objekty ve videu.
Testy a výsledky
| Benchmark | Qwen 3.5‑9B |
|-----------|-------------|
| MMU‑Pro (vizuální) | 70,1 % – překonala Google Gemini 2.5 Flash‑Lite (59,7) a specializovanou Qwen 3‑VL‑30B‑A3B (63,0) |
| Logické myšlení | 81,7 % – více než OpenAI gpt‑oss‑120B (80,1), i když má poslední 10× víc parametrů |
| HMMT Feb 2025 (matematika) | 83,2 % (9B), 74,0 % (4B) – prokázalo, že k složitým úkolům přesných věd nepotřebuje gigantické cloudové zdroje |
| OmniDocBench v1.58 | 87,7 % – lídr mezi všemi modely |
| MMMLU (multijazyčnost) | 81,2 % – překonala gpt‑oss‑120B (78,2 %) |
Proč je to důležité?
Příchod Qwen 3.5 souběhl se zvyšujícím se požadavkem na autonomní AI agenty. Moderní uživatel vyžaduje nejen chatboty, ale i systémy, které:
1. Myslí – rozumí a uvažuje nad úkoly.
2. Vidí – zpracovává obrázky, videa a UI prvky.
3. Dělají – umí používat nástroje (vyplňovat formuláře, třídit soubory).
Vzhledem k tomu, že velké modely (tři‑pětikratní miliarda parametrů) jsou drahé na provoz, Qwen 3.5 je ekonomičtější řešení. Modely lze spouštět lokálně bez připojení k cloudu a API, a trénink s posilováním jim umožňuje přijímat „lidské rozhodnutí“ – například uspořádat pracovní plochu nebo vytvářet kód podle videozáznamu.
Praktické využití
* Mobilní zařízení – 0,8 mld parametrů snadno zapadne do smartphonu a zajišťuje autonomní provoz.
* Pracovní stanice – 9 mld parametrů poskytuje kompletní sadu funkcí agentního AI bez cloudu.
* Agentura rozhraní – díky „připnutí na úroveň pixelů“ mohou modely procházet UI, vyplňovat formuláře a třídit soubory, vykonávat jednoduché příkazy v přirozeném jazyce s přesností kolem 90 %.
Tímto Alibaba Qwen 3.5 otevírá cestu k dostupnějším, flexibilnějším a výkonnějším AI agentům, kteří mohou pracovat jak v cloudu, tak lokálně, a splňovat rostoucí požadavky moderního uživatele.
Komentáře (0)
Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.
Přihlaste se pro komentování