Alibaba spouští kompaktní modely Qwen 3.5, které běží přímo na notebookech a převyšují ekvivalenty od OpenAI.

Alibaba spouští kompaktní modely Qwen 3.5, které běží přímo na notebookech a převyšují ekvivalenty od OpenAI.

10 hardware

Alibaba Qwen 3.5 – nová série kompaktních AI modelů

V rámci svého oddělení umělé inteligence Alibaba oznámila uvedení řady modelů Qwen 3.5, které slibují „malý rozměr + vysokou účinnost“. Ve srovnání s americkými ekvivalenty ukazují lepší přesnost při menším objemu paměti.

ModelVelikostKlíčové vlastnosti
Qwen 3.5‑0.8B0,8 mld parametrů„Miniaturní“ a „rychlý“, určený pro prototypy a mobilní zařízení s omezenou autonomií
Qwen 3.5‑2B2 mldPodobně jako 0.8B, ale mírně výkonnější
Qwen 3.5‑4B4 mldMultimodální, kontextové okno 262 144 tokenů; vhodný pro lehké agentní řešení
Qwen 3.5‑9B9 mldSchopen rozumět a překonávat OpenAI gpt‑oss‑120B (13,5× více parametrů) a dosahuje úrovně postgraduálního logického myšlení

Všechny modely jsou dostupné pod licencí Apache 2.0, což umožňuje jejich použití v komerčních projektech a další trénink podle potřeby.

Co je nového v architektuře?
Alibaba se vzdala klasických Transformerů a použila hybridní schéma:

* Gated Delta Networks (GDN) – zajišťují vysokou propustnost a nízké zpoždění.
* Mixture‑of‑Experts (MoE) – řeší problém omezené paměti typické pro malé modely.

Díky tomu může Qwen 3.5 pracovat s multimodálními tokeny ihned, místo aby „přidával“ generátory obrázků k textovým modelům, jak to dělaly předchozí generace. V důsledku toho verze 4B a 9B dokážou rozpoznávat UI prvky a počítat objekty ve videu.

Testy a výsledky
| Benchmark | Qwen 3.5‑9B |
|-----------|-------------|
| MMU‑Pro (vizuální) | 70,1 % – překonala Google Gemini 2.5 Flash‑Lite (59,7) a specializovanou Qwen 3‑VL‑30B‑A3B (63,0) |
| Logické myšlení | 81,7 % – více než OpenAI gpt‑oss‑120B (80,1), i když má poslední 10× víc parametrů |
| HMMT Feb 2025 (matematika) | 83,2 % (9B), 74,0 % (4B) – prokázalo, že k složitým úkolům přesných věd nepotřebuje gigantické cloudové zdroje |
| OmniDocBench v1.58 | 87,7 % – lídr mezi všemi modely |
| MMMLU (multijazyčnost) | 81,2 % – překonala gpt‑oss‑120B (78,2 %) |

Proč je to důležité?
Příchod Qwen 3.5 souběhl se zvyšujícím se požadavkem na autonomní AI agenty. Moderní uživatel vyžaduje nejen chatboty, ale i systémy, které:

1. Myslí – rozumí a uvažuje nad úkoly.
2. Vidí – zpracovává obrázky, videa a UI prvky.
3. Dělají – umí používat nástroje (vyplňovat formuláře, třídit soubory).

Vzhledem k tomu, že velké modely (tři‑pětikratní miliarda parametrů) jsou drahé na provoz, Qwen 3.5 je ekonomičtější řešení. Modely lze spouštět lokálně bez připojení k cloudu a API, a trénink s posilováním jim umožňuje přijímat „lidské rozhodnutí“ – například uspořádat pracovní plochu nebo vytvářet kód podle videozáznamu.

Praktické využití
* Mobilní zařízení – 0,8 mld parametrů snadno zapadne do smartphonu a zajišťuje autonomní provoz.
* Pracovní stanice – 9 mld parametrů poskytuje kompletní sadu funkcí agentního AI bez cloudu.
* Agentura rozhraní – díky „připnutí na úroveň pixelů“ mohou modely procházet UI, vyplňovat formuláře a třídit soubory, vykonávat jednoduché příkazy v přirozeném jazyce s přesností kolem 90 %.

Tímto Alibaba Qwen 3.5 otevírá cestu k dostupnějším, flexibilnějším a výkonnějším AI agentům, kteří mohou pracovat jak v cloudu, tak lokálně, a splňovat rostoucí požadavky moderního uživatele.

Komentáře (0)

Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.

Zatím žádné komentáře. Zanechte komentář a podělte se o svůj názor!

Chcete-li zanechat komentář, přihlaste se.

Přihlaste se pro komentování