Nvidia představila Nemotron 3 Super 120B – otevřený LLM s pětinásobným nárůstem rychlosti pro AI agenty.

Nvidia představila Nemotron 3 Super 120B – otevřený LLM s pětinásobným nárůstem rychlosti pro AI agenty.

8 hardware

Nový model od Nvidia – Nemotron 3 Super

Nvidia oznámila spuštění Nemotron 3 Super, otevřeného AI‑modelu typu Mixture‑of‑Experts (MoE).

* 120 miliard celkových parametrů, z nichž 12 miliard aktivních.
* Určen pro agentní AI – systémy, kde se několik „agentů“ navzájem a s vnějším světem vzájemně ovlivňují.

Architektura
Model používá hybridní přístup Mamba‑Transformer (kombinace vrstev Mamba a prvků Transformer).

V Nemotron 3 Super je poprvé použita paradigma LatentMoE, vrstvy Multi‑Token Prediction a předběžné trénování podle protokolu NVFP4. Podle Nvidia tento stack zvyšuje přesnost a urychluje inference.

Výkon
* Propustnost – až 5× rychlejší než předchozí verze Nemotron Super.
* Přesnost – až 2× vyšší.
* Podpora kontextového okna o velikosti 1 milion tokenů umožňuje agentům uchovávat kompletní stav pracovního procesu, čímž se snižuje riziko odchýlení od cíle.

Praktické využití
Nemotron 3 Super je vhodný pro složité úkoly v rámci multi‑agentních systémů:

ÚkolPříklad použití
Generování a ladění kódu bez rozdělování na dokumentyAutomatické psaní a ověřování velkých programů
Finanční analýzaZačlenění tisíců stránek zpráv do paměti modelu

Trénink
Model byl trénován na syntetických datech vytvořených pomocí logických modelů myšlení. Nvidia zveřejňuje kompletní metodologii:

* více než 10 trilionů tokenů před a po tréninku;
* 15 prostředí pro posilovací učení;
* recepty pro hodnocení.

Výzkumníci mohou využít platformu Nvidia NeMo k dalšímu přizpůsobení nebo vytvoření vlastních verzí modelu.

Technické detaily
* Podpora NVFP4 na architektuře Nvidia Blackwell.
* Snížení požadavků na paměť a čtyřnásobné urychlení výstupu oproti FP8 na Nvidia Hopper bez ztráty přesnosti.

Dostupnost
Model je již k dispozici:

* Přes build.nvidia.com, Hugging Face, OpenRouter a Perplexity.
* Cloudoví partneři: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* V podobě mikroservisu Nvidia NIM, který umožňuje nasadit model lokálně nebo v cloudu.

Nemotron 3 Super otevírá nové možnosti pro agentní AI, kombinující vysokou přesnost, škálovatelnost a flexibilitu přizpůsobení.

Komentáře (0)

Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.

Zatím žádné komentáře. Zanechte komentář a podělte se o svůj názor!

Chcete-li zanechat komentář, přihlaste se.

Přihlaste se pro komentování