Nvidia představila Nemotron 3 Super 120B – otevřený LLM s pětinásobným nárůstem rychlosti pro AI agenty.
Nový model od Nvidia – Nemotron 3 Super
Nvidia oznámila spuštění Nemotron 3 Super, otevřeného AI‑modelu typu Mixture‑of‑Experts (MoE).
* 120 miliard celkových parametrů, z nichž 12 miliard aktivních.
* Určen pro agentní AI – systémy, kde se několik „agentů“ navzájem a s vnějším světem vzájemně ovlivňují.
Architektura
Model používá hybridní přístup Mamba‑Transformer (kombinace vrstev Mamba a prvků Transformer).
V Nemotron 3 Super je poprvé použita paradigma LatentMoE, vrstvy Multi‑Token Prediction a předběžné trénování podle protokolu NVFP4. Podle Nvidia tento stack zvyšuje přesnost a urychluje inference.
Výkon
* Propustnost – až 5× rychlejší než předchozí verze Nemotron Super.
* Přesnost – až 2× vyšší.
* Podpora kontextového okna o velikosti 1 milion tokenů umožňuje agentům uchovávat kompletní stav pracovního procesu, čímž se snižuje riziko odchýlení od cíle.
Praktické využití
Nemotron 3 Super je vhodný pro složité úkoly v rámci multi‑agentních systémů:
| Úkol | Příklad použití |
|---|---|
| Generování a ladění kódu bez rozdělování na dokumenty | Automatické psaní a ověřování velkých programů |
| Finanční analýza | Začlenění tisíců stránek zpráv do paměti modelu |
Trénink
Model byl trénován na syntetických datech vytvořených pomocí logických modelů myšlení. Nvidia zveřejňuje kompletní metodologii:
* více než 10 trilionů tokenů před a po tréninku;
* 15 prostředí pro posilovací učení;
* recepty pro hodnocení.
Výzkumníci mohou využít platformu Nvidia NeMo k dalšímu přizpůsobení nebo vytvoření vlastních verzí modelu.
Technické detaily
* Podpora NVFP4 na architektuře Nvidia Blackwell.
* Snížení požadavků na paměť a čtyřnásobné urychlení výstupu oproti FP8 na Nvidia Hopper bez ztráty přesnosti.
Dostupnost
Model je již k dispozici:
* Přes build.nvidia.com, Hugging Face, OpenRouter a Perplexity.
* Cloudoví partneři: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* V podobě mikroservisu Nvidia NIM, který umožňuje nasadit model lokálně nebo v cloudu.
Nemotron 3 Super otevírá nové možnosti pro agentní AI, kombinující vysokou přesnost, škálovatelnost a flexibilitu přizpůsobení.
Komentáře (0)
Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.
Přihlaste se pro komentování