Nvidia se připravuje na boj o inference, vytváří čip založený na technologiích Groq pro OpenAI a AI agenty.
Nový čip Nvidia – krok k rychlejším AI aplikacím
Nvidia plánuje v březnu představit nový procesor, vyvinutý speciálně pro urychlení inferencí (výpočty již naučených modelů) a zaměřený na klienty jako OpenAI. Jedná se o změnu směru společnosti, která dříve byla převážně soustředěna na trénink AI systémů.
Co přesně přijde
- Nová platforma bude představena na konferenci vývojářů GTC (Graphics Technology Conference).
- Do jádra platformy vstoupí čip od startupu Groq – jednoho z nejrychlejších řešení pro inferenci.
- Platforma má konkurovat vlastním akcelerátorům Google a Amazon, které již dosáhly významných úspěchů.
Proč je to důležité
S rostoucí popularitou „web‑kódování“ (generování kódu AI z textu) roste poptávka po rychlé a energeticky účinné infrastruktuře.
Pro OpenAI se nový procesor stává klíčovým faktorem:
- V lednu firma uzavřela dohodu s Cerebras o čipu zaměřeném na inferenci, který podle jejich odhadu je rychlejší než konkurenti.
- Předtím OpenAI oznámila velkou transakci s Nvidia, v rámci které získala „dedikované kapacity pro inferenci“ a investovala 30 milionů dolarů od „zeleného“ výrobce.
Konkurenceschopné prostředí
Společnost | Produkt | Orientace
Nvidia | GPU rodiny Hopper, Blackwell, Rubin | Trénink a inferenční
Google | TPU | Inferenční
Amazon | Trainium | Inferenční
Cerebras | Specializovaný čip | Inferenční
Groq | Čipy s „jazykovými zpracovatelskými bloky“ | Inferenční
Nvidia drží více než 90 % podíl na trhu GPU, ale její čipy jsou často považovány za drahé a energeticky náročné pro úkoly inferencí. To přitahuje pozornost společností hledajících alternativu.
Klíčové aplikace
- Generování kódu: služby Claude Code (Anthropic) a Codex (OpenAI) používají cloudové infrastruktury Amazonu a Googlu, ale Codex plánuje přejít na novou platformu Nvidia.
- Cílení reklamy: Meta spolupracuje s Nvidia na inferenci AI systémů, kde centrální procesory se ukazují jako nejefektivnější.
Závěr
Nvidia nejen rozšiřuje svou produktovou řadu, ale vstupuje do přímé konkurence s průmyslovými giganty. Nový čip integrováný se startupem Groq může stát rozhodujícím faktorem pro společnosti usilující o rychlejší a úspornější zpracování AI modelů.
Komentáře (0)
Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.
Přihlaste se pro komentování