Komplex Anthropic Claude z 16 AI‑agentů samostatně vytvořil překladač C.

Komplex Anthropic Claude z 16 AI‑agentů samostatně vytvořil překladač C.

9 software

Krátká verze

V rámci experimentu společnost Anthropic shromáždila skupinu 16 autonomních agentů umělé inteligence, kteří společně od nuly vytvořili překladač jazyka C v Rustu. Výsledek – „čistá“ implementace, která umí sestavit jádro Linux 6.19 a kompilovat projekty jako PostgreSQL, SQLite, Redis, FFmpeg a QEMU, ale zůstává značně za GCC co do kvality a efektivity.

Jak to bylo provedeno
EtapCo se staloPříprava16 instancí modelu Claude Opus 4.6 běží v samostatných Docker‑kontainerech bez přístupu k internetu. Každý z nich klonuje společný Git repozitář a dostává úkoly prostřednictvím lock‑souborů.Samostatné plánováníŽádný centrální koordinátor: každý agent si sám určuje, jakou „zjevnou“ část práce provést dál. Při konfliktu sloučení kód automaticky sjednocen.VývojAgentům bylo svěřeno napsat překladač C úplně od nuly. Práce trvala 2 týdny a vyžadovala téměř 2000 sezení Claude Code.TestováníAby nedocházelo k „zabíjení“ kontextu modelu dlouhými dotazy, testy běží v režimu shrnutí (pouze několik řádků výstupu). Pro urychlení je přidán rychlý režim zpracování 1–10 % testů.

Konečný produkt
* Objem – asi 100 000 řádků Rust kódu.
* Funkčnost – může sestavit jádro Linux 6.19 na x86, ARM a RISC‑V; kompiluje PostgreSQL, SQLite, Redis, FFmpeg, QEMU; projde ~99 % testů GCC.
* Omezení – negeneruje 16bitový strojový kód (pro spuštění Linuxu je potřeba GCC), assembler a linker pracují s chybami, a výkon kódu je nižší než u GCC. Kvalita původního Rust kódu zanechává co říct ve srovnání s prací zkušeného programátora.

Co experiment stálo
UkazatelCenaTokeny Claude API~\$20 000Další náklady (trénink modelu, organizace projektu, testové sady)Nejsou zahrnuty v uvedené částce

Lekce a závěry
1. Omezující autonomie – při růstu kódu na ~100 000 řádků agenti přestávají plně chápat projekt; to je pravděpodobně horní hranice pro samostatnou AI.
2. Potřeba podpory – pokusy o rozšíření funkčnosti často lámaly již fungující části kódu.
3. Důležitost vývojového prostředí – izolace od internetu a správná konfigurace testů se ukázala být kritická pro stabilní práci agentů.

Závěr
Experiment ukazuje, že moderní AI modely jsou schopny generovat složité softwarové systémy s minimálním dohledem. Nicméně zatím nemohou plně nahradit zkušené vývojáře: kvalita kódu, výkon a spolehlivost zůstávají nižší než u tradičních překladačů, a rozsah projektu je omezen na stovky tisíc řádků. Je to důležitý krok vpřed, ale ještě daleko od plně autonomního vývoje softwaru.

Komentáře (0)

Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.

Zatím žádné komentáře. Zanechte komentář a podělte se o svůj názor!

Chcete-li zanechat komentář, přihlaste se.

Přihlaste se pro komentování