Alibaba, ByteDance a Kuaishou spustili nové modely umělé inteligence – od robotiky po generování videoobsahu pro film.
Čínské IT‑giganty představují nové AI algoritmy
Kontext
Minulý týden byl americký trh umělé inteligence obsazen diskusemi o možnostech modelů Anthropic a Altruist, které ovlivňují programování a finanční služby. Současně čínské technologické giganty – Alibaba, ByteDance (majitel TikToku) a Kuaishou – představily vlastní AI modely, ukázaly růst výkonnosti v robotice a generaci videa. Tyto inovace potvrzují, že Čína nezůstává pozadu za západními konkurenty.
Pozadí
Oznámení o nových algoritmech přišly po nedávném prohlášení Demisa Hassabisa (zakladatele Google DeepMind), který poznamenal, že čínské AI modely zaostávají od západu o několik měsíců. Přesto nástroj představený letos může být přímým konkurentem produktům OpenAI (Sora), Nvidia a Google v oblasti generování videa a robotiky.
1. RynnBrain – „chytrý“ robotický asistent od Alibaby
* Co je to?
Výzkumná divize Alibaba DAMO oznámila model RynnBrain, určený k tomu, aby roboti lépe rozpoznávali okolní svět a interagovali s objekty.
* Demonstrace
V videu je ukázán robot se špičkami místo rukou, který sbírá pomeranče a ukládá je do košíku. Dále je demonstrováno vytahování mléka z lednice.
* Technické vlastnosti
- Rozsáhlé tréninkové data jsou nutná pro rozpoznávání běžných objektů.
- RynnBrain obsahuje vestavěné uvědomění času a prostoru: robot si pamatuje, kde a kdy se události odehrávají, sleduje postup úkolu a může pokračovat v práci na několika fázích.
- To zvyšuje spolehlivost a konzistenci v reálných podmínkách.
* Pozicování
Alibaba si klade za cíl vytvořit „základní inteligentní úroveň“ pro vestavěné systémy, konkurovat Nvidia a Google v robotice.
2. Seedance 2.0 – generování videa od ByteDance
* Funkce
Model umožňuje vytvářet realistické video klipy na základě jednoduchého textového popisu. Algoritmus může také zpracovávat existující videa a obrázky, kombinovat je do nových kompozic.
* Výhody
- Vylepšená ovladatelnost, rychlost a efektivita oproti předchozím verzím.
- Pozitivní recenze od výzkumnice Hugging Face Adiny Yakefu: model „překvapuje svou vyvážeností“ a poskytuje kvalitní výsledky již při prvním spuštění.
* Technické detaily
Seedance 2.0 kombinuje vizualizaci, zvukové doprovodení a režijní práci do jednoho proudu, vytváří dokončený produkt místo experimentálního prototypu.
* Problémy a omezení
- Kvůli otázkám soukromí ByteDance dočasně zakázala funkci generování lidského hlasu na základě nahraného foto.
- Toto rozhodnutí bylo učiněno poté, co blogger vyjádřil obavy ohledně neautorizovaného syntetického řeči.
3. Kling 3.0 – konkurent od Kuaishou
* Obecný popis
Model Kling 3.0 je určen pro generování videa a je prezentován jako přímý konkurent Seedance 2.0.
* Klíčová vylepšení
- Vylepšená konzistence (detaily nejsou ve textu uvedeny, ale předpokládá se výrazný nárůst kvality).
Závěry
- Čínské společnosti aktivně rozvíjejí AI algoritmy pro robotiku a generování videa, prezentují konkurenceschopná řešení.
- Alibaba se zaměřuje na „chytré“ roboty s uvědoměním času a prostoru.
- ByteDance nabízí pokročilý model tvorby video obsahu, ale čelí otázkám etiky syntézy hlasu.
- Kuaishou pokračuje v rozšiřování svého portfolia generativních modelů, konkuruje ByteDance.
Tyto inovace potvrzují, že Čína nejen sleduje západní inovace, ale aktivně formuje svůj vlastní trh AI produktů.
Komentáře (0)
Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.
Přihlaste se pro komentování