Umělá inteligence prokázala úspěchy ve výzkumu vzácných a málo rozšířených jazyků
Velké jazykové modely snižují jazykovou propast
Nové verze umělé inteligence (AI) ukazují výrazný pokrok v práci s méně rozšířenými a málo známými jazyky, což významně zmenšuje globální „jazykovou propast“. To potvrzuje výzkum společnosti RWS publikovaný na TechRadar.
1. Co ukázaly studie
- Google Gemini Pro získal hodnocení kvality vyšší než 4,5 z 5 bodů v oblasti znalosti jazyka kinjarwanda – na kterém mluví přibližně 12 milionů lidí v Rwandě, Ugandě a Demokratické republice Kongo.
- Autoři vysvětlují úspěch tím, že moderní modely se opírají nejen o obrovské datové sady konkrétního jazyka, ale také využívají společné statistické zákonitosti všech jazyků (mechanismus mezjazykového přenosu).
- Zlepšení v tokenizátorech – systémech rozdělování textu na „tokeny“ – rovněž přispívá k přesnější práci s méně rozšířenými jazyky.
2. Efekt „driftního benchmarku“
Odborníci zjistili, že při přechodu od jedné verze modelu ke druhé se jeho schopnosti mohou neočekávaně měnit:
- Poslední verze OpenAI GPT ustupuje starším modelům v některých úlohách generování obsahu, i když předchůdce byla efektivnější.
- Efektivita tokenizátoru může mezi generacemi kolísat až 3,5‑krát; to znamená, že výsledky předchozích testů nejsou vždy přenositelné na nové verze.
3. Co se mění v prioritách vývojářů
- Dříve AI laboratoře stavily do popředí výkon na angličtině a několika klíčových jazycích.
- Moderní modely již úspěšně zvládají tyto úkoly, proto se pozornost posouvá k širšímu publiku: podpora méně rozšířených jazyků se stává stále důležitější.
- Přestože hodnocení 4,5/5 ne zaručuje skutečnou úroveň ovládání jazyka; vícejazyčná podpora zatím není považována za kritickou.
4. Závěr
AI pokračuje v rozbíjení bariér mezi kulturami a jazyky. I když „pokrytí“ méně rozšířených jazyků ještě nebylo povinným požadavkem, trend k širšímu dosažení publika je již zřejmý a podle očekávání odborníků se bude v příštích letech dále zesilovat.
Komentáře (0)
Podělte se o svůj názor — prosím, buďte slušní a držte se tématu.
Přihlaste se pro komentování