-as frissítésben

Új nyelvek vannak és a Fordító nyelvjárásait – jelentette be a Google szerdán. A többnyelvű neurális gépi fordítási szolgáltatáshoz hozzáadott új elemek a világ különböző régióiból származó nyelveket tartalmaznak, köztük a kecsuát, a guaranit és az aymara-t, amelyek Amerika őshonos nyelveinek számítanak. Ezzel a Google Fordító által lefedett nyelvek száma 133-ra nőtt.

„A Google Fordító évek óta segített lebontani a nyelvi korlátokat és összekapcsolni a közösségeket szerte a világon. És szeretnénk ezt még több ember számára lehetővé tenni – különösen azok számára, akiknek a nyelve nincs képviselve a legtöbb technológiában. Így ma 24 nyelvet adtunk hozzá a Fordítóhoz, amelyek összesen 133 nyelvet támogatnak világszerte” – mondja Isaac Caswell, a Google Fordító vezető szoftvermérnöke. „Több mint 300 millió ember beszéli ezeket az újonnan hozzáadott nyelveket – például a mizót, amelyet körülbelül 800 000 ember használ India távoli északkeleti részén, és a lingala nyelvet, amelyet több mint 45 millióan használnak Közép-Afrikában.”

Caswell megjegyzi, hogy ez a Google Fordító legújabb frissítése meglehetősen különleges, mivel ezek a nyelvek az elsők, amelyeket a „Zero-Shot Machine Translation” használatával adtak hozzá. Szerinte ezeknek a nyelveknek a gépi tanulási modellje „megtanul egy másik nyelvre lefordítani anélkül, hogy példát látna”, és „csak egynyelvű szöveget lát”. Ezzel a szoftvermérnök bevallja, hogy nem minden szempontból tökéletes, bár lenyűgözőnek veszi. „És folyamatosan fejlesztjük ezeket a modelleket, hogy ugyanazt az élményt nyújtsuk, mint például a spanyol vagy német fordításoknál” – teszi hozzá. „Ha szeretne elmélyülni a technikai részletekben, tekintse meg Google AI blogbejegyzésünket és kutatási dokumentumunkat.”

Itt található a Google Fordítóhoz hozzáadott legújabb nyelvek és dialektusok teljes listája a helyekkel együtt hol beszélik, és az őket használó beszélők száma:

asszámi. Északkelet-India (körülbelül 25 millió beszélő)

Aymara. Bolívia, Chile és Peru (mintegy kétmillió beszélő)

bambara. Mali (körülbelül 14 millió beszélő)

Bhojpuri. Észak-India, Nepál és Fidzsi-szigetek (körülbelül 50 millió beszélő)

Dhivehi. Maldív-szigetek (kb. 300 000 beszélő)

Dogri. Észak-India (körülbelül hárommillió beszélő)

Ewe. Ghána és Togo (körülbelül hétmillió beszélő)

Guarani. Paraguay és Bolívia, Argentína és Brazília (körülbelül hétmillió beszélő)

Ilocano. Észak-Fülöp-szigetek (körülbelül 10 millió beszélő)

Konkani. Közép-India (körülbelül kétmillió beszélő)

Krio. Sierra Leone (körülbelül négymillió beszélő)

kurd (sorani). Irak és Irán (körülbelül 15 millió beszélő)

Lingala. Kongói Demokratikus Köztársaság, Kongói Köztársaság, Közép-afrikai Köztársaság, Angola és a Dél-Szudáni Köztársaság (mintegy 45 millió beszélő)

Luganda. Uganda és Ruanda (körülbelül 20 millió beszélő)

Maithili. Észak-India (körülbelül 34 millió beszélő)

Meiteilon (Manipuri). Északkelet-India (körülbelül kétmillió beszélő)

Mizo. Északkelet-India (körülbelül 830 000 beszélő)

Oromo. Etiópia és Kenya (körülbelül 37 millió beszélő)

kecsua. Peru, Bolívia, Ecuador és a környező országok (körülbelül 10 millió beszélő)

szanszkrit. India (körülbelül 20 000 beszélő)

Sepedi. Dél-Afrika (körülbelül 14 millió beszélő)

Tigrinya. Eritrea és Etiópia (mintegy nyolcmillió beszélő)

Tsonga. Eswatini, Mozambik, Dél-Afrika és Zimbabwe (körülbelül hétmillió beszélő)

Twi. Ghána (körülbelül 11 millió beszélő)

Categories: IT Info