
Cantonais, patois et wolof : Google Traduction apprend 110 nouvelles langues

Avec 110 nouvelles langues, Google a annoncé la plus grande mise à jour de son outil de traduction Google Translate.
Avec l'aide de l'IA, et plus précisément du Language Model PaLM 2, Google étend considérablement les capacités de son traducteur. En effet, 110 nouvelles langues viennent s'ajouter aux 133 déjà existantes. Celles-ci sont parlées par 614 millions de personnes et vont du cantonais au manx, qui n'est parlé que sur l'île de Man.
Des langues mondiales avec plus de 100 millions d'utilisateurs aux dialectes régionaux
Environ un quart des nouvelles langues ajoutées proviennent d'Afrique, selon le développeur de logiciels Isaac Caswell de l'équipe Translate de Google dans un post de blog officiel.
Caswell sélectionne plusieurs langues et donne des détails à leur sujet. Ainsi, le cantonais a été la langue la plus demandée par Google Translate. Le problème était d'avoir suffisamment de matériel de formation utilisable, car la langue a de nombreux points communs avec le mandarin à l'écrit. Le gaélique manx est mort en 1974 sur l'île de Man avec le dernier locuteur natif. Mais après une renaissance, plusieurs milliers de personnes sur l'île maîtriseraient à nouveau la langue.
Pour certaines langues, Google a également dû faire des compromis. Ainsi, le romani a de nombreux dialectes différents en Europe. Les traductions sont les plus proches du romani vlax du sud, qui est très utilisé en ligne, mais elles contiennent également des éléments du romani vlax du nord et du romani des Balkans. PaLM 2 a été d'une grande aide pour enseigner au traducteur de nouvelles langues qui sont proches de langues existantes. Caswell cite l'exemple des langues créoles des Seychelles et de l'île Maurice.

Source : ArnoldPlaton, CC BY-SA 3.0, Wikipedia
Vous pouvez trouver la liste des 110 nouvelles langues ici. En y jetant un coup d'œil, je remarque, outre les langues déjà mentionnées, le balinais, le féroïen, le patois jamaïcain, le tchétchène et le punjabi, la principale langue du Pakistan. Si vous voyagez en Italie, vous pourrez bientôt utiliser Google Translate pour le ligurien, le lombard, le sicilien ou le vénitien. En France, le breton et le limbourgeois (sud de la Basse-Franconie), au carrefour de l'Allemagne, de la Belgique et des Pays-Bas, viennent s'ajouter à la liste.
Les nouvelles langues devraient être disponibles dans les prochains jours translate.google.com ainsi que dans les applications Google Traduction sur Android et iOS.
Les 110 nouvelles langues de Google Translate
Quelle est la langue que vous appréciez le plus parmi les nouvelles langues ?
Abkhaz
Acehnese
Acholi
Afar
Alur
Avar
Awadhi
Balinais
Baluchi
Baoulé
Bashkir
Batak Karo
Batak Simalungun
Batak Toba
Bemba
Betawi
Bikol
Breton
Buryat
Cantonais
Chamorro
Chechen
Chuukese
Chuvash
Crimean Tatar
Dari
Dinka
Dombe
Dyula
Dzongkha
Faroese
Fijian
Fon
Friulian
Fulani
Ga
Hakha Chin
Hiligaynon
Hunsrik
Iban
Patois jamaïcain
Jingpo
Kalaallisut
Kanuri
Kapampangan
Khasi
Kiga
Kikongo
Kituba
Kokborok
Komi
Latgalien
Ligurien
Limbourgeois
Lombard
Luo
Madurais
Macassar
Malais (Jawi)
Mam
Manx
Marshallese
Marwadi
Créole mauricien
Meadow Mari
Minang
Nahuatl (Huasteca oriental)
Ndau
Ndebele (Sud)
Népalbhasa (Newari)
NKo
Nuer
Occitan
Ossetien
Pangasinan
Papiamento
Portugais (Portugal)
Punjabi (Shahmukhi)
Q'eqchi'
Romani
Rundi
Sami (Nord)
Sango
Santali
Créole seychellois
Shan
Sicilien
Silésien
Susu
Swati
Tahitien
Tamazight
Tamazight (Tifinagh)
Tetum
Tibétain
Tiv
Tok Pisin
Tongan
Tswana
Tulu
Tumbuka
Tuvan
Udmurt
Venda
Vénitien
Waray
Wolof
Yakut
Yucatec Maya
Zapotec


Lorsque j'étais à l'école primaire, je m'asseyais dans le salon d'un ami avec de nombreux camarades de classe pour jouer à la Super NES. Aujourd'hui, je mets directement la main sur les dernières technologies et les teste pour vous. Ces dernières années, j'ai travaillé chez Curved, Computer Bild et Netzwelt, et maintenant chez Digitec et Galaxus.