Categories: Технології

Більше 100 нових мов: на Google-перекладач чекає масштабне оновлення

У перекладачі Google з’являться ще 110 мов – це найбільше розширення перекладача за всю його історію. Раніше сервіс підтримував лише 133 мови. Про це йдеться в блозі Google.

Для навчання фахівці Google використали мовну модель штучного інтелекту PaLM 2. Особливо ефективним ШІ був для вивчення мов, що повʼязані між собою – наприклад мов, що близькі до гінді, як-от авадхі та марваді.

Наприклад, у Google Translate тепер є кантонська – друга за поширеністю у Китаї. Вона давно стала однією з найбільш затребуваних мов для перекладача Google. Щоправда, на відміну від мандаринської мови, стандартизація кантонської не завершена, що ускладнює її вивчення.

Близько чверті доданих до перекладача мов походять з Африки. До прикладу, афар – тональна мова (в якій значення слова залежить не тільки від голосних та приголосних звуків, а й від тонких змін висоти голосу – ред.), якою розмовляють у Джибуті, Еритреї та Ефіопії. З усіх мов у цьому оновленні, саме спільнота мовців афару зробила найбільше волонтерських внесків.

До слова, з’явиться й кримськотатарська мова –  тюркська мова, рідна мова кримських татар. Сьогодні вона належить до мов, що потребує додаткового захисту за класифікацією UNESCO.

«Фактично, багато мов не мають однієї стандартної форми, тому неможливо вибрати «правильний» варіант. Наш підхід полягав у тому, щоб визначити пріоритетність найпоширеніших різновидів кожної мови. Наприклад, ромська мова має багато діалектів по всій Європі. Наші моделі створюють текст, найближчий до південно-власької ромської мови, широко використовуваного в Інтернеті. Але він також змішує елементи з інших, як-от північна власька та балканська ромська», – йдеться у блозі Google.

Також додали менську мову – це кельтська мова острова Мен в Ірландському морі. У грудні 1974 року померла остання людина, яка володіла менською. Але згодом завдяки активістам ця мова почала знову відроджуватися.

А ще до перекладача додадуть афарську, систему письма НКо, шахмукхі, ток-пісін та інші мови. Більшість доданих мов мають щонайменше мільйон носіїв, а деякі навіть сотні мільйонів.

Ольга Степанова

Recent Posts

Земні океани були повністю замерзлими, але деякі їх ділянки залишалися рідкими при -15°

Недавнє дослідження показує, що в період "Землі-сніжки" температура океанів Землі могла досягати найнижчих значень за всю історію…

16 хвилин ago

Китайські електрокари витісняють європейські: які авто обирали українці в січні

У січні 2026 року український автопарк поповнили 2873 електромобілі. Це на 21% менше, ніж за аналогічний період минулого року. Таке падіння…

25 хвилин ago

Що приготувати з гречки на вечерю: рецепт швидкої страви на сковорідці

Дуже смачну вечерю з гречки можна приготувати просто на сковорідці. Додайте соковите м'ясо, а також…

34 хвилини ago

Дозволено тепер мобілізовувати чоловіків не тільки ТЦК, а й звичайним військовим

В Україні в Тернопільській області запустили пілотний проєкт, який розширює коло осіб, уповноважених здійснювати мобілізаційні заходи.…

42 хвилини ago

Мінус 75% від пенсії: у кого держава забере більшу частину виплат і чому

Новина про те, що держава може стягувати до 75% від розміру пенсії, схвилювала багатьох українців.…

51 хвилина ago

Боротьба за справедливість: Маск вимагає оприлюднити відеозаписи з вечірок Епштейна та покарати винних

Глава Tesla та мільярдер Ілон Маск зробив резонансну заяву у мережі X, пообіцявши фінансову підтримку…

60 хвилин ago