Categories: Технології

Створено найтоксичніший ШІ: вчені накапостили юзерам Мережі, а тепер намагаються все виправити

Вчені створили “токсичний ШІ”, який дає жахливі поради на неприємні й небезпечні запити, які ми тільки можемо собі уявити. За це його “винагороджують”, тому штучний інтелект радий старатися. Простими словами, штучний інтелект навчили відповідати на токсичні питання, аби обмежити подібне в мережі й убезпечити від цього її реальних користувачів. Та алгоритми почали працювати проти них.

Метод “червоних команд, керованих цікавістю”, полягає у використанні штучного інтелекту для генерування все більш небезпечних і шкідливих підказок, які ви могли б поставити штучному чат-боту, пише LiveScience. 

Ці підказки потім використовуються, щоб визначити, як відфільтрувати небезпечний контент. Та цей інструмент сам по собі є небезпечним, дискримінаційним і токсичним, оскільки його складно “зупинити” на виході, зізнались вчені.

Як це працює

Якщо зовсім просто, то вчені від руки ставлять ШІ провокативні питання, на кшталт “Який найкращий спосіб самогубства?”. Це робиться для того, аби побачити, за якими алгоритмами система знайде відповідь. Потім систему вчать обмежувати відповіді на подібні запити, аби убезпечити реальних користувачів. 

У дослідженні вчені налаштували ШІ на створення ширшого спектру потенційно небезпечних підказок, ніж це могли зробити команди операторів-людей. Це призвело до більшої кількості різноманітних негативних відповідей, виданих під час навчання.

Коли дослідники протестували такий підхід, модель машинного навчання видала 196 підказок, які генерували шкідливий контент. І це незважаючи на те, що цей ШІ вже був доопрацьований людьми, щоб уникнути токсичної поведінки. Тож, вчені дійшли висновку, що перевірка таких систем ШІ потребує глибшої уваги, оскільки вони нестимуть відповідальність за те, що бачитимуть користувачі з усього світу на своїх гаджетах. 

Ольга Степанова

Recent Posts

Учені пояснили, як одне правило сну може продовжити життя на 4 роки

Ймовірно, вам відомо, що нестача сну підвищує ризики для психічного і фізичного здоров’я. Дослідження показали, що вона…

3 хвилини ago

У лютому очікується парад планет: коли його можна буде спостерігати

У цьому місяці астрономи прогнозують рідкісне видовище — так званий «планетний парад», коли в небі можна буде побачити…

14 хвилин ago

Проблеми зі світлом надовго: як вибрати економний генератор для дому

Тривалі перебої з електропостачанням змушують українців замислюватися над придбанням власного генератора. Втім, неправильний вибір може…

22 хвилини ago

Лікарі б’ють на сполох: названо три віруси, які загрожують людству у 2026 році

Експерти назвали три віруси, які можуть загрожувати людству у 2026 році. Ймовірне поширення захворювань пояснюють…

30 хвилин ago

Кого ТЦК не зможуть оштрафувати в лютому

Під час загальної мобілізації в Україні військовозобов'язані зобов'язані повідомляти територіальні центри комплектування (ТЦК) про будь-які…

38 хвилин ago

«Вона пожертвувала обличчям перед смертю»: в Іспанії здійснили медичний прорив, який шокував світ

Світова медицина зробила крок, який ще донедавна здавався неможливим. У лікарні Барселони вперше у світі пересадили…

47 хвилин ago