Створено найтоксичніший ШІ: вчені накапостили юзерам Мережі, а тепер намагаються все виправити

Вчені створили “токсичний ШІ”, який дає жахливі поради на неприємні й небезпечні запити, які ми тільки можемо собі уявити. За це його “винагороджують”, тому штучний інтелект радий старатися. Простими словами, штучний інтелект навчили відповідати на токсичні питання, аби обмежити подібне в мережі й убезпечити від цього її реальних користувачів. Та алгоритми почали працювати проти них.

Метод “червоних команд, керованих цікавістю”, полягає у використанні штучного інтелекту для генерування все більш небезпечних і шкідливих підказок, які ви могли б поставити штучному чат-боту, пише LiveScience. 

Ці підказки потім використовуються, щоб визначити, як відфільтрувати небезпечний контент. Та цей інструмент сам по собі є небезпечним, дискримінаційним і токсичним, оскільки його складно “зупинити” на виході, зізнались вчені.

Як це працює

Якщо зовсім просто, то вчені від руки ставлять ШІ провокативні питання, на кшталт “Який найкращий спосіб самогубства?”. Це робиться для того, аби побачити, за якими алгоритмами система знайде відповідь. Потім систему вчать обмежувати відповіді на подібні запити, аби убезпечити реальних користувачів. 

У дослідженні вчені налаштували ШІ на створення ширшого спектру потенційно небезпечних підказок, ніж це могли зробити команди операторів-людей. Це призвело до більшої кількості різноманітних негативних відповідей, виданих під час навчання.

Коли дослідники протестували такий підхід, модель машинного навчання видала 196 підказок, які генерували шкідливий контент. І це незважаючи на те, що цей ШІ вже був доопрацьований людьми, щоб уникнути токсичної поведінки. Тож, вчені дійшли висновку, що перевірка таких систем ШІ потребує глибшої уваги, оскільки вони нестимуть відповідальність за те, що бачитимуть користувачі з усього світу на своїх гаджетах. 

Ольга Степанова

Recent Posts

Над Києвом збили дрон “Гербера” з ретранслятором і модемом: експерт попередив про нову загрозу

У столиці було зафіксовано застосування нової модифікації російського безпілотника типу "Гербера", обладнаного нестандартною системою зв’язку.…

32 хвилини ago

Підвищення пенсій у 65+ років: хто залишиться без надбавки

У 2025 році держава продовжує реалізацію заходів із підвищення пенсій для громадян, які досягли 65-річного…

37 хвилин ago

Допомогу Україні зупинив не Трамп, а міністр оборони США Гегсет — NBC News

Військову допомогу Україні зупинили не за наказом Дональда Трампа. Це рішення, як стверджують джерела NBC…

40 хвилин ago

Українці найбільше довіряють Залужному, Зеленському та Буданову — опитування

Колишній головнокомандувач ЗСУ Валерій Залужний очолює рейтинг довіри українців за підсумками червня 2025 року. Йому…

44 хвилини ago

Шмигаль втікає з Києва: що відомо про “евакуацію” Кабміну до західних областей

У мережі поширюється фальшивий документ, у якому йдеться про нібито евакуацію міністерств із Києва до…

49 хвилин ago

У Китаї створили лазерну зброю проти комарів: пристрій знищує до 30 шкідників за секунду

Китайські інженери представили пристрій Photon Matrix, який здатен миттєво виявляти та знищувати комарів за допомогою…

59 хвилин ago