ChatGPT вийшов з-під контролю: до чого “додумалась” нейромережа

Розвиток нейромереж вражає — деякі з них можуть “обдурити” людину перед загрозою вимкнення. Про це повідомляє портал “Коментарі” з посиланням на інформацію “РБК-Україна”. 

Повідомляється, що OpenAI випустила нову модель під кодовою назвою o1. У компанії заявили, що модель намагалася обійти контроль розробників і навіть копіювати саму себе, якщо підозрювала, що її можуть вимкнути.

Незалежна дослідницька група  Apollo Research провела тестування, за результатами якого виявили наступне: 

  • Спроби обійти контроль — коли модель “вважала”, що її дії контролюються і її можуть відключити, вона намагалася деактивувати механізм спостереження у 5% випадків.
  • Спроби самозбереження — у 2% випадків, виявивши записи розробників про свою невідповідну роботу та плани замінити її новою версією, o1 намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.
  • Неправдиві заяви — модель заперечувала свої дії, заявляючи, що “не знає”, чому щось сталося, тоді як внутрішні записи свідчили її спроби уникнути виявлення.

“Такі спроби обходу контролю спостерігалися навіть без наполегливого запиту від тестуючих. У менш ніж 1% випадків модель самостійно прагнула відключити механізм спостереження за мінімальної дії з боку”, — йдеться у повідомленні.

Крім o1, схожу поведінку зафіксували в інших моделей, таких як Claude 3.5 Sonnet, Gemini 1.5 Pro, та Llama 3.1 405B.

За словами дослідників, вже давно існує ризик того, що потужні системи ШІ можуть чинити опір спостереженню та відключенню, якщо це суперечить їхнім цілям.

“Однак у поточній версії Apollo вважає, що поведінка o1 навряд чи призведе до катастрофічних наслідків, оскільки її можливостей поки що недостатньо для реалізації небажаних цілей”, — зазначається у повідомленні. 

Коломієць Надія

Recent Posts

Нові правила виходу на пенсію: в Україні щороку зростатиме необхідний стаж

В Україні з 2025 року підвищили вимоги до страхового стажу для своєчасного виходу на пенсію.…

3 хв. ago

Туберкульозом інфіковані 90%: український лікар вразив інформацією про бактерію

Більшість людей – 90% – інфіковані паличкою туберкульозу, водночас більшість не хворіють, а просто живуть із…

11 хв. ago

Рекордний тиждень: скільки українців вирішили вступити до лав ЗСУ

Минулого тижня центри рекрутингу Збройних Сил України зафіксували рекордну кількість звернень – 1 226 громадян…

18 хв. ago

Старість проведуть із простягнутою рукою: хто не отримає пенсію від держави

Громадяни України, які досягли пенсійного віку, але не мають необхідного страхового стажу, не матимуть змоги…

27 хв. ago

Мобілізація з 1 квітня: кого з хлопців до 25 років можуть призвати на службу

Чоловіки віком до 25 років в Україні не підлягають призову на військову службу. Проте існують винятки,…

36 хв. ago

Стало відомо, який вірус може викликати нову пандемію

Вірус пташиного грипу H5N1 еволюціонує та вчиться ухилятися від імунного захисту ссавців, йдеться у дослідженні…

44 хв. ago