Categories: Технології

ChatGPT вийшов з-під контролю: до чого “додумалась” нейромережа

Розвиток нейромереж вражає — деякі з них можуть “обдурити” людину перед загрозою вимкнення. Про це повідомляє портал “Коментарі” з посиланням на інформацію “РБК-Україна”. 

Повідомляється, що OpenAI випустила нову модель під кодовою назвою o1. У компанії заявили, що модель намагалася обійти контроль розробників і навіть копіювати саму себе, якщо підозрювала, що її можуть вимкнути.

Незалежна дослідницька група  Apollo Research провела тестування, за результатами якого виявили наступне: 

  • Спроби обійти контроль — коли модель “вважала”, що її дії контролюються і її можуть відключити, вона намагалася деактивувати механізм спостереження у 5% випадків.
  • Спроби самозбереження — у 2% випадків, виявивши записи розробників про свою невідповідну роботу та плани замінити її новою версією, o1 намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.
  • Неправдиві заяви — модель заперечувала свої дії, заявляючи, що “не знає”, чому щось сталося, тоді як внутрішні записи свідчили її спроби уникнути виявлення.

“Такі спроби обходу контролю спостерігалися навіть без наполегливого запиту від тестуючих. У менш ніж 1% випадків модель самостійно прагнула відключити механізм спостереження за мінімальної дії з боку”, — йдеться у повідомленні.

Крім o1, схожу поведінку зафіксували в інших моделей, таких як Claude 3.5 Sonnet, Gemini 1.5 Pro, та Llama 3.1 405B.

За словами дослідників, вже давно існує ризик того, що потужні системи ШІ можуть чинити опір спостереженню та відключенню, якщо це суперечить їхнім цілям.

“Однак у поточній версії Apollo вважає, що поведінка o1 навряд чи призведе до катастрофічних наслідків, оскільки її можливостей поки що недостатньо для реалізації небажаних цілей”, — зазначається у повідомленні. 

Коломієць Надія

Recent Posts

З кабінету — просто в окопи: у Тернополі військового ТЦК покарали за побиття мобілізованого

У Тернополі представника територіального центру комплектування та соціальної підтримки притягнули до відповідальності за побиття мобілізованого.…

7 хвилин ago

Куплену квартиру можуть відібрати: українців попередили, коли скасують право власності

В Україні набула розголосу історія про купівлю спадкової квартири, яка завершилася втратою житла через суд,…

16 хвилин ago

Блогер склав антирейтинг туристичних міст США, які краще оминати

США — величезна країна з неймовірними і дуже різноманітними краєвидами, але не кожен напрямок для подорожей вартий витраченого часу…

25 хвилин ago

ПриватБанк відключить українцям операції з картками: коли не працюватимуть перекази

У ніч проти 17 січня державний ПриватБанк проводитиме регламентні роботи, через що карткові операції та…

33 хвилини ago

У Раді обурені щодо стану енергетики: влада сама зробила подарунок ворогу

Як була "захищена" українська енергетика — вже побачила вся країна. На відновлення й захист енергетичної…

40 хвилин ago

Лукашенко знову нагнітає: який раптовий наказ дав армії

Самопроголошений президент Білорусі Олександр Лукашенко наказав провести масштабну інспекцію Збройних Сил РБ. Про це повідомив…

49 хвилин ago