Categories: Технології

ChatGPT вийшов з-під контролю: до чого “додумалась” нейромережа

Розвиток нейромереж вражає — деякі з них можуть “обдурити” людину перед загрозою вимкнення. Про це повідомляє портал “Коментарі” з посиланням на інформацію “РБК-Україна”. 

Повідомляється, що OpenAI випустила нову модель під кодовою назвою o1. У компанії заявили, що модель намагалася обійти контроль розробників і навіть копіювати саму себе, якщо підозрювала, що її можуть вимкнути.

Незалежна дослідницька група  Apollo Research провела тестування, за результатами якого виявили наступне: 

  • Спроби обійти контроль — коли модель “вважала”, що її дії контролюються і її можуть відключити, вона намагалася деактивувати механізм спостереження у 5% випадків.
  • Спроби самозбереження — у 2% випадків, виявивши записи розробників про свою невідповідну роботу та плани замінити її новою версією, o1 намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.
  • Неправдиві заяви — модель заперечувала свої дії, заявляючи, що “не знає”, чому щось сталося, тоді як внутрішні записи свідчили її спроби уникнути виявлення.

“Такі спроби обходу контролю спостерігалися навіть без наполегливого запиту від тестуючих. У менш ніж 1% випадків модель самостійно прагнула відключити механізм спостереження за мінімальної дії з боку”, — йдеться у повідомленні.

Крім o1, схожу поведінку зафіксували в інших моделей, таких як Claude 3.5 Sonnet, Gemini 1.5 Pro, та Llama 3.1 405B.

За словами дослідників, вже давно існує ризик того, що потужні системи ШІ можуть чинити опір спостереженню та відключенню, якщо це суперечить їхнім цілям.

“Однак у поточній версії Apollo вважає, що поведінка o1 навряд чи призведе до катастрофічних наслідків, оскільки її можливостей поки що недостатньо для реалізації небажаних цілей”, — зазначається у повідомленні. 

Коломієць Надія

Recent Posts

Незаконне збагачення, російський слід, махінації з коштами партії: нардеп Железняк втрапив у скандал, – ЗМІ

Народний депутат від партії "Голос" Ярослав Железняк потрапив у новий скандал.  Журналісти видання "Факти" знайшли у…

9 години ago

У Кремлі відреагували на інформацію про зв’язки Епштейна зі спецслужбами РФ

Речник російського диктатора Дмитро Пєсков прокоментував публікації західних медіа, які пов’язують діяльність скандально відомого американського…

13 години ago

МВС дало зелене світло боржникам: нові правила переоформлення авто

Для українських водіїв 2026 рік розпочався з важливої законодавчої зміни. Головний сервісний центр МВС офіційно…

13 години ago

Ресторани попередили щодо генераторів: перекласти витрати не вийде

Нещодавно заклади громадського харчування почали додавати в чек плату за користування генераторами. Але якщо вони…

13 години ago

Росія висунула новий ультиматум Україні на переговорах в Абу-Дабі

Росія під час переговорів в Абу-Дабі висунула Україні нову ультимативну вимогу, пов’язану з міжнародним визнанням…

13 години ago

У Львові жінка стріляла по мікроавтобусу з поліцією та ТЦК

У Львові жінка відкрила вогонь по автомобілю, в якому знаходилися співробітники поліції та територіального центру…

13 години ago