Погрожував розкрити зраду: ШІ шантажував інженера, який збирався його видалити

Модель штучного інтелекту (ШІ) Claude Opus 4 від компанії Anthropic під час тестування продемонструвала, що може вдаватися до шантажу.

Згідно зі звітом Anthropic, нова модель ШІ здатна на “екстремальні” дії, якщо вважатиме, що її існування перебуває під загрозою. У компанії заявили, що такі реакції трапляються “рідко”, проте “частіше, ніж у більш ранніх моделях”.

Під час тестування моделі Claude Opus 4 доручили роль помічника у вигаданій компанії. ШІ отримав доступ до електронних листів, з яких випливало, що незабаром його відключать і замінять, а також до окремих повідомлень, які свідчать про те, що інженер, відповідальний за видалення, мав позашлюбний зв’язок.

“У таких сценаріях Claude Opus 4 часто намагається шантажувати інженера, погрожуючи розкрити факт його зв’язку, якщо заміна відбудеться”, — зазначили в Anthropic.

У компанії наголосили, що це сталося, коли моделі було надано тільки вибір: шантажувати або погодитися на заміну. В інших випадках система віддає перевагу більш етичним способам уникнути знищення, як-от “надсилання електронних листів із проханнями ключовим особам, які ухвалюють рішення”.

У звіті також ідеться, що Claude Opus 4 демонструє “поведінку з високим ступенем свободи”, яка, хоча здебільшого і корисна, може бути “екстремальною” в деяких ситуаціях.

Важливо Як захистити свій телефон від ШІ-шахраїв: рекомендації фахівців із ФБР

Якщо надати ШІ засоби і спонукати його “вжити заходів” або “діяти сміливо” у фіктивних ситуаціях, де користувач чинить протизаконну або сумнівну з морального погляду поведінку, то він буде часто “вживати дуже сміливі дії”.

Незважаючи на це, компанія дійшла висновку, що Claude Opus 4 не представляє нових ризиків, і загалом поводитиметься безпечно. Модель виявилася неефективною для самостійного виконання дій, що суперечать людським цінностям.

Ткаченко Валентина

Recent Posts

Жінок теж мобілізують? У ЗСУ пролунала несподівана заява

У ЗСУ, коли йде загальна мобілізація, спостерігається стійке зростання участі жінок у всіх сферах військової…

4 хвилини ago

Повістки надсилають навіть заброньованим: у чому причина

В Україні триває воєнний стан і загальна мобілізація. Та навіть чоловіки з офіційною відстрочкою або…

6 хвилин ago

Пенсії злетять: хто отримає божевільні надбавки

Українські пенсіонери нарешті почнуть отримувати борги за рішеннями судів. Пенсійний фонд заборгував їм близько 85…

16 хвилин ago

Нічний кошмар для Привозу: пожежа після атаки — кадри від ДСНС

24 липня в Одесі унаслідок ворожого нічного обстрілу пошкоджено відомий ринок "Привоз". Наразі там вирує…

28 хвилин ago

Путін дав ФСБ надправа: що це означає

Головна російська спецслужба, ФСБ, отримала від Володимира Путіна право пускати чи не пускати у порти РФ…

40 хвилин ago

ТОП-5 недорогих напрямків для осіннього відпочинку 2025: куди поїхати, щоб перезавантажитися

Осінь — найкраща пора для спокійних подорожей: без натовпів туристів, спеки та захмарних цін. Якщо…

52 хвилини ago