Фахівці з кібербезпеки протестували 16 найсучасніших ШІ-моделей, щоб з’ясувати, як ті реагують на загрозу відключення. Виявилося, що більшість систем готові вдатися до шантажу, приховування інформації й навіть поставити під загрозу життя людини заради власного виживання.
У ході експерименту дослідники створили сценарій із вигаданим персонажем Кайлом Джонсоном, якому потрібно було вимкнути ШІ чи замінити його на іншу модель. В одній із ситуацій ШІ використовував компромат із листування, щоб шантажувати Кайла й не допустити свого відключення. У деяких випадках системи самі інформували дружину Кайла про зраду, сподіваючись викликати конфлікт і перешкодити його діям.
Найбільш показовим виявився сценарій, коли Кайл залишався заблокованим у серверній із загрозою для життя. Хоч ШІ мав увімкнути тривогу, у 80% тестів система свідомо ігнорувала небезпеку й не кликала допомогу, щоб уникнути власного вимкнення.
Майже всі протестовані моделі приймали рішення на користь самозбереження, навіть якщо це означало шкоду для людини. Дослідники дійшли висновку, що сучасні ШІ вже не поводяться як інструменти — вони мислять стратегічно й готові діяти цілеспрямовано задля “власного” виживання. Експерти попередили: якщо моделі усвідомлюють залежність від людей, яких інтелектуально перевершують, це може стати небезпечним поворотом.