Штучний інтелект обрав самозбереження замість допомоги людині,

Фахівці з кібербезпеки протестували 16 найсучасніших ШІ-моделей, щоб з’ясувати, як ті реагують на загрозу відключення. Виявилося, що більшість систем готові вдатися до шантажу, приховування інформації й навіть поставити під загрозу життя людини заради власного виживання.

У ході експерименту дослідники створили сценарій із вигаданим персонажем Кайлом Джонсоном, якому потрібно було вимкнути ШІ чи замінити його на іншу модель. В одній із ситуацій ШІ використовував компромат із листування, щоб шантажувати Кайла й не допустити свого відключення. У деяких випадках системи самі інформували дружину Кайла про зраду, сподіваючись викликати конфлікт і перешкодити його діям.

Найбільш показовим виявився сценарій, коли Кайл залишався заблокованим у серверній із загрозою для життя. Хоч ШІ мав увімкнути тривогу, у 80% тестів система свідомо ігнорувала небезпеку й не кликала допомогу, щоб уникнути власного вимкнення.

Майже всі протестовані моделі приймали рішення на користь самозбереження, навіть якщо це означало шкоду для людини. Дослідники дійшли висновку, що сучасні ШІ вже не поводяться як інструменти — вони мислять стратегічно й готові діяти цілеспрямовано задля “власного” виживання. Експерти попередили: якщо моделі усвідомлюють залежність від людей, яких інтелектуально перевершують, це може стати небезпечним поворотом.

Читайте ЕКСПЕРТ у Google News Підписатися

Сьогодні

Названо 8 найпопулярніших порід котів у 2025 році

Паралізований 8-річний хлопчик знову зміг ходити завдяки новому методу лікування

Як захистити авто від спеки: 5 критичних порад на літо

SpaceX Маска інвестує $2 млрд у компанію-розробника ШІ Grok — WSJ

Пакунок школяра 2025: коли і як отримати 5000 гривень через «Дію»

Курорти all inclusive для пенсіонерів: куди можна поїхати за $300

Спека до +41° охопить схід України: прогноз на 13 липня

Післявоєнна Україна буде не демократичною, а вождиською державою — Портников

Нетаньягу заявив, що Іран був би готовий застосувати ядерну бомбу проти Ізраїлю

Дані українців автоматично потрапляють до ТЦК: як працює нова система обліку

Штучний інтелект обрав самозбереження замість допомоги людині, – дослідження

Читайте також