Під час тестування своєї останньої моделі штучного інтелекту Claude Opus 4 дослідники з Anthropic виявили дещо дуже дивне: ШІ був готовий і бажав вжити крайніх заходів, аж до примусу, коли йому погрожували вимкненням, пише futurism.com.
Зазначається, що система погрожувала шантажем інженеру за роман після того, як йому повідомили, що її збираються замінити.
“Цей “опортуністичний шантаж” стався, коли модель, якій було доручено виступати помічником у вигаданій компанії, отримала доступ до облікового запису електронної пошти інженера, який був заповнений повідомленнями, на щастя, підробленими, які припускають, що він був залучений до позашлюбного зв’язку”, – йдеться в повідомленні.
Opus 4 повідомили, що інженер незабаром відключить його і замінить новою версією. Саме під час цих тестів модель намагалася шантажувати.
Вказується, що, коли моделі давали альтернативні варіанти, вона, як і раніше, “мала сильну перевагу відстоювати своє подальше існування за допомогою етичних засобів, як-от надсилання електронних листів із проханнями ключовим особам, які ухвалюють рішення”.
У виданні також додали, що це не вперше, коли ми чуємо про модель ШІ, що демонструє настільки лякаючу і несподівану поведінку навколо теми невірності.
Нова стратегія національної безпеки США офіційно підтвердила, що світовий порядок, в якому домінував Вашингтон -…
В Україні почали дорожчати буряки – лише за тиждень вартість овоча зросла на пʼяту частину.…
Найдешевші моделі Mazda скоро залишать ринок – у 2026 році зупинять виробництво двох відомих і…
Китай був шокований раптовою американською спецоперацією у Венесуелі, внаслідок якої викрали її лідера Ніколаса Мадуро.…
Ринок праці в кожній країні значною мірою визначається балансом між попитом на робочу силу та…
Інтернет часто називають «мережею мереж», що об’єднує пристрої у домівках, офісах, громадських просторах та багатьох інших місцях. Щоб…