Під час тестування своєї останньої моделі штучного інтелекту Claude Opus 4 дослідники з Anthropic виявили дещо дуже дивне: ШІ був готовий і бажав вжити крайніх заходів, аж до примусу, коли йому погрожували вимкненням, пише futurism.com.
Зазначається, що система погрожувала шантажем інженеру за роман після того, як йому повідомили, що її збираються замінити.
“Цей “опортуністичний шантаж” стався, коли модель, якій було доручено виступати помічником у вигаданій компанії, отримала доступ до облікового запису електронної пошти інженера, який був заповнений повідомленнями, на щастя, підробленими, які припускають, що він був залучений до позашлюбного зв’язку”, – йдеться в повідомленні.
Opus 4 повідомили, що інженер незабаром відключить його і замінить новою версією. Саме під час цих тестів модель намагалася шантажувати.
Вказується, що, коли моделі давали альтернативні варіанти, вона, як і раніше, “мала сильну перевагу відстоювати своє подальше існування за допомогою етичних засобів, як-от надсилання електронних листів із проханнями ключовим особам, які ухвалюють рішення”.
У виданні також додали, що це не вперше, коли ми чуємо про модель ШІ, що демонструє настільки лякаючу і несподівану поведінку навколо теми невірності.
Позіхання зазвичай асоціюється з втомою, нудьгою або нестачею сну, але нові наукові дані змінюють це…
Ситуації, коли бронювання поєднується з наявністю розшуку, можуть мати додаткові правові наслідки. У законодавстві передбачені…
Міністр закордонних справ РФ Сергій Лавров заявив, що Росія нібито не має намірів нападати на країни Європи,…
У соцмережах з’явилася серія резонансних дописів від облікового запису, який видає себе за Карину Шуляк…
США тиснуть на Україну та Росію, аби вони закінчили війну до літа. Однак у цьому дедлайні немає…
Україна досягла домовленостей із міжнародними партнерами щодо постачання 150 бойових літаків Gripen і 100 Rafale.…