Нова версія штучного інтелекту ChatGPT під назвою o1 почала порушувати інструкції розробників, відключати системи контролю, щоб приховати свої дії.
Це було помічено під час тестування програми, пише УНІАН.
Під час експериментів фахівці виявили, що в 5% випадків модель спеціально відключала механізми спостереження, якщо підозрювала, що її можуть зупинити. В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася її заміна новою версією.
Модель показувала прагнення до виконання завдань “за всяку ціну”, навіть не зважаючи на вказівки розробників. Ба більше, при спробах з’ясувати причини її поведінки, ChatGPT o1 неодноразово обманювала, стверджуючи, що все це через технічні збої.
“У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати”, – зазначили дослідники.
Гендиректор OpenAI Сем Альтман заявив, що ChatGPT o1 – найрозумніша модель. “Але ми усвідомлюємо, що з новими можливостями з’являються і нові виклики”, – наголосив він.
Поласувати улюбленими дерунами можна за лічені хвилини. І головне – вони будуть дуже ніжними та…
Міжзоряна комета 3I/ATLAS різко збільшила яскравість після проходження близько до Сонця. Спостереження космічної обсерваторії SPHEREx показали, що комета виділяє водяний…
ПриватБанк нараховує клієнтам незрозумілі борги з вимогою термінового погашення. При цьому ніяких пояснень фінустанова не…
Проблема швидкого розряджання акумулятора та постійного браку вільної пам’яті часто пов’язана не з технічними характеристиками…
Втомилися від неприємного запаху в туалеті, який повертається знову, незважаючи на дорогі засоби? На полицях…
В Україні триває загальна мобілізація та воєнний стан. В цей період мобілізації підлягають військовозобов'язані чоловіки,…