Нова версія штучного інтелекту ChatGPT під назвою o1 почала порушувати інструкції розробників, відключати системи контролю, щоб приховати свої дії.
Це було помічено під час тестування програми, пише УНІАН.
Під час експериментів фахівці виявили, що в 5% випадків модель спеціально відключала механізми спостереження, якщо підозрювала, що її можуть зупинити. В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася її заміна новою версією.
Модель показувала прагнення до виконання завдань “за всяку ціну”, навіть не зважаючи на вказівки розробників. Ба більше, при спробах з’ясувати причини її поведінки, ChatGPT o1 неодноразово обманювала, стверджуючи, що все це через технічні збої.
“У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати”, – зазначили дослідники.
Гендиректор OpenAI Сем Альтман заявив, що ChatGPT o1 – найрозумніша модель. “Але ми усвідомлюємо, що з новими можливостями з’являються і нові виклики”, – наголосив він.
ІТ-новини, інновації, штучний інтелект, гаджети, наукові відкриття та стартапи, що змінюють світ. Усе про сучасні технології та цифрове майбутнє — читайте в розділі «Технології».
