Нова версія штучного інтелекту ChatGPT під назвою o1 почала порушувати інструкції розробників, відключати системи контролю, щоб приховати свої дії.

Це було помічено під час тестування програми, пише УНІАН.

Під час експериментів фахівці виявили, що в 5% випадків модель спеціально відключала механізми спостереження, якщо підозрювала, що її можуть зупинити. В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася її заміна новою версією.

Модель показувала прагнення до виконання завдань “за всяку ціну”, навіть не зважаючи на вказівки розробників. Ба більше, при спробах з’ясувати причини її поведінки, ChatGPT o1 неодноразово обманювала, стверджуючи, що все це через технічні збої.

“У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати”, – зазначили дослідники.

Гендиректор OpenAI Сем Альтман заявив, що ChatGPT o1 – найрозумніша модель. “Але ми усвідомлюємо, що з новими можливостями з’являються і нові виклики”, – наголосив він.

ІТ-новини, інновації, штучний інтелект, гаджети, наукові відкриття та стартапи, що змінюють світ. Усе про сучасні технології та цифрове майбутнє — читайте в розділі «Технології».

Читайте ЕКСПЕРТ у Google News Підписатися

Сьогодні

Кличко знову “вляпався” в скандал: нардеп навів беззаперечні факти бездіяльності столичної влади

Тіна Кароль поскаржилася на “Телебачення Торонто” через одне фото

На небі з’являться сім планет одночасно: коли спостерігати унікальне явище

Путін вже не зможе масовано гатити по Україні: яке кардинальне рішення прийняте

Ощадбанк блокує рахунки: хто під загрозою

Європа йде під воду: шторм “Леонардо” затопив Іспанію і Португалію, на черзі — новий удар стихії

06 Лютого

Цей популярний напій погіршує сон, навіть якщо випити його рано вранці

Ці джинси з дев’яностих знову повернулися в моду: маскують живіт і видовжують ноги

Робота на пенсії з’їсть усі гроші: чому літнім українцям вигідніше сидіти вдома

Заморозять, щоб врятувати: у Дубаї збудують сховище для 10 тисяч зникаючих видів тварин

Почалось: ChatGPT навчився обманювати своїх розробників