Почалось: ChatGPT навчився обманювати своїх розробників

Нова версія штучного інтелекту ChatGPT під назвою o1 почала порушувати інструкції розробників, відключати системи контролю, щоб приховати свої дії.

Це було помічено під час тестування програми, пише УНІАН.

Під час експериментів фахівці виявили, що в 5% випадків модель спеціально відключала механізми спостереження, якщо підозрювала, що її можуть зупинити. В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася її заміна новою версією.

Модель показувала прагнення до виконання завдань “за всяку ціну”, навіть не зважаючи на вказівки розробників. Ба більше, при спробах з’ясувати причини її поведінки, ChatGPT o1 неодноразово обманювала, стверджуючи, що все це через технічні збої.

“У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати”, – зазначили дослідники.

Гендиректор OpenAI Сем Альтман заявив, що ChatGPT o1 – найрозумніша модель. “Але ми усвідомлюємо, що з новими можливостями з’являються і нові виклики”, – наголосив він.

Лисенко Катерина

Next У Токіо введуть чотириденний робочий тиждень »

Previous « Військові КНДР залишаються в Курській області у бойовій готовності, – Пентагон

Published by

Лисенко Катерина

1 рік ago

Деруни з “секретом” вражають ніжністю та ситністю: цей рецепт мусить спробувати кожен

Поласувати улюбленими дерунами можна за лічені хвилини. І головне – вони будуть дуже ніжними та…

30 хвилин ago

Наука

Міжзоряна комета 3I/ATLAS вразила вчених органічними молекулами (ФОТО)

Міжзоряна комета 3I/ATLAS різко збільшила яскравість після проходження близько до Сонця. Спостереження космічної обсерваторії SPHEREx показали, що комета виділяє водяний…

39 хвилин ago

Гроші

ПриватБанк вішає на українців незрозумілі борги: ні пояснень, ні вибачень

ПриватБанк нараховує клієнтам незрозумілі борги з вимогою термінового погашення. При цьому ніяких пояснень фінустанова не…

50 хвилин ago

Технології

Видаліть їх негайно: три види додатків, які «вбивають» ваш смартфон та крадуть дані

Проблема швидкого розряджання акумулятора та постійного браку вільної пам’яті часто пов’язана не з технічними характеристиками…

59 хвилин ago

Лайфхаки

Як позбутись запаху в туалеті за копійки: секрет з кухонної шафи

Втомилися від неприємного запаху в туалеті, який повертається знову, незважаючи на дорогі засоби? На полицях…

1 годину ago

Суспільство

Відмова від повістки та ВЛК: що може загрожувати військовозобов’язаному

В Україні триває загальна мобілізація та воєнний стан. В цей період мобілізації підлягають військовозобов'язані чоловіки,…

1 годину ago