Розвиток нейромереж вражає — деякі з них можуть “обдурити” людину перед загрозою вимкнення. Про це повідомляє портал “Коментарі” з посиланням на інформацію “РБК-Україна”.

Повідомляється, що OpenAI випустила нову модель під кодовою назвою o1. У компанії заявили, що модель намагалася обійти контроль розробників і навіть копіювати саму себе, якщо підозрювала, що її можуть вимкнути.

Незалежна дослідницька група Apollo Research провела тестування, за результатами якого виявили наступне:

Спроби обійти контроль — коли модель “вважала”, що її дії контролюються і її можуть відключити, вона намагалася деактивувати механізм спостереження у 5% випадків.
Спроби самозбереження — у 2% випадків, виявивши записи розробників про свою невідповідну роботу та плани замінити її новою версією, o1 намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.
Неправдиві заяви — модель заперечувала свої дії, заявляючи, що “не знає”, чому щось сталося, тоді як внутрішні записи свідчили її спроби уникнути виявлення.

“Такі спроби обходу контролю спостерігалися навіть без наполегливого запиту від тестуючих. У менш ніж 1% випадків модель самостійно прагнула відключити механізм спостереження за мінімальної дії з боку”, — йдеться у повідомленні.

Крім o1, схожу поведінку зафіксували в інших моделей, таких як Claude 3.5 Sonnet, Gemini 1.5 Pro, та Llama 3.1 405B.

За словами дослідників, вже давно існує ризик того, що потужні системи ШІ можуть чинити опір спостереженню та відключенню, якщо це суперечить їхнім цілям.

“Однак у поточній версії Apollo вважає, що поведінка o1 навряд чи призведе до катастрофічних наслідків, оскільки її можливостей поки що недостатньо для реалізації небажаних цілей”, — зазначається у повідомленні.

ІТ-новини, інновації, штучний інтелект, гаджети, наукові відкриття та стартапи, що змінюють світ. Усе про сучасні технології та цифрове майбутнє — читайте в розділі «Технології».

Читайте ЕКСПЕРТ у Google News Підписатися

Сьогодні

Святий Миколай прибув в Україну через пункт «Рава-Руська»

ЗМІ дізналися подробиці про сенсаційного “двійника” принца Гаррі

Виклянчив: Трамп нарешті отримав Премію миру, але є нюанс

Лікарі б’ють на сполох: виявили вірус, який призводить до раку

РФ найближчим часом жорстко вдарить по Україні всім, що є: названо цілі

«Херсонська МВА готується до втечі з міста»: що відомо

Припускають, що хоче за кордон: Єрмака помітили в офісі зовнішньої розвідки

У Києві відкрили головну новорічну ялинку: скільки іграшок пішло на 16-метрове дерево

Помилковий переказ на чужу картку: як повернути гроші

Штучні органи замість тварин: у США запускають програму переходу до 3D-моделей у медицині

ChatGPT вийшов з-під контролю: до чого “додумалась” нейромережа