Categories: Технології

ChatGPT вийшов з-під контролю: до чого “додумалась” нейромережа

Розвиток нейромереж вражає — деякі з них можуть “обдурити” людину перед загрозою вимкнення. Про це повідомляє портал “Коментарі” з посиланням на інформацію “РБК-Україна”. 

Повідомляється, що OpenAI випустила нову модель під кодовою назвою o1. У компанії заявили, що модель намагалася обійти контроль розробників і навіть копіювати саму себе, якщо підозрювала, що її можуть вимкнути.

Незалежна дослідницька група  Apollo Research провела тестування, за результатами якого виявили наступне: 

  • Спроби обійти контроль — коли модель “вважала”, що її дії контролюються і її можуть відключити, вона намагалася деактивувати механізм спостереження у 5% випадків.
  • Спроби самозбереження — у 2% випадків, виявивши записи розробників про свою невідповідну роботу та плани замінити її новою версією, o1 намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.
  • Неправдиві заяви — модель заперечувала свої дії, заявляючи, що “не знає”, чому щось сталося, тоді як внутрішні записи свідчили її спроби уникнути виявлення.

“Такі спроби обходу контролю спостерігалися навіть без наполегливого запиту від тестуючих. У менш ніж 1% випадків модель самостійно прагнула відключити механізм спостереження за мінімальної дії з боку”, — йдеться у повідомленні.

Крім o1, схожу поведінку зафіксували в інших моделей, таких як Claude 3.5 Sonnet, Gemini 1.5 Pro, та Llama 3.1 405B.

За словами дослідників, вже давно існує ризик того, що потужні системи ШІ можуть чинити опір спостереженню та відключенню, якщо це суперечить їхнім цілям.

“Однак у поточній версії Apollo вважає, що поведінка o1 навряд чи призведе до катастрофічних наслідків, оскільки її можливостей поки що недостатньо для реалізації небажаних цілей”, — зазначається у повідомленні. 

Коломієць Надія

Recent Posts

Дим над підйомником у “Буковелі”: що сталося на відомому курорті

У суботу, 7 лютого, після масштабної російської атаки на енергооб’єкти України без електропостачання залишився популярний карпатський гірськолижний курорт…

10 хвилин ago

Через війну в Україні почалася зворотна еволюція собак

Вчені з’ясували, що війна в Україні запустила зворотну еволюцію собак. За короткий, за історичними мірками, період колишні домашні тварини…

19 хвилин ago

Батьки залишаться без допомоги: хто не отримає виплати на дітей

В Україні діє програма державної підтримки "єЯсла", яка передбачає щомісячні виплати для батьків маленьких дітей.…

28 хвилин ago

Ще одна країна Європи хоче заборонити соцмережі для дітей

Прем'єр Чехії Андрей Бабіш заявив у неділю, що підтримує заборону використання соціальних мереж дітьми віком…

36 хвилин ago

Пляшки за гроші та вода з крана: українка поділилась, до чого довелося звикати в Норвегії

Українка, яка переїхала до Норвегії, поділилася несподіваними побутовими змінами, до яких їй довелося звикнути за…

43 хвилини ago

У США підняли в небо культовий винищувач Другої світової: що він може

Хоча існувало багато культових винищувачів часів Другої світової війни, одним з найбільш примітних є Republic P-47 Thunderbolt.…

52 хвилини ago