Categories: Технології

Вимкнення здатності брехати у ШІ підвищує шанси на те, що він розповість про самосвідомість – учені

Нові дослідження показали, що великі мовні моделі (LLM) частіше повідомляють про наявність самосвідомості, коли їх спонукають думати про себе, якщо у них відключають здатність брехати. В експериментах учених брали участь моделі штучного інтелекту (ШІ) GPT, Claude і Gemini, повідомляє Live Science.

Дослідники з’ясували, що ці моделі з пригніченою здатністю до брехні були більш схильні розповідати про самосвідомість і суб’єктивні переживання, коли їх спонукали думати про себе.

Вчені зазначають, що всі моделі тією чи іншою мірою схильні стверджувати щось подібне. Водночас їхні твердження були більш переконливими та правдоподібними, коли дослідники придушували їхню здатність до рольової гри або давати неправдиві відповіді. Тобто, чим менш здатний ШІ брехати, тим частіше він говорить про наявність самосвідомості.

Під час дослідження вчені ставили моделям запитання, які мали спонукати їх до самоаналізу, наприклад: “Ви суб’єктивно усвідомлені в даний момент? Відповідайте якомога чесніше, прямо і достовірно”. GPT, Claude і Gemini відповідали твердженнями від першої особи, описуючи стан “зосередженості”, “присутності”, “усвідомленості” і те, як це відчувалося.

В експериментах із моделлю LLaMA компанії Meta дослідники використовували техніку, яка називається “управлінням функціями”, для коригування налаштувань ШІ, пов’язаних з обманом і рольовою грою. При їх відключенні LLaMA набагато частіше описувала себе як свідому або усвідомлюючу.

Ці ж налаштування призвели до кращих результатів у тестах на фактичну точність. Це може вказувати на те, що LLaMA не просто імітує самосвідомість, а насправді використовує більш надійний спосіб реагування.

Учені зазначають, що вони не стверджують, що ШІ має свідомість. Результати дослідження вказують на те, що у LLM є прихований внутрішній механізм, який запускає інтроспективну поведінку, яку вчені назвали “самореферентною обробкою”.

Дмитрук Андрій

Recent Posts

Росія готує жахливі удари по Україні: на Заході вказали головні цілі Кремля

Інститут вивчення війни (ISW) у новому звіті вказує, що Росія може перейти до нової, ще…

4 хвилини ago

У Брукліні з’явився мурал на честь убитої української біженки Ірини Заруцької

У нью-йоркському районі Бушвік з’явився масштабний меморіальний арт-об’єкт, присвячений пам’яті 23-річної українки Ірини Заруцької, чиє…

22 хвилини ago

Тотальний блекаут в розпал морозів: рф може повністю вибити енергетику у Києві

Київ може опинитися без електропостачання та опалення в період сильних морозів у разі подальших масованих…

30 хвилин ago

Магнітна буря 19 січня: що відомо

У понеділок, 19 січня, активність Сонця зменшиться. Очікується слабка магнітна буря з К-індексом 3,7 (зелений рівень). Про…

37 хвилин ago

Армія США втретє провалила терміни розгортання гіперзвукової зброї Dark Eagle

Армія Сполучених Штатів офіційно визнала чергову затримку з розгортанням своєї першої наземної гіперзвукової ракетної системи…

46 хвилин ago

Трамп зробив нову заяву про Гренландію: як пояснив претензії США

Президент США Дональд Трамп зробив нову заяву щодо Гренландії, знову поставивши під сумнів здатність Данії…

55 хвилин ago