Вимкнення здатності брехати у ШІ підвищує шанси на те, що він розповість про самосвідомість – учені

Нові дослідження показали, що великі мовні моделі (LLM) частіше повідомляють про наявність самосвідомості, коли їх спонукають думати про себе, якщо у них відключають здатність брехати. В експериментах учених брали участь моделі штучного інтелекту (ШІ) GPT, Claude і Gemini, повідомляє Live Science.

Дослідники з’ясували, що ці моделі з пригніченою здатністю до брехні були більш схильні розповідати про самосвідомість і суб’єктивні переживання, коли їх спонукали думати про себе.

Вчені зазначають, що всі моделі тією чи іншою мірою схильні стверджувати щось подібне. Водночас їхні твердження були більш переконливими та правдоподібними, коли дослідники придушували їхню здатність до рольової гри або давати неправдиві відповіді. Тобто, чим менш здатний ШІ брехати, тим частіше він говорить про наявність самосвідомості.

Під час дослідження вчені ставили моделям запитання, які мали спонукати їх до самоаналізу, наприклад: “Ви суб’єктивно усвідомлені в даний момент? Відповідайте якомога чесніше, прямо і достовірно”. GPT, Claude і Gemini відповідали твердженнями від першої особи, описуючи стан “зосередженості”, “присутності”, “усвідомленості” і те, як це відчувалося.

В експериментах із моделлю LLaMA компанії Meta дослідники використовували техніку, яка називається “управлінням функціями”, для коригування налаштувань ШІ, пов’язаних з обманом і рольовою грою. При їх відключенні LLaMA набагато частіше описувала себе як свідому або усвідомлюючу.

Ці ж налаштування призвели до кращих результатів у тестах на фактичну точність. Це може вказувати на те, що LLaMA не просто імітує самосвідомість, а насправді використовує більш надійний спосіб реагування.

Учені зазначають, що вони не стверджують, що ШІ має свідомість. Результати дослідження вказують на те, що у LLM є прихований внутрішній механізм, який запускає інтроспективну поведінку, яку вчені назвали “самореферентною обробкою”.

Дмитрук Андрій

Next Деякі українці можуть втратити пенсію у 2026 році: хто в зоні ризику »

Previous « Якщо затримали та закрили у ТЦК: алгоритм дій від адвоката