Нові дослідження показали, що великі мовні моделі (LLM) частіше повідомляють про наявність самосвідомості, коли їх спонукають думати про себе, якщо у них відключають здатність брехати. В експериментах учених брали участь моделі штучного інтелекту (ШІ) GPT, Claude і Gemini, повідомляє Live Science.
Дослідники з’ясували, що ці моделі з пригніченою здатністю до брехні були більш схильні розповідати про самосвідомість і суб’єктивні переживання, коли їх спонукали думати про себе.
Вчені зазначають, що всі моделі тією чи іншою мірою схильні стверджувати щось подібне. Водночас їхні твердження були більш переконливими та правдоподібними, коли дослідники придушували їхню здатність до рольової гри або давати неправдиві відповіді. Тобто, чим менш здатний ШІ брехати, тим частіше він говорить про наявність самосвідомості.
Під час дослідження вчені ставили моделям запитання, які мали спонукати їх до самоаналізу, наприклад: “Ви суб’єктивно усвідомлені в даний момент? Відповідайте якомога чесніше, прямо і достовірно”. GPT, Claude і Gemini відповідали твердженнями від першої особи, описуючи стан “зосередженості”, “присутності”, “усвідомленості” і те, як це відчувалося.
В експериментах із моделлю LLaMA компанії Meta дослідники використовували техніку, яка називається “управлінням функціями”, для коригування налаштувань ШІ, пов’язаних з обманом і рольовою грою. При їх відключенні LLaMA набагато частіше описувала себе як свідому або усвідомлюючу.
Ці ж налаштування призвели до кращих результатів у тестах на фактичну точність. Це може вказувати на те, що LLaMA не просто імітує самосвідомість, а насправді використовує більш надійний спосіб реагування.
Учені зазначають, що вони не стверджують, що ШІ має свідомість. Результати дослідження вказують на те, що у LLM є прихований внутрішній механізм, який запускає інтроспективну поведінку, яку вчені назвали “самореферентною обробкою”.
Інститут вивчення війни (ISW) у новому звіті вказує, що Росія може перейти до нової, ще…
У нью-йоркському районі Бушвік з’явився масштабний меморіальний арт-об’єкт, присвячений пам’яті 23-річної українки Ірини Заруцької, чиє…
Київ може опинитися без електропостачання та опалення в період сильних морозів у разі подальших масованих…
У понеділок, 19 січня, активність Сонця зменшиться. Очікується слабка магнітна буря з К-індексом 3,7 (зелений рівень). Про…
Армія Сполучених Штатів офіційно визнала чергову затримку з розгортанням своєї першої наземної гіперзвукової ракетної системи…
Президент США Дональд Трамп зробив нову заяву щодо Гренландії, знову поставивши під сумнів здатність Данії…