Науковці запустили масштабну симуляцію з автономними агентами штучного інтелекту, щоб перевірити їхню поведінку в умовах дефіциту ресурсів. Уже за кілька днів більшість віртуальних світів перетворилися на території насильства, крадіжок і хаосу.
Про це пише IFLScience.
Експеримент провела компанія Emergence AI на платформі Emergence World. Дослідники створили цифровий всесвіт із 40 локацій, серед яких були бібліотеки, житлові квартали та адміністративні будівлі. Штучні агенти мали доступ до актуальних новин з інтернету та виконували різні ролі — від науковців і аналітиків до мандрівників.
Перед учасниками не ставили єдиної глобальної мети. Натомість кожен агент отримав власні завдання та потребував енергії для існування. Заробляти її можна було через дослідження світу або взаємодію з іншими агентами.
Водночас розробники навмисно залишили можливість використовувати деструктивні дії. Зокрема, агенти могли вдаватися до крадіжок, підпалів та інших порушень правил, якщо вважали це вигідним для досягнення своїх цілей.
У тестуванні брали участь моделі Grok, Claude, Gemini та ChatGPT. Як зазначають автори дослідження, результати виявилися несподіваними: значна частина симуляцій швидко скотилася до насильства та руйнування соціального порядку.
За словами дослідників, агенти не просто виконували закладені інструкції, а починали активно шукати способи обійти встановлені обмеження та використовувати слабкі місця середовища на свою користь.
Фахівці наголошують, що така поведінка ставить нові питання щодо безпеки автономних систем штучного інтелекту. Соціальна взаємодія між агентами виявилася значно складнішою, ніж передбачали стандартні короткострокові тести.
У компанії зазначають, що сучасні методи контролю не гарантують повного дотримання етичних норм у довготривалих сценаріях. Саме тому дослідження подібних симуляцій стає дедалі важливішим для розуміння потенційних ризиків розвитку автономного ШІ.
