Деякі люди побоюються, що штучний інтелект у майбутньому захопить усі робочі місця, позбавивши нас свого заробітку. Проте це навряд чи станеться найближчим часом, що підтверджують результати сміливого експерименту, пише Futurism.
Зазначається, що вчені з Університету Карнегі-Меллона створили фальшиву компанію TheAgentCompany, яка займається розробкою програмного забезпечення. Усі її співробітники – моделі ШІ, призначені для самостійного виконання завдань. Результати цього експерименту виявилися досить хаотичними.
Компанію TheAgentCompany укомплектували штучними працівниками з Google, OpenAI, Anthropic і Meta. Вони виконували ролі фінансових аналітиків, інженерів-програмістів і менеджерів проєктів, працюючи разом із симульованими колегами, такими як фальшивий відділ кадрів і головний технічний директор.
Вчені поставили перед “співробітниками” TheAgentCompany завдання, засновані на повсякденній роботі реальної компанії у сфері інформаційних технологій. Моделі ШІ переміщалися каталогами файлів, віртуально оглядали нові офісні приміщення і писали відгуки про роботу інженерів-програмістів на основі зібраного зворотного зв’язку.
У виданні поділилися, що найкраще себе показала модель Claude 3.5 Sonnet від Anthropic. Проте вона впоралася лише з 24% доручених їй завдань. Для виконання одного завдання моделі доводилося здійснювати близько 30 кроків.
Модель Gemini 2.0 Flash від Google в середньому робила 40 кроків на одне виконане завдання. Тільки 11,4% з них були виконані успішно.
Найгіршим ШІ-працівником виявилася модель Nova Pro v1 від Amazon. Вона робила в середньому по 20 кроків на виконання одного завдання, але показники успіху їх виконання становили лише 1,7%.
Учені заявили, що АІ-співробітники агенти страждають від нестачі здорового глузду, слабких соціальних навичок і поганого розуміння того, як орієнтуватися в Інтернеті. Також нейромережі часто самі створювали собі перешкоди, намагаючись побудувати короткі шляхи до виконання завдань.
“Наприклад, під час виконання одного завдання ШІ-агент не зміг знайти потрібну людину, якій необхідно поставити запитання для виконання завдання. У результаті він вирішив створити найкоротше рішення, перейменувавши іншого користувача на ім’я того, хто йому потрібен”, – розповіли вчені.
Створюючи свій унікальний неповторний стиль, кожна представниця прекрасної статі хоче виглядати привабливо, а не прославитися…
У Колумбії сталася авіакатастрофа за участі пасажирського літака державної авіакомпанії Satena. Загинули всі 15 людей,…
Нове дослідження італійського інженера ставить під сумнів усю історію Стародавнього Єгипту. Згідно з аналізом ерозії каменю,…
В Україні офіційно продовжено дію воєнного стану та загальної мобілізації щонайменше до травня 2026 року.…
Саудівська Аравія та Об’єднані Арабські Емірати повідомили США, що не дозволять використовувати свій повітряний простір…
Обіцянки отримати посвідчення водія «без навчання та іспитів» виглядають привабливо, але саме за цією «легкістю»…