Site icon Експерт

Люди не впізнали ШІ: 73% сплутали GPT-4.5 з людиною

Вчені заявили, що великі мовні моделі вже здатні настільки точно імітувати людину, тому GPT-4.5 успішно пройшов тест Тюрінга.

Про це повідомляє T4.

У новому дослідженні зазначено, що під час тристороннього тесту GPT-4.5 зумів у 73% випадків переконати учасників у тому, що вони спілкуються з людиною. У цьому ж дослідженні порівнювали інші моделі штучного інтелекту.

Хоча раніше інша команда повідомляла, що GPT-4 пройшов двосторонній тест Тюрінга, це дослідження стало першим прикладом, коли LLM пройшла складнішу версію “імітаційної гри”, запропоновану Аланом Тюрінгом.

Один із авторів дослідження, Кемерон Джонс з Університету Сан-Дієго, прокоментував у соцмережі X:

“Чи LLM проходять тест Тюрінга? Ми вважаємо, що це досить переконливий доказ того, що проходять. Люди не можуть краще, ніж випадково, відрізнити людей від GPT-4.5 і LLaMa (з підказкою про особу). І навіть 4.5 вважали людиною значно частіше, ніж справжніх людей!”

Найвищий результат продемонструвала модель GPT-4.5. Водночас LLaMa-3.1 від Meta також була помилково сприйнята як людина у 56% випадків — цей показник перевищує оригінальний прогноз Тюрінга, згідно з яким “середній запитувач матиме не більше 70% шансів на правильну ідентифікацію після п’ятихвилинної розмови”.

Читати повну версію