Categories: Технології

Люди не впізнали ШІ: 73% сплутали GPT-4.5 з людиною

Вчені заявили, що великі мовні моделі вже здатні настільки точно імітувати людину, тому GPT-4.5 успішно пройшов тест Тюрінга.

Про це повідомляє T4.

У новому дослідженні зазначено, що під час тристороннього тесту GPT-4.5 зумів у 73% випадків переконати учасників у тому, що вони спілкуються з людиною. У цьому ж дослідженні порівнювали інші моделі штучного інтелекту.

Хоча раніше інша команда повідомляла, що GPT-4 пройшов двосторонній тест Тюрінга, це дослідження стало першим прикладом, коли LLM пройшла складнішу версію “імітаційної гри”, запропоновану Аланом Тюрінгом.

Один із авторів дослідження, Кемерон Джонс з Університету Сан-Дієго, прокоментував у соцмережі X:

“Чи LLM проходять тест Тюрінга? Ми вважаємо, що це досить переконливий доказ того, що проходять. Люди не можуть краще, ніж випадково, відрізнити людей від GPT-4.5 і LLaMa (з підказкою про особу). І навіть 4.5 вважали людиною значно частіше, ніж справжніх людей!”

Найвищий результат продемонструвала модель GPT-4.5. Водночас LLaMa-3.1 від Meta також була помилково сприйнята як людина у 56% випадків — цей показник перевищує оригінальний прогноз Тюрінга, згідно з яким “середній запитувач матиме не більше 70% шансів на правильну ідентифікацію після п’ятихвилинної розмови”.

Романчук Микола

Recent Posts

По 20 годин без світла стануть нормою: що чекає на українців

Майже доба без світла може стати новою реальністю для великих міст. Масована атака росіян по…

7 хвилин ago

Коломойський під час судового засідання влаштував страшний скандал: деталі

Під час чергового судового засідання за участю бізнесмена Ігоря Коломойського виникла гостра суперечка через заборону…

15 хвилин ago

Проблеми в сексі: як вони руйнують стосунки, навіть якщо ви цього не помічаєте

Інтимне життя — важлива частина будь-яких стосунків. Часто саме проблеми в ліжку стають першою ознакою…

20 хвилин ago

Не шкодять фігурі та дають енергію: ТОП-5 корисних перекусів, які радять нутриціологи

Перекуси часто мають погану репутацію — їх звинувачують у наборі ваги та зриві дієти. Насправді…

29 хвилин ago

Мир буксує: WSJ назвав три головні проблеми переговорів щодо України

Українські, американські та російські переговірники завершили дводенні переговори в Абу-Дабі, не досягнувши практично жодного прогресу в найскладнішому…

41 хвилина ago

Один простий лайфхак, який щомісяця економить гроші — ви точно ним не користуєтесь

Більшість людей переконані, що для економії потрібні жорсткі обмеження, таблиці витрат і повна відмова від…

56 хвилин ago