Популярний чат-бот ChatGPT демонструє високий рівень самовпевненості, який не завжди підкріплений фактами. Як повідомляє Експерт із посиланням на дослідження Університету штату Вашингтон, система схильна давати діаметрально протилежні відповіді на один і той самий запит.
Дослідник Месут Чічек провів експеримент, повторюючи ідентичні наукові запитання до десяти разів поспіль. Результати виявилися невтішними: система часто змінювала вердикт із «правда» на «хиба» без будь-яких змін у формулюванні завдання. Лише 72,9% відповідей залишалися незмінно правильними після серії повторів, що свідчить про серйозну нестабільність алгоритмів.
Загальна точність нейромережі у 2025 році на перший погляд сягала 80%. Проте після вирахування фактора випадкового вгадування реальний показник ефективності впав до 60%. Найслабшим місцем виявилися непідтверджені гіпотези: у таких випадках ШІ розпізнавав помилку лише у 16,4% тестів, зазвичай просто погоджуючись із твердженням користувача.
Причина такої поведінки криється в самій архітектурі мовних моделей. Вони прогнозують найбільш імовірну послідовність слів на основі масивів тексту, а не проводять логічну перевірку фактів у реальному часі. Через це грамотно побудована фраза може бути цілковитою вигадкою, яку розробники називають «галюцинацією» ШІ.
Науковці наголошують, що штучний інтелект станом на березень 2026 року залишається допоміжним інструментом, а не надійним джерелом істини. Для складних аналітичних завдань фахівці радять використовувати метод «перехресної перевірки»: ставити одне запитання кілька разів та зіставляти результати з офіційними науковими джерелами.
Попри прогрес порівняно з минулим роком, ChatGPT досі не може гарантувати стабільність логічних висновків. Дослідники підсумовують: остаточне рішення та верифікація даних мають залишатися за людиною, оскільки алгоритм орієнтується на статистику слів, а не на розуміння суті проблеми.
