Популярні чат-боти Claude, ChatGPT та Gemini пройшли жорстку перевірку на «вошивість» у висвітленні гарячих подій війни в Ірані. Тестування, яке організувало видання Tom’s Guide, виявило небезпечну тенденцію: чим впевненіше говорить ШІ, тим більше він може вигадувати.
Про результати експерименту, де один із ботів став «королем фейків», повідомляє Експерт.
Gemini: детальні відповіді з вигаданими датами
Найгірший результат продемонстрував Gemini. Хоча бот надавав розлогі та дуже впевнені звіти, він виявився найбільш схильним до «галюцинацій». Дослідники зафіксували численні фактичні помилки: від вигаданих імен іранських посадовців до неіснуючих дат і цифр. Gemini намагався заповнити будь-яку прогалину в знаннях правдоподібною, але абсолютно фальшивою інформацією.
ChatGPT: правильний каркас із «домішками»
Чат-бот від OpenAI посів середню позицію. Він добре структурував інформацію та дотримувався загальної логіки подій, проте періодично «дофантазовував» деталі, які не були підтверджені офіційними джерелами. ChatGPT мав схильність видавати припущення аналітиків за доконані факти, що може вводити користувачів в оману.
Claude: лідер, який вміє мовчати
Справжнім переможцем став Claude. Цей чат-бот продемонстрував найкращу «інтелектуальну чесність»:
- Чітко розділяв підтверджені факти та спекуляції.
- Надавав посилання на джерела для кожного важливого твердження.
- Відмовлявся коментувати питання, які стосувалися закритих військових операцій, визнаючи межу компетентності.
Експерти наголошують, що в умовах війни, коли інформація змінюється щогодини, схильність ШІ до вигадок стає критичною загрозою. Поки що лише Claude зміг довести, що здатен «тримати себе в руках» і не годувати користувача фейками заради красивої відповіді.
