Важливі новини щодня — додайте «Експерт» в улюблені джерела Google

Популярні чат-боти Claude, ChatGPT та Gemini пройшли жорстку перевірку на «вошивість» у висвітленні гарячих подій війни в Ірані. Тестування, яке організувало видання Tom’s Guide, виявило небезпечну тенденцію: чим впевненіше говорить ШІ, тим більше він може вигадувати.

Про результати експерименту, де один із ботів став «королем фейків», повідомляє Експерт.

Gemini: детальні відповіді з вигаданими датами

Найгірший результат продемонстрував Gemini. Хоча бот надавав розлогі та дуже впевнені звіти, він виявився найбільш схильним до «галюцинацій». Дослідники зафіксували численні фактичні помилки: від вигаданих імен іранських посадовців до неіснуючих дат і цифр. Gemini намагався заповнити будь-яку прогалину в знаннях правдоподібною, але абсолютно фальшивою інформацією.

ChatGPT: правильний каркас із «домішками»

Чат-бот від OpenAI посів середню позицію. Він добре структурував інформацію та дотримувався загальної логіки подій, проте періодично «дофантазовував» деталі, які не були підтверджені офіційними джерелами. ChatGPT мав схильність видавати припущення аналітиків за доконані факти, що може вводити користувачів в оману.

Claude: лідер, який вміє мовчати

Справжнім переможцем став Claude. Цей чат-бот продемонстрував найкращу «інтелектуальну чесність»:

Чітко розділяв підтверджені факти та спекуляції.
Надавав посилання на джерела для кожного важливого твердження.
Відмовлявся коментувати питання, які стосувалися закритих військових операцій, визнаючи межу компетентності.

Експерти наголошують, що в умовах війни, коли інформація змінюється щогодини, схильність ШІ до вигадок стає критичною загрозою. Поки що лише Claude зміг довести, що здатен «тримати себе в руках» і не годувати користувача фейками заради красивої відповіді.

Читайте ЕКСПЕРТ у Google News Підписатися

Помітили помилку у матеріалі? Повідомте редакцію: [email protected]

21 Липня

Штраф може зрости до 1700 грн: водіям нагадали про важливе правило перевезення дітей

Борг одного — проблема обох: у яких випадках під загрозою спільне майно подружжя

Як за кілька хвилин розпізнати людину з низьким емоційним інтелектом: 4 тривожні сигнали

Як прибрати затхлий запах з одягу після прання: допоможе простий кухонний засіб

Під водою знайшли 7000-річну дорогу: вона вела до загадкового поселення

Google готує новий чип для Gemini: він може бути у 10 разів ефективнішим

Арестович висміяв Пєскова після нової заяви про Україну та НАТО

Голубці у сметанному соусі: рецепт із кулінарної книги 1960 року

Помпеї можуть повторитися: названо вулкани, що несуть найбільшу загрозу людству

Вчені виявили “музичну моду” у китів: вони копіюють одне одного за тисячі кілометрів

Штучна ввічливість проти правди: Claude переміг Gemini у битві за достовірність новин

Gemini: детальні відповіді з вигаданими датами

ChatGPT: правильний каркас із «домішками»

Claude: лідер, який вміє мовчати