Нещодавнє дослідження Humaine, за результатами якого склали топ найкращих чат-ботів за версією користувачів, показало несподіваний результат: улюблений мільйонами ChatGPT посів лише 8-ме місце.
На вершині рейтингу опинився Google Gemini 2.5 Pro, випередивши китайський DeepSeek і французький Magistral від Mistral. Humaine оцінює чат-ботів за тим, наскільки зручно і зрозуміло з ними спілкуватися, як вони адаптуються до діалогу і викликають довіру.
Humaine оцінює чат-ботів через реальні діалоги користувачів. Загалом у дослідженні брали участь майже 25 тисяч осіб із США і Великої Британії, які представляють різні вікові групи, раси і політичні уподобання.
Кожного бота оцінювали за чотирма критеріями: виконання основного завдання та логіка міркувань, уміння підтримувати діалог і адаптуватися до зміни теми, стиль спілкування та подача інформації, довіра, етичність і безпека відповідей.
Особливість дослідження – head-to-head порівняння: користувачі вели діалог із двома анонімними моделями та обирали переможця. Такий метод дає реальну оцінку того, як бот спілкується з людиною, а не тільки розв’язує тестові завдання.
Humaine показує, що для більшості людей важливим є не тільки правильне розв’язання задачі, а й зручність, природність і зрозумілість спілкування.
Комітет Верховної Ради рекомендував прийняти за основу законопроєкт №14320, який суттєво розширює повноваження сільських та…
Покупка б/у автомобіля завжди пов’язана з ризиком — як переплатити, купити авто з прихованими проблемами…
На території Мозирського нафтопереробного заводу в Білорусі з літа 2025 року розміщена система протиповітряної оборони,…
В інтернеті щороку з’являються десятки «чудо-порад» для садівників і дачників. Одна з найпопулярніших — поливати…
Чорний колір роками вважався універсальним і безпечним вибором для щоденного одягу. Проте стилісти та імідж-експерти…
Військовослужбовці зі статусом учасника бойових дій мають право на безплатний проїзд один раз на два…