Нещодавнє дослідження Humaine, за результатами якого склали топ найкращих чат-ботів за версією користувачів, показало несподіваний результат: улюблений мільйонами ChatGPT посів лише 8-ме місце.
На вершині рейтингу опинився Google Gemini 2.5 Pro, випередивши китайський DeepSeek і французький Magistral від Mistral. Humaine оцінює чат-ботів за тим, наскільки зручно і зрозуміло з ними спілкуватися, як вони адаптуються до діалогу і викликають довіру.
Humaine оцінює чат-ботів через реальні діалоги користувачів. Загалом у дослідженні брали участь майже 25 тисяч осіб із США і Великої Британії, які представляють різні вікові групи, раси і політичні уподобання.
Кожного бота оцінювали за чотирма критеріями: виконання основного завдання та логіка міркувань, уміння підтримувати діалог і адаптуватися до зміни теми, стиль спілкування та подача інформації, довіра, етичність і безпека відповідей.
Особливість дослідження – head-to-head порівняння: користувачі вели діалог із двома анонімними моделями та обирали переможця. Такий метод дає реальну оцінку того, як бот спілкується з людиною, а не тільки розв’язує тестові завдання.
Humaine показує, що для більшості людей важливим є не тільки правильне розв’язання задачі, а й зручність, природність і зрозумілість спілкування.
Виконавця замаху на заступника начальника Головного розвідувального управління Володимира Алексєєва затримали у Дубаї. Про це…
Польща готується до важливих змін у правилах працевлаштування для іноземців, зокрема українців, які становлять значну…
Багато городників та садівників роками експериментують з добривами та стимуляторами росту, сподіваючись знайти надійний спосіб…
Для того щоб дитина росла щасливою та впевненою, важливо усвідомлювати, що певні дії чи слова…
Цього тижня музей Лувр опублікував фотографії, що показують поточний стан корони імператриці Євгенії, яку дивом не…
Європейські синоптичні центри вже фіксують перебудову атмосферних процесів на весняний лад, проте шлях до тепла пролягатиме через…