OpenAI поділилася результатами нового тесту GDPval, який уперше спробував оцінити, наскільки можливості сучасних провідних ШІ-моделей близькі до професійного рівня в економічно значущих професіях.
Тест охопив 9 провідних галузей економіки США та 44 професії – від агентів з продажу нерухомості та соціальних працівників до медсестер, інженерів і фінансових консультантів.
Результати показали, що найкраще ШІ-моделі проявили себе в рутинних та чітко сформульованих завданнях. Наприклад, GPT-5 і його конкуренти успішно підготували маркетингові матеріали, аналізували ринок, працювали з первинною юридичною документацією та обробляли медичні зображення.
Примітно, що лідером тесту виявився зовсім не GPT-5, а Claude Opus 4.1 від Anthropic. Він набрав найкращі оцінки від галузевих експертів за 220 завданнями. ШІ-модель від OpenAI посіла друге місце, продемонструвавши точність виконання завдань на одному рівні з галузевими експертами.
У OpenAI наголосили, що результати включають тільки обмежений набір завдань, тому говорити про повне заміщення професій поки зарано. Проте компанія фактично визнає, що штучний інтелект уже здатний виконувати частину завдань швидше і дешевше за фахівців.
Ключова проблема залишається незмінною – галюцинації та помилки, що особливо критично під час використання ШІ в науці, освіті або, наприклад, у медицині.
З моменту запуску першої версії ChatGPT наприкінці 2022 року, ШІ чат-бот постійно вдосконалювався. На початку серпня 2025-го OpenAI представила модель нового покоління – ChatGPT 5. За словами авторів, використовувати її – немов спілкуватися з кандидатом наук.
У 2026 році українцям варто готуватися до подорожчання одного з базових продуктів харчування – гречки.…
Нобелівський комітет відреагував на те, що лауреатка Премії миру Марія Коріна Мачадо передала свою медаль президенту США…
Фахівці Пенсійного фонду України (ПФУ) розповіли, як громадянам почати вчасно отримувати пенсію з 65 років,…
80% дронів, що надходять в ЗСУ, являють собою "різноманітний шлак". Так оцінив ситуацію з поставками…
Королівський військово-морський флот Великої Британії завершив перший політ свого першого повнорозмірного автономного вертольота, призначеного для…
Державна фінустанова "Ощадбанк" може стягувати комісії навіть із заблокованих кредитних карток. Таке може статися у…