OpenAI поділилася результатами нового тесту GDPval, який уперше спробував оцінити, наскільки можливості сучасних провідних ШІ-моделей близькі до професійного рівня в економічно значущих професіях.
Тест охопив 9 провідних галузей економіки США та 44 професії – від агентів з продажу нерухомості та соціальних працівників до медсестер, інженерів і фінансових консультантів.
Результати показали, що найкраще ШІ-моделі проявили себе в рутинних та чітко сформульованих завданнях. Наприклад, GPT-5 і його конкуренти успішно підготували маркетингові матеріали, аналізували ринок, працювали з первинною юридичною документацією та обробляли медичні зображення.
Примітно, що лідером тесту виявився зовсім не GPT-5, а Claude Opus 4.1 від Anthropic. Він набрав найкращі оцінки від галузевих експертів за 220 завданнями. ШІ-модель від OpenAI посіла друге місце, продемонструвавши точність виконання завдань на одному рівні з галузевими експертами.
У OpenAI наголосили, що результати включають тільки обмежений набір завдань, тому говорити про повне заміщення професій поки зарано. Проте компанія фактично визнає, що штучний інтелект уже здатний виконувати частину завдань швидше і дешевше за фахівців.
Ключова проблема залишається незмінною – галюцинації та помилки, що особливо критично під час використання ШІ в науці, освіті або, наприклад, у медицині.
З моменту запуску першої версії ChatGPT наприкінці 2022 року, ШІ чат-бот постійно вдосконалювався. На початку серпня 2025-го OpenAI представила модель нового покоління – ChatGPT 5. За словами авторів, використовувати її – немов спілкуватися з кандидатом наук.
Подорожуючи, варто бути пильними щодо своїх грошей і документів, адже в деяких містах світу ризик…
Вченому вдалось виявити сліди давньої глобальної цивілізації, яка нібито існувала задовго до відомих історичних епох і залишила по всьому…
Деякі українці продають на OLX домашніх тварин, зокрема кошенят. Станом на початок лютого 2026 року…
Астероїд 2024 YR4 діаметром близько 60 м, який вчені вважали потенційно небезпечним для Землі, тепер, як…
В Україні для військовозобов’язаних, які порушують правила військового обліку, законодавством передбачені певні обмеження прав. Водночас…
Аналітик аграрного бізнесу пояснив, чому знеструмлення змусять українців платити більше за крупи. Попри те, що крупи…