OpenAI поділилася результатами нового тесту GDPval, який уперше спробував оцінити, наскільки можливості сучасних провідних ШІ-моделей близькі до професійного рівня в економічно значущих професіях.
Тест охопив 9 провідних галузей економіки США та 44 професії – від агентів з продажу нерухомості та соціальних працівників до медсестер, інженерів і фінансових консультантів.
Результати показали, що найкраще ШІ-моделі проявили себе в рутинних та чітко сформульованих завданнях. Наприклад, GPT-5 і його конкуренти успішно підготували маркетингові матеріали, аналізували ринок, працювали з первинною юридичною документацією та обробляли медичні зображення.
Примітно, що лідером тесту виявився зовсім не GPT-5, а Claude Opus 4.1 від Anthropic. Він набрав найкращі оцінки від галузевих експертів за 220 завданнями. ШІ-модель від OpenAI посіла друге місце, продемонструвавши точність виконання завдань на одному рівні з галузевими експертами.
У OpenAI наголосили, що результати включають тільки обмежений набір завдань, тому говорити про повне заміщення професій поки зарано. Проте компанія фактично визнає, що штучний інтелект уже здатний виконувати частину завдань швидше і дешевше за фахівців.
Ключова проблема залишається незмінною – галюцинації та помилки, що особливо критично під час використання ШІ в науці, освіті або, наприклад, у медицині.
З моменту запуску першої версії ChatGPT наприкінці 2022 року, ШІ чат-бот постійно вдосконалювався. На початку серпня 2025-го OpenAI представила модель нового покоління – ChatGPT 5. За словами авторів, використовувати її – немов спілкуватися з кандидатом наук.
Колишній голова Офісу президента Андрій Єрмак нещодавно відвідував секретаря РНБО та ексміністра оборони Рустема Умєрова в його…
Дослідники відтворили зовнішність чоловіка, який жив на острові Ратлін в Ірландії понад чотири тисячі років тому. Унікальне…
Станом на 1 січня 2026 року українці зберігали на банківських рахунках 1,618 трлн грн —…
У 2026 році деякі категорії пенсіонерів можуть отримувати лише частину своєї пенсії, якщо перебувають на…
Спортсменів зі стрибків на лижах з трампліну, які братимуть участь в зимових Олімпійських іграх, можуть перевіряти на ін’єкції для збільшення…
Кофеїн стимулює нервову систему, підвищує концентрацію та додає енергії. Однак є і негативний вплив —…