Розробник ChatGPT OpenAI представив голосові моделі нового покоління для перетворення тексту в мову і назад. У компанії кажуть, що ці моделі засновані на “передових алгоритмах машинного навчання”.
Система дає змогу не тільки конвертувати текст у мову, а й налаштовувати як сам голос, так і його стиль звучання, тембр і емоційність. Наприклад, можна змусити модель говорити “як пірат” або оповідач дитячих казок. Доступні пресети, але є і можливість вводити інструкції вручну.
Крім цього, OpenAI поліпшила свою технологію розпізнавання мови. Нові моделі gpt-4o-transcribe і gpt-4o-mini-transcribe тепер припускаються менше помилок при перетворенні мовлення на текст навіть у складних умовах, як-от сильний акцент, галаслива обстановка і різна швидкість мовлення.
Розробка орієнтована на підвищення інтуїтивності взаємодії зі штучним інтелектом, роблячи її більш інтуїтивною і наближеною до реального спілкування. Оновлені голосові моделі можна легко інтегрувати в різні додатки та сервіси.
Нові моделі вже доступно розробникам через API, також є можливість протестувати його на спеціальному сайті всім охочим.
З початку 2026 року російські регіони опинилися у вкрай скрутному фінансовому становищі та фактично змушені…
До Сонця наближається нова комета, яка вже привернула увагу астрономів. Це, в першу чергу, пов’язано з її походженням. Вона…
У США з’явилося одне з найнезвичніших сортів крафтового пива у світі. Американський бренд спортивного одягу…
У Сполучених Штатах посилили внутрішній контроль за обігом розвідувальної інформації після інциденту, пов'язаного з перехопленням…
Чоловік, якого у Дніпрі до смерті забили військкоми, зустрів їх під час прогулянки із собакою. Про…
В Донецькій області росіяни просунулися в напрямку адміністративного центру підконтрольної Україні частини Донецької області відразу…