Розробник ChatGPT OpenAI представив голосові моделі нового покоління для перетворення тексту в мову і назад. У компанії кажуть, що ці моделі засновані на “передових алгоритмах машинного навчання”.
Система дає змогу не тільки конвертувати текст у мову, а й налаштовувати як сам голос, так і його стиль звучання, тембр і емоційність. Наприклад, можна змусити модель говорити “як пірат” або оповідач дитячих казок. Доступні пресети, але є і можливість вводити інструкції вручну.
Крім цього, OpenAI поліпшила свою технологію розпізнавання мови. Нові моделі gpt-4o-transcribe і gpt-4o-mini-transcribe тепер припускаються менше помилок при перетворенні мовлення на текст навіть у складних умовах, як-от сильний акцент, галаслива обстановка і різна швидкість мовлення.
Розробка орієнтована на підвищення інтуїтивності взаємодії зі штучним інтелектом, роблячи її більш інтуїтивною і наближеною до реального спілкування. Оновлені голосові моделі можна легко інтегрувати в різні додатки та сервіси.
Нові моделі вже доступно розробникам через API, також є можливість протестувати його на спеціальному сайті всім охочим.
Протягом десятиліть люди вважали, що розпізнавання облич є завданням, яке вимагає великого і складного мозку. Проте,…
Цього місяця міжнародна група вчених намагається встановити датчики на льодовику Туейтса і навколо нього. Цей…
В Україні діють посилені правила мобілізації, і за порушення військового обліку передбачені відчутні штрафи. Ігнорування…
Національний банк України готується до випуску нової пам'ятної монети. Як відомо уже зараз, вона матиме…
Середні ціни на квартири у Києві на вторинному та первинному ринку у лютому 2026 року…
Чат-бот Grok, розроблений компанією xAI Ілона Маска, попри заяви про дотримання законів, і далі створює…