Розробник ChatGPT OpenAI представив голосові моделі нового покоління для перетворення тексту в мову і назад. У компанії кажуть, що ці моделі засновані на “передових алгоритмах машинного навчання”.
Система дає змогу не тільки конвертувати текст у мову, а й налаштовувати як сам голос, так і його стиль звучання, тембр і емоційність. Наприклад, можна змусити модель говорити “як пірат” або оповідач дитячих казок. Доступні пресети, але є і можливість вводити інструкції вручну.
Крім цього, OpenAI поліпшила свою технологію розпізнавання мови. Нові моделі gpt-4o-transcribe і gpt-4o-mini-transcribe тепер припускаються менше помилок при перетворенні мовлення на текст навіть у складних умовах, як-от сильний акцент, галаслива обстановка і різна швидкість мовлення.
Розробка орієнтована на підвищення інтуїтивності взаємодії зі штучним інтелектом, роблячи її більш інтуїтивною і наближеною до реального спілкування. Оновлені голосові моделі можна легко інтегрувати в різні додатки та сервіси.
Нові моделі вже доступно розробникам через API, також є можливість протестувати його на спеціальному сайті всім охочим.
Російський диктатор Володимир Путін намагається не викликати ворожості з боку США, прагнучи домогтися сприятливого результату…
У Києві залишається складною ситуація з опаленням. Подекуди температура опустилася до критично низького рівня. Про…
Собаки відіграли ключову роль у дослідженні Антарктиди, і згодом використовувалися на континенті майже століття. Але…
Ядерні авіаносці здатні роками ходити морями без дозаправки. Секрет їхньої автономності – у компактному реакторі,…
Болгарські перці відрізняються не лише смаком та ціною, а й поживною цінністю. Яка з них…
Аналітична платформа Numbeo оприлюднила рейтинг п'яти найнебезпечніших міст України, який очолила Одеса. Вона отримала найвищу…