Розробник ChatGPT OpenAI представив голосові моделі нового покоління для перетворення тексту в мову і назад. У компанії кажуть, що ці моделі засновані на “передових алгоритмах машинного навчання”.
Система дає змогу не тільки конвертувати текст у мову, а й налаштовувати як сам голос, так і його стиль звучання, тембр і емоційність. Наприклад, можна змусити модель говорити “як пірат” або оповідач дитячих казок. Доступні пресети, але є і можливість вводити інструкції вручну.
Крім цього, OpenAI поліпшила свою технологію розпізнавання мови. Нові моделі gpt-4o-transcribe і gpt-4o-mini-transcribe тепер припускаються менше помилок при перетворенні мовлення на текст навіть у складних умовах, як-от сильний акцент, галаслива обстановка і різна швидкість мовлення.
Розробка орієнтована на підвищення інтуїтивності взаємодії зі штучним інтелектом, роблячи її більш інтуїтивною і наближеною до реального спілкування. Оновлені голосові моделі можна легко інтегрувати в різні додатки та сервіси.
Нові моделі вже доступно розробникам через API, також є можливість протестувати його на спеціальному сайті всім охочим.
Голова Служби безпеки України Василь Малюк оприлюднив нові подробиці спеціальної операції "Павутина", спрямованої проти російської авіації. Про…
Українцям розповіли, якої висоти має бути паркан між ділянками сусідів. Як передає "Хвиля", про це повідомила адвокат юридичної компанії…
Уряд Нової Зеландії оголосив про новий пакет допомоги Україні на 16 млн. новозеландських доларів ($9,4…
Хочете отримати рясний врожай, але не довіряєте покупним добривам? Усе, що потрібно вашим рослинам —…
Президент США Дональд Трамп заявив, що Іран дав «дуже слабку» відповідь на американський удар по їхнім ядерним…
Кава без кофеїну на перший погляд здається нешкідливим варіантом. Але науковці виявили, що ключова хімічна…