Розробник ChatGPT OpenAI представив голосові моделі нового покоління для перетворення тексту в мову і назад. У компанії кажуть, що ці моделі засновані на “передових алгоритмах машинного навчання”.
Система дає змогу не тільки конвертувати текст у мову, а й налаштовувати як сам голос, так і його стиль звучання, тембр і емоційність. Наприклад, можна змусити модель говорити “як пірат” або оповідач дитячих казок. Доступні пресети, але є і можливість вводити інструкції вручну.
Крім цього, OpenAI поліпшила свою технологію розпізнавання мови. Нові моделі gpt-4o-transcribe і gpt-4o-mini-transcribe тепер припускаються менше помилок при перетворенні мовлення на текст навіть у складних умовах, як-от сильний акцент, галаслива обстановка і різна швидкість мовлення.
Розробка орієнтована на підвищення інтуїтивності взаємодії зі штучним інтелектом, роблячи її більш інтуїтивною і наближеною до реального спілкування. Оновлені голосові моделі можна легко інтегрувати в різні додатки та сервіси.
Нові моделі вже доступно розробникам через API, також є можливість протестувати його на спеціальному сайті всім охочим.
Глава НБУ Андрій Пишний заявив, що Україна може відмовитися від долара як основної валюти для…
Українців попередили, що влітку можливі відключення світла у вечірній час. Причина – ремонтні роботи на…
З травня по червень в Україні триває пік активності кліщів. У Міністерстві охорони здоров’я нагадали, як…
Представник Європейської комісії назвав Китай ключовим спонсором війни Росії проти України. Як передає "Хвиля", про це повідомляє Reuters. Неназваний…
ПриватБанк пропонує кілька зручних рішень, які допоможуть клієнтам підтримувати безперебійний доступ до своїх рахунків та…
Податкова взялася за банківські перекази: 11 тисяч українців вже потрапили у поле зору через підозрілу…