Розробник ChatGPT OpenAI представив голосові моделі нового покоління для перетворення тексту в мову і назад. У компанії кажуть, що ці моделі засновані на “передових алгоритмах машинного навчання”.
Система дає змогу не тільки конвертувати текст у мову, а й налаштовувати як сам голос, так і його стиль звучання, тембр і емоційність. Наприклад, можна змусити модель говорити “як пірат” або оповідач дитячих казок. Доступні пресети, але є і можливість вводити інструкції вручну.
Крім цього, OpenAI поліпшила свою технологію розпізнавання мови. Нові моделі gpt-4o-transcribe і gpt-4o-mini-transcribe тепер припускаються менше помилок при перетворенні мовлення на текст навіть у складних умовах, як-от сильний акцент, галаслива обстановка і різна швидкість мовлення.
Розробка орієнтована на підвищення інтуїтивності взаємодії зі штучним інтелектом, роблячи її більш інтуїтивною і наближеною до реального спілкування. Оновлені голосові моделі можна легко інтегрувати в різні додатки та сервіси.
Нові моделі вже доступно розробникам через API, також є можливість протестувати його на спеціальному сайті всім охочим.
Популярні місця відпочинку по всій Європі запроваджують антитуристичні обмеження в боротьбі за поліпшення життя своїх розгніваних місцевих…
Верховна Рада готується запровадити оподаткування доходів, отриманих українцями від операцій із криптовалютою. За словами голови парламентського фінансового…
Тарифи на основні комунальні послуги залишаються незмінними після 30 квітня. Але все ж таки в…
Частина доларів, які українці можуть зберігати вдома, мають печатки або інші дивні позначення. Проблема виникає…
З підвищенням температури автовласникам по всій Україні нагадують про важливість переходу із зимових шин на…
Українці, які через війну опинилися у складних обставинах, можуть претендувати на одноразову допомогу у розмірі…