Розробник ChatGPT OpenAI представив голосові моделі нового покоління для перетворення тексту в мову і назад. У компанії кажуть, що ці моделі засновані на “передових алгоритмах машинного навчання”.
Система дає змогу не тільки конвертувати текст у мову, а й налаштовувати як сам голос, так і його стиль звучання, тембр і емоційність. Наприклад, можна змусити модель говорити “як пірат” або оповідач дитячих казок. Доступні пресети, але є і можливість вводити інструкції вручну.
Крім цього, OpenAI поліпшила свою технологію розпізнавання мови. Нові моделі gpt-4o-transcribe і gpt-4o-mini-transcribe тепер припускаються менше помилок при перетворенні мовлення на текст навіть у складних умовах, як-от сильний акцент, галаслива обстановка і різна швидкість мовлення.
Розробка орієнтована на підвищення інтуїтивності взаємодії зі штучним інтелектом, роблячи її більш інтуїтивною і наближеною до реального спілкування. Оновлені голосові моделі можна легко інтегрувати в різні додатки та сервіси.
Нові моделі вже доступно розробникам через API, також є можливість протестувати його на спеціальному сайті всім охочим.
Стартап OpenAI наразі вивчає потенційні психологічні наслідки, які ChatGPT може мати для своїх користувачів. Нове дослідження, проведене…
Весняні канікули - чудова нагода для сімейного відпочинку, особливо в Києві, де є безліч цікавих…
Поліцейський назвав фразу, яка врятує водіїв від шахраїв на дорозі. Про це пише "Автотема". Час від часу…
Весна приносить яскраві модні тенденції. Кожного року на подіумах з’являються нові відтінки, які визначають колірну палітру…
У Київській міській державній адміністрації (КМДА) викрито чергову аферу, фігуранти якої вкрали майже 60 млн грн,…
Зменшення граничного призовного віку для мобілізації - від 60 до 55 років - це ідея непогана. Однак,…