У застосунку ChatGPT помітили ознаки нової голосової моделі, яка зможе одночасно слухати й говорити. Оновлення можуть запустити вже найближчими днями.
Про це пише Android Authority.
У коді застосунку виявили згадки про модель GPT Bidi 1. Її назва походить від слова bidirectional — тобто двонаправлена. Першим на це звернув увагу ресурс TestingCatalog.
Нову модель описують як наступне покоління голосового режиму ChatGPT із помітним стрибком у рівні інтелекту. Вона має з’явитися у списку доступних моделей поряд зі стандартним і розширеним голосовими режимами.
Після активації GPT Bidi 1 іконка голосового режиму, за попередніми даними, змінюватиме колір на жовтий.
Головна особливість новинки — здатність говорити, поки користувач ще продовжує фразу, і водночас не втрачати здатність слухати. Це має зробити діалог більш природним і схожим на живу розмову.
Очікується, що модель зможе реагувати навіть на короткі паузи або уповільнення мовлення без різких перебивань. Також вона швидше перемикатиметься між завданнями.
Наприклад, якщо попросити ChatGPT рахувати до десяти, а потім раптово змінити команду на зворотний відлік, система зможе відразу адаптуватися до нової інструкції.
Ще одна важлива зміна — покращене утримання контексту під час тривалих діалогів. У нинішньому голосовому режимі ChatGPT інколи втрачає частину попередньої інформації, а Bidi 1 має краще запам’ятовувати хід розмови.
Також модель більше не повинна втручатися під час довгих пауз, що було однією з частих скарг користувачів.
За інформацією інсайдерів, OpenAI уже почала поступово відкривати доступ до GPT Bidi 1 для окремих користувачів застосунку. Це може означати, що публічний запуск відбудеться вже цього тижня.
