OpenAI представила свій новий генератор зображень для ChatGPT, який компанія називає “найбільш просунутим”.
Головна відмінність нового генератора – поліпшена точність і контроль над деталями. Дослідник Габріель Го розповів The Verge, що система набагато краще справляється з біндингом, коректним розташуванням об’єктів і їхніх характеристик. Раніше нейромережі часто плутали кольори, форми або забували про деталі, але тепер ШІ може точно передавати властивості навіть за складних запитів із 15-20 об’єктами.
Важливе поліпшення – якісне відображення тексту на зображеннях. Раніше генератори часто ламали слова і символи, перетворюючи написи на хаотичний набір букв. В OpenAI визнали, що домогтися чіткості тексту виявилося складніше, ніж очікувалося, але після місяців роботи вони довели результат до стабільної якості.
У демонстрації OpenAI показала, як нейромережа може створювати наукові схеми, комікси з послідовними сценами і діалогами, афіші та плакати з точними написами, а також зображення з прозорим фоном, наприклад, для стікерів і логотипів. Також в одному з прикладів нейромережа послідовно зробила з кота користувача головного героя комп’ютерної гри.
Функція доступна користувачам усіх рівнів підписки, включно з безкоштовним. Однак ліміти на генерацію зображень поки залишаються невідомими.