Дослідження китайських фахівців із Alibaba Group та Університету Сунь Ятсена розвіяло міф про те, що нейромережі вже завтра зможуть повністю перебрати на себе роботу IT-фахівців. Як з’ясувалося, ШІ чудово пише короткі фрагменти коду, але катастрофічно «провалюється» на дистанції. Про це повідомляє Експерт.
Експеримент на витривалість: 233 дні кодування
На відміну від стандартних тестів, де нейромережі дають разове завдання, цього разу 18 моделей від 8 провайдерів змусили працювати над еволюцією реальних базах коду протягом тривалого часу. Завданням було додавати нові функції, не ламаючи того, що вже працює.
Результати виявилися приголомшливими:
- Масовий регрес: 15 із 18 моделей не змогли виконати навіть 37% завдань без помилок у попередньому коді.
- Накопичення «боргу»: Протягом 233 днів імітованої розробки нейромережі створювали надто «крихку» архітектуру.
- Швидкість проти якості: ШІ жертвував чистотою коду заради миттєвого результату, що призводило до накопичення критичних технічних проблем.
Технічний борг і архітектурний хаос
Дослідники помітили, що на початкових етапах ШІ-агенти легко набирали бали на простих правках. Проте, коли справа доходила до глибокої інтеграції нових фіч у наявну систему, моделі починали «грузнути» у власних помилках.
Головна проблема ШІ — відсутність стратегічного мислення. Нейромережа не бачить майбутнього продукту, а лише намагається видати статистично ймовірну відповідь на конкретний запит. Це створює величезний технічний борг, який зрештою робить підтримку коду дорожчою, ніж його написання з нуля людиною.
Чи є майбутнє у ШІ-кодингу?
Попри низькі показники (75% моделей спрацювали погано), вчені не закликають відмовлятися від ШІ. Вони наголошують, що на поточному етапі нейромережі — це лише допоміжний інструмент для швидких чернеток. Контроль архітектури, довгострокове планування та забезпечення стабільності залишаються виключною прерогативою «живих» розробників.

