Китайська Alibaba випустила третє покоління великих мовних моделей Qwen. Судячи з тестів, вони обходять свіжі o1 і o3-mini від OpenAI, а також DeepSeek R1 і Grok 3 Маска, пише портал TechCrunch.
Сімейство Qwen 3 представляє гібридний підхід до розв’язування проблем: це одночасно “думаюча” модель і ні. У першому режимі модель покроково аналізує проблему і видає комплексну відповідь. Режим “недумання” підійде для швидких повсякденних запитів із миттєвим відгуком.
Деякі моделі також використовують змішану архітектуру експертів (MoE), підвищуючи обчислювальну ефективність завдяки розбиттю завдань на частини та їхньому передаванню дрібнішим, спеціалізованим “експертним” моделям.
Більшість моделей Qwen 3 вже доступні для скачування за “відкритою” ліцензією на платформах Hugging Face і GitHub. Крім того, Qwen 3 можна запускати локально – вони варіюються за розміром від 0,6 млрд до 235 млрд параметрів.
Використовувати ШІ-моделі Qwen 3 також можна у веб-версії або в мобільному застосунку для iOS і Android. Нейромережа підтримує 119 мов, включно з українською та російською.
Нерідко з різноманітним майном у спадщину родичам можуть дістатися й борги, які людина не сплатила за життя. До спадщини близьким…
Фінал Національного відбору на Євробачення-2026 в Україні супроводжувався гучним скандалом. Фіналістка шоу Jerry Heil публічно…
Колишній голкіпер клубів НХЛ Домінік Гашек закликав Україну через суд стягнути мільярди євро з Міжнародного…
Відомий техноблогер Маркус Браунлі, він же MKBHD, витратив майже $40 000 на повністю запечатаний оригінальний iPhone…
Лютий 2026 року не буде звичайним місяцем. Сонячне затемнення 17 лютого принесе енергію, яка змінить…
Подорожуючи, варто бути пильними щодо своїх грошей і документів, адже в деяких містах світу ризик…