Новая версия Alibaba самостоятельно исправляет ошибки в чужих репозиториях, управляет браузером и создает 3D-игры по одному текстовому запросу.
Alibaba Research представила языковую модель нового поколения. Разработчики из команды Qwen акцентировали внимание не на улучшении ответов на вопросы, а на способности модели выполнять длинные последовательности действий: планировать, запускать код, исправлять ошибки и продолжать работать без помощи.
Главным структурным отличием от предыдущей версии является контекстное окно в один миллион токенов по умолчанию. Для понимания масштабов: это примерно 750 тысяч слов, что соответствует нескольким крупным романам одновременно. Благодаря этому модель способна удерживать в памяти весь крупный проект целиком: историю переписки, код, документацию, результаты предыдущих шагов.
В области автономного написания кода Qwen3.6-Plus демонстрирует результаты, близкие к лидерам индустрии. На бенчмарке SWE-bench Verified — это стандартный тест, в котором модель должна самостоятельно обнаружить и исправить реальную ошибку в публичном репозитории на GitHub — новинка набрала 78,8 балла. Claude Opus 4.5 от Anthropic получил 80,9. Разница небольшая, но контекст важен: Qwen3.6-Plus при этом более экономичен в эксплуатации для большинства сценариев.

Отдельно стоит отметить Terminal-Bench 2.0 — тест на работу в реальном терминале Linux с реальными файлами, процессами и временными ограничениями. Здесь модель достигла 61,6 балла, что является наилучшим результатом среди всех участников сравнения, включая Claude и GLM5.
Qwen3.6-Plus воспринимает не только текст, но и изображения, скриншоты интерфейсов, видео. По тесту RealWorldQA, где требуется отвечать на вопросы по фотографиям реальных ситуаций, модель набрала 85,4 — это выше, чем у GPT-5.2 (83,3) и Gemini-3 Pro (83,3). Практическое применение — модель может видеть скриншот сайта или мокап дизайна и сразу писать рабочий HTML/CSS/JS-код. В автоматическом рейтинге фронтенд-разработки QwenWebBench новинка показала результат 1501,7 балла против 1159,5 у Kimi-K2.5.
Модель доступна через API Alibaba Cloud Model Studio. Ключевая особенность интеграции — поддержка протокола Anthropic, что позволяет подключить ее к Claude Code просто через переменные окружения, без необходимости переписывания существующих скриптов. Аналогично работает совместимость с форматом OpenAI.
Среди поддерживаемых инструментов — OpenClaw, Qwen Code, Cline и другие популярные оболочки для терминала. Новый параметр API сохраняет цепочку рассуждений модели между шагами — это снижает избыточные вычисления в длинных агентных сессиях.
Alibaba анонсировала предстоящий открытый релиз компактных версий модели. Это значит, что часть возможностей Qwen3.6-Plus станет доступной для локального запуска — без API и облака.
Фото: hi-tech.mail.ru





