Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA
La nouvelle IA d’Alibaba Qwen3.7 Max met une claque à la preview Qwen3.6 Max avec un bond de 4,8 points sur l’Artificial Analysis Intelligence Index. Le modèle se démarque surtout dans le codage agentique, le raisonnement complexe et les tâches XXL, grâce à une gigantesque fenêtre de contexte d’un million de tokens.
La percée d’Alibaba dans le domaine de l’intelligence artificielle devient de plus en plus difficile à ignorer. Longtemps perçu comme un outsider face aux mastodontes américains, le géant chinois accélère aujourd’hui sur les modèles IA avancés avec une ambition de réduire l’écart avec OpenAI, Google ou Anthropic. Sa nouvelle IA Qwen3.7 Max illustre cette montée en puissance, notamment dans le codage avancé, le raisonnement complexe et les tâches longues.
Des chiffres impressionnants sur le Qwen3.7 Max d’Alibaba
Selon les chiffres publiés autour du modèle, Qwen3.7 Max atteint un score de 56,6 sur l’Artificial Analysis Intelligence Index. C’est 4,8 points de plus que Qwen3.6 Max Preview lancé quelques mois plus tôt. La progression peut sembler modeste vue de loin, mais dans le petit monde des modèles IA, quelques points suffisent parfois à changer la hiérarchie.
Les gains les plus visibles concernent surtout le raisonnement scientifique et le codage avancé. Sur certains tests spécialisés comme Humanity’s Last Exam ou TerminalBench Hard, Alibaba annonce des bonds assez massifs. Le groupe cherche à séduire les développeurs et les entreprises qui utilisent déjà l’IA pour automatiser des tâches complexes.
Alibaba’s new Qwen3.7 Max model scores 56.6 on the Artificial Analysis Intelligence Index, 4.8 points higher than Qwen3.6 Max Preview (51.8). While Alibaba still trails models from OpenAI, Anthropic and Google, Qwen3.7 Max is the closest they have been to the frontier
— Artificial Analysis (@ArtificialAnlys) May 21, 2026
Qwen3.7… pic.twitter.com/h4zUPwqN2R
L’un des principaux changements apportés par Qwen3.7 Max concerne sa fenêtre de contexte. Celle-ci passe désormais à un million de tokens, contre 256 000 auparavant.
Concrètement, cela permet à l’IA de traiter des volumes beaucoup plus importants d’informations dans une seule conversation. Cette capacité peut s’avérer utile pour l’analyse de longs documents, les projets de programmation complexes ou encore les tâches nécessitant plusieurs étapes de raisonnement.
Une réduction des hallucinations mise en avant
Pour le moment, le modèle reste limité aux échanges textuels. Alibaba n’a pas encore intégré de fonctions multimodales avancées comme la génération d’images ou l’analyse vidéo.
Mais ce n’est pas le seul point intéressant. Les évaluations indépendantes montrent aussi une nette baisse du taux d’hallucinations du modèle. Qwen3.7 Max d’Alibaba génère moins de réponses incorrectes ou inventées que son prédécesseur.

Cette amélioration semble toutefois liée à une approche plus prudente. Le modèle préfère parfois ne pas répondre plutôt que de fournir une information incertaine. C’est une stratégie qui peut être intéressante dans des usages professionnels où la fiabilité devient un critère essentiel.
Alibaba indique aussi avoir fortement investi dans les techniques de reinforcement learning afin d’améliorer les capacités de raisonnement du modèle.
Pourtant, malgré ses progrès, Qwen3.7 Max reste encore derrière certains modèles développés par OpenAI, Anthropic ou Google sur plusieurs classements globaux. Le modèle montre néanmoins que les laboratoires chinois continuent de réduire progressivement l’écart avec les acteurs américains.
Cet article Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA a été publié sur LEBIGDATA.FR.















