De acordo com pt.wedoany.com-Na Cúpula Alibaba Cloud 2026, realizada em 20 de maio, a Alibaba lançou oficialmente a nova geração do modelo carro-chefe Qwen, o Qwen3.7-Max. No ranking geral do teste cego de grandes modelos da Arena, realizado por uma instituição terceirizada, o modelo superou o Kimi-K2.6, DeepSeek-v4-pro e GLM-5.1, aproximando-se dos modelos mais fortes como GPT, Claude e Gemini, e ficando em primeiro lugar entre os modelos chineses. O Qwen 3.7 foi totalmente projetado para a era atual dos agentes inteligentes, alcançando avanços contínuos em capacidades essenciais como programação e raciocínio, e podendo completar de forma totalmente autônoma tarefas complexas de agentes inteligentes de longa duração de até 35 horas, marcando a entrada oficial dos grandes modelos chineses na fase de validação de capacidade centrada em Agentes.
Observando vários testes de benchmark, o Qwen3.7-Max demonstra uma capacidade de produto que acompanha de perto os modelos líderes globais. Em agentes de programação, o modelo obteve uma pontuação de 80,4 no SWE-Verified, no mesmo nível do Claude Opus-4.6 Max (80,8) e DeepSeek-v4-Pro Max (80,6); no Terminal Bench 2.0-Terminus, obteve 69,7, superando os 67,9 do DeepSeek-v4-pro-Max. Em capacidade de raciocínio, a pontuação no GPQA Diamond foi de 92,4 e no HLE foi de 41,4, ambas superiores aos 91,3 e 40,0 do Claude Opus-4.6. Em avaliações de agentes inteligentes de uso geral, a pontuação no MCP-Mark foi de 60,8, superando os 57,5 do GLM-5.1; no MCP-Atlas foi de 76,4, ligeiramente superior aos 75,8 do Claude Opus-4.6. No benchmark de automação de escritório SpreadSheetBench-v1, conquistou 87 pontos, um nível de ponta.
O teste de evolução autônoma de longa duração de 35 horas é a prova de capacidade mais convincente deste lançamento. Em uma plataforma de hardware totalmente nova, o T-Head Zhenwu M890, com a qual o modelo nunca havia tido contato, o Qwen3.7-Max partiu do zero, recebendo apenas a descrição da tarefa, uma implementação de referência SGLang Triton e scripts de avaliação. Operando continuamente por 35 horas, completou de forma independente 432 avaliações de kernel e 1158 chamadas de ferramentas, realizando de forma totalmente autônoma a escrita, compilação, análise de desempenho e melhorias iterativas, resultando em um aumento de 10 vezes na velocidade de inferência em comparação com a versão original. O registro do teste mostrou que o modelo ainda encontrou pontos de otimização eficazes após mais de 30 horas de operação independente e iniciou proativamente um redesenho arquitetônico chave. Este experimento também comparou o desempenho de vários modelos líderes na mesma tarefa: o GLM 5.1 alcançou uma aceleração de 7,3 vezes, o Kimi K2.6 de 5,0 vezes, enquanto o DeepSeek V4 Pro foi de apenas 3,3 vezes e interrompeu-se automaticamente no meio do processo.
Os avanços no nível da arquitetura técnica são a base que permite a realização das capacidades mencionadas. O laboratório Tongyi adotou um design de desacoplamento ortogonal "tarefa-estrutura de execução-verificador" na arquitetura de treinamento do Qwen3.7-Max. Ao impulsionar o treinamento por aprendizado por reforço de dados sintéticos para distribuições reais, alcançou uma estratégia de agente inteligente generalista e capacidade de generalização entre estruturas. O modelo integra ferramentas de produtividade de escritório como o office-cli através do Protocolo de Contexto de Modelo (MCP), suporta orquestração de múltiplos agentes e extensão de controle de inteligência incorporada, e está totalmente alinhado com os protocolos de API da OpenAI e Anthropic, alcançando integração perfeita plug-and-play com estruturas de agentes inteligentes convencionais como Claude Code, OpenClaw e Qwen Code. O desenvolvimento de grandes modelos da Alibaba acelerou significativamente; nos últimos 3 meses, o modelo carro-chefe Qwen iterou de forma estável três versões: 3.5, 3.6 e 3.7, elevando continuamente o limite máximo de desempenho dos modelos chineses.
Este lançamento não é apenas uma atualização da capacidade do modelo, mas também uma parte central da reestruturação do sistema de tecnologia full-stack da Alibaba Cloud para a era Agentic. No dia da cúpula, a Alibaba Cloud anunciou a conclusão da atualização agentizada full-stack "chip - nuvem - modelo - inferência", lançando simultaneamente o novo site oficial de produtos de IA "Qwen Cloud", projetado para Agentes, e servidores de supernó equipados com o chip de IA proprietário Zhenwu M890. Liu Weiguang, Vice-Presidente Sênior da Alibaba Cloud, afirmou que, após ultrapassar o ponto crítico, os Agentes podem trabalhar ininterruptamente 24 horas por dia, gerando uma demanda infinita por IA e nuvem. A Alibaba Cloud está realizando uma inovação tecnológica full-stack, atualizando completamente desde os chips subjacentes, Nuvem Agentic e modelos até a plataforma de inferência, construindo a maior fábrica de IA da China.
O CEO do Grupo Alibaba, Wu Yongming, declarou na teleconferência de resultados de 13 de maio que a Receita Recorrente Anualizada (ARR) dos modelos e serviços de aplicação de IA da Alibaba já ultrapassou 8 bilhões de yuans, com previsão de exceder 30 bilhões de yuans até o final do ano. A receita trimestral de produtos relacionados à IA foi de 8,971 bilhões de yuans, com uma receita anualizada superior a 35,8 bilhões de yuans, representando pela primeira vez mais de 30% da receita de comercialização externa da Alibaba Cloud. Anteriormente, a Alibaba comprometeu-se a investir mais de 380 bilhões de yuans (aproximadamente 53 bilhões de dólares) nos próximos três anos em infraestrutura de nuvem e IA. Wu Yongming enfatizou na teleconferência: "Atualmente, quase não há uma única placa ociosa em nossos servidores. Sob a demanda prevista para os próximos 3 a 5 anos, o retorno sobre o investimento na construção de nossos centros de dados de IA, nos quais estamos investindo pesadamente, é muito certo."
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com










