Alibaba da China lança o modelo carro-chefe Qwen Qwen3.7-Max
2026-05-20 17:45
Favoritos

De acordo com pt.wedoany.com-Na Cúpula Alibaba Cloud 2026, realizada em 20 de maio, a Alibaba lançou oficialmente a nova geração do modelo carro-chefe Qwen, o Qwen3.7-Max. No ranking geral do teste cego de grandes modelos da Arena, realizado por uma instituição terceirizada, o modelo superou o Kimi-K2.6, DeepSeek-v4-pro e GLM-5.1, aproximando-se dos modelos mais fortes como GPT, Claude e Gemini, e ficando em primeiro lugar entre os modelos chineses. O Qwen 3.7 foi totalmente projetado para a era atual dos agentes inteligentes, alcançando avanços contínuos em capacidades essenciais como programação e raciocínio, e podendo completar de forma totalmente autônoma tarefas complexas de agentes inteligentes de longa duração de até 35 horas, marcando a entrada oficial dos grandes modelos chineses na fase de validação de capacidade centrada em Agentes.

Observando vários testes de benchmark, o Qwen3.7-Max demonstra uma capacidade de produto que acompanha de perto os modelos líderes globais. Em agentes de programação, o modelo obteve uma pontuação de 80,4 no SWE-Verified, no mesmo nível do Claude Opus-4.6 Max (80,8) e DeepSeek-v4-Pro Max (80,6); no Terminal Bench 2.0-Terminus, obteve 69,7, superando os 67,9 do DeepSeek-v4-pro-Max. Em capacidade de raciocínio, a pontuação no GPQA Diamond foi de 92,4 e no HLE foi de 41,4, ambas superiores aos 91,3 e 40,0 do Claude Opus-4.6. Em avaliações de agentes inteligentes de uso geral, a pontuação no MCP-Mark foi de 60,8, superando os 57,5 do GLM-5.1; no MCP-Atlas foi de 76,4, ligeiramente superior aos 75,8 do Claude Opus-4.6. No benchmark de automação de escritório SpreadSheetBench-v1, conquistou 87 pontos, um nível de ponta.

O teste de evolução autônoma de longa duração de 35 horas é a prova de capacidade mais convincente deste lançamento. Em uma plataforma de hardware totalmente nova, o T-Head Zhenwu M890, com a qual o modelo nunca havia tido contato, o Qwen3.7-Max partiu do zero, recebendo apenas a descrição da tarefa, uma implementação de referência SGLang Triton e scripts de avaliação. Operando continuamente por 35 horas, completou de forma independente 432 avaliações de kernel e 1158 chamadas de ferramentas, realizando de forma totalmente autônoma a escrita, compilação, análise de desempenho e melhorias iterativas, resultando em um aumento de 10 vezes na velocidade de inferência em comparação com a versão original. O registro do teste mostrou que o modelo ainda encontrou pontos de otimização eficazes após mais de 30 horas de operação independente e iniciou proativamente um redesenho arquitetônico chave. Este experimento também comparou o desempenho de vários modelos líderes na mesma tarefa: o GLM 5.1 alcançou uma aceleração de 7,3 vezes, o Kimi K2.6 de 5,0 vezes, enquanto o DeepSeek V4 Pro foi de apenas 3,3 vezes e interrompeu-se automaticamente no meio do processo.

Os avanços no nível da arquitetura técnica são a base que permite a realização das capacidades mencionadas. O laboratório Tongyi adotou um design de desacoplamento ortogonal "tarefa-estrutura de execução-verificador" na arquitetura de treinamento do Qwen3.7-Max. Ao impulsionar o treinamento por aprendizado por reforço de dados sintéticos para distribuições reais, alcançou uma estratégia de agente inteligente generalista e capacidade de generalização entre estruturas. O modelo integra ferramentas de produtividade de escritório como o office-cli através do Protocolo de Contexto de Modelo (MCP), suporta orquestração de múltiplos agentes e extensão de controle de inteligência incorporada, e está totalmente alinhado com os protocolos de API da OpenAI e Anthropic, alcançando integração perfeita plug-and-play com estruturas de agentes inteligentes convencionais como Claude Code, OpenClaw e Qwen Code. O desenvolvimento de grandes modelos da Alibaba acelerou significativamente; nos últimos 3 meses, o modelo carro-chefe Qwen iterou de forma estável três versões: 3.5, 3.6 e 3.7, elevando continuamente o limite máximo de desempenho dos modelos chineses.

Este lançamento não é apenas uma atualização da capacidade do modelo, mas também uma parte central da reestruturação do sistema de tecnologia full-stack da Alibaba Cloud para a era Agentic. No dia da cúpula, a Alibaba Cloud anunciou a conclusão da atualização agentizada full-stack "chip - nuvem - modelo - inferência", lançando simultaneamente o novo site oficial de produtos de IA "Qwen Cloud", projetado para Agentes, e servidores de supernó equipados com o chip de IA proprietário Zhenwu M890. Liu Weiguang, Vice-Presidente Sênior da Alibaba Cloud, afirmou que, após ultrapassar o ponto crítico, os Agentes podem trabalhar ininterruptamente 24 horas por dia, gerando uma demanda infinita por IA e nuvem. A Alibaba Cloud está realizando uma inovação tecnológica full-stack, atualizando completamente desde os chips subjacentes, Nuvem Agentic e modelos até a plataforma de inferência, construindo a maior fábrica de IA da China.

O CEO do Grupo Alibaba, Wu Yongming, declarou na teleconferência de resultados de 13 de maio que a Receita Recorrente Anualizada (ARR) dos modelos e serviços de aplicação de IA da Alibaba já ultrapassou 8 bilhões de yuans, com previsão de exceder 30 bilhões de yuans até o final do ano. A receita trimestral de produtos relacionados à IA foi de 8,971 bilhões de yuans, com uma receita anualizada superior a 35,8 bilhões de yuans, representando pela primeira vez mais de 30% da receita de comercialização externa da Alibaba Cloud. Anteriormente, a Alibaba comprometeu-se a investir mais de 380 bilhões de yuans (aproximadamente 53 bilhões de dólares) nos próximos três anos em infraestrutura de nuvem e IA. Wu Yongming enfatizou na teleconferência: "Atualmente, quase não há uma única placa ociosa em nossos servidores. Sob a demanda prevista para os próximos 3 a 5 anos, o retorno sobre o investimento na construção de nossos centros de dados de IA, nos quais estamos investindo pesadamente, é muito certo."

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com
Recomendações
Google dos EUA e Samsung da Coreia do Sul unem-se à Warby Parker e Gentle Monster para lançar óculos de áudio com IA, com estreia global no outono
2026-05-20
A SMIC, Hua Hong Group e outras empresas chinesas unem-se para estabelecer o Centro Internacional da Cadeia de Abastecimento de Materiais Eletrónicos de Xangai, com um capital registado de 200 milhões de yuans
2026-05-20
Espera-se que a capacidade de computação para inferência de IA dos cinco maiores provedores de serviços de nuvem da América do Norte cresça 122% ao ano, com aceleração da implantação de racks completos NVIDIA GB e Vera Rubin nos EUA
2026-05-20
TSMC da China anuncia que a taxa de rendimento da embalagem avançada CoWoS ultrapassa 98%, e produtos com tamanho de retículo de 5,5x já estão em produção em massa
2026-05-20
Meitu, da China, lidera rodada anjo de milhões de dólares na Chance AI, apostando no segmento de agentes inteligentes de visão nativos de câmera
2026-05-20
A HiDream.ai da China concluiu uma nova rodada de financiamento de centenas de milhões e lançou o modelo de imagem multimodal nativo de grande escala HiDream-O1-Image-Pro com mais de 200 bilhões de parâmetros
2026-05-20
Zhou Jian, fundador da UBTECH da China, anuncia a marca de robôs humanoides de consumo "UWORLD"
2026-05-20
A Qianxun Intelligent da China e a Dgua Robot estabelecem uma parceria estratégica, e o modelo de código aberto Spirit v1.5 conclui a adaptação profunda com o chip Sunrise S600
2026-05-20
Alibaba Pingtouge, da China, lança chip de IA Zhenwu M890 com desempenho até 3 vezes superior ao da geração anterior
2026-05-20
Alibaba da China lança o modelo carro-chefe Qwen Qwen3.7-Max
2026-05-20