Huawei Cloud da China lança pilha de infraestrutura de agentes, suportando cluster de 100 mil placas
2026-06-16 14:46
Favoritos

De acordo com pt.wedoany.com-A Huawei Cloud lançou a pilha "Agentic Infra" (infraestrutura de agentes), oferecendo um conjunto completo de produtos de computação, armazenamento e rede, projetado para suportar a execução de agentes de IA em larga escala em plataformas de nuvem baseadas em NPU. Esta medida é vista como o esforço mais direto da provedora de serviços em nuvem até o momento para competir com a NVIDIA no campo da infraestrutura de IA.

Novo escritório da Huawei em Jacarta, Indonésia

No evento Inspire realizado em Xangai, a Huawei Cloud lançou o AICS (Serviço de Cluster de IA), afirmando que pode suportar uma plataforma de computação com um cluster de 100 mil placas. O cluster opera com base no protocolo de interconexão UnifiedBus (UB) proprietário da Huawei, oferecendo uma taxa de transferência de 5 milhões de tokens por segundo entre 1.000 placas, com capacidade total de computação de 200 EFLOPS (200 exaflops) e latência de geração de tokens inferior a 10 milissegundos.

A Huawei também lançou uma solução de armazenamento chamada AMS (Armazenamento de Memória de Agentes), que fornece expansão de memória para chips NPU e reduz os custos de inferência para tarefas de agentes de longo ciclo por meio de cache hierárquico de chave-valor (KV).

Outros componentes da pilha incluem o escalonador CCE Volcano Next, que alega aumentar a utilização de recursos em mais de 30% ao mesclar cargas de trabalho de treinamento e inferência em vez de isolá-las; e o AgentSphere, um ambiente de sandbox com isolamento de segurança onde os usuários podem iniciar centenas de milhares de instâncias de agentes por minuto.

A pilha foi apresentada durante o discurso principal do Dr. Peter Zhou, membro do conselho de administração da Huawei e CEO da Huawei Cloud. Ele afirmou que a IA de agentes está impulsionando uma mudança fundamental no paradigma da computação. A Huawei demonstrou a pilha de infraestrutura no Inspire em um momento em que a China promove a construção de alternativas nacionais, e a gigante está aproveitando as oportunidades de mercado após a proibição de importação de chips dos EUA para dobrar seus investimentos em capacidade de computação. Embora o CEO da Huawei, Ren Zhengfei, tenha admitido no verão passado que seus chips estão uma geração atrás dos concorrentes americanos, a empresa busca reduzir rapidamente essa diferença. O princípio de escalonamento de seu design de semicondutores, Tau (τ), concentra-se em melhorar o design reduzindo a latência de propagação de sinal dos chips, em vez de miniaturizar ainda mais os transistores. A Huawei já usou esse conceito para projetar cerca de 381 chips e o combinará com a arquitetura LogicFolding, que melhorou o desempenho do τ em vários níveis, sendo crucial para o desenvolvimento da série de processadores Kirin.

No campo de modelos e agentes, a Huawei lançou a plataforma de modelos ModelArts Next, com novos recursos de Aprendizado por Reforço como Serviço (RLaaS) e uma camada de roteamento de modelos que pode enviar dinamicamente solicitações para o modelo mais adequado entre mais de 20 modelos parceiros, incluindo sistemas da DeepSeek, Zhipu AI e MiniMax. A Huawei afirma que a precisão de escalonamento do mecanismo de roteamento é superior a 95%, reduzindo os custos de inferência em cerca de 20%. A lista de parceiros foi formalizada como "Programa de Parceiros de Modelos de IA". A Huawei também lançou a plataforma de agentes empresariais AgentArts, voltada para tarefas de agentes de longo ciclo em nível de produção, oferecendo uma versão de código aberto cujo código-fonte compartilha mais de 90% com a versão comercial, além do portal AgentArts Orchard para construir e implantar agentes por meio de interface de linha de comando.

A Huawei lançou uma camada de segurança dedicada para esta pilha, incluindo criptografia de hardware com chave própria (HYOK) e suporte para computação confidencial entre máquinas virtuais, treinamento e inferência, e afirma ter ultrapassado 1.000 dias sem incidentes graves de serviço.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com