Huawei Cloud China lança ModelArts Next para fortalecer a base de treinamento e inferência de agentes empresariais
2026-06-05 16:24
Favoritos

De acordo com pt.wedoany.com-No dia 5 de junho, a Huawei Cloud lançou em Xangai a nova plataforma de treinamento e inferência de modelos, ModelArts Next, oferecendo quatro capacidades principais — serviço RL, inferência confidencial, roteamento de modelos e matriz de modelos — para a construção de sistemas de agentes de IA exclusivos para empresas. A plataforma é centrada no treinamento, inferência, chamada segura e agendamento de múltiplos modelos de grande escala, com o objetivo de reduzir a barreira para as empresas passarem do teste de modelos para a implantação de agentes em nível de produção.

O valor central do ModelArts Next reside em reintegrar os elos dispersos no uso de modelos de grande escala pelas empresas em uma plataforma unificada de treinamento e inferência. Atualmente, ao introduzir agentes de IA, as empresas enfrentam dificuldades que vão além de "conseguir ou não chamar um modelo": como otimizar continuamente o treinamento do modelo, garantir a segurança dos dados sensíveis durante o processo de inferência, selecionar o modelo adequado para diferentes tarefas e colocar rapidamente vários modelos mainstream em operação com gerenciamento unificado. O serviço RL atende à necessidade das empresas por aprendizado por reforço e otimização contínua de modelos, especialmente quando os agentes evoluem de perguntas e respostas simples para a execução de tarefas complexas, exigindo que o modelo melhore constantemente sua capacidade de tomada de decisão por meio de mecanismos de feedback; a inferência confidencial é voltada para cenários altamente sensíveis, como codificação de IA, gestão de riscos financeiros e bases de conhecimento empresariais, permitindo que os dados processados pelo modelo operem em ambientes de execução confiáveis, reduzindo riscos de vazamento de dados e conformidade; o roteamento de modelos resolve o problema de eficiência de chamada na era de múltiplos modelos, onde a plataforma pode selecionar dinamicamente o serviço mais adequado entre diferentes modelos com base nas características da solicitação, tipo de tarefa, prioridade de custo, prioridade de efeito ou estratégia de equilíbrio; a matriz de modelos permite que as empresas integrem rapidamente modelos SOTA mainstream como DeepSeek, Kimi e GLM da Zhipu, além de cobrir cenários como programação e multimodalidade com o modelo Pangu desenvolvido pela própria Huawei Cloud.

Isso significa que o ModelArts Next não é o lançamento de um único modelo, mas sim uma infraestrutura de modelo voltada para a implementação de IA empresarial.

Quando modelos de grande escala entram em cenários industriais, as empresas realmente precisam de um sistema de engenharia de IA estável, controlável e gerenciável. Muitas empresas, ao testar modelos de grande escala no início, geralmente começam com geração de texto, atendimento ao cliente, assistência de código ou recuperação de bases de conhecimento. No entanto, quando a aplicação entra nos processos de negócios principais, surgem problemas como flutuação no efeito do modelo, aumento nos custos de chamada, complexidade nas permissões de dados, dificuldade na seleção de modelos e requisitos mais rigorosos de auditoria de segurança. As quatro capacidades propostas pelo ModelArts Next correspondem exatamente a esses problemas de nível de produção: a capacidade de aprendizado por reforço é usada para melhorar a estabilidade dos agentes na execução de tarefas complexas; a inferência confidencial resolve os limites de segurança após a entrada de dados sensíveis no modelo; o roteamento de modelos equilibra dinamicamente efeito e custo; e a matriz de modelos evita que as empresas fiquem presas a uma única capacidade de modelo. Informações públicas mostram que o roteamento de modelos MaaS da Huawei Cloud já oferece mais de 15 serviços de modelos SOTA, com precisão de agendamento superior a 95% e uma redução média de 20% nos custos de chamada. Se esses indicadores puderem se manter estáveis em operações reais, eles impactarão diretamente o retorno sobre o investimento e a disponibilidade do sistema na implantação de agentes de IA pelas empresas.

Do ponto de vista da concorrência no setor, os provedores de nuvem estão passando de "fornecer interfaces de modelo" para "fornecer plataformas de produção de agentes". Os clientes empresariais não pagarão a longo prazo apenas por chamadas únicas de tokens; eles se preocupam mais com se o modelo pode ser integrado aos sistemas de negócios, se pode selecionar automaticamente a capacidade adequada com base na tarefa e se pode formar fluxos de trabalho confiáveis em cenários como finanças, P&D, manufatura, escritório e atendimento ao cliente. O lançamento do ModelArts Next pela Huawei Cloud está alinhado com seu foco recente em aumentar a produtividade, o segundo plano de computação e o sistema de agentes empresariais. Para a Huawei Cloud, o ModelArts Next desempenha um papel de ponte: conecta-se para cima com capacidades de modelos como DeepSeek, Kimi, GLM da Zhipu e Pangu, e para baixo com dados empresariais, ambientes de segurança, recursos de inferência e desenvolvimento de aplicações de agentes, servindo, em última análise, à construção de sistemas de IA exclusivos para empresas.

O valor real do ModelArts Next dependerá do efeito da implantação em nível empresarial, da estabilidade do roteamento de modelos, da perda de desempenho da inferência confidencial, da facilidade de uso do serviço RL e da velocidade de expansão do ecossistema de múltiplos modelos. À medida que a IA empresarial passa de testes para operações regulares, as plataformas de treinamento e inferência de modelos se tornarão uma base importante para a concorrência entre provedores de nuvem. Quem conseguir integrar de forma mais suave modelos, segurança, custos, agendamento e cenários de negócios terá mais chances de atender à próxima fase de demanda por construção de agentes empresariais.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com