Plataforma de IA em nuvem dos EUA, GMI Cloud, apoia a construção da fábrica de IA agêntica Vera Rubin
2026-06-05 10:19
Favoritos

De acordo com pt.wedoany.com-Recentemente, a empresa americana de infraestrutura de nuvem nativa em IA, GMI Cloud, anunciou que sua plataforma apoiará a construção de uma nova geração de infraestrutura voltada para fábricas de IA agêntica, alinhando-se com a direção da plataforma Vera Rubin, promovida pela NVIDIA durante a GTC 2026 em Taipei. A empresa está construindo uma plataforma de nuvem centrada em inferência, oferecendo a desenvolvedores e empresas a capacidade de implantar, escalar e operar cargas de trabalho de IA em nível de produção.

A "fábrica de IA agêntica" enfatizada pela GMI Cloud desta vez aponta para os novos requisitos impostos à infraestrutura subjacente após as aplicações de IA evoluírem de consultas únicas para operação contínua, colaboração autônoma e processamento multimodal. Os recursos tradicionais de nuvem de IA concentram-se mais em treinamento de modelos, inferência de modelo único ou chamadas de API; quando os agentes de IA começam a executar planejamento, chamar ferramentas, processar imagens, vídeos e áudio, reter memória de contexto e operar continuamente, a plataforma precisa suportar simultaneamente inferência de alta taxa de transferência e baixa latência, escalonamento dinâmico, isolamento multi-inquilino, gerenciamento de contexto de longo prazo, orquestração de fluxo de trabalho e ambiente de execução seguro. O portfólio da plataforma GMI Cloud inclui infraestrutura de treinamento, inferência e implantação de produção, serviço de modelo de baixa latência Prime Inference, API MaaS para modelos proprietários e de código aberto, endpoints dedicados de nível empresarial e uma camada de orquestração e otimização de infraestrutura para operações de IA escaláveis.

A infraestrutura de fluxo de trabalho agêntico é uma parte fundamental deste lançamento. As capacidades da plataforma propostas pela GMI Cloud abrangem sistemas de IA autônomos em sandbox, com chamada de ferramentas, e suportam ambientes de implantação nativos multimodais para aplicações de IA de próxima geração. Para clientes empresariais, essas capacidades podem ser usadas para construir agentes de atendimento ao cliente contínuos, agentes de código, agentes de análise de dados, sistemas de geração de conteúdo, assistentes de processos industriais e fluxos de trabalho de automação de negócios. Em comparação com chamadas de modelo comuns, os sistemas de IA agêntica precisam manter estado por mais tempo, acessar ferramentas, ler e escrever dados externos e alocar recursos entre várias tarefas, portanto, a estabilidade, o isolamento e o controle de custos da plataforma de nuvem subjacente afetam diretamente a qualidade da implantação em produção.

A segurança também é colocada no centro da infraestrutura da fábrica de IA. A GMI Cloud afirma que está adotando a capacidade de computação confidencial da NVIDIA para fornecer um ambiente de execução confiável para cargas de trabalho de IA de próxima geração que precisam proteger a privacidade de modelos e dados. À medida que as fábricas de IA processam dados proprietários de empresas, conteúdo regulamentado, contexto de modelo e memória de agente, a plataforma de inferência deve atender simultaneamente aos requisitos de desempenho, privacidade, segurança e conformidade. A plataforma Vera Rubin é vista como um nó importante na evolução da infraestrutura da fábrica de IA, projetada em torno de computação, rede, segurança e sistemas de rack de próxima geração, atendendo às necessidades de inferência em larga escala e operação contínua da IA agêntica.

Este lançamento reflete que a competição na infraestrutura de nuvem de IA está mudando de "fornecer poder de computação GPU" para "suportar sistemas inteligentes de nível de produção". Depois que as aplicações de IA entram nos processos centrais das empresas, os clientes não se preocupam apenas com a possibilidade de alugar GPUs, mas também com a latência do serviço de modelo, custo de token, disponibilidade da plataforma, isolamento de segurança, orquestração de fluxo de trabalho, endpoints dedicados, escopo de acesso a modelos e capacidade de suporte a tarefas multimodais. A GMI Cloud optou por se posicionar em torno da arquitetura nativa de inferência e da fábrica de IA agêntica, indicando que deseja assumir um papel mais próximo da camada de execução de produção na cadeia de infraestrutura de IA. A variável-chave subsequente é se a GMI Cloud conseguirá combinar o ecossistema relacionado à Vera Rubin, a capacidade de computação confidencial e a plataforma de inferência em um produto escalável e atrair mais desenvolvedores, startups e clientes empresariais para implantar agentes de IA complexos em sua plataforma de nuvem.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com