De acordo com pt.wedoany.com-A Arrcus e a operadora de telecomunicações canadense TELUS anunciaram o início de um projeto de prova de conceito (PoC) com o objetivo de avaliar a Arquitetura de Rede de Inferência (AINF) da Arrcus como base de rede para inferência de IA soberana e distribuída no Canadá.

O objetivo do plano é fornecer serviços de IA de baixa latência para segurança pública, resposta a emergências, agências governamentais e clientes empresariais, garantindo ao mesmo tempo que dados confidenciais e cargas de trabalho de IA permaneçam dentro do território canadense. Este PoC reflete uma mudança mais ampla na arquitetura de IA, do treinamento centralizado de modelos para a inferência distribuída, onde os modelos de IA são executados mais próximos dos usuários, dispositivos e fontes de dados. A Arrcus posiciona a AINF como uma arquitetura de rede com reconhecimento de políticas, projetada especificamente para cargas de trabalho de IA.
A plataforma é capaz de avaliar políticas definidas pela operadora, como requisitos de latência, regras de soberania de dados, seleção de modelos, disponibilidade de capacidade e restrições de consumo de energia, roteando dinamicamente as solicitações de inferência para o local de computação mais adequado. No nível de implantação, a AINF integra-se com as DPUs NVIDIA BlueField-3 e switches Ethernet Spectrum-4, fornecendo conectividade de IA distribuída e criptografada em ambientes de borda, data center e nuvem.
A arquitetura também se integra ao NVIDIA Dynamo para balanceamento de carga local de Modelos de Linguagem de Grande Escala (LLMs), enquanto a AINF gerencia o roteamento de inferência em toda a rede através da infraestrutura da TELUS. A Arrcus afirma que esta abordagem visa melhorar a capacidade de resposta da IA, a utilização de recursos computacionais e a conformidade com os requisitos de residência de dados canadenses. A TELUS está avaliando a AINF para implantações de IA soberana que suportem aplicações de segurança pública, governo e empresas. A AINF oferece roteamento com reconhecimento de políticas de IA com base em latência, soberania, disponibilidade de modelos, condições de rede e políticas operacionais, suportando cercamento geográfico e aplicação de residência de dados para manter as cargas de trabalho de IA dentro do Canadá.
A integração com a DPU NVIDIA BlueField-3 permite transmissão criptografada de até 400 Gbps, sem sobrecarga da CPU. A arquitetura também suporta NVIDIA Dynamo, vLLM, SGLang, Triton, Kubernetes, SRv6 e a rede de Plano de Usuário Móvel (MUP). De acordo com fontes de pesquisa do setor, a Arrcus aponta vantagens potenciais, incluindo: redução de mais de 60% no Tempo para o Primeiro Token (TTFT), redução de 40% na latência ponta a ponta, aumento de 15% na taxa de transferência e redução de até 30% nos custos de inferência.
Tim Fell, Vice-Presidente de Tecnologia e Serviços de Rede Fixa da TELUS, afirmou: "A segurança pública e os serviços de missão crítica exigem uma IA que seja rápida, confiável e soberana por design. Com a AINF, a Arrcus nos fornece uma base de rede inteligente e com reconhecimento de políticas, capaz de fornecer inferência de IA de forma rápida e em grande escala em nossa rede, ao mesmo tempo que atende aos requisitos de soberania de dados, segurança e previsibilidade exigidos por nossos parceiros de segurança pública, clientes governamentais e empresariais."
Este anúncio destaca o crescente foco do setor em redes de inferência de IA, em vez de clusters de treinamento de IA. Embora grande parte do foco do mercado de infraestrutura de IA esteja em GPUs e treinamento de modelos em larga escala, as operadoras enfrentam cada vez mais os desafios associados ao fornecimento de serviços de inferência em locais geograficamente distribuídos. Esta tendência está impulsionando o interesse em plataformas de rede capazes de tomar decisões de roteamento com base em políticas específicas de IA. Para a Arrcus, a parceria com a TELUS é uma oportunidade de validação de alto perfil para a AINF. A AINF é uma arquitetura de rede dedicada, projetada para inferência de IA distribuída, lançada pela empresa no início deste ano. A plataforma expande a estratégia mais ampla da Arrcus de construir infraestrutura de rede definida por software em seu sistema operacional ArcOS, ao mesmo tempo que aproveita o ecossistema de chips comerciais. A integração com as DPUs NVIDIA BlueField, switches Ethernet Spectrum e o software Dynamo alinha a Arrcus com o ecossistema de infraestrutura de IA em rápida expansão da NVIDIA, à medida que provedores de serviços e governos em todo o mundo exploram iniciativas de IA soberana e arquiteturas de inferência distribuída.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









