De acordo com pt.wedoany.com-A startup britânica de redes fotônicas Oriole Networks implantará a primeira rede de IA totalmente fotônica em larga escala do mundo para o ARIA Scaling Inference Lab, do Reino Unido. O sistema combinará a tecnologia de rede fotônica da Oriole com GPUs AMD Instinct e CPUs AMD EPYC para validar a capacidade da próxima geração de infraestrutura de IA em termos de throughput de inferência, baixa latência e controle de consumo de energia.
O gargalo dos data centers de IA está se deslocando do desempenho de chips individuais para a interconexão de rede dentro do cluster. A inferência e o treinamento de grandes modelos exigem a operação coordenada de um grande número de GPUs, CPUs, memória e sistemas de armazenamento. A velocidade de transmissão de dados, a latência e o consumo de energia entre os nós afetam diretamente a eficiência geral. As redes tradicionais de data centers dependem fortemente de equipamentos de comutação elétrica. À medida que os clusters de IA aumentam de escala, o consumo de energia da camada de comutação, o congestionamento de links e o tempo de espera das GPUs tornam-se fatores limitantes. A solução da Oriole substitui parte do caminho tradicional de comutação elétrica por uma rede puramente fotônica, com o objetivo de reduzir a latência e o consumo de energia da rede no nível do sistema, permitindo que mais recursos computacionais sejam realmente dedicados ao processamento de tarefas de IA.
Esta implantação no ARIA Scaling Inference Lab representa um marco importante de validação comercial para a rede fotônica de IA da Oriole. O laboratório é focado em problemas de escalabilidade de inferência de IA, estudando como executar grandes modelos em uma infraestrutura de menor custo, maior eficiência e maior interatividade.
A Oriole lançou anteriormente a infraestrutura de roteamento fotônico PRISM, projetada para data centers, computação de alto desempenho e cargas de trabalho de aprendizado profundo distribuído. A ideia do PRISM é usar redes de comutação fotônica para atender às necessidades de interconexão de alta velocidade em clusters de IA, reduzindo a pressão de energia e latência causada pela comutação elétrica. Se a tecnologia for validada como eficaz no ambiente de laboratório, ela influenciará posteriormente as redes de servidores de IA, módulos de interconexão óptica, arquiteturas de comutação de data centers, implantação de clusters de GPU e design de redes de computação de alto desempenho. A participação da AMD nesta implantação também indica que os fabricantes de chips de IA estão prestando atenção aos gargalos de desempenho em nível de sistema além dos chips de computação. Se o poder computacional da GPU pode ser totalmente liberado depende cada vez mais da cooperação entre rede, memória, encapsulamento, dissipação de calor e agendamento de software.
Esta implantação ainda é um projeto de demonstração e validação para o laboratório ARIA, e não equivale a uma implantação comercial em larga escala em data centers. A Oriole já considera este projeto como sua primeira implantação comercial e planeja promover aplicações mais amplas na indústria até 2027. O foco subsequente recairá sobre a validação do desempenho real de throughput, estabilidade da rede, compatibilidade com clusters de servidores de IA, custo de implantação, complexidade operacional e eficácia na economia de energia.










