De acordo com pt.wedoany.com-A Lambda, provedora de serviços em nuvem apoiada pela Microsoft, obteve acesso antecipado ao próximo switch de rede de fotônica coembarcada (CPO) da NVIDIA e o exibiu ao público. Este hardware já entrou em "produção total" e a Lambda planeja utilizá-lo em seu sistema de cluster GB300 NVL72.
Este switch pertence à série Quantum-X Q3450-LD, baseado na arquitetura InfiniBand, com formato 4U, capaz de acomodar 144 portas de 800G, com capacidade de comutação sem bloqueio de 115,2 terabits por segundo (Tb/s). O dispositivo utiliza resfriamento líquido, com dois loops internos e quatro interfaces de resfriamento líquido UDQ4. A NVIDIA emprega tecnologia de fotônica de silício para aumentar a largura de banda e melhorar o desempenho da conexão entre servidores em grandes clusters de GPUs.
A equipe de engenharia da Lambda destacou que uma grande vantagem do switch CPO é a economia de energia. Switches tradicionais exigem um grande número de transceptores plugáveis, enquanto o switch CPO integra internamente os motores ópticos com quatro ASICs, eliminando a necessidade desses componentes. O switch utiliza conexão por matriz de fibras ópticas, fornecendo sinal para portas MPO (Multi-fiber Push-On) através de 18 módulos de fonte de luz removíveis, o que encurta significativamente o caminho do circuito entre os componentes ópticos e o ASIC, reduzindo a latência e a perda de sinal. Rich Underwood, arquiteto de sistemas HPC da Lambda, exemplificou que um switch tradicional de 72 portas requer 72 transceptores, cada um consumindo 25 watts, e a solução CPO pode reduzir drasticamente o consumo de energia. Ashkan Seyedi, diretor de redes da NVIDIA, explicou o princípio de funcionamento do CPO, destacando que o sinal elétrico é imediatamente convertido para o domínio óptico no encapsulamento, reduzindo o comprimento do canal elétrico. Ele enfatizou que a redução do número de lasers, a eliminação dos processadores de sinais digitais (DSP) e a garantia de limpeza das fibras ópticas podem acelerar a montagem do sistema.
Além da vantagem de consumo de energia, a equipe da Lambda acredita que a tecnologia CPO também pode aumentar a confiabilidade da rede, pois a remoção dos transceptores elimina um ponto potencial de falha. Underwood estimou que, em um cluster de nuvem superinteligente com 128 mil GPUs, a solução tradicional exigiria 5 milhões de lasers, enquanto a solução CPO precisaria de apenas 1 milhão. A economia de energia se traduz diretamente em mais GPUs disponíveis e tempo de computação. A TSMC está fabricando para a NVIDIA versões CPO dos switches baseados em Quantum-X e Spectrum-X baseados em Ethernet, com ambas as empresas colaborando na produção de circuitos integrados fotônicos.
Apesar da adoção do CPO, a NVIDIA ainda planeja continuar usando cabos de cobre. Seu CEO, Jensen Huang, confirmou em seu discurso principal na GTC que os cabos de cobre terão seu lugar em suas soluções de interconexão, incluindo a próxima arquitetura Feynman. Gilad Shainer, vice-presidente sênior de redes da NVIDIA, explicou que o uso simultâneo das duas tecnologias visa "fazer o design correto" e afirmou que a transmissão por cabo de cobre tem consumo de energia zero e é passiva, priorizando o uso de cabos de cobre sempre que possível.










