De acordo com pt.wedoany.com-A empresa americana de semicondutores Marvell lançou recentemente o chip de comutação Teralynx T100, oferecendo capacidade de comutação de 102,4 Tbps para infraestrutura de data centers de IA e nuvem.
O principal cenário de aplicação deste chip são as redes internas de clusters de IA em larga escala. Com o rápido aumento no número de aceleradores GPU e XPU, o gargalo dos data centers está mudando do desempenho de chips de computação individuais para a eficiência da troca de dados dentro do cluster, latência de rede, controle de consumo de energia e complexidade da arquitetura. A Marvell afirma que o Teralynx T100, fabricado com o avançado processo de 3 nanômetros, foi reprojetado para cargas de trabalho de treinamento e inferência de IA, com consumo de energia típico inferior a 1000W, podendo reduzir o consumo em até cerca de 25% em comparação com soluções concorrentes similares, e suporta capacidade de expansão horizontal de 512 portas. Para provedores de serviços em nuvem de hiperescala e operadores de infraestrutura de IA, o chip de comutação não é o componente de maior visibilidade externa, mas determina diretamente se dezenas de milhares de aceleradores podem formar um cluster de computação estável, eficiente e de baixa latência. As plataformas de comutação de data centers tradicionais são mais projetadas em torno de redes empresariais, computação em nuvem geral e arquiteturas hierárquicas. Quando as tarefas de treinamento de IA atingem o nível de dezenas ou centenas de milhares de GPUs, a hierarquia de rede, o número de interconexões ópticas, o controle de congestionamento, a latência de cauda e o consumo de energia se amplificam em custos sistêmicos. O Teralynx T100 tenta reduzir os níveis de comutação e o número de links ópticos dentro do cluster de IA por meio de maior largura de banda, maior densidade de portas e uma estrutura de rede mais plana, permitindo que os data centers implantem mais aceleradores sob as restrições de energia existentes e reduzindo a pressão dos equipamentos de rede sobre a potência do rack, dissipação de calor e custo total de propriedade.
A Marvell afirma que o Teralynx T100 começará a enviar amostras para clientes neste trimestre, oferecendo múltiplos formatos de encapsulamento, incluindo BGA, conexão de cobre co-embalada e óptica co-embalada.
Os data centers de IA estão entrando em uma nova fase de restrições conjuntas de "poder computacional, rede, energia elétrica e dissipação de calor". Nos últimos anos, o mercado focou mais no fornecimento de GPUs, encapsulamento avançado e memória HBM, e o papel da infraestrutura de rede em clusters de treinamento em larga escala está aumentando rapidamente. Se a eficiência da rede de um cluster de IA for insuficiente, aceleradores caros sofrerão com espera por comunicação, lentidão na sincronização de tarefas e prolongamento do tempo de convergência do treinamento, convertendo, em última análise, os custos de aquisição de hardware em perda de utilização. O chip de comutação, portanto, passa de um componente de rede de data center tradicional para um semicondutor chave para a expansão escalável da infraestrutura de IA. O Teralynx T100 suporta implantações de expansão horizontal e vertical, é compatível com a arquitetura Ethernet de IA emergente e os requisitos relacionados ao Ultra Ethernet Consortium, e integra telemetria, controle de congestionamento nativo de IA e gerenciamento de tráfego de baixa latência. Isso significa que, ao planejar clusters de IA no futuro, os operadores de data centers podem projetar arquiteturas em torno de maior densidade de portas, menos níveis de rede, menor consumo de energia e formas de interconexão mais flexíveis. À medida que a potência dos racks de GPU se aproxima ou até ultrapassa os limites de projeto das salas de servidores tradicionais, a redução no consumo de energia dos chips de rede não é mais apenas uma otimização de parâmetros de equipamento, mas afetará a redundância de energia de todo o data center, a proporção de resfriamento líquido, a densidade dos racks e o ritmo de expansão. Para provedores de serviços em nuvem, empresas de internet e operadores de poder computacional de IA, a melhoria na eficiência da infraestrutura de rede impactará diretamente os custos de treinamento, a latência de inferência e a capacidade de entrega de poder computacional.
Este lançamento também mostra que a competição em infraestrutura de IA está se estendendo de chips de computação individuais para elos subjacentes, como chips de comutação, interconexões ópticas, SerDes, sistemas operacionais de rede e escalonamento de clusters. As variáveis subsequentes concentram-se na validação de amostras com clientes, no ritmo de produção em massa, na compatibilidade com diferentes ecossistemas Ethernet de IA e no custo real de implantação de soluções ópticas co-embaladas em grandes data centers. Se as tecnologias relacionadas entrarem nos clusters dos principais provedores de nuvem, a rede de data centers de IA se tornará um novo foco de investimento em semicondutores avançados e infraestrutura de nuvem.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









