Super Micro Computer divulga blueprint de data center de IA com 1152 GPUs escalável
2026-06-02 09:54
Favoritos

De acordo com pt.wedoany.com-A Super Micro Computer, Inc. lançou blueprints de soluções de blocos de construção de data center (DCBBS) baseados nas plataformas NVIDIA Vera Rubin NVL72 e NVIDIA HGX Rubin NVL8. Esses blueprints são projetados especificamente para implantação de data centers de IA em escala de gigawatt, começando com uma unidade escalável contendo 1152 GPUs, que pode ser expandida para praticamente qualquer tamanho. Os blueprints DCBBS da Supermicro oferecem uma solução completa de ponta a ponta, do design à entrega, acompanhada por uma equipe de especialistas dedicados que cobre todo o ciclo de vida da implantação. A solução integra computação, armazenamento, rede, refrigeração líquida avançada, distribuição de energia e infraestrutura no local para acelerar a entrada em operação de fábricas de IA refrigeradas a líquido em grande escala.

Os blueprints DCBBS da Supermicro visam resolver os desafios práticos de implementação das infraestruturas de IA mais avançadas do mundo. A plataforma NVIDIA Vera Rubin aumenta significativamente a densidade de desempenho das fábricas de IA, duplicando a velocidade em múltiplos domínios de computação. A arquitetura de referência mais recente da NVIDIA define com precisão o conteúdo ideal de uma unidade escalável de 1152 GPUs, enquanto os blueprints DCBBS da Supermicro definem as etapas específicas para uma implantação bem-sucedida. A Supermicro possui um histórico comprovado na implantação das maiores fábricas de IA refrigeradas a líquido do mundo, equipadas com mais de 100.000 GPUs.

Os clientes que planeiam a construção ou modernização de fábricas de IA enfrentam uma restrição rígida comum: a energia elétrica disponível. O blueprint DCBBS para o NVIDIA Vera Rubin NVL72 fornece uma lista de materiais equilibrada dentro de uma faixa de potência especificada (de 5MW a 1GW), configurando proporcionalmente a capacidade de refrigeração, distribuição de energia, nós de computação, nós de gestão, nós de armazenamento de alto desempenho, nós de plataforma de armazenamento de memória de contexto e rede, eliminando gargalos de desempenho causados por obstáculos como subscrição excessiva de rede, limitações de capacidade de energia ou throttling térmico.

Estes blueprints abrangem o processo completo de ponta a ponta da Supermicro para concluir projetos de IA em grande escala em tempo recorde. A investigação das instalações no local é realizada pela equipa dedicada da Supermicro, analisando a compatibilidade do espaço físico com os requisitos de implantação, incluindo docas de carga, dimensões das salas de dados, pé-direito, plantas e capacidade de carga do piso. O design e o planeamento do projeto incorporam todos os detalhes críticos num plano de construção personalizado de acordo com os requisitos do cliente e as restrições das instalações. A Supermicro define a combinação correta de componentes DCBBS, como a solução de refrigeração: para instalações totalmente compatíveis com refrigeração líquida direta, oferece Unidades de Distribuição de Refrigeração (CDU) de até 1,8MW montadas em fila; para locais sem infraestrutura de água, oferece unidades laterais ar-líquido; simultaneamente, estão a ser desenvolvidas opções de CDU dentro do rack baseadas em configurações de gabinete de 52U, bem como opções complementares de trocadores de calor montados na porta traseira para ambientes de alta temperatura ambiente. Na fase de integração da solução com serviços completos no local, a maior parte do trabalho é realizada nas suas fábricas de produção nos EUA, incluindo montagem, empilhamento e cabeamento dentro de cada rack. A Supermicro valida a funcionalidade através de um processo de teste que excede os padrões da indústria, abrangendo testes de nível de sistema (L10) e testes multinó de nível de cluster (L11). A equipa dedicada gere a logística dos componentes no local, como CDUs, torres de refrigeração e infraestrutura elétrica, incluindo a coordenação com fornecedores terceiros escolhidos pelo cliente. Os serviços de entrega integrados e integração no local abrangem posicionamento de racks, conexões elétricas e de refrigeração, cabeamento de rede, comissionamento do sistema, instalação da pilha de software e validação no local. Em termos de suporte, serviços e software, é oferecida uma série de opções contínuas no local, incluindo resposta no local em até 4 horas para requisitos críticos de tempo de atividade, e suporte para integração com ferramentas de gestão de infraestrutura como Supermicro SuperCloud Composer e SuperCloud Director, permitindo controlo unificado desde a gestão de bare metal até à orquestração de cargas de trabalho multi-inquilino, integrando simultaneamente pilhas de software como NVIDIA AI Enterprise e NVIDIA Run:ai.

A plataforma NVIDIA Vera Rubin tem o potencial de proporcionar ganhos de desempenho geracionais transformadores, mas requer um método repetível e fiável para uma implantação bem-sucedida. A Supermicro garante que as soluções estão alinhadas com as mais recentes arquiteturas de referência da NVIDIA, dando aos clientes a confiança de que as suas implantações estão consistentes com o ecossistema de parceiros de cloud da NVIDIA. A unidade escalável central do blueprint DCBBS da Supermicro oferece 1152 GPUs NVIDIA Rubin, equipadas com 331 TB de memória GPU HBM4. Em comparação com o NVIDIA Blackwell, a geração Vera Rubin duplica a largura de banda da memória GPU, a largura de banda NVLink GPU-para-GPU e a largura de banda de rede por GPU, fornecendo a base arquitetural para treinar e inferir modelos de IA de topo com biliões de parâmetros. A sua infraestrutura de suporte inclui: stack de refrigeração líquida direta avançada (DLC-2), abrangendo uma torre de refrigeração de 5MW, 4 CDUs de fila de até 1,8MW, 16 manifolds de distribuição de refrigeração montados verticalmente, 576 cold plates de cobre para arrefecimento direto de chips, e o líquido de refrigeração Supermicro SMC PG25-A com excelente estabilidade química e térmica, oferecendo opções ar-líquido de 200kW e 500kW; infraestrutura de distribuição de energia, desde transformadores de média tensão até distribuição de baixa tensão, power shelves a nível de rack e Unidades de Bateria de Reserva (BBU), com cada rack Vera Rubin NVL72 equipado com quatro power shelves de 110kW e unidades de alimentação redundantes de 18,3kW, suportando Sistemas de Armazenamento de Energia em Bateria (BESS) que fornecem energia de reserva com comutação instantânea; gabinetes otimizados de 48U e 52U; 16 racks de computação otimizados para as plataformas NVIDIA Vera Rubin NVL72 e NVIDIA HGX Rubin NVL8; 6 racks de rede (4 para computação, 2 para convergência), suportando NVIDIA Spectrum-X Ethernet ou NVIDIA Quantum-X800 InfiniBand, com taxas de estrutura de computação de até 1,6 TB/s, e opções de rede de silício fotónico baseadas em ótica co-embalada (CPO) sem necessidade de transceivers plugáveis; 4 racks de armazenamento de alto desempenho baseados na plataforma de servidor Petascale da Supermicro, para armazenamento de aplicações em camada NVMe e checkpoints de treino de modelos; além de 2 racks de plataforma de armazenamento de memória de contexto, otimizados para inferência de contexto longo, memória de trabalho de agentes e cargas de trabalho de recuperação. Mais informações disponíveis em supermicro.com/vera-rubin.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com