De acordo com pt.wedoany.com-A Nvidia cancelou o projeto do acelerador de IA Rubin Ultra com quatro chips de computação, adotando um design de dois chips GPU, devido a dificuldades de produção superiores às esperadas. Originalmente previsto para ser lançado em 2027, o Rubin Ultra era considerado o ponto mais ambicioso do roteiro da empresa, visando duplicar o desempenho em relação ao Rubin original (design de dois chips), mas conectar quatro chips próximos ao tamanho da máscara e arrefecer 16 módulos HBM4E constituiu um desafio de engenharia formidável. De acordo com a SemiAnalysis, com base em "preocupações com a execução da fabricação", a Nvidia decidiu cancelar esta solução, adotando uma arquitetura de dois chips de computação mais fácil de produzir em massa.

O desempenho do Rubin Ultra ajustado deverá ser apenas metade do original, o que pode enfraquecer a sua vantagem competitiva face a rivais como a série AMD Instinct MI500. No entanto, a Nvidia ainda pode otimizar a eficiência geral do acelerador de IA para justificar a atualização. Além disso, o Rubin Ultra utilizará memória HBM4E em vez do HBM4 do Rubin original. A partir da GPU Rubin, a Nvidia planeia fornecer sistemas de rack Kyber arrefecidos a líquido, aumentando o número de GPUs por domínio de expansão para pelo menos 144, melhorando assim o desempenho computacional total entregue aos clientes.

O cancelamento do acelerador de IA com 16 pacotes HBM4E pode impactar o mercado de HBM, uma vez que a nova versão do Rubin Ultra utiliza apenas oito módulos HBM4E. Simultaneamente, o design de dois chips também torna o custo de uma única GPU Rubin Ultra inferior ao da versão original. Como a Nvidia vende principalmente soluções de rack completas em vez de GPUs independentes, as alterações nos gastos reais dos parceiros ainda precisam ser observadas: se adquirirem mais sistemas para obter o mesmo número de chips de computação, os gastos totais podem ser superiores aos do plano original.









