De acordo com pt.wedoany.com-A Intel está colaborando com a SambaNova e a Foxconn para lançar, na Computex Taipei de 2026, uma arquitetura em nível de rack projetada para cargas de trabalho de inferência e IA agentiva. A plataforma integra processadores Intel Xeon, as unidades de fluxo de dados reconfiguráveis (RDU) SN-50 da SambaNova e a capacidade de integração de sistemas da Foxconn, oferecendo racks de IA prontos para produção para datacenters de hiperescala, empresas e fábricas de IA emergentes. Esta iniciativa demonstra o esforço da Intel em posicionar a CPU como um componente central para implantações de IA em larga escala, atendendo à tendência de mercado em que a demanda por inferência supera gradualmente o treinamento de modelos.

A arquitetura reflete a evolução do setor de uma infraestrutura centrada em treinamento para uma centrada em inferência. Em cenários de treinamento, normalmente uma CPU suporta quatro GPUs, mas, à medida que as cargas de trabalho agentivas se expandem, a proporção entre CPU e aceleradores se aproxima de 1:1. O design do rack prioriza o desempenho por watt e por dólar, em vez de maximizar a taxa de transferência de treinamento. A Intel destaca que a IA agentiva exige mais da CPU em termos de orquestração, escalonamento, gerenciamento de memória, movimentação de dados e execução de cargas de trabalho não matriciais.
A Intel demonstrou uma arquitetura de inferência totalmente desacoplada por meio do Vector Core Compute, uma plataforma apoiada pela Vista Equity Partners e pela Cambium Capital, posicionada como uma nuvem de inferência dedicada de nível empresarial. Em uma demonstração executando o modelo MiniMax 2.5, a carga de trabalho foi dinamicamente dividida entre diferentes arquiteturas de silício para otimizar cada estágio do pipeline de IA: a orquestração e execução foram tratadas pelo processador Intel Xeon 6, o processamento de decodificação pela RDU SN40 da SambaNova e as operações de pré-preenchimento por GPUs NVIDIA Blackwell. Esta implantação é considerada um dos primeiros pipelines de inferência de produção a distribuir cargas de trabalho entre diferentes tipos de processadores. A Together.ai já se tornou o primeiro cliente comercial.
Os principais anúncios incluem: a colaboração entre Intel, SambaNova e Foxconn para fornecer infraestrutura em nível de rack para implantações de inferência e IA agentiva; a Foxconn responsável pela integração de sistemas de ponta a ponta, fabricação e implantação, com planos de lançar variantes de CPU de alta densidade para otimizar custos de inferência, processamento de dados e IA híbrida; e o lançamento do processador Intel Xeon 6+ (codinome Clearwater Forest), baseado no processo Intel 18A, a primeira implantação deste nó de processo em datacenters. Um único rack refrigerado a líquido pode suportar até 36.864 núcleos Xeon 6+, projetado para maximizar a concorrência de agentes de IA dentro de uma faixa de potência de aproximadamente 100 kW por rack.
O CEO da Intel, Lip-Bu Tan, afirmou que, com o surgimento da inferência, IA agentiva e IA física, a Intel está comprometida em fornecer inovação desde o chip até o nível de sistema. O foco deste anúncio é a tentativa da Intel de definir uma arquitetura completa de rack de IA. A NVIDIA já expandiu para infraestrutura de IA de pilha completa por meio de designs como DGX, NVL72 e fábricas de IA. A Intel adota uma estratégia semelhante, posicionando o Xeon como a camada de orquestração para inferência de IA, enquanto colabora com fornecedores especializados em aceleradores. A parceria com a SambaNova permite que a Intel obtenha uma arquitetura madura de acelerador de inferência sem precisar esperar por alternativas de desenvolvimento interno. Em um contexto em que os gastos estão migrando de treinamento para implantações de IA de produção, métricas como consumo de energia, utilização, latência e custo total de propriedade tornam-se cruciais. A ênfase da Intel na densidade de CPU, integração em nível de rack e inferência desacoplada visa capturar oportunidades de mercado em fábricas de IA que não exigem grandes quantidades de GPUs de treinamento, mas ainda precisam de orquestração e capacidade de inferência em larga escala.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









