De acordo com pt.wedoany.com-A NVIDIA anunciou oficialmente em 19 de maio, horário local, que sua primeira CPU Vera, projetada especificamente para IA Agêntica (Agentic AI), completou as primeiras entregas de sistemas. Ian Buck, vice-presidente de hiperescala e computação de alto desempenho da NVIDIA, entregou pessoalmente os primeiros sistemas a quatro clientes: na sexta-feira anterior, os sistemas chegaram à Anthropic em São Francisco, à OpenAI em Mission Bay e à SpaceXAI (anteriormente xAI) em Palo Alto, três dos principais laboratórios de IA do mundo; nesta segunda-feira, outro lote de sistemas foi entregue à Oracle Cloud Infrastructure (OCI) em Santa Clara. Este movimento marca a transição oficial da CPU Vera da fase de lançamento para a fase de produção e entrega em volume.
A CPU Vera é a primeira CPU personalizada totalmente desenvolvida internamente pela NVIDIA, projetada para cargas de trabalho de IA Agêntica. Ela é equipada com 88 núcleos Olympus proprietários da NVIDIA, suportando 176 threads, com desempenho de núcleo único sob carga total 50% superior ao da geração anterior, a CPU Grace. Em termos de memória, a Vera é a primeira CPU para data center do mundo a adotar memória LPDDR5X, alcançando uma largura de banda de memória de 1,2 TB/s através de módulos SOCAMM e suportando até 1,5 TB de memória do sistema, o triplo da capacidade da Grace. Em capacidade de interconexão, a Vera suporta a interconexão de memória coerente NVLink-C2C de segunda geração a 1,8 TB/s, podendo formar a arquitetura de fábrica de IA de nova geração NVIDIA Vera Rubin juntamente com GPUs Rubin, DPUs BlueField-4, SuperNICs ConnectX-9 e switches Ethernet Spectrum-X.
O CEO da NVIDIA, Jensen Huang, posicionou a CPU Vera independente como o próximo negócio de bilhões de dólares da empresa durante a conferência GTC em San José, em março deste ano. A NVIDIA não apenas usa a Vera como processador host para as GPUs Rubin no sistema de rack NVL72 Vera Rubin — cada NVL72 integra 36 CPUs Vera e 72 GPUs Rubin — mas também a venderá como um produto independente, visando diretamente o mercado de CPUs para data centers.
Buck declarou durante esta entrega: "A IA Agêntica está criando um novo momento para a CPU nas fábricas de IA — à medida que os modelos passam de responder perguntas para executar tarefas proativamente, a Vera foi projetada especificamente para suportar esse tipo de carga de trabalho em larga escala." Ele explicou ainda que, quando um modelo de IA enfrenta um problema, a resposta muitas vezes não está pronta de antemão; o modelo precisa gerar código Python, chamar ferramentas e orquestrar tarefas para chegar ao resultado correto. Todo esse é um trabalho central no nível da CPU, e foi justamente a observação dessa tendência que impulsionou o aumento vertiginoso na demanda por CPUs.
Entre os primeiros clientes a receber, cada um tem um foco diferente para a aplicação da Vera. James Bradbury, chefe de computação da Anthropic, declarou após receber o sistema: "A expansão da escala computacional é um acelerador importante para o crescimento do modelo, e esperamos ver a Vera se tornar uma peça importante no ecossistema de IA no domínio das cargas de trabalho agênticas." Na sede da OpenAI em Mission Bay, Sachin Katti, chefe de infraestrutura computacional, recebeu o sistema pessoalmente, e Buck ainda abriu o gabinete no local para mostrar a arquitetura interna. A SpaceXAI foi recebida pessoalmente pelo fundador Elon Musk, que perguntou detalhadamente sobre o número de núcleos, o layout da memória e a solução de refrigeração. A SpaceXAI está avaliando o desempenho da Vera em cargas de trabalho de aprendizado por reforço e pipelines de simulação baseados em agentes.
O compromisso da Oracle Cloud Infrastructure foi o mais explícito. Karan Batta, chefe de gestão de produtos da OCI, afirmou: "A Oracle Cloud planeja implantar centenas de milhares de CPUs NVIDIA Vera a partir de 2026. A IA Agêntica exige desempenho sustentado em larga escala, e a arquitetura da Vera, projetada para cargas de trabalho de inferência de alto rendimento, oferece a eficiência, densidade e espaço físico que a Oracle Cloud precisa para impulsionar a IA empresarial da próxima geração." A Oracle torna-se assim o primeiro provedor de nuvem a se comprometer com a implantação em hiperescala da Vera.
A entrega da CPU Vera ocorre num momento crucial de transição da indústria de IA, da IA Generativa para a IA Agêntica. A IA Generativa tradicional é principalmente responsável por responder perguntas e gerar conteúdo, enquanto a IA Agêntica precisa planejar processos de forma autônoma, chamar ferramentas externas, executar código, recuperar informações e completar tarefas de múltiplas etapas. Essa mudança impõe novas exigências às CPUs de data center — a necessidade de lidar simultaneamente com várias cargas de trabalho, como sandboxing inteligente, chamada de ferramentas, orquestração de tarefas e recuperação de contexto longo, sob pressão de tarefas em tempo real e alta concorrência. A Vera é uma nova categoria de processador projetada a partir dessa realidade.
A CPU Vera é fabricada com o processo de 3nm da TSMC, utilizando encapsulamento avançado 2.5D/3D, com um ciclo de produção mais curto que o da GPU Rubin, sendo esta também a principal razão pela qual a Vera pôde ser entregue aos clientes primeiro. O ritmo de produção em massa da plataforma Vera Rubin está acelerando: a CPU Vera completou as primeiras entregas, e espera-se que a GPU Rubin entre em produção e embarque em grande volume no segundo semestre deste ano até o terceiro trimestre. À medida que a NVIDIA avança na comercialização rumo ao mercado de CPUs, seu mapa de infraestrutura de IA de pilha completa, abrangendo GPUs, CPUs, DPUs e chips de comutação de rede, está se formando rapidamente.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com










