192 núcleos em processo de 3 nm, a CPU mais poderosa da arquitetura Arm é oficialmente lançada
2026-06-11 10:11
Favoritos

No dia 10 de junho, horário local, a Amazon Web Services (AWS) anunciou oficialmente o lançamento das instâncias Amazon EC2 M9g e M9gd, baseadas em seu quinto processador Arm proprietário, o Graviton5, lançado em dezembro do ano passado. Isso não é apenas uma iteração de hardware comum, mas é visto pela indústria como um movimento estratégico crucial da AWS para a iminente era da "IA Agente" (Agentic AI).

Processo de 3 nm, 192 núcleos

Com a explosão da IA Agente (Agentic AI), a carga de trabalho da IA está passando por uma transformação fundamental: de simples "perguntas e respostas de texto" para "ações autônomas" — raciocínio em tempo real, geração de código, orquestração de tarefas de múltiplas etapas e chamadas de ferramentas entre sistemas. Essas tarefas impõem demandas sem precedentes de alta concorrência e baixa latência à Unidade Central de Processamento (CPU), responsável pelo controle lógico e agendamento. O AWS Graviton5, projetado com núcleos grandes, grande cache e alta largura de banda de memória, foi criado para atender às necessidades da "IA Agente".

O Graviton5 utiliza o processo de 3 nm da TSMC, encapsulando mais transistores com o mesmo consumo de energia, alcançando maior densidade de circuito e eficiência energética.

O núcleo Neoverse V3 do Graviton5 foi co-definido pela Arm e pela AWS Annapurna Labs. Embora o cache L1 (64 KB) e o cache L2 (2 MB) não sejam os maiores destaques, o cache L3 aumentou 5 vezes, atingindo 192 MB, permitindo que grandes volumes de dados de acesso frequente fiquem mais próximos do núcleo. Além disso, sua capacidade de previsão de desvio foi significativamente aprimorada, resultando em um aumento de desempenho de até 30% na execução de códigos complexos, como bancos de dados reais, algo que testes de loop pequeno focados apenas em benchmarks não conseguem igualar.

Em termos de número de núcleos, o Graviton5 saltou de 96 núcleos do Graviton4 para 192 núcleos, um aumento de 100%. Mas, mais importante, a AWS abandonou a arquitetura de chip único (Die) anterior e adotou um design avançado de 4 chips (Chiplet). Isso significa que os 192 núcleos são distribuídos uniformemente em 4 chips independentes, cada um contendo 48 núcleos, com controladores de memória DRAM dedicados e controladores de E/S PCIe 6.0 integrados.

Esse design traz duas grandes vantagens: primeiro, os dados não precisam mais percorrer longas distâncias através do chip para acessar a memória ou dispositivos de E/S, reduzindo drasticamente a latência; segundo, através de uma tecnologia de interconexão entre chips personalizada, a largura de banda entre os quatro chips pode chegar a 420 GB/s, garantindo a eficiência de colaboração da grade de computação geral.

Mais crucialmente, o Graviton5 se torna o primeiro processador na nuvem a suportar memória DDR5-8800 e PCIe Gen 6. A AWS enfatiza que, através de uma colaboração estreita com fabricantes de DRAM, o Graviton5 oferece a velocidade de memória mais rápida entre todos os processadores de nuvem atuais. Para aplicações sensíveis à largura de banda de memória (como grandes bancos de dados, análise em tempo real), isso significa uma redução significativa de gargalos.

Além disso, o Graviton5 adota um design sem tampa (removendo a tampa metálica de dissipação de calor da CPU, permitindo que o chip nu entre em contato direto com o dispositivo de resfriamento), reduzindo o consumo de energia do ventilador de resfriamento em 33%.

A AWS afirmou anteriormente em um comunicado que o Graviton5 é "o CPU proprietário mais poderoso e energeticamente eficiente já projetado" (our most powerful and energy efficient custom-designed chip yet). Embora isso se limite ao âmbito dos chips proprietários da AWS, considerando a posição de mercado da AWS no segmento de chips de servidor Arm, essa declaração tem um valor de referência considerável.

Desempenho superior da instância M9g em vários cenários

As melhorias nos parâmetros de hardware do Graviton5 devem, em última análise, se traduzir em melhorias no desempenho das instâncias. Como a plataforma de lançamento do Graviton5, a instância M9g apresentou resultados convincentes em várias dimensões.

De acordo com dados oficiais da AWS, em comparação com a instância M8g baseada no Graviton4, a instância M9g oferece: aumento de 25% no desempenho de computação geral; aumento de 35% no desempenho de aplicações web; aumento de 35% no desempenho de inferência de aprendizado de máquina; aumento de 30% no desempenho de banco de dados.

Durante o período de pré-visualização de vários meses, vários clientes de referência da indústria validaram esses números com ambientes de produção reais:

ClickHouse: obteve um aumento de desempenho de 36% sem nenhuma alteração no código.

Honeycomb: em um teste A/B de 6 meses com cargas de trabalho de observabilidade em produção, a taxa de transferência por núcleo aumentou 36%.

HubSpot: após migrar seu banco de dados MySQL para M9g, o tempo de consulta caiu até 60%.

Meta: comprometeu-se a implantar dezenas de milhões de núcleos Graviton para seus projetos de IA Agente, tornando-se um dos maiores clientes Globais do Graviton.

Para cargas de trabalho que exigem armazenamento local de alta velocidade, a AWS também lançou a instância M9gd, oferecendo até 11,4 TB de NVMe SSD, com IOPS 30% maior que a geração anterior. Em termos de rede, a largura de banda de rede da instância máxima foi aumentada para 100 Gbps, a largura de banda EBS para 72 Gbps, e suporta a Configuração de Largura de Banda de Instância (IBC), permitindo que os usuários aloquem dinamicamente até 25% da largura de banda entre a rede VPC e o armazenamento EBS para se adaptar a diferentes tarefas sensíveis a E/S.

Primeira integração do mecanismo de isolamento Nitro

Além do desempenho, o Graviton5 introduz pela primeira vez outro marco do sistema de segurança da AWS — o mecanismo de isolamento Nitro.

O isolamento de virtualização tradicional é baseado em uma série de verificações e testes de software e hardware, que teoricamente podem ter vulnerabilidades não descobertas. O mecanismo de isolamento Nitro utiliza tecnologia de verificação formal, um método que prova matematicamente que o comportamento do hardware ou software está totalmente de acordo com o esperado (em vez de apenas através de casos de teste específicos). Como um componente dedicado, este mecanismo controla rigorosamente o acesso a toda a memória da máquina virtual, estado dos registradores da CPU e dispositivos de E/S através de um conjunto mínimo de APIs.

Isso torna o AWS Nitro o primeiro hipervisor de nuvem formalmente verificado. Não é mais "acreditamos que é seguro", mas sim "matematicamente comprovado que é seguro". Para cargas de trabalho sensíveis dos setores financeiro, governamental e de segurança, isso oferece uma garantia de isolamento de nível matemático sem precedentes.

Disponibilidade e Lançamento

Atualmente, as instâncias M9g e M9gd estão oficialmente disponíveis nas regiões Leste dos EUA (Norte da Virgínia, Ohio), Oeste dos EUA (Oregon) e Europa (Frankfurt) da AWS. Os clientes podem adquirir através de instâncias sob demanda, instâncias reservadas ou Savings Plans. Para ajudar os clientes a migrar suavemente, a AWS também oferece o Guia de Início Rápido do Graviton, um painel de economia de custos e o serviço de transformação de código orientado por IA AWS Transform, que pode automatizar a migração de aplicações Java da arquitetura x86 para instâncias Graviton.

De acordo com dados divulgados pela AWS, atualmente, mais de 120.000 clientes usam processadores Graviton, suportando mais de 350 tipos de instâncias, cobrindo tudo, desde aplicações web, microsserviços, contêineres até automação de design eletrônico (EDA), jogos e codificação de vídeo. O negócio de chips, com receita anual superior a US$ 20 bilhões e mantendo crescimento de três dígitos, prova que a estratégia proprietária da AWS não é apenas uma exploração tecnológica, mas se tornou o núcleo de lucro e o motor de diferenciação de seu negócio de nuvem.

O lançamento do Graviton5 marca mais um passo decisivo da AWS no caminho dos chips proprietários para a nuvem. A empresa não se contenta mais em apenas alcançar a arquitetura x86 em termos de custo-benefício, mas, através da otimização prospectiva para cargas de trabalho de IA Agente, tenta definir a base de computação da próxima geração de computação em nuvem.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com