De acordo com pt.wedoany.com-A Amazon Web Services (AWS) lançou as instâncias otimizadas para computação C9g, equipadas com o processador Graviton5 desenvolvido internamente, voltadas para cargas de trabalho intensivas em computação, agora disponíveis oficialmente.

As instâncias C9g contam com CPUs Graviton5 que possuem o dobro do número de núcleos da geração anterior, com uma redução de 33% na latência entre núcleos. Atualmente, essas instâncias estão disponíveis nas regiões Leste dos EUA, Oeste dos EUA e Europa (Frankfurt), com expansão para mais regiões prevista.
Esta é a mais recente movimentação da AWS na linha de produtos otimizados para computação, após o lançamento das instâncias EC2 M9g e M9gd em junho. A AWS afirma que, em comparação com as instâncias C8g da geração anterior, as instâncias C9g oferecem um aumento de desempenho por vCPU (CPU virtual) de até 25%.
Em termos de aplicação, essas instâncias são otimizadas para cargas de trabalho agentivas. Sébastien Stormacq, principal defensor de desenvolvedores da AWS, destacou que a velocidade de processamento mais rápida e o cache maior reduzem o tempo de espera dos dados pelas cargas de trabalho, aumentando assim a taxa de transferência de análise de memória, acelerando os ciclos agentivos e melhorando a capacidade de resposta de aplicações em tempo real. Com a transição da IA de responder perguntas para executar tarefas, rodar código e orquestrar fluxos de trabalho de múltiplas etapas, a demanda por computação de CPU está crescendo, e as instâncias C9g foram projetadas para assumir essas tarefas.
As instâncias C9gd, lançadas simultaneamente, são equipadas com SSDs NVMe locais, adequadas para cenários que exigem armazenamento de baixa latência, como simulações de HPC (computação de alto desempenho) e mecanismos de veiculação de anúncios. Em comparação com as instâncias de armazenamento local da geração anterior, seu armazenamento de alta velocidade e baixa latência suporta maior taxa de transferência e IOPS (operações de entrada/saída por segundo).
C9g e C9gd são as primeiras instâncias otimizadas para computação da AWS equipadas com o Nitro Isolation Engine. Esse componente de segurança controla o acesso à memória da máquina virtual, ao estado dos registradores da CPU e aos dispositivos de E/S por meio de um conjunto mínimo de APIs, fornecendo isolamento matematicamente verificado entre máquinas virtuais. As instâncias M9g e M9gd, lançadas anteriormente, também incorporaram esse recurso.
As duas séries de instâncias oferecem 11 tamanhos, variando de medium a 48xlarge, além de opções bare metal. Dados da AWS indicam que, em comparação com as instâncias da geração anterior, a largura de banda média de rede dos diferentes tamanhos aumentou 15%, e a largura de banda do EBS (Elastic Block Store) aumentou 20%.
A AWS está expandindo continuamente seu portfólio de instâncias alimentadas por chips próprios, oferecendo aos clientes de nuvem uma gama mais ampla de opções de hardware básico além da Nvidia. Em março deste ano, o provedor de serviços de nuvem fechou uma parceria com a empresa de chips Cerebras, combinando seus servidores Trainium com o sistema CS-3 em escala de wafer; simultaneamente, a iniciativa de desenvolver chips próprios otimizados para IA culminou no Project Rainier, um cluster de instalações em escala massiva construído para a Anthropic, equipado com mais de 500.000 chips Trainium2.
Os esforços de expansão da AWS são acompanhados por ajustes de custos. Desde 1º de julho, as taxas dos blocos de capacidade EC2 para serviços reservados de GPU de aprendizado de máquina aumentaram cerca de 20%, o segundo aumento de preço em seis meses.









