NVIDIA e AWS colaboram para acelerar índices vetoriais em 10x_Boletins

NVIDIA e AWS colaboram para acelerar índices vetoriais em 10x

2026-06-26 09:52

Favoritos

De acordo com pt.wedoany.com-Em 25 de junho de 2026, a NVIDIA e a Amazon Web Services (AWS) anunciaram uma parceria para resolver restrições críticas na construção de sistemas de IA em larga escala, como inferência de baixa latência, pesquisa vetorial rápida, custo-benefício de GPUs e escalabilidade da infraestrutura. Por meio do Amazon OpenSearch e do Amazon EC2, a infraestrutura de IA da NVIDIA oferece às empresas caminhos práticos para implantar IA em produção em escala.

As instâncias EC2 G7, alimentadas pelas GPUs NVIDIA RTX PRO 4500 Blackwell Server Edition, expandem a camada de computação para cargas de trabalho de IA, gráficos, vídeo e análise de dados. A biblioteca NVIDIA cuVS acelera a camada de recuperação ao tornar os índices vetoriais baseados em GPU a opção padrão no OpenSearch Serverless. Além disso, a AWS alcançou o status NVIDIA Exemplar Cloud no NVIDIA GB300, garantindo aos clientes desempenho otimizado máximo em cargas de trabalho de treinamento.

As instâncias Amazon EC2 G7 trazem as GPUs NVIDIA RTX PRO 4500 Blackwell Server Edition para a AWS, destinadas a inferência de IA, gráficos, computação espacial e análise de dados acelerada por GPU. Este é um novo tipo de instância projetado para cargas de trabalho de produção, oferecendo desempenho sem que os clientes precisem gerenciar a sobrecarga operacional da plataforma GPU. Em comparação com as instâncias G6, as G7 oferecem até 4,6x mais desempenho em inferência de IA e até 2,1x mais desempenho gráfico. Ao usar a biblioteca NVIDIA cuDF para cargas de trabalho Apache Spark, a instância permite análise de dados acelerada por GPU mais rápida no Amazon EMR. As instâncias G7 suportam até 8 GPUs, totalizando 256 GB de memória GPU, conectividade de rede EFA de 700 Gbps e até 7,6 TB de armazenamento NVMe SSD local, em configurações de 1, 2, 4 e 8 GPUs, além de futuras instâncias bare metal, permitindo que os clientes ajustem a infraestrutura conforme a carga de trabalho.

O Amazon OpenSearch Serverless de próxima geração oferece suporte a IA agêntica e cargas de trabalho dinâmicas sem a necessidade de gerenciar infraestrutura. O serviço usa índices vetoriais acelerados por GPU, alimentados pela NVIDIA cuVS, como a opção de computação padrão para todos os conjuntos de vetores. Para equipes que constroem aplicações de geração aumentada por recuperação, pesquisa semântica, sistemas de recomendação e IA agêntica, essa mudança transforma a pesquisa vetorial baseada em GPU de um projeto de otimização especializado em uma capacidade padrão da AWS. O impacto para os clientes é: aceleração de até 10x na criação de índices vetoriais em comparação com construções puramente baseadas em CPU, com custo reduzido a um quarto do original, tornando possível construir um banco de dados vetorial com bilhões de entradas em menos de uma hora.

A AWS alcançou o status NVIDIA Exemplar Cloud no NVIDIA GB300 para cargas de trabalho de treinamento. Isso significa que a AWS atendeu aos rigorosos limites de desempenho da NVIDIA para benchmarking de cargas de trabalho de IA em relação à sua arquitetura de referência. Essa conquista resulta da profunda engenharia colaborativa entre as equipes da AWS e da NVIDIA. Por meio do programa NVIDIA Exemplar Cloud, desenvolvedores e líderes de IA podem ter a certeza de que estão usando uma infraestrutura de nuvem consistente e de alto desempenho para treinamento em larga escala, ajudando as equipes a avaliar provedores de nuvem com mais confiança, melhorar o custo total de propriedade e avançar projetos de IA do planejamento à produção com mais eficiência.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com