AMD dos EUA lança acelerador PCIe Instinct MI350P, voltado para IA agente e particionamento multiusuário_Boletins

AMD dos EUA lança acelerador PCIe Instinct MI350P, voltado para IA agente e particionamento multiusuário

2026-05-09 19:13

Favoritos

De acordo com pt.wedoany.com-A AMD dos EUA lançou a Instinct MI350P para ambientes de servidor. Esta placa é compatível com slots PCIe 5.0 padrão e tem como alvo principal a Inteligência Artificial agente, ou seja, agentes de IA que auxiliam proativamente os utilizadores na conclusão de tarefas. O produto apresenta um formato de duas ranhuras com cerca de 26,7 cm de comprimento, dependendo do forte fluxo de ar dentro dos servidores em rack para arrefecimento passivo. A sua memória HBM3e empilhada de 144 GB garante o processamento de modelos de IA com 200 a 250 mil milhões de parâmetros. Em comparação, a placa gráfica para estações de trabalho Radeon AI Pro 9700, equipada com apenas 32 GB de VRAM, atinge o seu limite por volta dos 40 a 50 mil milhões de parâmetros.

A arquitetura da GPU da MI350P partilha a mesma origem das Instinct MI350X/355X em formato de Módulo Acelerador Aberto, mas com a configuração reduzida para metade. A placa ativa apenas 128 unidades de computação, enquanto as versões OAM possuem 256 CUs; a memória HBM3e de alta velocidade também é reduzida de 288 GB para 144 GB. Embora não confirmado oficialmente por escrito, as imagens do produto mostram que esta integra apenas um chip de E/S e quatro chiplets de computação, o equivalente a dividir ao meio o encapsulamento da GPU da versão de maiores dimensões.

Em termos de consumo energético, o TDP nominal é de 600 Watts, situando-se num intervalo semelhante ao da Nvidia RTX Pro 6000 Blackwell ou H200 NVL, e utiliza um conector de alimentação 12V-2×6, podendo também ser comutado para um modo de 450 Watts. Para suportar paralelismo multiusuário, a placa oferece três modos de particionamento: SPX, DPX e CPX. O SPX é o modo de velocidade total; o DPX divide uniformemente as unidades de computação, memória e recursos como motores de vídeo/JPEG por dois utilizadores; o CPX divide em quatro, onde duas partições partilham um motor de vídeo e um grupo de motores JPEG de dez núcleos. Todo o chip pode processar simultaneamente 99 streams de vídeo AV1 a 1080p30, ou codificar/descodificar 4425 imagens JPEG a 1080p por segundo.

Em termos de desempenho de pico teórico, a precisão FP8 pode atingir 2300 Teraflops (matriz densa), aproximadamente duplicando com esparsidade; tanto MXFP4 como MXFP6 atingem 4600 Tflops. Este nível é ligeiramente inferior a metade do da MI355X, enquanto a métrica de matriz densa da Nvidia H200 NVL ronda os 1670 Tflops. Em avaliações de throughput real, a MI350P atinge tipicamente 60% a 70% da taxa máxima, exceto em MXFP6, que alcança apenas 40% do valor teórico, não conseguindo duplicar a relação face ao FP8.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com