AMD dos EUA lança acelerador PCIe Instinct MI350P, voltado para IA agente e particionamento multiusuário
2026-05-09 19:13
Favoritos

De acordo com pt.wedoany.com-A AMD dos EUA lançou a Instinct MI350P para ambientes de servidor. Esta placa é compatível com slots PCIe 5.0 padrão e tem como alvo principal a Inteligência Artificial agente, ou seja, agentes de IA que auxiliam proativamente os utilizadores na conclusão de tarefas. O produto apresenta um formato de duas ranhuras com cerca de 26,7 cm de comprimento, dependendo do forte fluxo de ar dentro dos servidores em rack para arrefecimento passivo. A sua memória HBM3e empilhada de 144 GB garante o processamento de modelos de IA com 200 a 250 mil milhões de parâmetros. Em comparação, a placa gráfica para estações de trabalho Radeon AI Pro 9700, equipada com apenas 32 GB de VRAM, atinge o seu limite por volta dos 40 a 50 mil milhões de parâmetros.

A arquitetura da GPU da MI350P partilha a mesma origem das Instinct MI350X/355X em formato de Módulo Acelerador Aberto, mas com a configuração reduzida para metade. A placa ativa apenas 128 unidades de computação, enquanto as versões OAM possuem 256 CUs; a memória HBM3e de alta velocidade também é reduzida de 288 GB para 144 GB. Embora não confirmado oficialmente por escrito, as imagens do produto mostram que esta integra apenas um chip de E/S e quatro chiplets de computação, o equivalente a dividir ao meio o encapsulamento da GPU da versão de maiores dimensões.

Em termos de consumo energético, o TDP nominal é de 600 Watts, situando-se num intervalo semelhante ao da Nvidia RTX Pro 6000 Blackwell ou H200 NVL, e utiliza um conector de alimentação 12V-2×6, podendo também ser comutado para um modo de 450 Watts. Para suportar paralelismo multiusuário, a placa oferece três modos de particionamento: SPX, DPX e CPX. O SPX é o modo de velocidade total; o DPX divide uniformemente as unidades de computação, memória e recursos como motores de vídeo/JPEG por dois utilizadores; o CPX divide em quatro, onde duas partições partilham um motor de vídeo e um grupo de motores JPEG de dez núcleos. Todo o chip pode processar simultaneamente 99 streams de vídeo AV1 a 1080p30, ou codificar/descodificar 4425 imagens JPEG a 1080p por segundo.

Em termos de desempenho de pico teórico, a precisão FP8 pode atingir 2300 Teraflops (matriz densa), aproximadamente duplicando com esparsidade; tanto MXFP4 como MXFP6 atingem 4600 Tflops. Este nível é ligeiramente inferior a metade do da MI355X, enquanto a métrica de matriz densa da Nvidia H200 NVL ronda os 1670 Tflops. Em avaliações de throughput real, a MI350P atinge tipicamente 60% a 70% da taxa máxima, exceto em MXFP6, que alcança apenas 40% do valor teórico, não conseguindo duplicar a relação face ao FP8.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com
Recomendações
Ministério da Indústria e Tecnologia da Informação da China lança Plano Piloto de Revisão e Serviço de Ética em Ciência e Tecnologia de Inteligência Artificial, abrangendo inicialmente 10 províncias
2026-05-09
Baidu da China lança o modelo Wenxin 5.1, com custo de pré-treinamento equivalente a apenas 6% do setor
2026-05-09
China Mobile lança "Sistema de Inovação Tecnológica da Rede Nacional Integrada de Computação", transitando da operação por Byte para a operação por Token
2026-05-09
Xiaoyu Zhizao, da China, conclui rodada de financiamento B+ de centenas de milhões de yuans, entrando na inteligência incorporada industrial com a arquitetura "Um Cérebro, Múltiplas Formas"
2026-05-09
Academia Chinesa de Ciências e mais de cem instituições propõem em Tongxiang, Zhejiang, a construção conjunta do ecossistema "Nuvem Espacial" da China
2026-05-09
Computador quântico supercondutor autônomo de quarta geração da China, "Origem Wukong-180", entra em operação com 180 qubits computacionais e é disponibilizado globalmente
2026-05-09
Inédito no setor! A Plataforma de Inteligência Ontológica Wutong Data (KnoVa) da China Mobile conquista duas avaliações oficiais no domínio ontológico do CAICT
2026-05-09
Astranis, dos EUA, obtém financiamento de US$ 450 milhões e avaliação de US$ 2,8 bilhões para acelerar a produção em massa de satélites de órbita geoestacionária
2026-05-09
Primeiro chip de IA para inferência em dispositivo de borda CCS-1 da Primordial Semiconductor da China é ligado com sucesso, com todos os indicadores da primeira fabricação de teste atingindo plenamente as metas
2026-05-09
Módulo NCBSiC autodesenvolvido pela chinesa MacMic Science & Technology obtém certificação internacional e entra na cadeia de fornecimento de fontes de alimentação para servidores de IA
2026-05-09