Longsys, da China, executa modelo de 397B na plataforma AMD Ryzen AI_Boletins_Wedoany.com

Início Notícias Detalhes

Longsys, da China, executa modelo de 397B na plataforma AMD Ryzen AI

2026-06-21 11:13

Favoritos

De acordo com pt.wedoany.com-A AMD recentemente lançou sua plataforma Ryzen AI Halo no mercado por US$ 4.000, gerando discussões comparativas com o produto DGX Spark, um pouco mais caro, da Nvidia. A empresa de armazenamento e memória Longsys foi além, demonstrando a execução local de um modelo de IA com 397 bilhões de parâmetros nessa plataforma. A demonstração utilizou um processador Ryzen AI Max+ 395 de 16 núcleos e 128 GB de memória, alcançando compressão de dados em tempo real por meio de sua SPU proprietária e configuração iSA. Isso permitiu que o dispositivo executasse um modelo que normalmente exigiria 200-250 GB de VRAM, utilizando apenas 128 GB de memória unificada (dos quais 96 GB estavam disponíveis para a GPU).

AMD Ryzen AI

O modelo é presumivelmente uma versão personalizada derivada do Qwen 3.5 397B (A17B) da Alibaba, empregando a abordagem de Mistura de Especialistas (MoE). Mesmo com quantização INT4, seus requisitos de memória excedem em muito a memória disponível no dispositivo de demonstração. A Longsys afirma que seu método utiliza descarregamento de especialistas, gerenciamento inteligente de cache e algoritmos de pré-busca preditiva para descarregar especialistas inativos da DRAM para um grande buffer de armazenamento rápido, permitindo que o chip de IA os recarregue quando necessário. Esta abordagem visa resolver problemas como o grande número de parâmetros em modelos de linguagem MoE, a rápida expansão do cache KV e a latência de E/S. A empresa alega que, ao utilizar uma camada de cache para reduzir a demanda por DRAM, é possível armazenar o dobro da quantidade de dados em unidades de armazenamento de até 128 GB. Vale notar que a Longsys não forneceu detalhes sobre a potência computacional medida em tokens por segundo, uma métrica na qual o chip Ryzen AI é relativamente limitado em comparação com a maioria dos produtos modernos de GPU de IA. Apesar disso, essa abordagem de tratar o armazenamento como memória sugere que, ao utilizar armazenamento rápido, é possível contornar as limitações de memória, permitindo que modelos de ponta, que normalmente exigiriam hardware de IA caro, sejam executados em dispositivos do tamanho da palma da mão.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com

Informação e Comunicação Engenharia de processamento inteligente de dados Engenharia de inteligência artificial

Anterior：Veículo submarino avançado da Noruega inicia primeira missão de mapeamento do fundo do mar

Próximo：Avisa App brasileira apresenta serviço de marketing no WhatsApp no Web Summit Rio

Solicitar Cotação

Robô Inteligente para Troca de Cabos em Mineração

Solicitar Cotação

Monitoramento Inteligente

Shenzhen Invt Electric Co., Ltd.

Solicitar Cotação

Solução de Instrumentação de Segurança SIS

Beijing Consen Automation Technology Co., Ltd.

Solicitar Cotação

Solução de Prevenção contra Vazamento de Dados para Escritórios

Sangfor Technologies Inc.

Solicitar Cotação

Jiangsu Zhongtian Technology Co., Ltd.

Solicitar Cotação

Sistema de Monitoramento Inteligente de Correias Transportadoras

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Solicitar Cotação

Série DYJWGB-50 Dispositivo Terminal Remoto (RTU) com GPRS

Ningbo Donghai Group Co., Ltd.

Solicitar Cotação

Switch Industrial Nacional 100%

Shenzhen Yuhang Communication Technology Co., Ltd.

Solicitar Cotação

Cabo Óptico GYTA do tipo Não Auto-Suportado para Aéreo e Dutos

TONGDING INTERCONNECTION INFORMATION CO., LTD.

Solicitar Cotação

Fibra Óptica Monomodo G.652B

SHENZHEN SDG INFORMATION CO., LTD.

Solicitar Cotação

Radar Meteorológico de Banda C Série 714CD

Chengdu Zhongdian Jinjiang Information Industry Co., Ltd.

Solicitar Cotação

Cabo óptico de tubo central GYXTW

DONGGUAN TW-SCIE CO., LTD.

Recomendações

Empresa chinesa Zhiwei Intelligent planeja adquirir servidores e equipamentos complementares no valor de até 4 bilhões de yuans

HPE dos EUA expande GreenLake com IA agêntica e nuvem privada, lançamento no 3º trimestre

Startup alemã de chips de IA Tensordyne lança sistema Napier

SLB dos EUA lança mercado digital com cerca de 200 produtos digitais

CSCS Suíça apresenta infraestrutura segura de IA/HPC da Vast Data

Enthus, da Alemanha, e Sievers-Group estabelecem parceria estratégica para oferecer suporte digital aos clientes

Pesquisadores da Universidade de Nagoya, no Japão, desenvolvem estrutura que identifica seis padrões de progressão da ELA

Projeto de prospecção de minério de terras raras pesadas do tipo adsorção iônica em Guangxi, China, é lançado

AutoRABIT adquire Integral Zone para expandir governança de APIs

Centros de dados com mais de 3,5 MW na Alemanha incluídos na regulamentação de infraestruturas críticas

Boletins Mais Recentes

Produção de aço bruto no Brasil atinge 13,4 milhões de toneladas nos primeiros 5 meses, queda de 1,9% em relação ao ano anterior

Coal India autorizada a desenvolver projeto solar flutuante de 20 MW em Uttar Pradesh sem licitação

UrbanChain, do Reino Unido, assina acordo de compra de energia solar de 15 anos com a AMPYR

Canadá LNG Canada conclui embarque da 100ª carga

Lightsource bp conclui fechamento financeiro de usina solar de 150 MW na Nova Zelândia

Nautilus Solar Energy renova financiamento de dívida de US$ 600 milhões para impulsionar 200 MW de energia solar comunitária

BiharBatteries, da Espanha, planeja iniciar linha piloto de baterias de sódio em 2027

Repsol vende 49% de projeto de 706 MW à Masdar

Empresa chinesa Zhiwei Intelligent planeja adquirir servidores e equipamentos complementares no valor de até 4 bilhões de yuans

Licitação na ilha de La Gomera, Espanha, para cobertura fotovoltaica e pontos de carregamento no valor de 157 mil euros