De acordo com pt.wedoany.com-A Suanmiao Technology anunciou que seu chip 3D TokenPU A4E, voltado para inferência de grandes modelos, foi tape-out em 15 de junho. Baseado na cadeia de suprimentos nacional, o chip adota uma arquitetura 3D de empilhamento híbrido, visando fornecer suporte computacional autônomo e controlável para a indústria de grandes modelos. A Deloitte prevê que mais de 80% da demanda futura por poder computacional estará concentrada no lado da inferência.

A inferência de grandes modelos há muito sofre com a movimentação frequente de dados entre memória e processador, resultando em até 80% do consumo de energia e 70% dos custos. A arquitetura 3D TokenPU da Suanmiao Technology empilha verticalmente 8 camadas de wafers de memória sobre o wafer lógico de computação, utilizando tecnologias de Through-Silicon Via (TSV) e bumps para interconexão em escala micrométrica, reduzindo a distância de transmissão tradicional de milímetros em duas ordens de grandeza, oferecendo uma largura de banda de acesso à memória de 16 TB/s. O chip introduz o conceito de colaboração software-hardware Tile-Native, utilizando Tile como unidade básica para movimentação, armazenamento e computação de dados, realizando um modelo de movimentação única e reutilização múltipla. O hardware suporta nativamente o agendamento de dados em nível de Tile e a comutação dinâmica de múltiplas precisões, enquanto o software constrói uma pilha de ferramentas de compilação adaptada a ecossistemas de código aberto como LLVM e Triton.
O Dr. Wang Fuquan, fundador e CEO da Suanmiao Technology, afirmou que o 3D TokenPU é projetado especificamente para o processamento de Tokens em grandes modelos, permitindo melhorias na densidade computacional e na eficiência energética sem depender exclusivamente da redução do processo.
A Suanmiao Technology já estabeleceu um sistema de cadeia de suprimentos nacional que abrange design de chips, IPs principais, fabricação e encapsulamento. O chip A4E é construído com base na arquitetura RISC-V auto-desenvolvida, IPs próprios e software próprio, colaborando com parceiros nacionais da cadeia de suprimentos e utilizando processos nacionais maduros. Os membros principais da equipe concluíram a produção em massa de wafers de empilhamento híbrido 3D em escala de milhares de unidades em projetos de chips de computação integrada de alto throughput. Mais de 80% da equipe de P&D da empresa é composta por pesquisadores, com membros-chave provenientes de instituições como a Academia Chinesa de Ciências, Universidade Tsinghua e Universidade de Pequim.
O 3D TokenPU é voltado para os principais fabricantes de grandes modelos, tendo realizado P&D aprofundada com clientes por quase um ano, ancorando as necessidades de cenários de inferência na fase de definição do chip e concluindo a otimização da arquitetura e dos algoritmos subjacentes. A empresa já obteve múltiplas rodadas de financiamento de plataformas de capital estatal, fundos de mercado e capital industrial, com investidores incluindo CDB Capital, Beijing Shunxi, Source Code Capital, Shixi Capital, Lenovo Capital, Xianghe Capital, entre outros.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









