A colaboração entre chips e software em nível de wafer impulsiona novos desenvolvimentos em inteligência artificial
2025-11-21 17:19
Fonte:Conversa
Favoritos

Atualmente, o desenvolvimento de sistemas de inteligência artificial (IA) enfrenta desafios em termos de escala, exigindo quantidades massivas de memória para garantir que os chips de processamento possam compartilhar dados rapidamente. As GPUs tradicionais, não projetadas originalmente para modelos de IA, requerem múltiplas GPUs conectadas por meio de redes de alta velocidade para suportar grandes modelos de linguagem (LLMs), resultando em baixas velocidades de transferência de dados e alto consumo de energia.

晶圆级芯片会因通信延迟而减速。

Para superar o gargalo das GPUs, empresas como a Cerebras, na Califórnia, desenvolveram processadores em nível de wafer. Esses chips são grandes, contendo enormes quantidades de memória on-chip e centenas de milhares de núcleos. No entanto, os chips em nível de wafer por si só são insuficientes; sistemas de software especializados também são necessários. O WaferLLM, desenvolvido em colaboração entre a Universidade de Edimburgo e a Microsoft Research, visa executar LLMs em larga escala de forma eficiente em chips em nível de wafer.

O WaferLLM emprega três novos algoritmos para decompor grandes operações matemáticas em partes menores, permitindo que núcleos adjacentes as processem em conjunto e transmitam informações localmente, evitando a redução de velocidade causada pela comunicação de longa distância. Simultaneamente, introduz uma nova estratégia para distribuir diferentes partes do LLM (Modelo de Nível de Linha) por centenas de milhares de núcleos, coordenando o processamento e a comunicação para garantir a operação eficiente do chip. Esses ajustes, testados no Centro Internacional de Dados de Edimburgo, resultaram em velocidades de geração de texto aproximadamente 100 vezes mais rápidas para chips em nível de wafer, latência dez vezes menor e o dobro da eficiência energética em comparação com um cluster de 16 GPUs.

Embora as GPUs possuam um ecossistema de software maduro, os chips em nível de wafer são mais adequados para cargas de trabalho que dependem de latência ultrabaixa, modelos ultragrandes ou alta eficiência energética. Enquanto isso, a tecnologia de GPU continua a avançar. Uma implicação mais ampla é que a infraestrutura de IA está se tornando um problema de codesign, exigindo que hardware e software evoluam em conjunto. Repensar a pilha de software é crucial para desbloquear a próxima geração de desempenho de IA. Para o público, os sistemas de IA suportarão mais aplicações que antes eram lentas ou caras, e a transição para a computação em nível de wafer marca uma nova fase no desenvolvimento de IA.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com
Inovações Tecnológicas
Investigadores da Chalmers University of Technology desenvolvem sistema gigante de superátomos para resolver o problema da descoerência na computação quântica
2026-04-14
Investigação da Universidade de Stanford Explora o Papel e o Impacto da Inteligência Artificial na Revisão por Pares Científica
2026-04-13
MIT lança sistema de software Sandook para melhorar o desempenho de pools de SSDs em data centers
2026-04-09
Estudo colaborativo da Universidade de Michigan (EUA) e da Universidade de Augsburg (Alemanha): Substituir um único átomo reduz o fluxo de calor pela metade em uma molécula
2026-04-08
Equipe de pesquisa alemã descobre mecanismo pelo qual a proteína Fis regula a virulência de patógeno diarreico
2026-04-03
Pesquisadores do Trinity College Dublin Colaboram com Universidades do Reino Unido e Suíça para Desenvolver Tecnologia de Luz em Escala de Chip, Aumentando a Eficiência de Comunicação em Data Centers e IA
2026-04-03
Equipe da USC desenvolve chip de memória de alta temperatura, resistente a mais de 700 graus Celsius
2026-04-02
Estudo RUBY do Hospital Infantil da Clínica Cleveland: Terapia de edição gênica atinge cura funcional para doença falciforme grave
2026-04-02
Equipa Espanhola e Americana Publica Método de Integração de Dados Multiómicos de Célula Única no "Genome Biology", Melhorando a Precisão na Identificação de Células Raras
2026-04-01
Universidade de Okayama, Japão, e Universidade de Pequim, China, Colaboram em Pesquisa sobre Cristais 2D Anisotrópicos para Realizar Ressonância Plasmônica Localizada Hiperbólica
2026-04-01