Qualcomm planeja levar tecnologia de chips para data centers a smartphones
2026-06-27 15:59
Favoritos

De acordo com pt.wedoany.com-A empresa americana de chips Qualcomm está revertendo a arquitetura de chips de IA para data centers para dispositivos terminais, como smartphones, PCs e automóveis. Em 27 de junho, Durga Malladi, vice-presidente executivo da Qualcomm, afirmou que a empresa planeja aplicar a tecnologia de chips para data centers, lançada esta semana, em smartphones, a fim de aprimorar a capacidade local de execução de IA em dispositivos móveis. A Qualcomm está em negociações com fabricantes de smartphones, PCs e automóveis sobre a tecnologia relacionada. A primeira geração de produtos com arquitetura de computação de alta largura de banda será lançada em data centers no próximo ano, com previsão de fornecimento comercial em 2028.

A tecnologia central proposta pela Qualcomm desta vez é a arquitetura de computação de alta largura de banda, ou HBC. Diferente do design tradicional de chips, que coloca unidades de computação e memória lado a lado, ela adota uma abordagem de empilhamento vertical de chips, aproximando a memória das unidades de computação, reduzindo a distância de movimentação de dados por meio da computação próxima à memória. Durante a execução de modelos de IA, a capacidade de computação não é o único gargalo; parâmetros do modelo, dados de contexto e resultados intermediários precisam fluir frequentemente entre as unidades de computação e a memória. Quanto maior a distância de movimentação de dados, maior a pressão na largura de banda, latência e consumo de energia, um problema conhecido na indústria de chips de IA como "barreira da memória".

A arquitetura HBC visa justamente resolver esse gargalo. No roteiro de data centers da Qualcomm, a HBC é descrita como uma arquitetura de computação próxima à memória voltada para cargas de trabalho de IA, que combina capacidade de computação com memória de alta largura de banda por meio de soluções de silício empilhadas em 3D, reduzindo o consumo de energia por token e melhorando a eficiência de transferência de dados durante a inferência de IA. O roteiro divulgado pela empresa mostra que o AI250, equipado com a primeira geração de HBC, está previsto para iniciar amostras comerciais em meados de 2027, enquanto a segunda geração de HBC será usada no AI300, com amostras comerciais previstas para 2028.

Ao contrário dos data centers, os smartphones impõem restrições mais rigorosas ao consumo de energia, volume, dissipação de calor e duração da bateria dos chips. Se os grandes modelos dependerem da execução em nuvem por muito tempo, os usuários precisam enviar solicitações ao servidor, o que envolve problemas como latência, conexão de rede, privacidade e custos de computação em nuvem. O objetivo da IA no dispositivo terminal é permitir que mais modelos sejam executados diretamente no smartphone localmente, incluindo assistentes de voz, geração de imagens, tradução em tempo real, resumo de documentos, agentes pessoais e compreensão multimodal. Para alcançar essas capacidades, os chips dos smartphones devem processar modelos maiores e tarefas de inferência mais frequentes dentro de um consumo de energia limitado.

Ao trazer a tecnologia HBC de data centers para smartphones, a Qualcomm está, em essência, transferindo a capacidade de movimentação de dados de maior largura de banda e menor consumo de energia para dispositivos terminais. No passado, os chips de smartphones enfatizavam a capacidade integrada de CPU, GPU, NPU, ISP e modem de comunicação. Na era da IA, exige-se que modelos locais estejam em execução constante, até mesmo realizando tarefas de percepção, análise e alerta quando o usuário não abre ativamente um aplicativo. Esse "agente residente" impõe maiores exigências ao gerenciamento de bateria, exigindo que o chip mantenha capacidade de inferência contínua sem aumentar significativamente o consumo de energia.

Malladi mencionou que "a tecnologia que começa nos data centers não vai parar por aí". Essa declaração reflete a avaliação da Qualcomm sobre o caminho de migração tecnológica: os data centers primeiro assumem inferência de IA de alta intensidade e validação de arquitetura; após o amadurecimento do processo, encapsulamento, coordenação de memória e pilha de software, a tecnologia se expande gradualmente para smartphones, PCs e automóveis. Em vez de introduzir diretamente uma arquitetura de alto risco em smartphones, validar a HBC primeiro em produtos de data center permite que a Qualcomm acumule experiência em design, fabricação, dissipação de calor e adaptação de software.

Esse caminho também está alinhado com a própria estrutura de negócios da Qualcomm. A Qualcomm há muito tempo se aprofunda em chips para smartphones, acumulando vasta experiência em SoCs de baixo consumo, coordenação de memória LPDDR, conectividade de comunicação e aceleração de IA no dispositivo terminal. Desta vez, o negócio de data centers não está completamente separado do negócio de smartphones; em vez disso, a capacidade de design de eficiência energética formada na era dos chips móveis é estendida para a infraestrutura de IA, e a nova arquitetura de memória e computação formada nos data centers é trazida de volta para dispositivos terminais. Para a Qualcomm, smartphones, PCs, automóveis e data centers estão se transformando de mercados diferentes em diferentes nós do mesmo sistema de computação de IA.

No lado dos data centers, a Qualcomm já incorporou a HBC ao roteiro de data centers Dragonfly e lançou simultaneamente a CPU C1000 voltada para infraestrutura de IA, o acelerador de inferência AI300 e uma linha de produtos de conectividade. A empresa afirma que a HBC Gen 1, combinada com o AI250, pode atingir uma largura de banda de memória efetiva de 133 TB/s por placa, um aumento de 18 vezes em comparação com a solução LPDDR5X do AI200; a HBC Gen 2, usada no AI300, pode proporcionar um aumento de 54 vezes em relação ao AI200. A Qualcomm também afirma que a HBC, em nível de placa, oferece uma largura de banda por watt 6 vezes maior que as soluções HBM e, em nível de rack, uma capacidade por watt 200 vezes maior que as soluções SRAM.

Se esses indicadores podem ser totalmente transferidos para o lado dos smartphones dependerá do orçamento de energia, custo de encapsulamento, capacidade de dissipação de calor e ecossistema de software dos produtos terminais. Smartphones não podem simplesmente copiar as especificações de chips de data centers, mas podem absorver conceitos de design como computação próxima à memória, empilhamento vertical e largura de banda de memória mais estreita. No futuro, se os chips de smartphones tiverem capacidade de movimentação de dados mais eficiente, poderão executar modelos de IA mais complexos localmente, reduzir a frequência de chamadas à nuvem e permitir que assistentes de IA tenham maior capacidade de resposta em tempo real em áreas como voz, imagem, trabalho, conectividade de direção e gerenciamento de dados pessoais.

A declaração da Qualcomm também indica que a competição de IA no dispositivo terminal está entrando no nível da arquitetura. No passado, a IA em smartphones dependia mais do pico de capacidade de computação da NPU, compressão de modelos e otimização de software. Na próxima fase, o foco estará mais na largura de banda da memória, estrutura de encapsulamento, densidade de energia e coordenação em nível de sistema. Se a HBC puder passar dos data centers para dispositivos terminais, os chips de smartphones passarão de "aceleradores de IA integrados" para "plataformas de computação reprojetadas para modelos de IA residentes". O próximo passo crucial é quando a Qualcomm definirá um cronograma para a implementação no lado dos smartphones e se os fabricantes de smartphones, PCs e automóveis estarão dispostos a arcar com os custos desse novo encapsulamento e arquitetura de memória.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com