Google dos EUA lança algoritmo TurboQuant, aumentando eficiência de memória de IA em 8 vezes e reduzindo custos em mais de 50%
2026-03-26 11:07
Favoritos

O departamento de pesquisa do Google lançou recentemente o conjunto de algoritmos TurboQuant, um avanço de software que visa o gargalo de memória dos grandes modelos de linguagem. Este algoritmo reduz o uso de memória do modelo em média 6 vezes através de compressão extrema do cache de chave-valor, melhora o desempenho em 8 vezes ao calcular a atenção e tem potencial para reduzir custos operacionais em mais de 50% para empresas. O artigo de pesquisa relacionado foi disponibilizado gratuitamente e pode ser aplicado sem necessidade de treinamento.

Baseado em estruturas matemáticas como PolarQuant e quantização Johnson-Lindenstrauss, o TurboQuant reduz efetivamente o erro de quantização através de processamento em duas etapas. Em testes com modelos como Llama-3.1-8B e Mistral-7B, o algoritmo reduziu a ocupação de memória em pelo menos 6 vezes mantendo o desempenho e alcançou uma aceleração de 8 vezes em hardware como o NVIDIA H100.

A reação da comunidade foi entusiástica. O analista técnico @Prince_Canuma testou o modelo Qwen3.5-35B no MLX, e relatórios indicam que o TurboQuant de 2.5 bits reduziu o cache KV em quase 5 vezes com perda de precisão zero. O usuário @NoahEpstein_ apontou que o algoritmo reduz a lacuna entre IA local e serviços em nuvem, permitindo que hardware de consumo processe contextos mais longos.

No mercado, as ações de fornecedores de memória apresentaram tendência de queda, refletindo expectativas de que a demanda por memória de alta largura de banda possa desacelerar. Para empresas, o TurboQuant oferece uma oportunidade de melhoria imediata, otimizando pipelines de inferência, expandindo a capacidade de processamento de contexto e aprimorando implantações locais, sem necessidade de retreinar modelos.

O Google optou por lançar o TurboQuant antes das conferências ICLR 2026 no Rio de Janeiro, Brasil, e AISTATS 2026 em Tânger, Marrocos, marcando uma transição da teoria acadêmica para aplicações práticas. O algoritmo fornece uma infraestrutura de memória eficiente para a era da IA de agentes e pode impulsionar a indústria em direção a uma abordagem de "memória melhor".

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com
Recomendações
Google dos EUA lança algoritmo TurboQuant, aumentando eficiência de memória de IA em 8 vezes e reduzindo custos em mais de 50%
2026-03-26
Empresa americana MatSing lança antena de lente de alta capacidade, cobrindo a banda WiFi 6E
2026-03-26
Carolina do Norte, EUA, aloca US$ 26 milhões para acelerar a cobertura de banda larga rural
2026-03-26
OpenAI anuncia objetivo "Estrela Polar": desenvolver um pesquisador de IA autônomo até 2028, lançando primeiro um "estagiário de pesquisa" em setembro deste ano
2026-03-25
Chefe da Comissão Nacional de Desenvolvimento e Reforma, Zheng Shanjie, encontra-se com o Presidente da Samsung Electronics, Lee Jae-yong: Aproveite as oportunidades da abertura da China e aprofunde ainda mais a cooperação no país
2026-03-25
Arm lança seu primeiro CPU para data centers de design próprio: projetado para IA de agentes, desempenho por rack é o dobro da plataforma x86
2026-03-25
Microsoft e NVIDIA Unem Forças em IA para Energia Nuclear: Ferramenta End-to-End Simplifica Aprovações, Acelera Projetos e Otimiza Operações
2026-03-25
Spade de Nova York, EUA, Conclui Rodada Série B de US$ 40 Milhões para Construir Plataforma de Dados Financeiros e IA
2026-03-25
Contrivian lança plataforma Constellation nos EUA, integrando múltiplas redes de satélites para melhorar a confiabilidade da conectividade
2026-03-25
Siemens e Alibaba aprofundam cooperação: Simulação industrial migra para a nuvem, IA impulsiona implementação da fabricação inteligente
2026-03-24