Google dos EUA lança algoritmo TurboQuant, aumentando eficiência de memória de IA em 8 vezes e reduzindo custos em mais de 50%_Boletins_Wedoany.com

Início Notícias Detalhes

Google dos EUA lança algoritmo TurboQuant, aumentando eficiência de memória de IA em 8 vezes e reduzindo custos em mais de 50%

2026-03-26 11:07

Favoritos

O departamento de pesquisa do Google lançou recentemente o conjunto de algoritmos TurboQuant, um avanço de software que visa o gargalo de memória dos grandes modelos de linguagem. Este algoritmo reduz o uso de memória do modelo em média 6 vezes através de compressão extrema do cache de chave-valor, melhora o desempenho em 8 vezes ao calcular a atenção e tem potencial para reduzir custos operacionais em mais de 50% para empresas. O artigo de pesquisa relacionado foi disponibilizado gratuitamente e pode ser aplicado sem necessidade de treinamento.

Baseado em estruturas matemáticas como PolarQuant e quantização Johnson-Lindenstrauss, o TurboQuant reduz efetivamente o erro de quantização através de processamento em duas etapas. Em testes com modelos como Llama-3.1-8B e Mistral-7B, o algoritmo reduziu a ocupação de memória em pelo menos 6 vezes mantendo o desempenho e alcançou uma aceleração de 8 vezes em hardware como o NVIDIA H100.

A reação da comunidade foi entusiástica. O analista técnico @Prince_Canuma testou o modelo Qwen3.5-35B no MLX, e relatórios indicam que o TurboQuant de 2.5 bits reduziu o cache KV em quase 5 vezes com perda de precisão zero. O usuário @NoahEpstein_ apontou que o algoritmo reduz a lacuna entre IA local e serviços em nuvem, permitindo que hardware de consumo processe contextos mais longos.

No mercado, as ações de fornecedores de memória apresentaram tendência de queda, refletindo expectativas de que a demanda por memória de alta largura de banda possa desacelerar. Para empresas, o TurboQuant oferece uma oportunidade de melhoria imediata, otimizando pipelines de inferência, expandindo a capacidade de processamento de contexto e aprimorando implantações locais, sem necessidade de retreinar modelos.

O Google optou por lançar o TurboQuant antes das conferências ICLR 2026 no Rio de Janeiro, Brasil, e AISTATS 2026 em Tânger, Marrocos, marcando uma transição da teoria acadêmica para aplicações práticas. O algoritmo fornece uma infraestrutura de memória eficiente para a era da IA de agentes e pode impulsionar a indústria em direção a uma abordagem de "memória melhor".

Informação e Comunicação Engenharia de inteligência artificial

Anterior：Empresa americana MatSing lança antena de lente de alta capacidade, cobrindo a banda WiFi 6E

Próximo：Fazenda Ledford, em Michigan, EUA, adota sistemas autônomos PTx Trimble e AGCO para enfrentar a escassez de mão de obra agrícola

Solicitar Cotação

Sistema de informação inteligente

LUOYANG SHANHAI MACHINERY MANUFACTURING CO., LTD.

Solicitar Cotação

Jiangsu Zhongtian Technology Co., Ltd.

Solicitar Cotação

Sistema de Monitoramento Inteligente de Correias Transportadoras

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Solicitar Cotação

Fibra monomodo não-dispersiva deslocada com extensão de faixa de comprimento de onda G.652.D

HONGAN GROUP CO. LTD

Solicitar Cotação

Plataforma de Serviços de IA

YUNDING TECHNOLOGY CO., LTD.

Solicitar Cotação

TWP16 Radar de Perfil de Vento Troposférico na Banda P

China Huayun Meteorological Technology Group Co., Ltd.

Solicitar Cotação

Estação Central em Nuvem da Internet das Coisas para Distribuição de Energia

XJ ELECTRIC CORPORATION

Solicitar Cotação

Subarranjo Tx de Antena de Matriz Faseada em Banda Ka

COXSAT TECHNOLOGY CO., LTD.

Solicitar Cotação /unidade

Radar de Monitoramento Oceânico Multifuncional para Baixa Altura – Medição de Ambiente Dinâmico Marítimo e Atmosférico

Chengdu Dixin Technology Co., Ltd.

Solicitar Cotação

Fibra Óptica Monomodo G.652B

SHENZHEN SDG INFORMATION CO., LTD.

Solicitar Cotação

Terminal satelital portátil de placa Terminal portátil manual com abertura de 0,35 metros

China Starwin Science & Technology co., Ltd.

Solicitar Cotação

Monitoramento Inteligente

Shenzhen Invt Electric Co., Ltd.

Recomendações

Diário de Expansão Internacional de TIC de 12 de maio: Poder de computação de IA, cabos submarinos e serviços digitais transfronteiriços tornam-se novos motores

A Unitree Technology da China lança o mecha tripulado transformável GD01, com preço a partir de 3,9 milhões de yuans

A China Mobile Yunnan, em parceria com a ZTE, foi a primeira a alcançar a implementação comercial em larga escala de uplink massivo 5G-A, com pico de uplink por usuário atingindo 1 Gbps+

Intel e NVIDIA reafirmam parceria e planejam desenvolver novos produtos com gráficos integrados e processadores

Akamai dos EUA e Anthropic assinam contrato de infraestrutura em nuvem de US$ 1,8 bilhão por sete anos, visando implantação de inferência na borda

OpenAI dos EUA lança projeto de segurança Daybreak, três modelos integrados em todo o processo de desenvolvimento

Academia Chinesa de TIC divulga primeiros resultados do teste do benchmark multimodal FangSheng, com humanos liderando amplamente em raciocínio contrafactual

Análise Técnica Aprofundada do Núcleo do DeepSeek-V4.1 da China, com Lançamento Previsto para Junho

Lunar Outpost dos EUA obtém financiamento de 30 milhões de dólares na Série B para acelerar a implantação de infraestrutura espacial

Brookfield do Canadá injeta US$ 500 milhões na plataforma de implantação da OpenAI nos EUA

Boletins Mais Recentes

CN insta Conselho de Transporte Terrestre dos EUA a rejeitar pedido de fusão entre Union Pacific e Norfolk Southern

Transporte marítimo de curta distância da Espanha cai 4,3% em 2025, totalizando 257,5 milhões de toneladas

Projeto de restauração da vegetação da Usina Hidrelétrica de Lianghekou, no Rio Yalong, em Sichuan, China, foi iniciado recentemente

A Guodian Electric Power Qinghai, na China, concluiu a reforma do desarenador na Garganta do Rio Datong, na Central Hidrelétrica de Dongxu, em 15 dias

Grupo suíço Fracht conclui transporte multimodal de três grandes transformadores da Alemanha para os EUA

Autoridade Portuária de Houston realiza reunião mensal para comemorar o 70º aniversário da viagem inaugural do primeiro navio porta-contêineres

Estator da primeira unidade geradora de impulso de 500 MW do mundo é içado e instalado na Usina Hidrelétrica de Zhala, na China

Brasil realizará múltiplas rodadas de leilões de concessões rodoviárias nos próximos meses, com investimentos totais de dezenas de bilhões de reais

Damen Shipyards, da Holanda, entrega primeiro navio de operação e serviço eólico offshore para a Ta San Shang Marine, de Taiwan

Navantia lança concurso para projeto solar fotovoltaico de 1,296 MWp em telhado na fábrica de Ferrol, Espanha