Fibocom da China alcança aceleração de 2,6x na inferência local de VLA
2026-06-30 17:14
Favoritos

De acordo com pt.wedoany.com-O Instituto de Pesquisa em IA da Fibocom obteve progressos significativos no campo da inteligência incorporada. Seu framework FiboVLA desenvolvido internamente, combinado com tecnologias de otimização de inferência local, permitiu que a velocidade de inferência de vários modelos VLA populares aumentasse em média 2,6 vezes, além de concluir a implantação do GR00T N1.5 em uma plataforma de controle principal de alto poder computacional na borda. Os resultados foram validados através do conjunto de dados de referência de simulação LIBERO e de um ambiente real com robôs de braço duplo sobre mesa, fornecendo suporte de engenharia para a operação eficiente de modelos de inteligência incorporada em robôs locais.

VLA (Modelo Visão-Linguagem-Ação) é uma tecnologia-chave na inteligência incorporada, integrando entrada visual, instruções de linguagem e geração de ações, permitindo que robôs gerem ações com base no ambiente e nas instruções da tarefa. Com o aumento explosivo na escala de parâmetros dos modelos VLA, a inferência em tempo real nos robôs locais enfrenta gargalos. A velocidade de inferência impacta diretamente a resposta de ação, a transição entre tarefas e a fluidez operacional do robô. Além disso, os robôs são limitados por múltiplos fatores como poder computacional, consumo de energia, dissipação de calor e recursos do sistema. Tornar modelos VLA complexos estáveis e eficientes em controladores locais de alto poder computacional tornou-se um desafio crucial para a implementação da inteligência incorporada.

Para lidar com a alta carga de inferência local dos modelos VLA, o Instituto de Pesquisa em IA da Fibocom adotou o framework de compressão FiboVLA, realizando otimização em nível de token na camada semântica do modelo. Durante o processo de inferência VLA, há uma grande quantidade de representações redundantes nas informações visuais e linguísticas. O FiboVLA, através da seleção e compressão refinada de tokens visuais, elimina informações de baixo valor, retendo apenas o conteúdo crítico fortemente relacionado à compreensão da tarefa, julgamento ambiental e geração de ações. Este framework reduz o cálculo ineficiente durante a inferência, diminuindo significativamente a carga computacional, mantendo a precisão da decisão do modelo, a capacidade de compreensão multimodal e a geração de ações. Simultaneamente, a equipe combinou o escalonamento da cadeia de inferência com a otimização do motor de inferência local, melhorando ainda mais a eficiência operacional do modelo no robô local. Validado, o framework não depende de uma arquitetura de modelo específica e já foi testado com sucesso em vários modelos VLA de ponta, aumentando o throughput de inferência em 2,6 vezes e comprimindo efetivamente a latência ponta a ponta.

Com base no framework FiboVLA e nas tecnologias de otimização de inferência local, o Instituto de Pesquisa em IA da Fibocom implantou com sucesso o GR00T N1.5 em uma plataforma de controle principal de alto poder computacional na borda, concluindo a validação operacional. No conjunto de dados de referência de simulação LIBERO, o framework garantiu o desempenho da tarefa após a aceleração da inferência; em um ambiente físico real, a validação operacional do GR00T N1.5 foi concluída em um cenário de robô de braço duplo sobre mesa. Isso significa que o robô pode completar mais rapidamente a percepção, decisão e geração de ações localmente, formando um ciclo de inferência contínuo e de baixa latência. Isso não é apenas um aumento na velocidade do modelo, mas também uma validação de engenharia concluída em uma plataforma robótica real.

A aplicação bem-sucedida do framework FiboVLA consolidou ainda mais as capacidades principais do Instituto de Pesquisa em IA da Fibocom nas áreas de IA local e inteligência incorporada, incluindo compressão de modelos, otimização de motores de inferência, validação de plataformas robóticas e capacidade de coordenação de sistemas. Diante da tendência industrial de desenvolvimento acelerado da inteligência incorporada, a Fibocom continuará a combinar suas capacidades de comunicação sem fio, poder computacional de borda, cadeia de ferramentas de IA e plataforma Fibot para ajudar robôs e vários terminais inteligentes a obter inteligência local mais eficiente e estável, fornecendo uma base de engenharia para a entrada da inteligência incorporada em sistemas reais.