Empresa chinesa X Square Robot abre três tecnologias de inteligência incorporada
2026-06-18 14:44
Favoritos

De acordo com pt.wedoany.com-A empresa chinesa de robótica X Square Robot está impulsionando robôs humanoides para cenários de aplicação mais complexos, com o objetivo central de permitir que robôs operem de forma autônoma em ambientes humanos reais, caóticos e imprevisíveis.

O fundador e CEO da empresa, Wang Qian, afirmou que a base de hardware da indústria robótica já está praticamente estabelecida, com avanços rápidos em locomoção humanoide, mãos hábeis e sistemas de controle de força, sendo a inteligência o verdadeiro gargalo. Para preencher essa lacuna, a X Square Robot abriu três tecnologias nas últimas semanas: o modelo visão-linguagem-ação Wall-OSS-0.5, o modelo de ação mundial WALL-WM, projetado para compreender eventos físicos, e o framework de coleta de dados e treinamento sem robô XRZero-G0.

O Wall-OSS-0.5 responde diretamente à questão de se o pré-treinamento pode ensinar habilidades úteis aos robôs. Diferente da abordagem de avaliar modelos após ajuste fino, a empresa implantou o modelo pré-treinado diretamente em robôs físicos e o testou em 17 tarefas do mundo real. O sistema demonstrou desempenho zero-shot em classificação de objetos, empilhamento de anéis e manipulação de objetos deformáveis. O modelo utiliza um framework de treinamento "ponte de gradiente", que converte ações robóticas em tokens de ação, aprendendo-os juntamente com representações de linguagem e visão durante o pré-treinamento, permitindo que percepção, compreensão de linguagem e geração de ação coevoluam em um modelo unificado. A empresa descobriu que o treinamento de ação não apenas melhorou as capacidades de manipulação, mas também aprimorou o desempenho de ancoragem visual, indicando que a interação física pode fortalecer a compreensão do mundo pelo modelo.

O WALL-WM visa resolver o problema de que a maioria dos sistemas VLA apenas aprende trajetórias de ação sem realmente compreender as relações causais físicas. O modelo desloca o aprendizado de sequências fixas de ação para eventos físicos significativos, como alcançar, agarrar, levantar e colocar. Diferente das arquiteturas tradicionais, o WALL-WM alinha observações visuais, descrições linguísticas e ações em torno de eventos do mundo real, com o objetivo de permitir que robôs não apenas ajam, mas também prevejam resultados, raciocinem sobre mudanças físicas e se ajustem quando os planos falham.

Para enfrentar o gargalo de dados na inteligência incorporada, a X Square Robot lançou o framework de hardware e software XRZero-G0. O sistema combina interfaces vestíveis, sensoriamento multivisão, detecção automatizada de qualidade e verificação com robôs reais, para coleta de dados e treinamento sem robô. Por meio de experimentos controlados, a empresa descobriu que combinar dez demonstrações sem robô com uma demonstração com robô real pode alcançar desempenho comparável ao de conjuntos de dados construídos inteiramente com dados de robôs reais. A empresa também publicou mais de 2.000 horas de dados multimodais, abrangendo cerca de 3.000 tarefas, para apoiar a pesquisa em inteligência incorporada.

Essas três tecnologias de código aberto formam juntas um framework full-stack que abrange dados, modelos mundiais e modelos fundamentais de robôs. Wang Qian acredita que o "momento eureka" da inteligência incorporada pode estar mais próximo do que se imagina.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com