X Square Robot da China lança estrutura de código aberto para coleta de dados robóticos sem robô_Boletins

X Square Robot da China lança estrutura de código aberto para coleta de dados robóticos sem robô

2026-06-15 14:19

Favoritos

De acordo com pt.wedoany.com-A empresa de robótica de Shenzhen, X Square Robot, lançou o XRZero-G0, um conjunto de hardware e software de código aberto para coletar dados de treinamento de robôs a partir de operadores humanos, gerar políticas e testá-las em robôs reais. O código é licenciado sob a MIT License e está hospedado no GitHub juntamente com o conjunto de dados G0-Dataset.

Coleta de dados robóticos sem robô

Os métodos tradicionais dependem de robôs reais para coletar amostras de treinamento, com cada sessão de operação produzindo dados de demonstração extremamente limitados, o que restringe diretamente o tamanho dos conjuntos de dados necessários para treinar IA incorporada. Demonstradores humanos oferecem uma fonte de dados de menor custo, e a X Square Robot integrou esse método em um sistema publicamente acessível. A empresa desenvolve robôs para cenários de trabalho físico, onde anteriormente era necessário investir tempo e recursos significativos para operar manualmente os robôs na coleta de amostras de treinamento.

Robôs reais percebem o ambiente ao redor por meio de múltiplas câmeras. Câmeras montadas na cabeça capturam cenas de grande angular, enquanto câmeras montadas no pulso registram detalhadamente as interações entre mãos e objetos. Muitos dispositivos de coleta de operação manual dependem apenas da visão do pulso, o que causa uma discrepância entre os dados de treinamento e a forma como o robô percebe durante a implantação real. O XRZero-G0 utiliza uma câmera montada na cabeça e duas câmeras de pulso para registrar simultaneamente o contexto amplo da cena e as operações finas de perto, mapeando essas perspectivas para uma representação compartilhada que corresponde à percepção do robô. Combinado com uma interface VR vestível e garras intercambiáveis, um único operador pode gerar dados de demonstração aplicáveis a diferentes corpos robóticos.

Os dados de demonstradores humanos apresentam problemas de qualidade que podem afetar seu valor de treinamento. O XRZero-G0 constrói um fluxo de trabalho em ciclo fechado que inclui coleta, inspeção, treinamento e avaliação para filtrar as amostras que entram na fase de treinamento. No nível de observação, restrições de consistência geométrica multivisual reduzem o desalinhamento entre imagem e movimento; no nível cinemático, um algoritmo de cinemática inversa de corpo inteiro com restrições de colisão e limites articulares elimina trajetórias inválidas; no nível de política, a reprodução em robôs reais serve como validação final. De acordo com a X Square Robot, em configurações controladas, a produção efetiva de dados do sistema se aproxima de 85%.

A empresa aponta que dados sem robô e dados de robôs reais podem trabalhar em conjunto. Combinar cerca de 10 segmentos de demonstração coletados por humanos com 1 segmento registrado por robô real alcançou desempenho equivalente ao de um conjunto de treinamento composto inteiramente por dados de robôs reais em tarefas de teste. Os dados coletados por humanos fornecem ampla cobertura comportamental, enquanto uma pequena quantidade de dados de robôs reais é usada para ancorar parâmetros físicos como atraso do motor e atrito. Sob condições de teste, essa proporção reduz a necessidade de dados de robôs reais em até 20 vezes.

O conjunto de dados G0-Dataset contém mais de 2.000 horas de demonstrações validadas, cobrindo modalidades visuais, táteis e auditivas, abrangendo 3.000 tarefas operacionais diferentes, com distribuição seguindo características de cauda longa. A velocidade máxima de coleta de dados por operador atinge 93,2 segmentos por hora. O conjunto de dados suporta pré-treinamento em larga escala e estudos de transferência entre diferentes corpos robóticos. A X Square Robot afirma que as políticas treinadas com base nesta estrutura podem generalizar para ambientes de coleta com diferentes posturas robóticas, alturas de mesa e perspectivas, e demonstram capacidade de transferência zero-shot para plataformas robóticas fora do conjunto de treinamento, executando tarefas sem necessidade de ajuste fino para a nova plataforma.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com