De acordo com pt.wedoany.com-A Galaxy General Robot lançou recentemente seu modelo básico de controle em tempo real para corpo inteiro de robôs humanoides, o AstraBrain-WBC 0.5. Este modelo é um componente importante do sistema tecnológico Galaxy Brain (AstraBrain), treinado com aproximadamente 2 bilhões de quadros de dados de movimento humano, com uma escala de parâmetros de 80,4 milhões, focado na construção da capacidade de "cerebelo universal" do robô.
Para treinar este modelo, a equipe de pesquisa conjunta da Galaxy General Robot construiu o maior conjunto de dados de treinamento de movimento para robôs humanoides da indústria, com duração total de aproximadamente 20.000 horas, cobrindo cenários ricos como dança, esportes, comportamentos diários, operações industriais e transporte colaborativo. Os dados mostram que a cobertura do espaço de movimento do modelo é cerca de 4 a 5 vezes maior do que a do conjunto de dados AMASS amplamente utilizado na indústria.
O AstraBrain-WBC 0.5 introduz pela primeira vez um paradigma de treinamento em escala semelhante ao GPT no campo de controle em tempo real de robôs humanoides. O modelo adota uma arquitetura de Transformer causal no estilo GPT, redefinindo o controle de corpo inteiro do robô como um problema de previsão de sequência contínua. A equipe de pesquisa também construiu uma biblioteca de prioridades de movimento composta por 384 especialistas em movimento e a fundiu em um modelo de controle unificado por meio de treinamento de destilação, realizando uma transição de "conjunto de habilidades de especialistas" para "modelo básico de movimento universal".
Em termos de desempenho, o modelo alcançou controle coordenado de corpo inteiro em um robô de 29 graus de liberdade, executando ações complexas como coordenação mão-pé, mudança de centro de gravidade e coordenação corporal.
Em testes com robôs reais, o modelo pode executar ações altamente dinâmicas como basquete, boxe, dança, levantar-se rolando e transporte colaborativo com zero-shot. Após otimização de engenharia, o modelo alcança latência de inferência ponta a ponta inferior a 1,5 milissegundos em uma única placa de vídeo RTX 4090, e a latência total do equipamento da cadeia de captura de movimento é inferior a 20 milissegundos, atendendo aos requisitos de controle de malha fechada em tempo real de 50 Hz.
Os dados do artigo mostram que, à medida que a escala dos dados de treinamento se expande de 2 milhões para 2 bilhões de quadros, o erro de rastreamento zero-shot do modelo continua diminuindo, e a taxa de sucesso aumenta de 83,26% para 92,58%, validando os benefícios significativos do treinamento em escala.
Em termos de aplicação, o AstraBrain-WBC 0.5 pode servir como modelo base de controle de movimento, fornecendo a instituições de pesquisa e desenvolvedores a capacidade de gerar dados de movimento de alta qualidade, e também pode ser usado para gerar em tempo real conteúdo de movimento complexo, como dança, performance e exibições interativas. O modelo suporta teleoperação de corpo inteiro em tempo real e rastreamento de movimento complexo, com potencial de aplicação em cenários como resgate de emergência e tratamento de ambientes perigosos.
Atualmente, os artigos, códigos e resultados técnicos relacionados ao AstraBrain-WBC 0.5 foram totalmente disponibilizados como código aberto para o ecossistema.
A Galaxy General Robot afirma que, por meio da combinação de dados em grande escala e arquitetura no estilo GPT, este modelo permite que o controle de movimento de robôs humanoides comece a ter capacidades de modelo básico, fornecendo uma base de capacidade subjacente para a entrada em larga escala de robôs em cenários de varejo, indústria e serviços.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









