EvoPhys-World da Universidade de Pequim, na China, lidera o ranking mundial WorldScore
2026-06-09 09:16
Favoritos

De acordo com pt.wedoany.com-No dia 8 de junho, o modelo de mundo 5D EvoPhys-World, lançado pela equipe EvoPhys da Universidade de Pequim, ficou em primeiro lugar na categoria "Geração de Mundo" na avaliação pública WorldScore da Universidade de Stanford. O modelo é centrado no ser humano, voltado para tarefas de geração controlável em nível de cena e interação física, e todo o treinamento nativo foi concluído com base na GPU MTT S5000 da Moore Threads e na pilha de software MUSA.

O foco técnico do EvoPhys-World é avançar o modelo de mundo de "gerar cenas assistíveis" para "gerar sistemas de cena interativos, controláveis e evolutivos". De acordo com as informações divulgadas na página do projeto, o modelo utiliza dados de interação em primeira pessoa e memória de cena para construir um gêmeo digital do mundo centrado no ser humano, introduzindo ainda mecanismos de interação controlável e auto-evolução, permitindo que um estado de cena possa derivar diferentes futuros sob diferentes ramos de ação. Seu modelo central inclui duas formas: World Engine e World Policy. O primeiro enfatiza a capacidade de criar gêmeos digitais de tudo e a interação física, enquanto o segundo enfatiza a previsibilidade do mundo e a seleção de ações. Juntos, eles formam um ciclo fechado que vai da geração de cena, previsão de estado, previsão de ação até a evolução por feedback. Para inteligência incorporada, treinamento de robôs, simulação virtual e geração de cenas complexas, o valor desse modelo reside em permitir que a IA não apenas entenda as relações espaciais nas imagens, mas também compreenda as conexões entre ações, causalidade, feedback físico e resultados de tarefas.

WorldScore é um benchmark de avaliação unificado para tarefas de geração de mundo, cobrindo a capacidade de modelos 3D, 4D e de vídeo em gerar mundos sob comando, com indicadores focados principalmente em controlabilidade, qualidade e desempenho dinâmico. O ranking público mostra que o EvoPhys-World está entre os primeiros em indicadores como WorldScore-Static.

Este avanço também coloca em maior evidência a capacidade de adaptação das GPUs e pilhas de software chinesas no treinamento de modelos de ponta. O treinamento de modelos de mundo exige alta capacidade de processamento de dados de sequência longa, estabilidade em treinamento distribuído, modelagem espaço-temporal multimodal, suporte a operadores e eficiência de colaboração hardware-software. O treinamento nativo do EvoPhys-World foi concluído inteiramente com base na GPU MTT S5000 da Moore Threads e na pilha de software MUSA, o que significa que a equipe de desenvolvimento do modelo não usou poder computacional local apenas na inferência ou em estágios posteriores de adaptação, mas completou a validação do hardware, pilha de software e fluxo de trabalho do modelo no caminho principal do treinamento. Para a indústria chinesa de infraestrutura de IA, esses casos são mais complexos do que simplesmente executar o treinamento de modelos de linguagem, pois os modelos de mundo envolvem múltiplos tipos de carga, como geração de vídeo, interação física, previsão de estado e estratégias de ação, exigindo maior capacidade do cluster de GPUs, eficiência de comunicação e compatibilidade com frameworks de treinamento.

As aplicações do EvoPhys-World também estão mais próximas do mundo físico. As cenas exibidas na página do projeto incluem operação manual, interação em mesa de trabalho, mover copos, armazenagem, fábrica química, cidade e cidade antiga, entre outros ambientes, indicando que o modelo tenta cobrir tarefas de geração em múltiplos níveis, desde ações manuais localizadas até navegação em grandes cenas, desde contato com objetos até raciocínio de tarefas. Se esta linha continuar a avançar, o modelo de mundo tem o potencial de se tornar uma base importante para o treinamento de inteligência incorporada, fornecendo um ambiente de treinamento virtual de baixo custo, altamente controlável e repetidamente evolutivo para robôs antes da implantação real, podendo também ser usado em simulação industrial, gêmeos digitais, pré-execução de operações complexas e verificação de colaboração humano-máquina.

A seguir, o impacto do EvoPhys-World dependerá do grau de abertura das capacidades do modelo, da construção do ecossistema de desenvolvedores, dos resultados de validação em mais tarefas reais e da estabilidade contínua da pilha de software de GPU chinesa em treinamentos de maior escala. Esta liderança no ranking WorldScore, pelo menos, mostra que as equipes universitárias chinesas já estão na vanguarda das avaliações públicas internacionais na direção de modelos de mundo, fornecendo também uma amostra observável para o suporte da capacidade computacional local de IA no treinamento de modelos multimodais de ponta.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com