alphaXiv adota modelo chinês de código aberto GLM-5.2 em substituição ao modelo restrito Claude
2026-06-23 09:18
Favoritos

De acordo com pt.wedoany.com-A demonstração do pesquisador automático do alphaXiv adotou pela primeira vez o modelo chinês de código aberto GLM-5.2, substituindo os modelos de ponta da Anthropic — Claude Fable 5 e Mythos 5 — que estavam inacessíveis devido a restrições impostas pelas autoridades dos EUA. A equipe do alphaXiv deixou claro que se trata apenas de uma demonstração própria, e não de um teste independente; a escolha por uma alternativa de código aberto se deve ao fato de que os modelos de ponta estão fechados para pesquisa, levando a comunidade de código aberto a buscar alternativas viáveis.

Na execução demonstrada, o GLM-5.2 realizou de forma autônoma a comparação entre dois esquemas de treinamento por reforço — o esquema totalmente assíncrono e o esquema síncrono combinado. O experimento foi conduzido em dois nós, cada um equipado com oito aceleradores H100, com base no framework SkyRL, utilizando o conjunto de tarefas de competição de código Harbor. A descrição da equipe indica que o agente corrigiu de forma autônoma problemas de ambiente (dependência libnuma), concluiu todas as execuções e compilou os dados finais de comparação de throughput e estabilidade de recompensa.

A função de pesquisador automático do alphaXiv é utilizada para resolver problemas de reprodutibilidade de código de artigos. Quando o usuário altera "arxiv" para "autoarxiv" no endereço do artigo, o agente implanta automaticamente o repositório, corrige o ambiente, executa verificações mínimas de reprodutibilidade e avalia o custo para uma reprodução completa. Esse processo envolve etapas de engenharia — montar e verificar o código de terceiros, e não descobertas científicas. Para códigos privados, existe uma plataforma independente chamada OpenResearch.sh.

O GLM-5.2, desenvolvido pela Z.ai (anteriormente Zhipu AI) da China, é um modelo de código aberto com arquitetura MoE, aproximadamente 750 bilhões de parâmetros, com cerca de 40 bilhões de parâmetros ativados por token, contexto de 1 milhão de tokens e licenciado sob MIT. A equipe destacou que a principal característica do modelo não são seus resultados em benchmarks, mas sim o fato de que seus pesos de código aberto não podem ser revogados por órgãos reguladores — o que representa uma garantia para ferramentas que exigem acesso previsível.

A equipe do alphaXiv reconhece que o GLM-5.2 carece de capacidade visual: enquanto outros modelos leem tendências diretamente dos gráficos do WandB (serviço de rastreamento de experimentos), o GLM escreve código numpy para analisar números brutos — suficiente para execuções simples, mas que pode atrapalhar em tarefas complexas. A equipe afirma que, no estágio atual, o modelo ainda não realiza pesquisas de fato; sua vantagem está em resolver problemas de implementação e reproduzir trabalhos existentes. A pesquisa autônoma aqui se refere ao ciclo de engenharia dos experimentos, e não a descobertas científicas.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com