Pré-treinamento, aprendizado por reforço e infraestrutura, tudo foi reconstruído do zero; desde o início formal do treinamento até o lançamento, levou menos de três meses. Em 23 de abril, o modelo de grande porte Hy3 preview da Tencent Hunyuan foi oficialmente lançado e completamente aberto. Com uma arquitetura de Mistura de Especialistas (MoE) de 295B parâmetros totais e apenas 21B parâmetros ativos, alcançou um salto no benchmark SWE-Bench de 53% para 74,4% na capacidade de código.
Enquanto a escala de parâmetros dos modelos de grande porte se aproxima de trilhões, a IA está passando de ser reativamente ativada para planejamento proativo. Em 23 de abril, o modelo Hy3 preview da Tencent Hunyuan foi oficialmente lançado e completamente aberto, não perseguindo a quantidade extrema de parâmetros, mas focando na otimização de "modelos de escala média", com ênfase em aumentar a densidade de inteligência por unidade.
Arquitetura base: Arquitetura MoE que combina pensamento rápido e lento
O Hy3 preview tem 295 bilhões de parâmetros totais, com apenas 21 bilhões de parâmetros ativos. Através da arquitetura MoE, apenas cerca de 7% dos parâmetros são ativados durante a inferência. Suporta um comprimento máximo de contexto de 256K, com velocidade de inferência de 23 tokens/segundo, e integra o mecanismo de "pensamento rápido e lento", sendo capaz tanto de respostas rápidas quanto de raciocínio profundo e complexo.
Eficiência de pesquisa: Reconstrução completa da infraestrutura em três meses
O treinamento começou oficialmente no final de janeiro de 2026 e foi concluído em três meses, sendo definido internamente como o início de uma transição de "ler dez mil livros" para "viajar dez mil milhas". A equipe reconstruiu do zero o pré-treinamento, o aprendizado por reforço e a infraestrutura, com o cientista-chefe de IA da Tencent, Yao Shunyu, liderando todo o processo.
Capacidade de agente e código: SWE-Bench salta de 53% para 74,4%
A capacidade de programação foi a área com melhoria mais significativa – o benchmark SWE-Bench saltou de 53% no Hunyuan 2.0 para 74,4%, um aumento de mais de 40%. Obteve resultados competitivos em várias avaliações como Terminal-Bench 2.0, BrowseComp e WideSearch, com desempenho destacado da capacidade de agente em benchmarks como ClawEval.
Custo-benefício e "praticidade"
Os custos caíram drasticamente: entrada da API a partir de 1,2 yuans/1 milhão de tokens, preço de acerto de cache de 0,4 yuans/1 milhão de tokens, saída a partir de 4 yuans/1 milhão de tokens; assinatura pessoal a partir de 28 yuans por mês.
Além disso, evitou ativamente rankings públicos suscetíveis a "manipulação", avaliando o "poder real de combate" por meio de questões auto-elaboradas, exames recentes, avaliação humana e testes de crowdsourcing de produto, obtendo excelentes resultados em Olimpíadas de Ciência de Fronteira, Olimpíada Internacional de Matemática (IMO), exame de doutorado em matemática do Instituto Qiuzhen da Universidade Qinghua, entre outros.
Integração ao ecossistema: Código aberto completo e implementação em múltiplos produtos
Os pesos do modelo e o código já estão abertos no GitHub, Hugging Face, ModelScope e GitCode. Já foi implementado em Yuanbao, ima, CodeBuddy, WorkBuddy, QQ, QQ Browser, Tencent Docs, Tencent LeEnjoy, Tencent Maps, Tencent E-Sign, entre outros, com WeChat Official Accounts, Tencent News, Peacekeeper Elite, Tencent Customer Service sendo gradualmente integrados. Suporta produtos de agente de código aberto como OpenClaw, OpenCode e KiloCode, e já está disponível na plataforma de serviços de modelos de grande porte da Tencent Cloud, TokenHub.
Definindo um novo caminho para modelos de grande porte de código aberto da China
Quantidade moderada de parâmetros, alta densidade de inteligência por unidade e acessibilidade. A competição de modelos de grande porte domésticos está passando de uma comparação de indicadores técnicos únicos para um desenvolvimento coordenado abrangente entre modelo, produto, engenharia e ecossistema.
Construindo um ecossistema de inovação saudável
Após DeepSeek e Kimi lançarem novidades na mesma semana no final de abril, o Hunyuan seguiu com código aberto, reutilizando e otimizando tecnologias subjacentes um do outro para formar uma competição técnica "um atrás do outro", criando um ciclo de inovação saudável.
Capacitando aplicações inteligentes em todos os cenários
Nas interações com usuários comuns, houve melhorias na compreensão de intenções, processamento de textos longos, estabilidade de respostas e humanização. O assistente de IA oficial do QQ, Xiao Q, realiza pesquisas de informações, define lembretes e resolve problemas com fotos. O cenário de agente inteligente é sua direção principal de diferenciação, com sistematização de capacidades; mesmo tarefas de agente único envolvem coordenação profunda de múltiplas dimensões como raciocínio, textos longos, instruções, diálogo, código e ferramentas.
Este Hy3 preview é apenas um ponto de partida provisório. Yao Shunyu afirmou que obter código aberto e feedback real será a chave para melhorar a praticidade da versão oficial. A equipe do Hunyuan está expandindo a escala de pré-treinamento e aprendizado por reforço para elevar o limite de inteligência, e explorando capacidades características de modelo por meio de design de produto profundamente colaborativo.
