Modelo openPangu-2.0-Flash da Huawei com 92 bilhões de parâmetros é lançado como código aberto
2026-06-30 15:56
Favoritos

De acordo com pt.wedoany.com-Em 30 de junho, a Huawei lançou oficialmente o modelo openPangu-2.0-Flash, com 92 bilhões de parâmetros, como código aberto. Os pesos do modelo, o código básico de inferência e os operadores de treinamento e inferência também foram disponibilizados em plataformas de código aberto. openPangu é a marca de modelos de IA de código aberto da Huawei, construída principalmente em torno das tecnologias nativas de treinamento e inferência da Ascend, oferecendo referências para o desenvolvimento e implantação de grandes modelos para desenvolvedores, empresas e instituições de pesquisa. A Huawei havia lançado anteriormente o openPangu 2.0 durante a HDC 2026, esclarecendo que a série inclui duas versões, Pro e Flash, e planeja liberar gradualmente os componentes relacionados a partir de 30 de junho.

O openPangu-2.0-Flash adota uma escala total de 92 bilhões de parâmetros, com 6 bilhões de parâmetros ativos, e suporta um contexto de 512K. A versão Flash enfatiza a eficiência de inferência e a adaptação de implantação, sendo adequada para tarefas de agente, processamento de texto longo, perguntas e respostas em bases de conhecimento empresariais e chamadas de aplicativos inteligentes no ecossistema HarmonyOS.

De acordo com o cronograma divulgado pela Huawei, os pesos do modelo openPangu-2.0-Flash, o código básico de inferência e os operadores de treinamento e inferência foram disponibilizados em plataformas de código aberto em 30 de junho; os pesos do modelo openPangu-2.0-Pro e o código básico de inferência serão lançados em julho; mais componentes de código aberto serão liberados gradualmente no segundo semestre do ano. De acordo com relatos do IT Home, o openPangu 2.0 planeja abrir gradualmente 7 componentes principais, incluindo pesos do modelo, código de inferência, relatórios técnicos, estrutura do modelo, além de código de pré-treinamento, código de pós-treinamento e operadores de treinamento recém-adicionados. Com a expansão do escopo dos componentes de código aberto, os desenvolvedores não só podem chamar o modelo, mas também observar o pipeline de engenharia de treinamento, inferência e adaptação de operadores do modelo.

O openPangu 2.0 é dividido em duas versões: Pro e Flash. Informações públicas mostram que o openPangu-2.0-Pro tem um total de 505B parâmetros, com 18B parâmetros ativos; o openPangu-2.0-Flash tem um total de 92B parâmetros, com 6B parâmetros ativos. Ambas as versões suportam um contexto de 512K, oferecendo uma janela de entrada mais longa para documentos longos, tarefas de múltiplas rodadas, bases de conhecimento empresariais, materiais de código e fluxos de agente. A versão Flash tem uma escala de parâmetros mais leve, atendendo principalmente a necessidades de baixa latência, alta taxa de transferência e implantação mais flexível; a versão Pro tem uma escala de parâmetros maior e liberará os pesos do modelo e o código básico de inferência em julho.

O foco deste lançamento de código aberto está no pipeline nativo da Ascend. Ao implantar grandes modelos em hardware de IA doméstico, os desafios comuns incluem adaptação de operadores, taxa de transferência de inferência, uso de memória, eficiência de contexto longo e estabilidade de implantação de engenharia. Ao abrir os pesos do modelo, o código de inferência e os operadores de treinamento e inferência juntos, a Huawei permite que os desenvolvedores reproduzam diretamente o fluxo de inferência no ambiente Ascend, reduzindo os custos de depuração para empresas que implantam modelos de código aberto em poder computacional doméstico. Para clientes em setores como governo, finanças, manufatura, transporte e energia que precisam de implantação privada, a capacidade do modelo de operar de forma estável em plataformas de poder computacional local muitas vezes afeta mais a velocidade de aplicação do que simplesmente as pontuações em rankings.

As aplicações de agente são uma direção importante de uso do openPangu 2.0. O contexto de 512K pode suportar registros de tarefas mais longos, cadeias de chamadas de ferramentas, regras de negócios e documentos empresariais, sendo adequado para tarefas como revisão de contratos, fluxo de ordens de serviço, assistência em pesquisa e desenvolvimento, bases de conhecimento de atendimento ao cliente, compreensão de código e automação de processos. Após o lançamento da versão Flash, os desenvolvedores podem primeiro construir aplicativos em torno de inferência leve, chamadas de ferramentas e bases de conhecimento do setor, e depois escolher a versão Pro, que será lançada posteriormente, com base na complexidade da tarefa. O Xiaoyi Claw da Huawei já integrou o modelo openPangu 2.0 Pro para melhorar a capacidade de execução de tarefas em nível de sistema do HarmonyOS, o que também mostra que o openPangu formará uma conexão técnica mais estreita com o HarmonyOS, Ascend e aplicativos empresariais de IA no futuro.

Com o lançamento oficial do openPangu-2.0-Flash como código aberto, a Huawei estabelece um novo ponto de conexão entre modelos de IA, poder computacional doméstico e o ecossistema de sistemas operacionais. A abertura dos pesos do modelo resolve o problema de "se pode ser usado", o código básico de inferência e os operadores de treinamento e inferência resolvem o problema de "como executá-lo bem na Ascend", e, após a abertura de componentes como código de pré-treinamento e código de pós-treinamento, empresas e desenvolvedores podem realizar treinamento adaptativo com dados do setor. Os pontos de observação subsequentes incluem os termos da licença de código aberto, a integridade dos componentes na plataforma GitCode, as barreiras de implantação no hardware Ascend, o custo real do contexto longo e o desempenho do modelo após o lançamento da versão Pro em julho.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com