Meituan, da China, lança modelo de parâmetros de trilhões LongCat-2.0 como código aberto_Boletins

Meituan, da China, lança modelo de parâmetros de trilhões LongCat-2.0 como código aberto

2026-06-30 11:08

Favoritos

De acordo com pt.wedoany.com-Em 30 de junho, a Meituan lançou oficialmente o novo modelo de parâmetros de trilhões LongCat-2.0 e anunciou sua abertura como código aberto. O modelo possui um total de 1,6T parâmetros, com uma média de aproximadamente 48B parâmetros ativados, variando dinamicamente de 33B a 56B, suportando nativamente um contexto ultra longo de 1M. O LongCat-2.0 é um modelo de parâmetros de trilhões treinado e inferido em um cluster de computação doméstica de 50.000 placas, com dados de pré-treinamento superiores a 30T tokens, abrangendo dados em chinês, inglês, multilíngue e código, fornecendo capacidades de modelo base para compreensão de textos longos, processamento de código, tarefas multilíngues e aplicações de agentes complexos.

O lançamento do LongCat-2.0 estende as capacidades de modelo da Meituan de aplicações de negócios para a abertura de modelos base. O cluster de computação doméstica de 50.000 placas, 1,6T parâmetros totais e janela de contexto de 1M são as informações técnicas mais notáveis deste lançamento.

Em termos de estrutura do modelo, o LongCat-2.0 adota uma configuração de parâmetros totais na escala de trilhões e parâmetros ativados na escala de dezenas de bilhões, com uma média de aproximadamente 48B ativados e uma faixa dinâmica de 33B a 56B. Tarefas complexas podem chamar mais parâmetros, enquanto tarefas leves podem reduzir o consumo computacional. Esse design ajuda a controlar os custos de inferência e melhora a eficiência de utilização de recursos em diferentes cenários de tarefas. A capacidade de contexto ultra longo de 1M permite que o modelo processe documentos, bases de código, contratos, arquivos de projeto e registros de tarefas de múltiplas rodadas em uma única vez, reduzindo a perda de informações causada pela segmentação de conteúdos longos.

A computação doméstica é outra informação chave deste lançamento. O LongCat-2.0 foi treinado e inferido em um cluster de computação doméstica de 50.000 placas, indicando que a infraestrutura de IA doméstica já entrou na cadeia de treinamento de modelos de escala ultra grande.

Após a abertura como código aberto, o LongCat-2.0 estará disponível para desenvolvedores, empresas e instituições de pesquisa. Indústrias como manufatura, varejo, logística, cadeia de suprimentos e serviços de engenharia possuem grandes volumes de materiais de texto longo, incluindo manuais de equipamentos, especificações técnicas, contratos de compras, arquivos de projeto, registros de atendimento ao cliente, repositórios de código e bases de conhecimento corporativas. O modelo de contexto de 1M pode ser usado para perguntas e respostas em bases de conhecimento, análise de documentos longos, assistência de código, automação de processos de negócios e orquestração de tarefas de agentes, reduzindo a barreira para empresas construírem modelos específicos do setor e aplicações privadas.

O lançamento do LongCat-2.0 pela Meituan sinaliza seu compromisso contínuo em investir em capacidades de base de modelos grandes. Os efeitos de aplicação subsequentes ainda dependerão dos pesos do modelo, relatórios técnicos, termos de licença, custos de inferência e do escopo de ferramentas complementares abertas.