De acordo com pt.wedoany.com-Em 10 de junho, a empresa chinesa de GPUs domésticas Moore Threads anunciou o lançamento e a abertura do código do MusaCoder. Trata-se de um grande modelo de código especializado para a geração de operadores de GPU de baixo nível, capaz de gerar kernels nativos de GPU CUDA e MUSA com base na implementação de referência do PyTorch, focando em computação de alto desempenho, otimização de treinamento e inferência de IA, e na construção do ecossistema de software de GPUs domésticas.
Os operadores de GPU de baixo nível são a camada de conexão crítica entre os frameworks de IA e o desempenho do hardware. Treinamento de grandes modelos, inferência, computação científica e processamento gráfico exigem uma grande quantidade de operações de multiplicação de matrizes, transformação de tensores, redução, otimização de acesso à memória e escalonamento paralelo. Se a eficiência dos operadores de baixo nível for insuficiente, mesmo que a escala de parâmetros do modelo de nível superior seja ampliada, será difícil liberar totalmente o poder computacional da GPU. No passado, o desenvolvimento de operadores dependia fortemente da escrita manual e da otimização iterativa por engenheiros, exigindo um alto nível de conhecimento em arquitetura de hardware, programação paralela, hierarquia de memória e cadeia de ferramentas de compilação. O lançamento do MusaCoder visa exatamente este elo de alto custo, na esperança de usar um grande modelo de código especializado para aumentar a eficiência da geração de operadores de baixo nível.
A particularidade deste resultado de código aberto reside no fato de que todo o seu processo de pós-treinamento foi concluído no cluster de computação inteligente Kua'e, construído com base no MTT S5000. A Moore Threads apresentou que o MusaCoder é o primeiro grande modelo de código aberto da indústria a completar o treinamento e a verificação de ciclo completo com base em uma base de poder computacional de GPU doméstica.
O MusaCoder adota um framework de treinamento voltado para a geração de kernels, combinando métodos como síntese de dados, ajuste fino por rejeição e aprendizado por reforço com feedback de execução, permitindo que o modelo, após gerar o código, seja verificado quanto à compilação, correção numérica e efeito real de aceleração. A geração de operadores de GPU é diferente do preenchimento de código comum; a capacidade de o código ser executado é apenas o primeiro passo. Mais crucial é se ele pode ser compilado de forma estável no backend de hardware especificado, se os resultados estão corretos, se não há rollback ilegal e se obtém ganhos de desempenho na execução real. Ao incorporar o backend MUSA no processo de treinamento e verificação, a Moore Threads significa que o modelo não serve apenas ao ecossistema CUDA universal, mas também se direciona diretamente ao ambiente de computação paralela de GPUs domésticas.
Para a indústria de GPUs domésticas, o significado do MusaCoder vai além de ser apenas um modelo de código aberto. Para que o poder computacional de IA doméstico entre em mais projetos de desenvolvedores e empresas, é necessário resolver os problemas de adaptação do ecossistema de software, incluindo frameworks de aprendizado profundo, bibliotecas de operadores, compiladores, bibliotecas de comunicação, mecanismos de inferência e migração de modelos de aplicação. Com o aumento da capacidade de geração de operadores de baixo nível, os desenvolvedores podem converter mais rapidamente programas de tensores de alto nível em código de GPU executável e otimizável, reduzindo os custos de migração manual e ajuste de desempenho. Para fabricantes de modelos, instituições de pesquisa e equipes de aplicação da indústria que precisam se adaptar a GPUs domésticas, esse tipo de ferramenta pode encurtar o ciclo desde a portabilidade de código até a verificação de desempenho.
O impacto na cadeia industrial se concentrará em elos como ferramentas de desenvolvimento de GPUs domésticas, adaptação de frameworks de IA, otimização de treinamento de modelos e serviços de software de centros de computação inteligente. À medida que os grandes modelos entram em uma fase de engenharia mais profunda, a competição por poder computacional não depende mais apenas dos parâmetros de pico de uma única placa, mas também de se a pilha de software pode suportar o treinamento estável do modelo, a implantação de inferência e o ajuste de desempenho. Se o MusaCoder puder iterar continuamente e ganhar a adoção dos desenvolvedores, ajudará o ecossistema MUSA da Moore Threads a acumular mais operadores, exemplos e experiência em otimização, e também aumentará o valor de verificação do cluster de computação inteligente Kua'e em tarefas de treinamento de grandes modelos e geração de código. Os próximos passos incluem a situação de download e uso dos pesos do modelo, feedback dos desenvolvedores, a expansão do escopo de adaptação do backend MUSA e se o modelo pode produzir resultados práticos em mais frameworks de IA e cenários de operadores da indústria.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









