Conferência de Modelagem de Linguagem de Montreal: Algoritmos Adaptativos em Destaque
2025-12-05 17:28
Fonte:Universidade de Yale
Favoritos

Um artigo co-escrito pelo professor Alex Lew foi selecionado como um dos quatro "Artigos Distintos" da Conferência de Modelagem de Linguagem (COLM 2025), realizada em Montreal em outubro deste ano. Intitulado "Geração de Controle Rápido para Modelos de Linguagem via Amostragem de Rejeição com Ponderação Adaptativa", o artigo propõe um algoritmo mais rápido e preciso para gerar texto estruturado a partir de modelos de linguagem. Os resultados da pesquisa já foram publicados no servidor de pré-impressão arXiv.

O método proposto pelos pesquisadores (abaixo) é comparado com o método de máscara de token por enumeração (acima). Este método verifica apenas um subconjunto de tokens amostrados da mesma distribuição.

Os avaliadores destacaram que o artigo apresenta um amostrador de geração controlada que é rápido, fundamentado e adaptativo, abordando efetivamente o desafio de fazer com que grandes modelos de linguagem sigam restrições estritas de forma rápida. O método tradicional de "decodificação com restrições locais", embora garanta que o modelo siga as restrições 100% do tempo, é lento e pode ser excessivamente local, resultando em saídas tecnicamente válidas, mas distorcidas na prática. Por exemplo, ao gerar manchetes de notícias econômicas restritas a palavras com cinco letras ou menos, a decodificação com restrições locais pode não encontrar uma conclusão adequada.

O algoritmo proposto pelo professor Lew e seus colaboradores, no entanto, aplica restrições de forma eficiente e global. Em vez de verificar cada possível palavra seguinte, ele verifica apenas algumas, aumentando significativamente a eficiência. Além disso, o algoritmo utiliza métodos do campo da estatística computacional para aplicar restrições sem distorcer a distribuição de probabilidade das respostas do modelo de linguagem. O professor Lew afirmou: "Nossa abordagem pode reduzir drasticamente o número de avaliações de restrições necessárias; talvez apenas três palavras precisem ser avaliadas para executar este algoritmo." Este algoritmo demonstrou aceleração em diversas áreas, desde a geração de código Python válido até a síntese molecular. Atualmente, o algoritmo já foi implementado como parte do kit de ferramentas de código aberto GenLM, ampliando o potencial de aplicação dos modelos de linguagem.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com