Conferência de Modelagem de Linguagem de Montreal: Algoritmos Adaptativos em Destaque
2025-12-05 17:28
Fonte:Universidade de Yale
Favoritos

Um artigo co-escrito pelo professor Alex Lew foi selecionado como um dos quatro "Artigos Distintos" da Conferência de Modelagem de Linguagem (COLM 2025), realizada em Montreal em outubro deste ano. Intitulado "Geração de Controle Rápido para Modelos de Linguagem via Amostragem de Rejeição com Ponderação Adaptativa", o artigo propõe um algoritmo mais rápido e preciso para gerar texto estruturado a partir de modelos de linguagem. Os resultados da pesquisa já foram publicados no servidor de pré-impressão arXiv.

O método proposto pelos pesquisadores (abaixo) é comparado com o método de máscara de token por enumeração (acima). Este método verifica apenas um subconjunto de tokens amostrados da mesma distribuição.

Os avaliadores destacaram que o artigo apresenta um amostrador de geração controlada que é rápido, fundamentado e adaptativo, abordando efetivamente o desafio de fazer com que grandes modelos de linguagem sigam restrições estritas de forma rápida. O método tradicional de "decodificação com restrições locais", embora garanta que o modelo siga as restrições 100% do tempo, é lento e pode ser excessivamente local, resultando em saídas tecnicamente válidas, mas distorcidas na prática. Por exemplo, ao gerar manchetes de notícias econômicas restritas a palavras com cinco letras ou menos, a decodificação com restrições locais pode não encontrar uma conclusão adequada.

O algoritmo proposto pelo professor Lew e seus colaboradores, no entanto, aplica restrições de forma eficiente e global. Em vez de verificar cada possível palavra seguinte, ele verifica apenas algumas, aumentando significativamente a eficiência. Além disso, o algoritmo utiliza métodos do campo da estatística computacional para aplicar restrições sem distorcer a distribuição de probabilidade das respostas do modelo de linguagem. O professor Lew afirmou: "Nossa abordagem pode reduzir drasticamente o número de avaliações de restrições necessárias; talvez apenas três palavras precisem ser avaliadas para executar este algoritmo." Este algoritmo demonstrou aceleração em diversas áreas, desde a geração de código Python válido até a síntese molecular. Atualmente, o algoritmo já foi implementado como parte do kit de ferramentas de código aberto GenLM, ampliando o potencial de aplicação dos modelos de linguagem.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com
Inovações Tecnológicas
Investigadores da Chalmers University of Technology desenvolvem sistema gigante de superátomos para resolver o problema da descoerência na computação quântica
2026-04-14
Investigação da Universidade de Stanford Explora o Papel e o Impacto da Inteligência Artificial na Revisão por Pares Científica
2026-04-13
MIT lança sistema de software Sandook para melhorar o desempenho de pools de SSDs em data centers
2026-04-09
Estudo colaborativo da Universidade de Michigan (EUA) e da Universidade de Augsburg (Alemanha): Substituir um único átomo reduz o fluxo de calor pela metade em uma molécula
2026-04-08
Equipe de pesquisa alemã descobre mecanismo pelo qual a proteína Fis regula a virulência de patógeno diarreico
2026-04-03
Pesquisadores do Trinity College Dublin Colaboram com Universidades do Reino Unido e Suíça para Desenvolver Tecnologia de Luz em Escala de Chip, Aumentando a Eficiência de Comunicação em Data Centers e IA
2026-04-03
Equipe da USC desenvolve chip de memória de alta temperatura, resistente a mais de 700 graus Celsius
2026-04-02
Estudo RUBY do Hospital Infantil da Clínica Cleveland: Terapia de edição gênica atinge cura funcional para doença falciforme grave
2026-04-02
Equipa Espanhola e Americana Publica Método de Integração de Dados Multiómicos de Célula Única no "Genome Biology", Melhorando a Precisão na Identificação de Células Raras
2026-04-01
Universidade de Okayama, Japão, e Universidade de Pequim, China, Colaboram em Pesquisa sobre Cristais 2D Anisotrópicos para Realizar Ressonância Plasmônica Localizada Hiperbólica
2026-04-01