A Lei de Inovação da Universidade da Califórnia reduz o custo dos estudos de mestrado em Direito (LLM) e promove a adoção generalizada da tecnologia de inteligência artificial
2025-10-29 17:23
Fonte:Universidade da Califórnia
Favoritos

Uma equipe de engenheiros da Universidade da Califórnia, San Diego (UCSD), alcançou recentemente um avanço significativo, desenvolvendo um novo método que permite que grandes modelos de linguagem (LLMs) aprendam novas tarefas com menos dados e recursos computacionais. Os modelos LLM normalmente consistem em bilhões de parâmetros que determinam como eles processam informações. Os métodos tradicionais de ajuste fino exigem o ajuste de todos os parâmetros, o que é custoso e propenso a sobreajuste, afetando o desempenho do modelo em novos dados.

1 / 1BiDoRA概述。BiDoRA使用BLO框架执行PEFT。在底层,BiDoRA利用下游数据集的训练集学习更新矩阵的方向分量∆V。在上层,BiDoRA利用数据集的验证集,结合底层优化得到的∆V,对幅度分量m进行优化。确定最优幅度后,方向分量在训练集和验证集的组合上进行进一步微调,以最大化整体性能。

Para solucionar esse problema, os engenheiros da UCSD propuseram uma nova estratégia inteligente. Esse método não reconfigura todo o modelo, mas sim atualiza com precisão as partes mais críticas. Comparado aos métodos de ajuste fino existentes, esse método é menos custoso, mais flexível e melhor em generalizar o conhecimento aprendido para novos contextos.

A equipe de pesquisa demonstrou que, mesmo com dados de treinamento extremamente limitados, esse método pode ajustar com eficácia um modelo de linguagem de proteínas usado para prever propriedades de proteínas. Por exemplo, na previsão da capacidade de um peptídeo atravessar a barreira hematoencefálica, o novo método supera os métodos tradicionais em precisão, apesar de uma redução significativa no número de parâmetros (326 vezes). Na previsão da estabilidade térmica de proteínas, com uma redução de 408 vezes no número de parâmetros, seu desempenho é comparável ao de um método totalmente ajustado. Pengtao Xie, professor de Engenharia Elétrica e de Computação na Escola de Engenharia Jacobs da UC San Diego, afirmou: "Com nosso método, pequenos laboratórios e startups podem adaptar grandes modelos de IA às suas necessidades sem a necessidade de supercomputadores ou grandes conjuntos de dados."

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com
Inovações Tecnológicas
Investigadores da Chalmers University of Technology desenvolvem sistema gigante de superátomos para resolver o problema da descoerência na computação quântica
2026-04-14
Investigação da Universidade de Stanford Explora o Papel e o Impacto da Inteligência Artificial na Revisão por Pares Científica
2026-04-13
MIT lança sistema de software Sandook para melhorar o desempenho de pools de SSDs em data centers
2026-04-09
Estudo colaborativo da Universidade de Michigan (EUA) e da Universidade de Augsburg (Alemanha): Substituir um único átomo reduz o fluxo de calor pela metade em uma molécula
2026-04-08
Equipe de pesquisa alemã descobre mecanismo pelo qual a proteína Fis regula a virulência de patógeno diarreico
2026-04-03
Pesquisadores do Trinity College Dublin Colaboram com Universidades do Reino Unido e Suíça para Desenvolver Tecnologia de Luz em Escala de Chip, Aumentando a Eficiência de Comunicação em Data Centers e IA
2026-04-03
Equipe da USC desenvolve chip de memória de alta temperatura, resistente a mais de 700 graus Celsius
2026-04-02
Estudo RUBY do Hospital Infantil da Clínica Cleveland: Terapia de edição gênica atinge cura funcional para doença falciforme grave
2026-04-02
Equipa Espanhola e Americana Publica Método de Integração de Dados Multiómicos de Célula Única no "Genome Biology", Melhorando a Precisão na Identificação de Células Raras
2026-04-01
Universidade de Okayama, Japão, e Universidade de Pequim, China, Colaboram em Pesquisa sobre Cristais 2D Anisotrópicos para Realizar Ressonância Plasmônica Localizada Hiperbólica
2026-04-01