Pesquisa do MIT: Uma abordagem "guiada" para redes neurais melhora o desempenho de arquiteturas "ineficazes"
2025-12-04 17:15
Fonte:MIT
Favoritos

Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT descobriram que um método de "orientação" baseado no alinhamento temporário entre redes neurais pode melhorar significativamente o desempenho de arquiteturas anteriormente consideradas inadequadas para tarefas modernas. O estudo mostra que muitas redes "ineficazes" podem simplesmente ter começado em pontos desfavoráveis, e uma orientação de curto prazo pode ajudá-las a aprender mais facilmente. Esta descoberta oferece uma nova abordagem para otimizar o desempenho de redes neurais.

O princípio de orientação torna redes originalmente não treináveis treináveis através da similaridade de representação.

O método de orientação proposto pela equipe de pesquisa transfere conhecimento estrutural diretamente, incentivando a rede-alvo a corresponder às representações internas da rede orientadora durante o treinamento. Diferente da destilação de conhecimento tradicional, este método não imita a saída do professor, mas aprende a maneira como a rede orientadora organiza a informação. Mesmo redes não treinadas contêm preferências de arquitetura transferíveis, e uma rede orientadora treinada pode ainda transmitir padrões de aprendizado. Vignesh Subramanian, doutorando do Departamento de Engenharia Elétrica e Ciência da Computação do MIT, afirmou: "Conseguimos usar a similaridade de representação para fazer essas redes tradicionalmente 'ruins' realmente funcionarem."

O estudo também comparou o método de orientação com a destilação de conhecimento. A destilação de conhecimento falha completamente quando a rede professora não é treinada, pois a saída não contém sinais significativos. Já o método de orientação ainda alcança melhorias significativas, pois utiliza as representações internas. Isso destaca os valiosos vieses de arquitetura codificados por redes não treinadas, que podem orientar outras redes a aprender efetivamente. Além disso, esta descoberta tem amplas implicações para a compreensão das arquiteturas de redes neurais; o sucesso ou fracasso depende mais da posição da rede no espaço de parâmetros do que dos dados específicos da tarefa. Ao se alinhar com uma rede orientadora, é possível distinguir a contribuição do viés de arquitetura e do conhecimento aprendido.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com
Inovações Tecnológicas
Investigadores da Chalmers University of Technology desenvolvem sistema gigante de superátomos para resolver o problema da descoerência na computação quântica
2026-04-14
Investigação da Universidade de Stanford Explora o Papel e o Impacto da Inteligência Artificial na Revisão por Pares Científica
2026-04-13
MIT lança sistema de software Sandook para melhorar o desempenho de pools de SSDs em data centers
2026-04-09
Estudo colaborativo da Universidade de Michigan (EUA) e da Universidade de Augsburg (Alemanha): Substituir um único átomo reduz o fluxo de calor pela metade em uma molécula
2026-04-08
Equipe de pesquisa alemã descobre mecanismo pelo qual a proteína Fis regula a virulência de patógeno diarreico
2026-04-03
Pesquisadores do Trinity College Dublin Colaboram com Universidades do Reino Unido e Suíça para Desenvolver Tecnologia de Luz em Escala de Chip, Aumentando a Eficiência de Comunicação em Data Centers e IA
2026-04-03
Equipe da USC desenvolve chip de memória de alta temperatura, resistente a mais de 700 graus Celsius
2026-04-02
Estudo RUBY do Hospital Infantil da Clínica Cleveland: Terapia de edição gênica atinge cura funcional para doença falciforme grave
2026-04-02
Equipa Espanhola e Americana Publica Método de Integração de Dados Multiómicos de Célula Única no "Genome Biology", Melhorando a Precisão na Identificação de Células Raras
2026-04-01
Universidade de Okayama, Japão, e Universidade de Pequim, China, Colaboram em Pesquisa sobre Cristais 2D Anisotrópicos para Realizar Ressonância Plasmônica Localizada Hiperbólica
2026-04-01