Nova descoberta de pesquisa no Instituto Nacional de Ciência e Tecnologia de Ulsan, na Coreia do Sul: melhora o desempenho de modelos generativos de IA
2025-11-07 16:54
Fonte:Instituto Nacional de Ciência e Tecnologia de Ulsan
Favoritos

Quando os usuários geram imagens no estilo Ghibli usando o ChatGPT, as imagens reais são geradas pelo DALL-E. Embora essa ferramenta baseada em difusão possa produzir imagens impressionantes, ela apresenta limitações, como erros ocasionais, como mãos com três dedos ou distorções faciais, e enfrenta desafios ao ser executada em dispositivos com recursos computacionais limitados. Uma equipe de pesquisa liderada pelo Professor Yoo Jae-jun e pelo Professor Yoon Sung-hwan, da Escola de Pós-Graduação em Inteligência Artificial da Universidade de Ciência e Tecnologia de Ulsan (UNIST), propõe novos princípios de design de IA generativa para solucionar esses problemas.

1 / 1理论分析的概念图。定理 1(扩散模型的推论 1)将参数空间中的扰动转化为扰动分布的集合。定理 2(扩散模型的推论 2)表明平坦的极小值能够增强模型对分布间隙的鲁棒性。

1/1 Diagrama conceitual da análise teórica. O Teorema 1 (Corolário 1 do modelo de difusão) transforma perturbações no espaço de parâmetros em um conjunto de distribuições de perturbação. O Teorema 2 (Corolário 2 do modelo de difusão) mostra que mínimos planos aumentam a robustez do modelo a lacunas de distribuição.

Modelos de difusão são amplamente utilizados em aplicações populares de IA, como DALL-E e difusão estável, capazes de realizar tarefas como transferência de estilo e criação de desenhos animados. No entanto, a implementação enfrenta desafios como acúmulo de erros, degradação de desempenho e vulnerabilidade a ataques adversários. A equipe de pesquisa descobriu que esses problemas decorrem da capacidade limitada de generalização do modelo, ou seja, da capacidade insuficiente de operar de forma confiável com novos dados ou em ambientes desconhecidos. Para solucionar esse problema, a equipe de pesquisa propôs direcionar o processo de treinamento para "mínimos planos", regiões localizadas na superfície da função de perda do modelo. Essas superfícies amplas e com inclinação suave ajudam o modelo a manter um desempenho estável e confiável mesmo sob pequenas perturbações ou ruídos. Entre os diversos algoritmos para encontrar mínimos planos, o algoritmo de Minimização Sensível à Nitidez (SAM) apresentou os melhores resultados. Os modelos treinados com SAM exibiram menor acúmulo de erros em tarefas de geração rápida, saída de maior qualidade após a compressão e um aumento de sete vezes na resistência a ataques adversários, aprimorando significativamente a robustez do modelo.

A equipe de pesquisa destaca que o foco em mínimos planos oferece uma solução unificada para desafios como acúmulo de erros, erros de quantização e vulnerabilidades a ataques adversários. Sua estrutura não apenas melhora a qualidade da imagem, mas também permite o desenvolvimento de sistemas de IA generativa confiáveis ​​e totalmente funcionais, efetivamente aplicáveis ​​a diversos setores e cenários do mundo real, e treinando modelos em larga escala de forma eficiente, mesmo com dados limitados.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com
Inovações Tecnológicas
Investigadores da Chalmers University of Technology desenvolvem sistema gigante de superátomos para resolver o problema da descoerência na computação quântica
2026-04-14
Investigação da Universidade de Stanford Explora o Papel e o Impacto da Inteligência Artificial na Revisão por Pares Científica
2026-04-13
MIT lança sistema de software Sandook para melhorar o desempenho de pools de SSDs em data centers
2026-04-09
Estudo colaborativo da Universidade de Michigan (EUA) e da Universidade de Augsburg (Alemanha): Substituir um único átomo reduz o fluxo de calor pela metade em uma molécula
2026-04-08
Equipe de pesquisa alemã descobre mecanismo pelo qual a proteína Fis regula a virulência de patógeno diarreico
2026-04-03
Pesquisadores do Trinity College Dublin Colaboram com Universidades do Reino Unido e Suíça para Desenvolver Tecnologia de Luz em Escala de Chip, Aumentando a Eficiência de Comunicação em Data Centers e IA
2026-04-03
Equipe da USC desenvolve chip de memória de alta temperatura, resistente a mais de 700 graus Celsius
2026-04-02
Estudo RUBY do Hospital Infantil da Clínica Cleveland: Terapia de edição gênica atinge cura funcional para doença falciforme grave
2026-04-02
Equipa Espanhola e Americana Publica Método de Integração de Dados Multiómicos de Célula Única no "Genome Biology", Melhorando a Precisão na Identificação de Células Raras
2026-04-01
Universidade de Okayama, Japão, e Universidade de Pequim, China, Colaboram em Pesquisa sobre Cristais 2D Anisotrópicos para Realizar Ressonância Plasmônica Localizada Hiperbólica
2026-04-01