Um novo modelo da Universidade de Liverpool, no Reino Unido: Simulação da integração visual e auditiva humana, impulsionando o desenvolvimento da inteligência artificial Apresentação da Tecnologia_Aplicação da Tecnologia

Um novo modelo da Universidade de Liverpool, no Reino Unido: Simulação da integração visual e auditiva humana, impulsionando o desenvolvimento da inteligência artificial

2025-11-05 16:15

Favoritos

Um novo modelo computacional desenvolvido pela Universidade de Liverpool integra de forma singular visão e audição para simular a percepção humana. Inspirado na biologia e baseado no funcionamento do cérebro de insetos, e aprimorado pelo Dr. Cesare Paris, professor sênior de psicologia, o modelo consegue processar sinais audiovisuais reais, como vídeo e som, em vez de depender de parâmetros abstratos. Este trabalho inovador, publicado na revista *eLife*, representa um novo avanço nos campos da inteligência artificial e da percepção de máquinas.

对腹语表演者的反应模型。模型反应围绕着表演者聚集，重现了感知声源定位的错觉性偏移。

O Dr. Paris destaca que, embora a pesquisa sobre percepção audiovisual continue há décadas, os modelos existentes têm dificuldade em lidar com sinais audiovisuais reais, o que limita suas aplicações. O novo modelo, construído com base no princípio da detecção de correlação, reproduziu com sucesso os resultados de 69 experimentos envolvendo humanos, macacos e camundongos, simulando conjuntos de detectores, tornando-se a maior simulação já realizada na área. Este modelo não só reproduz o comportamento de diferentes espécies e supera os principais modelos bayesianos de inferência causal, como também consegue prever o ponto de fixação do olhar de humanos assistindo a filmes audiovisuais, funcionando como um "modelo de saliência" leve.

"A evolução resolveu o problema da coordenação entre som e visão por meio de computação simples e geral, uma abordagem computacional que pode ser escalada para diferentes espécies e ambientes", enfatizou o Dr. Paris. Ele acrescentou que o novo modelo processa diretamente sinais audiovisuais brutos, é aplicável a qualquer material do mundo real e suas aplicações vão além da neurociência. Comparado aos modelos de saliência audiovisual existentes, que dependem de redes massivas e enormes conjuntos de dados rotulados para treinamento, o novo modelo é leve, eficiente e não requer treinamento, tornando-o um forte candidato para aplicações de próxima geração. Paris concluiu que este modelo, que teve início com pesquisas sobre a visão de movimento em insetos, agora pode explicar como o cérebro integra som e visão, fornecendo um novo modelo para pesquisas em neurociência e inteligência artificial.

Reino Unido

Indústrias Emergentes Estratégicas Tecnologia da Informação de Nova Geração

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com

Anterior：O Observatório de Mundos Habitáveis planeja adicionar instrumentos sofisticados para aprimorar sua capacidade de buscar planetas semelhantes à Terra

Próximo：Cientistas alemães desenvolvem "superliga" que rompe os limites das aplicações de materiais em altas temperaturas