Um novo modelo computacional desenvolvido pela Universidade de Liverpool integra de forma singular visão e audição para simular a percepção humana. Inspirado na biologia e baseado no funcionamento do cérebro de insetos, e aprimorado pelo Dr. Cesare Paris, professor sênior de psicologia, o modelo consegue processar sinais audiovisuais reais, como vídeo e som, em vez de depender de parâmetros abstratos. Este trabalho inovador, publicado na revista *eLife*, representa um novo avanço nos campos da inteligência artificial e da percepção de máquinas.

O Dr. Paris destaca que, embora a pesquisa sobre percepção audiovisual continue há décadas, os modelos existentes têm dificuldade em lidar com sinais audiovisuais reais, o que limita suas aplicações. O novo modelo, construído com base no princípio da detecção de correlação, reproduziu com sucesso os resultados de 69 experimentos envolvendo humanos, macacos e camundongos, simulando conjuntos de detectores, tornando-se a maior simulação já realizada na área. Este modelo não só reproduz o comportamento de diferentes espécies e supera os principais modelos bayesianos de inferência causal, como também consegue prever o ponto de fixação do olhar de humanos assistindo a filmes audiovisuais, funcionando como um "modelo de saliência" leve.
"A evolução resolveu o problema da coordenação entre som e visão por meio de computação simples e geral, uma abordagem computacional que pode ser escalada para diferentes espécies e ambientes", enfatizou o Dr. Paris. Ele acrescentou que o novo modelo processa diretamente sinais audiovisuais brutos, é aplicável a qualquer material do mundo real e suas aplicações vão além da neurociência. Comparado aos modelos de saliência audiovisual existentes, que dependem de redes massivas e enormes conjuntos de dados rotulados para treinamento, o novo modelo é leve, eficiente e não requer treinamento, tornando-o um forte candidato para aplicações de próxima geração. Paris concluiu que este modelo, que teve início com pesquisas sobre a visão de movimento em insetos, agora pode explicar como o cérebro integra som e visão, fornecendo um novo modelo para pesquisas em neurociência e inteligência artificial.














