Instituto de Pesquisa AIRI da Rússia desenvolve rede neural Genatator para anotação genética
2026-07-05 16:23
Favoritos

De acordo com pt.wedoany.com-Cientistas do Instituto de Pesquisa AIRI desenvolveram um modelo de rede neural chamado Genatator, capaz de construir mapas genéticos a partir de sequências de DNA e anotar genomas que carecem de dados biológicos detalhados. Após receber uma sequência de DNA, o modelo pode determinar os limites dos genes, identificar tipos de transcritos e reconstruir estruturas, distinguindo genes, éxons, íntrons e outras regiões.

Encontrar genes no DNA é extremamente difícil, pois os genes não possuem sinais universais de início e término; seus limites dependem de combinações de motivos curtos, cujo significado é determinado pelo contexto. Os genes podem se sobrepor e estar localizados em fitas diferentes do DNA.

O modelo de rede neural Genatator funciona em etapas. Primeiro, o modelo busca possíveis sítios de início e término de transcrição em ambas as fitas de DNA. Em seguida, outro modelo verifica se a região se assemelha a um gene. Após um classificador determinar o tipo de transcrito, um modelo de segmentação refina a estrutura do gene e identifica éxons e íntrons. Por fim, o algoritmo remove previsões suspeitas e gera a anotação final.

Este método difere das ferramentas tradicionais, pois o modelo não depende apenas de regras predefinidas. Ferramentas tradicionais utilizam características de genes codificadores de proteínas, como códons de início, códons de parada e sinais de splicing, mas apresentam desempenho inferior em regiões não traduzidas e RNAs longos não codificantes. O novo modelo é treinado em grandes conjuntos de dados genômicos e busca padrões diretamente no DNA.

Esta abordagem é particularmente importante para organismos não modelo. Humanos e camundongos possuem anotações detalhadas após décadas de pesquisa, mas a maioria dos organismos possui apenas montagens genômicas não anotadas. A análise mostra que, dos 4.582 genomas de mamíferos no banco de dados NCBI, apenas 166 possuem anotações, tornando difícil o uso de genomas não anotados para pesquisa.

O sistema é capaz de identificar dois tipos de genes: genes codificadores de proteínas e genes de RNA longo não codificante. Para ambos os tipos, o sistema determina éxons e íntrons; para genes codificadores de proteínas, também anota regiões CDS, bem como as regiões 5'-UTR e 3'-UTR.

O Genatator foi treinado em genes humanos e de 38 espécies de mamíferos, incluindo morsas e elefantes. O modelo também apresentou bom desempenho em outros organismos não utilizados no treinamento, incluindo a mosca-da-fruta Drosophila melanogaster, a planta Arabidopsis thaliana e a levedura Saccharomyces cerevisiae.

O modelo também descobriu algumas regiões raras chamadas "éxons tóxicos", cuja inclusão pode levar à degradação do RNA. Mesmo em anotações de alta qualidade, esses elementos raramente aparecem. Os desenvolvedores deram atenção especial à precisão dos limites dos genes, pois um erro de um nucleotídeo pode causar deslocamento do quadro de leitura, distorcendo a previsão de proteínas.

O Doutor em Biologia, Veniamin Fishman, pesquisador principal do Instituto de Pesquisa AIRI e do Instituto de Citologia e Genética da Filial Siberiana da Academia Russa de Ciências (ИЦиГ СО РАН), destacou que a velocidade de montagem de novos genomas supera a velocidade de anotação, e modelos como este podem se tornar o primeiro passo da análise, permitindo obter mapas de genes candidatos mais rapidamente para validação.

Para avaliar a qualidade, a equipe criou um ranking público, comparando o modelo com outras abordagens. Em vários indicadores, o modelo apresentou o melhor desempenho. O conjunto de dados de treinamento foi preparado por cientistas da Universidade de Ciência e Tecnologia "Sirius" (Научно-технологический университет «Сириус») e do Instituto de Citologia e Genética da Filial Siberiana da Academia Russa de Ciências (ИЦиГ СО РАН).

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com