No dia 23, a Divisão de Ciências da Vida, liderada pela BGI, e o Laboratório Zhijiang lançaram em conjunto o Genos, o primeiro modelo universal de base genômica implantável do mundo com dezenas de bilhões de parâmetros. Este modelo suporta análises de contexto ultralongo de até um milhão de pares de bases e alcança identificação precisa com resolução de base única.
O genoma humano consiste em 3 bilhões de pares de bases. O Projeto Genoma Humano decifrou a sequência, mas as funções específicas das bases dentro da sequência ainda requerem identificação e interpretação precisas.

Os modelos existentes são, em sua maioria, treinados em um ou dois genomas de referência, o que não reflete a diversidade dos recursos genéticos humanos. O Genos, no entanto, integra diversos recursos públicos confiáveis, incluindo o Consórcio de Referência do Pan-Genoma Humano (HPRC) e o Projeto de Mapeamento da Variação Estrutural do Genoma Humano (HGSVC), e pela primeira vez utiliza 636 genomas humanos de alta qualidade, telômero a telômero, de todo o mundo como dados de treinamento. Esses dados abrangem populações diversas em todo o mundo e facilitam uma compreensão mais abrangente da diversidade genética humana.
Em termos de arquitetura algorítmica, o Genos utiliza uma arquitetura "híbrida especialista" para coordenar com precisão o processamento de algoritmos "especialistas" altamente correlacionados. Isso reduz os custos de inferência e o consumo de recursos ao agregar dezenas de bilhões de parâmetros, tornando o modelo poderoso e fácil de usar. Os resultados dos testes mostram que o Genos atingiu uma taxa de precisão de 92% na interpretação de mutações patogênicas diretamente para aplicações clínicas. Quando combinado com modelos científicos fundamentais, a precisão atingiu 98,3%. Múltiplas avaliações abrangentes também demonstram que o Genos supera os modelos de última geração existentes.
Um representante do BGI Life Sciences Institute afirmou que o modelo Genos foi totalmente disponibilizado em código aberto em plataformas como HuggingFace e Moda, oferecendo versões com 1,2 bilhão e 10 bilhões de parâmetros para atender a diversas necessidades.









