As complexas dobras e sulcos na superfície do córtex cerebral, para serem reconstruídos em tempo real em um computador, antes exigiam equipamentos de grande porte e caros para processamento offline prolongado. Agora, essa situação foi transformada por um chip do tamanho de uma unha.
A equipe do pesquisador do New Cornerstone, Professor Yang Yuchao da Faculdade de Circuitos Integrados da Universidade de Pequim, em colaboração com a equipe do Pesquisador Song Zhitang do Instituto de Microsistemas e Tecnologia da Informação de Xangai da Academia Chinesa de Ciências, desenvolveu com sucesso o primeiro chip de sistema neurodinâmico do mundo baseado em memristor de mudança de fase, comprimindo pela primeira vez o atraso de passo único desse tipo de operação complexa para 2,12 milissegundos, alcançando uma aceleração de 50 a 478 vezes em tarefas como reconstrução cortical em comparação com as unidades de processamento gráfico (GPUs) atuais mais avançadas, rompendo de uma só vez o gargalo de computação em tempo real que limitava a neurodinâmica por meio século. Os resultados relevantes foram publicados na revista Science na madrugada do dia 3.
Yang Yuchao disse aos repórteres que, para que as máquinas modelem e compreendam o mundo físico em tempo real como o cérebro, é necessário um "sistema neurodinâmico" que combine redes neurais com equações diferenciais. Ele pode reconstruir estruturas cerebrais tridimensionais suaves e precisas a partir de dados incompletos e ruidosos, com enorme potencial de aplicação.
No entanto, a arquitetura computacional tradicional tem um gargalo central: a separação entre armazenamento e computação. Durante o processo de solução, uma enorme quantidade de variáveis intermediárias viaja repetidamente entre a memória e o processador, como uma enorme fábrica de dados, onde muito tempo é desperdiçado no transporte, resultando não apenas em grande latência, mas também em alto consumo de energia.
Diante desse desafio, a equipe de pesquisa encontrou a resposta para a solução nas próprias características físicas do memristor. Eles utilizaram o fenômeno único de "deriva de condutância" dos dispositivos de memória de mudança de fase — dentro de uma certa janela de tempo, sua variação de condutância é previsível e pode ser controlada com precisão.
Com base nisso, a equipe propôs um novo paradigma de "computação controlada na memória", codificando diretamente a busca adaptativa do passo, que é a parte mais demorada na solução de sistemas dinâmicos, como um processo de evolução física da condutância do dispositivo, realizando a computação localmente dentro da unidade de armazenamento. Em termos simples, as operações que antes exigiam execução repetida por circuitos digitais complexos, acesso ao cache e transferência de dados, agora são delegadas às leis físicas do próprio dispositivo para "executar".
Mais notável ainda, a equipe também mapeou os pesos da rede neural para os estados de condutância de múltiplos níveis da memória de mudança de fase, realizando simultaneamente operações de multiplicação e soma de matrizes no mesmo arranjo. As duas principais tarefas computacionais foram assim integradas em um arranjo de memória e computação com área total de apenas 0,28 mm². Este chip, fabricado com processo de 40 nanômetros, opera a uma frequência de 50 megahertz, requer apenas 9 estágios de pipeline para uma única integração de passo, alcançando finalmente uma latência de iteração única de 2,12 milissegundos, levando o hardware neurodinâmico para a era dos milissegundos pela primeira vez.
"O desempenho é animador." Yang Yuchao afirmou que, sob a mesma carga computacional, este chip é 3,82 a 36,27 vezes mais rápido que os aceleradores especializados mais avançados atuais, com uma redução de consumo de energia de 11,75 a 24,73 vezes; em tarefas de reconstrução de alta fidelidade da superfície cortical, ele é até 478,18 vezes mais rápido que a GPU NVIDIA A100. A malha cortical reconstruída é suave e topologicamente consistente, capaz de descrever com precisão as complexas estruturas de dobras e suprimir eficazmente artefatos e defeitos de auto-interseção comuns em métodos tradicionais.
Yang Yuchao disse que esse avanço abre um novo espaço de imaginação para interfaces cérebro-máquina e diagnóstico e tratamento de doenças cerebrais. No futuro, gêmeos digitais cerebrais individualizados e dinâmicos se tornarão possíveis, e a navegação neural intraoperatória, a triagem precoce da doença de Alzheimer e intervenções personalizadas terão uma base de hardware em tempo real.
O que é "computação controlada na memória"
Se compararmos um computador tradicional a um escritório, o processador é o "funcionário de cálculo" sentado no centro, e a memória são os "armários de arquivos" nas paredes. A cada cálculo, o funcionário precisa se levantar para buscar os dados, calcular e depois voltar — o tempo é gasto no trajeto. Este é o famoso "gargalo de von Neumann": a separação entre armazenamento e computação, onde o transporte de dados prejudica a eficiência.
A ideia da "computação na memória" é direta: fazer com que o próprio armário de arquivos aprenda a fazer contas. Os dados não precisam mais ser transportados, mas sim calculados localmente dentro da unidade de armazenamento. Isso parece perfeito, mas sua implementação é extremamente desafiadora — as unidades de armazenamento são naturalmente projetadas apenas para "lembrar", fazê-las "calcular" ao mesmo tempo, e com precisão e estabilidade, já é um grande desafio.
O maior problema reside no "controle". O cálculo não é como simples adição ou subtração; muitas tarefas exigem ajustes dinâmicos e julgamento em tempo real. Como fazer com que um conjunto de dispositivos físicos tenha a capacidade de "se adaptar à situação" é o gargalo chave para que a computação na memória se torne realidade.
O ponto de ruptura veio de uma ideia "contra-intuitiva à ciência": utilizar a característica de que a condutância do dispositivo deriva de forma regular, algo antes visto como um "defeito". Se sua trajetória de mudança for compreendida, essa deriva pode ser domesticada em capacidade computacional — não mais usando circuitos digitais para leitura, escrita e comparação repetidas, mas permitindo que o próprio processo físico realize a operação.
Este é o núcleo da "computação controlada na memória": fazer com que a unidade de armazenamento, enquanto "lembra", também "calcule" da maneira definida pelo projetista e dentro de limites controláveis. Armazenar é calcular, e todo o processo é precisamente controlável. O chip desenvolvido com base nesse paradigma pode comprimir operações complexas para o nível de milissegundos, aumentando a eficiência energética dezenas ou até centenas de vezes.
