Após mais de uma década de pesquisa, uma equipe do MIT desenvolveu uma técnica que permite que robôs "vejam através" de obstáculos e localizem itens ocultos. O método depende de sinais sem fio que penetram superfícies e refletem em objetos escondidos. Recentemente, os cientistas introduziram um modelo de inteligência artificial generativa que efetivamente resolve um gargalo crítico que há muito limitava a precisão.

Esta abordagem inovadora realiza uma reconstrução parcial de alvos ocultos usando os sinais sem fio refletidos e, em seguida, emprega um modelo de IA generativa especialmente treinado para preencher as partes ausentes, gerando assim formas mais precisas. Isso tem o potencial de aumentar a confiabilidade na preensão e manipulação de objetos ocultos por robôs. Além disso, a equipe expandiu a funcionalidade do sistema, utilizando sinais sem fio de um radar fixo refletidos por uma pessoa em movimento para reconstruir com precisão cenas internas completas, incluindo todos os móveis.
A técnica evita a necessidade de instalar sensores sem fio em robôs móveis para escanear o ambiente e, em comparação com soluções comuns de câmera, oferece melhor proteção à privacidade das pessoas. O professor Fadel Adib afirma: "Estamos desenvolvendo modelos de IA generativa para compreender reflexos sem fio. Isso não é apenas um salto em capacidade – de preencher lacunas para interpretar reflexos e reconstruir cenas inteiras – mas também abre um novo caminho para usar a IA para finalmente desbloquear a visão sem fio."
Na implementação, a equipe utiliza sinais de ondas milimétricas, que conseguem penetrar materiais como drywall e plástico. No entanto, a natureza especular (reflexão espelhada) das ondas milimétricas faz com que o sinal seja refletido em apenas uma direção, deixando muitas áreas dos objetos não capturadas pelos sensores. Para contornar isso, os pesquisadores ajustaram um grande conjunto de dados de visão computacional para simular as propriedades de reflexão das ondas milimétricas, criando dados sintéticos para treinar o modelo de IA generativa.
O sistema resultante, chamado Wave-Former, é capaz de reconstruir fielmente cerca de 70 objetos do dia a dia, com uma taxa de precisão quase 20% maior do que as linhas de base mais avançadas. Paralelamente, o sistema expandido RISE utiliza reflexos de múltiplos caminhos (incluindo "sinais fantasmas") gerados pelo movimento humano para reconstruir uma sala inteira, com uma precisão aproximadamente duas vezes maior do que as técnicas existentes. Trabalhos futuros focarão em melhorar os detalhes da reconstrução e explorar a construção de grandes modelos de base para sinais sem fio.
Esses avanços têm aplicações potenciais em robôs de armazém para verificar itens embalados e reduzir desperdícios por devoluções, bem como em robôs domésticos inteligentes para compreender a localização das pessoas e melhorar a segurança da interação. O artigo relacionado foi publicado no servidor de pré-impressão arXiv e será formalmente apresentado na conferência IEEE sobre Visão Computacional e Reconhecimento de Padrões (CVPR).
Detalhes da publicação: Autor: Adam Zewe, Instituto de Tecnologia de Massachusetts; Título: "Generative AI improves a wireless vision system that sees through obstructions"; Publicado em: arXiv (2025).









