Caixas delimitadoras trapezoidais de equipe indiana elevam precisão de detecção de capacetes para 97% e sobrecarga para 78%_Boletins

Caixas delimitadoras trapezoidais de equipe indiana elevam precisão de detecção de capacetes para 97% e sobrecarga para 78%

2026-06-15 14:51

Favoritos

De acordo com pt.wedoany.com-Uma equipe de pesquisa do Instituto Internacional de Tecnologia da Informação de Hyderabad (IIIT-H) descobriu que as atuais câmeras de fiscalização de trânsito baseadas em IA apresentam falhas sistemáticas na detecção de motociclistas, cuja raiz está no formato das caixas delimitadoras usadas para identificar alvos. Para resolver esse problema, a equipe propôs uma caixa delimitadora trapezoidal, que elevou a precisão da detecção de capacetes de 66,25% para 97,08% e a precisão da detecção de sobrecarga de 36,70% para 78,34%.

Os sistemas tradicionais de detecção de objetos em visão computacional dependem de caixas delimitadoras retangulares, que são eficazes para veículos convencionais como carros e caminhões. No entanto, para motocicletas, especialmente quando observadas do ângulo de visão superior comum em câmeras de trânsito, o contorno combinado do motociclista e da motocicleta apresenta uma característica trapezoidal, com base larga e topo estreito. Ao usar caixas retangulares, se muito apertadas, cortam o guidão ou a cabeça do motociclista — áreas críticas para determinar o uso de capacete; se muito soltas, incorporam facilmente o fundo, fazendo com que o modelo confunda veículos adjacentes. Esse modo de falha é chamado de "falsa supressão não máxima" e é particularmente proeminente em cenários com alta densidade de motocicletas e trânsito caótico.

Imagem de câmera de vigilância de rua de motociclistas em estradas urbanas indianas, com caixas de detecção de visão computacional destacando em laranja as áreas do motociclista e do capacete.

A equipe de pesquisa, liderada por Aman Goyal, inclui Dev Agarwal, Anbumani Subramanian, C.V. Jawahar, Ravi Kiran Sarvadevabhatla do IIIT-H, e Rohit Saluja do IIT Kharagpur e IIT Mandi. O estudo foi publicado no Workshop de Percepção em Ambientes Não Controlados da CVPR 2022, introduzindo um novo primitivo geométrico chamado "Limite de Instância de Condução Trapezoidal" para substituir as caixas retangulares. Esse trapézio é definido por quatro parâmetros de deslocamento, permitindo que seus limites se ajustem ao contorno físico real da motocicleta observada do ângulo de filmagem. Essa inovação recebeu uma patente dos EUA (USPTO US 12.315.264, concedida em maio de 2025) e é de propriedade do centro de pesquisa iHub-Data do IIIT Hyderabad.

O sistema foi treinado com uma versão estendida do Conjunto de Dados de Condução da Índia (IDD), anotado com três categorias: capacete usado, capacete não usado e limite de instância de condução trapezoidal. Para lidar com o problema de passageiros no banco traseiro estarem obstruídos, a equipe de pesquisa adaptou a técnica de "regressor amodal" da pesquisa de detecção de pedestres, aplicando-a pela primeira vez em um pipeline para motocicletas. Esse regressor pode gerar limites de previsão completos para a unidade motociclista-motocicleta, inferindo de forma confiável o número de passageiros mesmo quando parcialmente obstruídos visualmente. O treinamento também empregou uma abordagem de "aprendizagem curricular", lidando com problemas de sobreposição de categorias do mais fácil para o mais difícil.

Imagem de câmera de visão traseira de rua de motociclistas, com caixas delimitadoras roxas, amarelas, azuis e vermelhas sobrepostas destacando o motociclista e a cabeça descoberta detectada pelo sistema de visão computacional.

O pipeline da equipe de pesquisa foi coberto pela mídia do setor e está atualmente sendo desenvolvido como parte do processo de emissão automatizada de multas para a polícia urbana indiana. O projeto Cidades Inteligentes da Índia já inclui mais de 100 cidades com Centros Integrados de Comando e Controle (ICCC), que são locais candidatos para implantação de sistemas automatizados de fiscalização de trânsito. De acordo com uma análise do Banco Mundial, acidentes rodoviários custam à Índia de 3% a 7% do seu PIB anualmente, e em 2022, o Banco Mundial comprometeu US$ 250 milhões especificamente para infraestrutura de segurança rodoviária na Índia.

Diagrama: um motociclista com uma estrutura de detecção geométrica sobreposta, marcando os cantos da caixa delimitadora O1, O2, O3, O4, coordenadas centrais (X,Y) e medição de largura W, com linhas de limite amarelas e roxas exibidas.

A importância desta pesquisa vai além da Índia. O estudo aponta que os sistemas de visão computacional para gestão de trânsito global são construídos principalmente com base em estradas e padrões de trânsito ocidentais, enquanto padrões de trânsito de alta densidade e mistos são mais comuns em países em desenvolvimento ao redor do mundo. O trabalho subsequente da equipe está expandindo o sistema de câmeras fixas elevadas para câmeras de painel, com seu artigo de 2025 intitulado "DashCop" demonstrando a geração automatizada de multas eletrônicas baseada em vídeos de câmeras de painel, visando a fiscalização em toda a rede viária.

Imagem de câmera de vigilância de rua: três pessoas em uma motocicleta, com uma caixa delimitadora ciano destacando o trio, todos sem capacete.

A equipe de pesquisa acredita que o gargalo de engenharia — tornar a detecção precisa o suficiente para ser confiável — foi resolvido para a detecção de infrações de motocicletas e cenários semelhantes de alta densidade. O que precisa ser explorado mais a fundo é como os quadros legais e regulatórios em torno de evidências geradas por IA evoluirão.

Imagem de câmera de visão traseira de rua: dois motociclistas, com uma caixa delimitadora laranja envolvendo ambos, e uma caixa vermelha destacando a cabeça descoberta do passageiro traseiro, enquanto o motociclista usa capacete.

Imagem de câmera de vigilância de rua com pouca luz de trânsito misto pesado em estradas indianas ao entardecer, com caixas de detecção vermelhas sobrepostas nos motociclistas e suas posições de cabeça.

Imagem de câmera de estrada: dois motociclistas em uma motocicleta passando sob uma passarela, com caixas de detecção laranja e vermelhas destacando os motociclistas e suas cabeças desprotegidas.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com

Índia