De acordo com pt.wedoany.com-Uma equipe de pesquisa do Instituto Internacional de Tecnologia da Informação de Hyderabad (IIIT-H) descobriu que as atuais câmeras de fiscalização de trânsito baseadas em IA apresentam falhas sistemáticas na detecção de motociclistas, cuja raiz está no formato das caixas delimitadoras usadas para identificar alvos. Para resolver esse problema, a equipe propôs uma caixa delimitadora trapezoidal, que elevou a precisão da detecção de capacetes de 66,25% para 97,08% e a precisão da detecção de sobrecarga de 36,70% para 78,34%.
Os sistemas tradicionais de detecção de objetos em visão computacional dependem de caixas delimitadoras retangulares, que são eficazes para veículos convencionais como carros e caminhões. No entanto, para motocicletas, especialmente quando observadas do ângulo de visão superior comum em câmeras de trânsito, o contorno combinado do motociclista e da motocicleta apresenta uma característica trapezoidal, com base larga e topo estreito. Ao usar caixas retangulares, se muito apertadas, cortam o guidão ou a cabeça do motociclista — áreas críticas para determinar o uso de capacete; se muito soltas, incorporam facilmente o fundo, fazendo com que o modelo confunda veículos adjacentes. Esse modo de falha é chamado de "falsa supressão não máxima" e é particularmente proeminente em cenários com alta densidade de motocicletas e trânsito caótico.
A equipe de pesquisa, liderada por Aman Goyal, inclui Dev Agarwal, Anbumani Subramanian, C.V. Jawahar, Ravi Kiran Sarvadevabhatla do IIIT-H, e Rohit Saluja do IIT Kharagpur e IIT Mandi. O estudo foi publicado no Workshop de Percepção em Ambientes Não Controlados da CVPR 2022, introduzindo um novo primitivo geométrico chamado "Limite de Instância de Condução Trapezoidal" para substituir as caixas retangulares. Esse trapézio é definido por quatro parâmetros de deslocamento, permitindo que seus limites se ajustem ao contorno físico real da motocicleta observada do ângulo de filmagem. Essa inovação recebeu uma patente dos EUA (USPTO US 12.315.264, concedida em maio de 2025) e é de propriedade do centro de pesquisa iHub-Data do IIIT Hyderabad.
O sistema foi treinado com uma versão estendida do Conjunto de Dados de Condução da Índia (IDD), anotado com três categorias: capacete usado, capacete não usado e limite de instância de condução trapezoidal. Para lidar com o problema de passageiros no banco traseiro estarem obstruídos, a equipe de pesquisa adaptou a técnica de "regressor amodal" da pesquisa de detecção de pedestres, aplicando-a pela primeira vez em um pipeline para motocicletas. Esse regressor pode gerar limites de previsão completos para a unidade motociclista-motocicleta, inferindo de forma confiável o número de passageiros mesmo quando parcialmente obstruídos visualmente. O treinamento também empregou uma abordagem de "aprendizagem curricular", lidando com problemas de sobreposição de categorias do mais fácil para o mais difícil.
O pipeline da equipe de pesquisa foi coberto pela mídia do setor e está atualmente sendo desenvolvido como parte do processo de emissão automatizada de multas para a polícia urbana indiana. O projeto Cidades Inteligentes da Índia já inclui mais de 100 cidades com Centros Integrados de Comando e Controle (ICCC), que são locais candidatos para implantação de sistemas automatizados de fiscalização de trânsito. De acordo com uma análise do Banco Mundial, acidentes rodoviários custam à Índia de 3% a 7% do seu PIB anualmente, e em 2022, o Banco Mundial comprometeu US$ 250 milhões especificamente para infraestrutura de segurança rodoviária na Índia.
A importância desta pesquisa vai além da Índia. O estudo aponta que os sistemas de visão computacional para gestão de trânsito global são construídos principalmente com base em estradas e padrões de trânsito ocidentais, enquanto padrões de trânsito de alta densidade e mistos são mais comuns em países em desenvolvimento ao redor do mundo. O trabalho subsequente da equipe está expandindo o sistema de câmeras fixas elevadas para câmeras de painel, com seu artigo de 2025 intitulado "DashCop" demonstrando a geração automatizada de multas eletrônicas baseada em vídeos de câmeras de painel, visando a fiscalização em toda a rede viária.
A equipe de pesquisa acredita que o gargalo de engenharia — tornar a detecção precisa o suficiente para ser confiável — foi resolvido para a detecção de infrações de motocicletas e cenários semelhantes de alta densidade. O que precisa ser explorado mais a fundo é como os quadros legais e regulatórios em torno de evidências geradas por IA evoluirão.
Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com









