Silft (scale invariant lowframerate tracking)
Description
Com o aumento da urbanização, a mobilidade se torna um tema central em grandes cidades, onde as pessoas passam em média 37 dias por ano no trânsito, afetando assim, a qualidade de vida e eficiência dos negócios. Vias urbanas e rodovias estão sendo instrumentadas com câmeras, radares e lombadas eletrônicas, aumentam o controle e a segurança de todos. No entanto, as informações das instrumentações ainda são pouco utilizadas para gerar conhecimento da utilização das vias e impactar decisões futuras de investimento em infraestrutura. As imagens das câmeras utilizadas para a vigilância de vias apresentam baixa resolução, alto nível de ruído e grande variabilidade de escala de objetos, tornando as tarefas de detecção e rastreamento de objetos em tempo real desafiadores para os trabalhos publicados até o momento. Este trabalho propõe a arquitetura Scale Invariant Low Framerate Tracking (SILFT), que utiliza a fusão da metodologia de fluxo ótico denso com um modelo de detecção, ambos baseados em redes neurais, além de um novo banco de dados de imagens de rodovias Brasileiras. A SILFT obteve precisão média para detecção de 65;97 %, superando os modelos You Only Look Once (YOLO) e Faster Region based Convolutional Neural Network (FASTER R-CNN) no banco de dados proposto. Para a tarefa de rastreamento a SILFT superou em três vezes a performance do rastreador por intersecção sobre união no banco de dados proposto.With the increase in urbanization, mobility has become a central theme in large cities, where people spend an average of 37 days a year in traffic, thus affecting the quality of life and business efficiency. Urban roads and highways are being instrumented with cameras, radars and electronic speed bumps, increasing the control and security of all. However, instrumentation information is still underused to generate knowledge of the use of roads and impact future infrastructure investment decisions. The images of the cameras used for the surveillance of roads present low resolution, high noise level and great variability of scale of objects, making the tasks of detecting and tracking objects in real time challenging for the works published so far. This work proposes the SILFT architecture, which uses the fusion of the dense optical flow method with a detection model, both based on neural networks, in addition to a new database of images of Brazilian highways. SILFT obtained average accuracy for detection of 65.97%, surpassing the YOLO e FASTER R-CNN models in the proposed database. For the tracking task, SILFT surpassed performance by three times when compared to the intersection voer union in the proposed database.