Segmentação de imagens com baixa profundidade de campo para aplicações em tempo real
Description
Com o objetivo de tornar dispositivos parcial ou completamente autônomos, hoje é imperativo extrair informações relevantes de uma vasta quantidade de dados disponíveis e com recursos computacionais adequados para operação em tempo real. Nos últimos anos, se tornou comum o processamento de imagens como uma solução possível para esse problema. Além disso, o uso de análise de imagens imita em partes a referência de sucesso em muitos casos práticos: a visão humana. Reconhecimento de imagens pode ser usado com altas taxas de acurácia quando o objeto de interesse ou o ambiente são bem conhecidos. Porém, em ambientes pouco controláveis, como espaços abertos urbanos, onde existe uma grande quantidade e variedade de artefatos e estímulos (informação), a separação ou segmentação do objeto de interesse (foreground) do restante da imagem background) é ainda uma ação desafiadora cientificamente. Uma forma possível de abordar esse problema é por meio de alterações na forma de captura das imagens, possibilitando que mais informação relevante esteja disponível para os algoritmos de segmentação. Uma abordagem atual é o uso de imagens com baixa profundidade de campo, que, analogamente à percepção humana, pode discriminar o objeto de interesse do restante da cena através de uma parte principal de atenção visual (foco). Essa dissertação propõe o uso de duas imagens para análise, sendo uma delas com baixa profundidade de campo (pequena região em foco) e a outra com alta profundidade de campo (região maior em foco). Neste contexto, descreve-se e implementa-se uma nova técnica para segmentação de imagens, com resultados promissores de acurácia e tempo de processamento, sobressaindo-se às demais técnicas de segmentação baseadas em foco já existentes e discutidas ao longo do trabalho.In order to make devices partially or completely autonomous, it is imperative nowadays to extract relevant information from a large set of data available and using adequate computational resources for real-time operation. In the last years, it has become common to use images processing as a feasible solution to this problem. Additionally, the use of image analysis imitates the successful reference: the human vision. Image recognition can be used with high accuracy rates when the object of interest or the surrounding environment are well known. However, for the opposite situation, like open urban spaces, where a large number visual artifacts and stimuli (information) from many sorts are present, the segmentation of the object of interest (foreground) from the rest of the scene (background) is a challenging issue. One possible way to tackle this problem is changing how images are captured, increasing the quantity of relevant information in an image for the segmentation algorithms. A feasible approach is using low-depth of field images, which, analogous to the human vision, can discriminate the object of interest from the rest of the scene through a limitation of image elements having visual attention (focus). This dissertation proposes the use of two image for the analysis: the first of with low-depth of field (fewer elements into focus) and the other one with a high depth of field (more elements into focus). In this context, a new image segmentation method for focused elements is described and implemented, having promising results for both accuracy and processing time, over standing the other existing focus-based segmentation methods that were discussed along this work.