Análise da influência de características visuais na detecção automática de foco ocular humano
Descrição
O foco ocular humano é uma das tarefas mais importantes nos processos cognitivos de interpretação de cenas. Na última década, surgiram vários métodos que objetivam predizer automaticamente os pontos de fixação do olhar humano. entretanto, a capacidade de estimar as regiões focais varia conforme o algoritmo utilizado e a imagem analisada, o que faz a eficiência ser satisfatória em apenas um conjunto de imagens. Este trabalho estudou 9 métodos surgidos na última década e 21 características diferentes para encontrar as relações entre as informações contidas nas imagens e a eficiência de predição. Utilizando uma base de dados supervisionada, este trabalho mostra que as características de dispersão para informações de intensidade e cor são as mais influentes para a eficiência dos métodos do que aquelas baseadas somente na média dessas informações. Além disso, características como a entropia da intensidade de tons de cinza ou área focal possuem uma correlação direta com a complexidade da cena e, quando o ruído visual aumenta (através do aumento do número de regiões de interesse ou cores) a centralidade foi a estratégia mais utilizada pelos seres humanos que testaram essa base, repercutindo nos métodos automáticos. Além do mais, este trabalho testa a capacidade de uma Rede Neural de identificar padrões contidos nas imagens originais e selecionar o método mais apropriado para estimar os pontos focais.The human eye focus is one of the most important tasks in the cognitive processes of interpretation of scenes.In the last decade, there have been several methods that aim automatically predict the focused points of the human eye.However, the ability t o estimate the focal region varies as the algorithm used and the image analyzed, which makes the efficiency satisfactory only in a set of images.This work studied 9 methods developed in the last decade and 21 different characteristics to find the relationships between the information contained in the images and the prediction efficiency. Using a supervised database, this work shows that the dispersion characteristics for intensity information and color are the most influential to the efficiency of the methods than those based only on the average information. Additionally, features such as the entropy of the intensity on gray scale or focal area have a direct correlation to scene complexity and, when the visual noise increases (by increasing the number of colors or regions of interest) the centrality was the strategy most used by humans who tested this database, reflecting on the automatics methods. Furthermore, this study tests the ability of a neural network to identify patterns contained in the original images and select the most appropriate method for estimating the focal points.