Classificação de cenas em imagens através da arquitetura cognitiva lida
Descrição
Na área de visão computacional, dentre as diversas linhas existentes, há aquela denominada de generalista. Esta vertente consiste em estudos amplos, incluindo muitos elementos e variáveis; nesse caso, inúmeras aplicações podem ser desenvolvidas dentro de um mesmo estudo. Um dos principais problemas estudados na área de visão computacional, seguindo a linha generalista, é conhecido como classificação de cenas. Na literatura, esse problema é geralmente enfrentado com o uso de técnicas de Deep Learning em combinação com outras técnicas de classificação. Em contrapartida, uma linha de pesquisa conhecida como arquiteturas cognitivas, que embora seja pouco explorada em visão computacional, vem sendo estudada nas últimas décadas buscando mesclar conceitos da neurociência e da ciência da computação. Neste trabalho, será apresentado um modelo que agrega a arquitetura cognitiva Learning Intelligent Distribution Agent (LIDA) com métodos já utilizados na área, visando estudar os aspectos poucos explorados até o momento, que são proporcionadas por esta união. Dentre os métodos existentes na área, serão utilizados o Support Vector Machine (SVM), Multilayer Perceptron (MLP) e Redes Neurais Convolucionais (CNN). Este trabalho contribuiu para a união pouco explorada descrita aqui, e também serve como base pra futuros trabalhos que estudem problemas através desta união. Outra contribuição é que o presente trabalho apresentou resultados similares ao estadoda-arte em bases de dados frequentemente utilizadas na área, como é o caso do MIT Indoor 67 (85,9% de acurácia) e SUN 397 (69,4% de acurácia), que são bases de cenas naturais coloridas segregadas entre diversas classesIn the computational vision field, among other lines of research, there is one line known by generalist. That line of research includes deeper studies with many subjects and variables; it means more complex problems, therefore more practical applications can be developed by using these studies. One of the main computational vision tasks, following the generalist research, is the scene classification. In literature, this problem is solved by methods that use Deep Learning together with other classification techniques. However, there is a research field known by cognitive architectures, although are few studies, has been investigated in the last decades combining concepts of neuroscience and computational science. The present work will present a model that combines the cognitive architecture Learning Intelligent Distribution Agent (LIDA) with methods proposed to solve the problem, aiming to study the possibilities relatively unexploited that are provided by that combination. This work use Support Vector Machine (SVM), Multilayer Perceptron (MLP) and Convolutional Neural Networks (CNN) to handle the scene classification task. The present work contributes to effort the combination of techniques stated before, besides it serves as a base for future studies in both fields. Furthermore, this work shows similar results of accuracy to the state-of-the-art in datasets often used: MIT Indoor 67 (85.9%) and SUN 397 (69.4%)