Show simple item record

dc.contributor.advisorBianchi, Reinaldo Augusto da Costa
dc.contributor.authorFerreira, L. A.
dc.date.accessioned2019-03-20T14:00:50Z
dc.date.accessioned2023-05-03T20:35:28Z
dc.date.available2019-03-20T14:00:50Z
dc.date.available2023-05-03T20:35:28Z
dc.date.issued2012
dc.identifier.citationFERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012.
dc.identifier.urihttps://hdl.handle.net/20.500.12032/89010
dc.description.abstractO objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.
dc.description.abstractThe goal of this work is to study heuristically accelerated Reinforcement Learning techniques to solve multi-agent multi-objective problems. From well known algorithms, two new methods based on Modular Reinforcement Learning, in which the objectives are divided in modules of Heuristically Accelerated Reinforcement Learning, were proposed. Experiments were made in different configurations of the Predator-Prey problem where the learning agent plays the role of the prey and must learn to escape the predator while searching for the food that is kept in a fixed position of the map. The results shows that by modularizing the problem it is possible to simplify the learning process and, when using heuristics for acceleration, the learning agent needs less time to learn to solve the problem when compared to conventional Reinforcement Learning algorithms.
dc.languagepor
dc.language.isopt_BR
dc.publisherCentro Universitário da FEI, São Bernardo do Campo
dc.subjectHeurística
dc.titleAprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivopt_BR
dc.typeDissertaçãopt_BR


Files in this item

FilesSizeFormatView
fulltext.pdf515bytesapplication/pdfView/Open

This item appears in the following Collection(s)

Show simple item record


© AUSJAL 2022

Asociación de Universidades Confiadas a la Compañía de Jesús en América Latina, AUSJAL
Av. Santa Teresa de Jesús Edif. Cerpe, Piso 2, Oficina AUSJAL Urb.
La Castellana, Chacao (1060) Caracas - Venezuela
Tel/Fax (+58-212)-266-13-41 /(+58-212)-266-85-62

Nuestras redes sociales

facebook Facebook

twitter Twitter

youtube Youtube

Asociaciones Jesuitas en el mundo
Ausjal en el mundo AJCU AUSJAL JESAM JCEP JCS JCAP