dc.contributor.advisor | Maillard, Patrícia Augustin Jaques | |
dc.contributor.author | Stein, Roger Alan | |
dc.date.accessioned | 2019-03-07T14:41:05Z | |
dc.date.accessioned | 2022-09-22T19:31:54Z | |
dc.date.available | 2019-03-07T14:41:05Z | |
dc.date.available | 2022-09-22T19:31:54Z | |
dc.date.issued | 2018-03-28 | |
dc.identifier.uri | https://hdl.handle.net/20.500.12032/61975 | |
dc.description.abstract | Modelos eficientes de representação numérica textual (word embeddings) combinados com algoritmos modernos de aprendizado de máquina têm recentemente produzido uma melhoria considerável em tarefas de classificação automática de documentos. Contudo, a efetividade de tais técnicas ainda não foi avaliada com relação à classificação hierárquica de texto. Este estudo investiga a aplicação daqueles modelos e algoritmos neste problema em específico através de experimentação e análise. Modelos de classificação foram treinados usando implementações proeminentes de algoritmos de aprendizado de máquina—fastText, XGBoost e CNN (Keras)— e notórios métodos de geração de word embeddings—GloVe, word2vec e fastText—com dados disponíveis publicamente e avaliados usando métricas especificamente adequadas ao contexto hierárquico. Nesses experimentos, fastText alcançou um LCAF1 de 0,871 usando uma versão da base de dados RCV1 com apenas uma categoria por tupla. A análise dos resultados indica que a utilização de word embeddings é uma abordagem muito promissora para classificação hierárquica de texto. | pt_BR |
dc.description.sponsorship | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | pt_BR |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade do Vale do Rio dos Sinos | pt_BR |
dc.rights | openAccess | pt_BR |
dc.subject | Hierarchical classification | en |
dc.subject | Classificação hierárquica | pt_BR |
dc.title | An analysis of hierarchical text classification using word embeddings | pt_BR |
dc.type | Dissertação | pt_BR |