dc.contributor.advisor | Alvarado Valencia, Jorge Andrés | |
dc.contributor.author | Herrera Cancelado, Catalina | |
dc.date.accessioned | 2021-07-23T17:14:34Z | |
dc.date.accessioned | 2023-05-11T19:21:38Z | |
dc.date.available | 2021-07-23T17:14:34Z | |
dc.date.available | 2023-05-11T19:21:38Z | |
dc.identifier.uri | https://hdl.handle.net/20.500.12032/113788 | |
dc.description.abstract | La rápida evolución de los modelos de lenguaje natural y la posibilidad de utilizarlos como predictores de palabras y oraciones dentro de su contexto los convierten en herramientas útiles para detectar la presencia de anomalías en términos dentro de un documento. Este estudio propone utilizar BERT como modelo generativo para tareas de detección de anomalías, analizando los tipos de anomalías identificadas tanto en un corpus con lenguaje “estándar” como en uno con errores gramaticales para encontrar las capacidades y limitaciones de la metodología propuesta, así como caracterizar los tipos de anomalías encontradas. La evaluación de 5 modelos no supervisados mostró las particularidades de BERT en el manejo de puntuación, nombres propios y fragmentos de palabras resultando estas en scores particularmente altos, y la complejidad de detectar errores a partir de anomalías dada la estructura secuencial y parafraseada del lenguaje. Finalmente, los resultados de la evaluación en el corpus de aprendizaje REALEC abren la posibilidad de utilizar técnicas de detección de anomalías en conjunto con variables adicionales como base para tareas de corrección de errores gramaticales. | spa |
dc.format | PDF | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | spa | spa |
dc.publisher | Pontificia Universidad Javeriana | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Modelos de lenguaje natural | |
dc.subject | Detección de anomalías | |
dc.subject | BERT | |
dc.subject | Learner annotated corpus | |
dc.title | Detección de anomalías en texto a partir de modelos de lenguaje natural | spa |