dc.contributor.advisor | Moreno Barbosa, Andrés Dario | |
dc.contributor.author | Martínez Pinilla, Manuel Francisco | |
dc.date.accessioned | 2022-10-13T11:49:04Z | |
dc.date.accessioned | 2023-05-11T17:10:41Z | |
dc.date.available | 2022-10-13T11:49:04Z | |
dc.date.available | 2023-05-11T17:10:41Z | |
dc.date.created | 2022-06-15 | |
dc.identifier.uri | https://hdl.handle.net/20.500.12032/104874 | |
dc.description.abstract | Resumen- La ineficiencia de la justicia colombiana es un fenómeno dilatorio; la justicia colombiana cuenta con 11 funcionarios judiciales por cada 100.000 habitantes, congestión significativa en el número de procesos judiciales en inventario, y en consecuencia enfrenta actos de corrupción. Los últimos desarrollos en algoritmos de aprendizaje profundo y técnicas como el aprendizaje de transferencia han llenado de nuevas posibilidades al PLN (Procesamiento del Lenguaje Natural), aunque cada vez son más los proyectos de digitalización, especialmente en el ámbito jurisdiccional; este constante torrente de información de datos que se ha creado hace posible entrenar modelos de Machine Learning con datos que permitan incursionar en la investigación de modelos de IA para una decisión judicial en Colombia. Proponemos un método para mejorar la calidad de las búsquedas y los modelos de clasificación de textos basados en rankings para textos de jurisprudencia utilizando el aprendizaje de transferencia y el BERT. La búsqueda se basa en la conversión de
23.750 textos de ley de la "Corte Constitucional" en vectores multidimensionales basados en modelos pre-entrenados y la búsqueda de estos vectores utilizando una búsqueda de similitudes usando FAIIS, distancia euclidiana y KNN para el campo de categorización de textos . Los resultados de este modelo fueron conectados a una interfaz web y fueron evaluados en base a la metodología propuesta por Knijnenburg donde se busca un método pragmático basado en el usuario para medir el sistema de recuperación propuesto, las preguntas fueron planteadas a un grupo de abogados y estudiantes de derecho, los resultados fueron comparados con los motores de búsqueda tradicionales y tiene una mayor calidad percibida de recomendación según los resultados. | spa |
dc.format | PDF | |
dc.format.mimetype | application/pdf | |
dc.language.iso | spa | |
dc.publisher | Pontificia Universidad Javeriana | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Jurisprudencia | |
dc.subject | Investigación jurídica | |
dc.subject | Procesamiento del lenguaje natural | |
dc.subject | Recuperación de Información | |
dc.subject | BERT | |
dc.subject | Clasificación de textos | |
dc.subject | Incrustación de palabras | |
dc.subject | FAISS | |
dc.subject | Distancia L2 | |
dc.title | Búsqueda semántica de sentencias judiciales usando técnicas actuales del NLP y métodos de recuperación de información | spa |