Descrição
El proyecto tiene como objetivo desarrollar una prueba de concepto para realizar la validación de árboles de problemas formulados bajo la Metodología del Marco Lógico a través de técnicas basadas en el Procesamiento de Lenguaje Natural. Esta tarea es relevante dentro del marco del diseño de políticas públicas, pues el proceso de validación es difícil y costoso, dados los elementos transdisciplinarios y sistémicos que involucran a profesionales de múltiples disciplinas, así como intereses particulares. Para lograr este objetivo, se utilizó un repositorio de árboles de problemas correspondiente a proyectos de inversión reales y aprobados por el Departamento Nacional de Planeación, los cuales estaban etiquetados como causa, problema, efecto u otro. A partir de este conjunto de datos, se realizó un proceso de minería de datos con el fin de realizar las siguientes tareas: clasificación de oraciones (causa, problema, efecto u otra), reconocimiento de entidades nombradas y similitud semántica (problema - causa/efecto). Como principal hallazgo la prueba de concepto arroja la pertinencia de modelos de lenguaje basados en transformadores en español (BETO) para las tareas de clasificación de oraciones y similitud semántica. Mientras que para el reconocimiento de entidades nombradas se recomienda el uso de un modelo sobre ajustado FLERT. Finalmente, se realizó un modelo de aceptación tecnológica junto a un panel de expertos, con el fin de corroborar la idoneidad de la solución analítica propuesta para la formulación de proyectos sociales.