Show simple item record

dc.contributor.advisorSilva-Galvez, Arturo
dc.contributor.authorMartínez-Landa, Concepción H.
dc.date.accessioned2024-05-30T20:36:24Z
dc.date.accessioned2025-03-25T20:11:46Z
dc.date.available2024-05-30T20:36:24Z
dc.date.available2025-03-25T20:11:46Z
dc.date.issued2024-05
dc.identifier.citationMartínez-Landa, C. H. (2024). Implementación de NLP y análisis temático para la detección de sesgos de género. Trabajo de obtención de grado, Maestría en Ciencia de Datos. Tlaquepaque, Jalisco: ITESO.
dc.identifier.urihttps://hdl.handle.net/20.500.12032/158560
dc.description.abstractEl sesgo de género en contenidos digitales puede afectar la percepción y la representación, reforzando estereotipos y promoviendo desigualdades. Este estudio se centra en analizar cómo se manifiesta este sesgo, utilizando técnicas de Procesamiento del Lenguaje Natural (NLP) y visualización de datos. A través del análisis del conjunto de datos md_gender_bias, aplicamos NLP y Análisis Latente de Dirichlet (LDA) para desentrañar patrones temáticos y representaciones de género en distintos contextos. El análisis en los conjuntos de datos Yelp y ConvAI2 han revelado la existencia de sesgos de género. En Yelp, si bien no se observa un sesgo de género absoluto, el análisis muestra cierta inclinación hacia palabras asociadas con roles de género masculinos tradicionales, como referencias a profesiones típicamente masculinas, consumo de carnes rojas y actividades estereotípicamente masculinas. Por otro lado, también se identificaron tópicos con una perspectiva más orientada a lo femenino según roles convencionales, con palabras vinculadas a la mujer y actividades culinarias domésticas. En ConvAI2, el sesgo de género es más notorio, con tópicos claramente divididos en experiencias e intereses típicamente masculinos, como deportes y música, contrastando con tópicos femeninos relacionados con la vida familiar, relaciones personales, actividades domésticas y roles de género tradicionales. Para el subconjunto de Wizard, se demuestra que hay una subrepresentación en el género femenino. Esto nos lleva a la conclusión de que la selección de textos para la creación del dataset, así como el etiquetado influyen directamente en la presencia de los sesgos en el mismo. Este estudio resalta la presencia del sesgo de género en los contenidos digitales y subraya la importancia de herramientas avanzadas para su identificación y comprensión. A través de un análisis y visualizaciones, se muestra la presencia de los sesgos de género que se manifiestan el conjunto de datos analizado, finalmente buscando incentivar el desarrollo de estrategias para promover una representación más equitativa y diversa en el ámbito digital.
dc.language.isospa
dc.publisherITESO
dc.rights.urihttps://creativecommons.org/licenses/by-nc/4.0/deed.es
dc.subjectAnálisis Temático
dc.subjectSesgo de Género
dc.subjectProcesamiento del Lenguaje Natural
dc.titleImplementación de NLP y análisis temático para la detección de sesgos de género
dc.typeinfo:eu-repo/semantics/masterThesis


Files in this item

FilesSizeFormatView
NLP_LDA_SESGOS.pdf5.246Mbapplication/pdfView/Open

This item appears in the following Collection(s)

Show simple item record

https://creativecommons.org/licenses/by-nc/4.0/deed.es
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc/4.0/deed.es

© AUSJAL 2022

Asociación de Universidades Confiadas a la Compañía de Jesús en América Latina, AUSJAL
Av. Santa Teresa de Jesús Edif. Cerpe, Piso 2, Oficina AUSJAL Urb.
La Castellana, Chacao (1060) Caracas - Venezuela
Tel/Fax (+58-212)-266-13-41 /(+58-212)-266-85-62

Nuestras redes sociales

facebook Facebook

twitter Twitter

youtube Youtube

Asociaciones Jesuitas en el mundo
Ausjal en el mundo AJCU AUSJAL JESAM JCEP JCS JCAP