Autoencoders para manejo de clases desbalanceadas en problemas de propensión de compra
Descripción
El problema principal que se aborda en este documento es aquel en el que un algoritmo de clasificación no cuenta con el desempeño requerido debido a que el conjunto de datos con el que fue entrenado esta desbalanceado. Se tiene como objetivo analizar estrategias para incrementar la precisión de un algoritmo de clasificación cuando el conjunto de datos con el que es entrenado cuenta con clases desbalanceadas. Una de las estrategias que se analizan es el uso de Autoencoders para la generación de un conjunto de nuevas características que permitan realizar una mejor clasificación. Al generar este conjunto de nuevas características utilizando un Autoencoder, se demuestra que la precisión de un algoritmo de clasificación aumenta. Esta demostración se realizó al comparar el desempeño de un clasificador al ser entrenado con y sin las nuevas características generadas por el Autoencoder. Se utilizaron diferentes métricas para medir el desempeño y realizar la comparación, entre ellas la matriz de confusión, precisión, recall, accuracy and F1-score. Aunque las nuevas características generadas por el autoencoder, es necesario tener en cuenta la topología y configuración de este debe ser adaptada a cada problema. Asimismo, se debe tener en cuenta el tiempo requerido para el entrenamiento del autoencoder, y que este será proporcional la cantidad de características y número de registros del conjunto de datos.Consejo Nacional de Ciencia y Tecnología