Un algoritmo de clasificación incremental basado en los k vecinos más similares para datos mezclados
Fecha
2013-06Autor
Sánchez-Díaz, Guillermo
Escobar-Franco, Uriel
Morales-Manilla, Luis
Aguirre-Salado, Carlos A.
Franco-Arcega, Anilu
Piza-Dávila, Hugo I.
Metadatos
Mostrar el registro completo del ítemDescripción
En este trabajo, se presenta un algoritmo de clasificación incremental basado en los k vecinos más similares, el cual permite trabajar con datos mezclados y funciones de semejanza que no necesariamente son distancias. El algoritmo presentado es adecuado para procesar grandes conjuntos de datos, debido a que sólo almacena en la memoria principal de la computadora los k vecinos más similares procesados hasta el paso t, recorriendo una sola vez el conjunto de datos de entrenamiento. Se presentan resultados obtenidos con diversos conjuntos de datos sintéticos y reales. This paper presents an incremental k-most similar neighbor classifier, for mixed data and similarity functions that are not necessarily distances. The algorithm presented is suitable for processing large data sets, because it only stores in main memory the k most similar neighbors processed until step t, traversing only once the training data set. Several experiments with synthetic and real data are presented.ITESO, A.C.