Un algoritmo de clasificación incremental basado en los k vecinos más similares para datos mezclados
Date
2013-06Author
Sánchez-Díaz, Guillermo
Escobar-Franco, Uriel
Morales-Manilla, Luis
Aguirre-Salado, Carlos A.
Franco-Arcega, Anilu
Piza-Dávila, Hugo I.
Metadata
Show full item recordDescription
En este trabajo, se presenta un algoritmo de clasificación incremental basado en los k vecinos más similares, el cual permite trabajar con datos mezclados y funciones de semejanza que no necesariamente son distancias. El algoritmo presentado es adecuado para procesar grandes conjuntos de datos, debido a que sólo almacena en la memoria principal de la computadora los k vecinos más similares procesados hasta el paso t, recorriendo una sola vez el conjunto de datos de entrenamiento. Se presentan resultados obtenidos con diversos conjuntos de datos sintéticos y reales. This paper presents an incremental k-most similar neighbor classifier, for mixed data and similarity functions that are not necessarily distances. The algorithm presented is suitable for processing large data sets, because it only stores in main memory the k most similar neighbors processed until step t, traversing only once the training data set. Several experiments with synthetic and real data are presented.ITESO, A.C.