Una técnica de clasificación con variables categóricas
DOI:
https://doi.org/10.19053/01217488.4226Palabras clave:
conglomerado, distancia, disimilaridad, k-medias, k-modas (Cluster, Distance, Dissimilarity, k-means, k-modes.)Resumen
Presenta un algoritmo de clasificación para elementos caracterizados por variables categóricas, usandok-modas, un algoritmo similar a k-medias. A la vez, se incluyen diagramas de flujo para la implementación del algoritmo en cualquier lenguaje de programación. También se presenta un ejemplo con datos reales que ilustra la propuesta
Descargas
Referencias
Z. Huang, “Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values Data Mining and Knowledge
Discovery”, Kluwer Academic Publishers, vol. 2, no. 3, pp. 283-304, 1998. DOI: https://doi.org/10.1023/A:1009769707641
A. C. Rencher, “Methods of multivariate analysis”, John Wiley & Sons, vol. 492, 2003. DOI: https://doi.org/10.1002/0471271357
N. Roa y L. F. Pastrán, “Una técnica de Clasificación con Variables Categóricas”, Trabajo de Grado, Universidad del Tolima, Colombia, 2014.
W. Dillon, and M. Goldstein, “Multivariate Analysis, Methods and Applications”, Jhon Wiley and Sons, pp. 186-190, 1984.
D. F. Morrison, “Multivariate Statistical Methods”, Mc Graw Hill, pp. 389-391, 1990.
B. Tian, C. A. Kulikowsky, G. Leiguang, Y. Bin, H. Lan, and Z. Chunguang, “A Global K modes Algorithm for Clustering Categorical
Data”, Chinesse Journal of Electronics, vol. 21, no. 3, 2012.
S. Mingoti, and R. Matos, “Clustering Algorithms for Categorical Data: A Monte Carlo Study”, International Journal of Statistics ans
Applications, vol. 2, no. 4, pp. 24-32, 2012. DOI: https://doi.org/10.5923/j.statistics.20120204.01