Luna Romera, José MaríaGarcía Gutiérrez, JorgeMartínez Ballesteros, María del MarRiquelme Santos, José Cristóbal2022-04-122022-04-122018Luna Romera, J.M., García Gutiérrez, J., Martínez Ballesteros, M.d.M. y Riquelme Santos, J.C. (2018). Aproximación al índice externo de validación de clustering basado en chi cuadrado. En CAEPIA 2018: XVIII Conferencia de la Asociacion Española para la Inteligencia Artificial (821-826), Granada, España: Asociación Española para la Inteligencia Artificial (AEPIA).978-84-09-05643-9https://hdl.handle.net/11441/132075El clustering es una de las técnicas más utilizadas en minería de datos. Tiene como objetivo principal agrupar datos en clusters de manera que los objetos que pertenecen al mismo clúster sean más similares que los que pertenecen a diferentes clusters. La validación de un clustering es una tarea que se realiza aplicando los llamados índices de validación. Estos índices miden la calidad de la solución del clustering y se podrían clasificar como índices internos, los cuales calculan la calidad del clustering en función de los propios clusters; e índices externos, que miden la calidad mediante información externa de los datos, como puede ser la clase. Los índices externos que nos encontramos en la literatura están sujetos a una interpretación que puede dar lugar a error, por ello, el objetivo de este artículo es presentar un nuevo índice de validación externa basado en el test estadístico de chi cuadrado que mide la calidad del clustering de forma exacta, sin necesidad de tener que ser interpretado. Se ha realizado una experimentación usando 6 datasets que podrían ser considerados big data y los resultados obtenidos son prometedores ya que mejoran la tasa de aciertos y porcentaje de error respecto a los índices de la literatura.application/pdf6spaAttribution-NonCommercial-NoDerivatives 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Análisis de clusteringValidación de clusteringÍndices de validación externaBig DataAproximación al índice externo de validación de clustering basado en chi cuadradoinfo:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/openAccess