A fast version of the k-means classification algorithm for astronomical applications

Ordovás-Pascual, I.; Sánchez Almeida, J.
Referencia bibliográfica

Astronomy and Astrophysics, Volume 565, id.A53, 4 pp.

Fecha de publicación:
Número de autores
Número de autores del IAC
Número de citas
Número de citas referidas
Context. K-means is a clustering algorithm that has been used to classify large datasets in astronomical databases. It is an unsupervised method, able to cope very different types of problems. Aims: We check whether a variant of the algorithm called single pass k-means can be used as a fast alternative to the traditional k-means. Methods: The execution time of the two algorithms are compared when classifying subsets drawn from the SDSS-DR7 catalog of galaxy spectra. Results: Single-pass k-means turn out to be between 20% and 40% faster than k-means and provide statistically equivalent classifications. This conclusion can be scaled up to other larger databases because the execution time of both algorithms increases linearly with the number of objects. Conclusions: Single-pass k-means can be safely used as a fast alternative to k-means.
Proyectos relacionados
Imagen del Proyecto
Grupo de Estudios de Formación Estelar GEFE
El proyecto interno GEFE está enmarcado en el proyecto coordinado, ESTALLIDOS, financiado por el plan nacional desde el año 2001. El ultimo proyecto aprobado es ESTALLIDOS 6.0 (AYA2016- 79724-C4-2-P). En el proyecto GEFE trabajamos en base al caso científico del proyecto ESTALLIDOS 6.0. Los estallidos de formación estelar (Starbursts o SB) son
Muñoz Tuñón