Saltar la navegación

Iteración 0

1.Iniciar los valores de los controides: Se eligen las primeras dos semillas como los centroides iniciales. Siendo c1 y c2 las coordenadas de los centroides, entonces c1=(15.26,14.84) y c2=(14.88,14.57). Esto se muestra en la siguiente figura, los círculos azules representan los datos y las estrellas rojas los centroides.

iteración 0 del algoritmo K-medias

2.Asignación de los datos entre los grupos: Se calcula la distancia de cada dato a cada uno de los centroides utilizando la distancia euclídea. Realizando todos los cálculos correspondientes, se obtiene la siguiente matriz de distancia en la iteración 0.

matriz con distancias de los datos a cada uno de los centroides en la iteración 0 centroide c1 en la iteración 0 centroide c2 en la iteración 0

datos

Cada columna en la matriz de distancia D representa un dato. La primer fila de D se corresponde con la distancia de cada dato con respecto al centroide c1, mientras que la segunda fila se corresponde con la distancia de cada dato con respecto al centroide c2. Por ejemplo, la distancia de la tercer semilla (14.29,14.09) al primer centroide c1=(15.26,14.84) será:

distancia de la tercer semilla al primer centroide

y la distancia con respecto al centroide c2=(14.88,14.57) será:

distancia de la tercer semilla al segundo centroide

Cada dato se asignará al grupo con el que tenga mínima distancia. Por lo que, la semilla 1 será asignada al grupo 1, la semilla 2 al grupo 2, la semilla 3 al grupo 2 y la semilla 4 al grupo 2.

asignación de semillas a los grupos

3. Actualización de los centroides: Con los datos agrupados, se vuelven a calcular los centroides. Como el grupo 1 sólo tiene un miembro el centroide c1=(15.26,14.84) queda igual. El grupo 2 tiene 3 miembros, por lo que el centroide el es promedio de las coordenadas de todos sus miembros:

valor nuevo del centroide c2