Documente Academic
Documente Profesional
Documente Cultură
Cluster
Cluster: Un punto usado para representar un
conjunto de valores de entre todos los iniciales que tienen algo en comn, y se pueden agrupar en funcin de determinado rasgo
Concepto
Algoritmos de agrupamiento: Tienen como objetivo devolver al usuario una serie de puntos que en cierto modo representan al resto de puntos iniciales por su posicin privilegiada con respecto al total
Aplicaciones
Aprendizaje no supervisado: No requieren del uso del error entre la salida del sistema y el modelo que se pretende obtener para adaptar los parmetros
Compresin de voz e imagen Reconocimiento de formas Preprocesamiento de datos Fusin sensorial Procesamiento de imagen
entrada
Matriz de distancias
Matriz de distancias: Se almacena la distancia
d1,3
d2,9
k=1..n (n representa el nmero de variables para representar un punto, plano:n=2) i=1..c (c representa el nmero de clusters) j=1..N (N representa el nmero de puntos de cada variable)
enlace
c: Nmero de clusters
2 4 V 2.3 2
Matriz de pertenencias
Se define la pertenencia a uno u otro grupo
Matriz de distancias
D =[ 0 0.5000 1.0000 1.1180 2.0616 3.0414 4.0000 4.0311 4.1231 4.1231 4.0311 4.0000 3.0414 2.0616 1.1180 1.0000 0.5000 0]
Matriz de pertenencias
U =[1 0 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1] Grupo 1 Grupo 2
Algoritmo
Condiciones iniciales: c = Nmero de clusters z = [ ] Matriz de datos v = [ ] Valores iniciales de los clusters
Desde l=1 hasta criterio de mnima distancia {
Se calcula la matriz de distancias U (utiliza matrices z y v) Se calcula la matriz de pertenencias (utiliza la matriz U) Se calcula la matriz de centroides o clusters (utiliza la matriz z y U)
}
U =[1 0
1 0
1 0
1 0
1 0
0 1
0 1
0 1
0 1]
Grupo 1 Grupo 2
Ejemplo
Condiciones iniciales
Primera iteracin
Segunda iteracin
kmeans (Matlab)
Matlab posee un toolbox de estadstica que realiza el algoritmo de k-means clustering. La sintaxis es:
[...] = kmeans(...,'param1',val1,'param2',val2,...) donde, entre otras, devuelve: a) La matriz de pertenencia b) La matriz de centroides c) La matriz de distancias
kmeans (II)
Parmetros de entrada: Criterio para medir la distancia entre la matriz de datos y los centroides (la medida implcita es la norma eucldea)
La forma en que se establecen las condiciones iniciales de los centroides (de forma predeterminada escoge como valores iniciales de los centroides a valores de la matriz de datos)
Clculo de la pertenencia de variables a un grupo Mtodo de actualizacin de los centroides Criterio de parada del algoritmo