ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción...
Transcript of ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción...
![Page 1: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/1.jpg)
ANÁLISIS DE CONGLOMERADOS
1. Introducción
2. Medidas de similaridad
3. Análisis jerárquico
4. Análisis no jerárquico
5. Elección entre los distintos tipos de análisis
6. Caso práctico
![Page 2: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/2.jpg)
Análisis de interdependenciasclasificación
componentesprincipales
análisisfactorial
análisiscorrespondencias
análisiscluster
escalamientomultidimensional
Relaciónentre
variables
Métricas No métricas
Relaciónentrecasos
Relaciónentre
objetos
![Page 3: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/3.jpg)
Técnica para clasificar observaciones en grupos:
- Cada grupo sea homogéneo respecto a las variables utilizadas para su formación
- Que los grupos sean lo más distintos posible unos de otros respectos a las variables consideradas
- La composición de los grupos es desconocida a priori (en el análisis discriminante o en la regresión logística se conocen los grupos)
introducción
![Page 4: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/4.jpg)
- Por ejemplo:
- Clasificar los animales de un rebaño según sus características productivas y aptitudes para la explotación ecológica (producción de leche, producción de carne, edad, enfermedades, rusticidad, prolificidad, fertilidad, aplomos, raza, etc.)
- Clasificar explotaciones ganaderas según su implicación en funciones no productivas
introducción
![Page 5: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/5.jpg)
Pasos del análisis cluster:
- Se tiene información de n casos y k variables
- Se establece un indicador que nos diga en qué medida cada par de observaciones se parece entre sí (distancia o similaridad)
- Se crean los grupos de acuerdo a la medida de similaridad o distancia anterior. Hay dos tipos de creación de grupos y varios métodos de agrupación
- Se describen los grupos obtenidos y se comparan unos con otros
- Validación del análisis
introducción
![Page 6: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/6.jpg)
Medidas de similaridad
Ejemplo
Se tiene información de la producción de leche y del rendimiento quesero de 8 cabras
medidas de similaridad
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
![Page 7: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/7.jpg)
medidas de similaridad
0
5
10
15
20
25
30
35
40
45
100 250 400 550
![Page 8: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/8.jpg)
medidas de similaridad
0
5
10
15
20
25
30
35
40
45
100 250 400 550
![Page 9: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/9.jpg)
Medidas de similaridad para variables métricas
- Distancia euclídea (D) entre dos casos: D = √Σ (Xip – Xjp)2
- En el ejemplo:
- D12 = √ (225 – 225)2 + (15 – 10)2 = 5
- D13 = √ (210 – 225)2 + (30 – 10)2 = 196
medidas de similaridad
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
![Page 10: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/10.jpg)
- Distancia euclídea al cuadrado (D2) entre dos casos:
- Menos exigente que el anterior
- D = Σ (Xip – Xjp)2
- En el ejemplo:
- D12 = (225 – 225)2 + (15 – 10)2 = 25
- D13 = (210 – 225)2 + (30 – 10)2 = 38425
medidas de similaridad
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
![Page 11: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/11.jpg)
- Distancia de Minkowski:
- M = [Σ (Xip – Xjp)2]1/n
- Los dos casos anteriores son un caso particular (n=2) de la distancia de Minkowski
- Distancia city block o “Manhatan”:
- M = Σ (Xip – Xjp)
medidas de similaridad
![Page 12: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/12.jpg)
medidas de similaridad
0
5
10
15
20
25
30
35
40
45
100 250 400 550
c
b
a
![Page 13: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/13.jpg)
medidas de similaridad
Estandarización de los datos:
- Las distancias de similaridad son muy sensibles a las unidades en que estén medidas las variables.
- En el ejemplo (distancia D2):
- D12 = (225 – 225)2 + (15 – 10)2 = 25
- D13 = (210 – 225)2 + (30 – 10)2 = 38.425
- Si la producción de leche la medimos en centilitros:
- D12 = (22500 – 22500)2 + (15 – 10)2 = 25
- D13 = (21000 – 22500)2 + (30 – 10)2 = 2.250.400
- Lo más común en restar la media a cada observación y dividir por la desviación típica (variables de media cero y d.t. 1)
![Page 14: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/14.jpg)
Medidas de similaridad para datos binarios
- Se utilizan con variables ficticias o con variables dicotómicas (p.e. “no”=0; “si”=1)
- Se utiliza una tabla de doble entrada:
medidas de similaridad
Ganadero Ecológico ATP Soltero Estudios1 1 1 0 02 0 1 1 13 1 1 0 14 0 0 0 15 1 1 1 0
![Page 15: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/15.jpg)
medidas de similaridad
Ganadero Ecológico ATP Soltero Estudios1 1 1 0 02 0 1 1 13 1 1 0 14 0 0 0 15 1 1 1 0
1 01 1 20 1 0
2
1
![Page 16: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/16.jpg)
medidas de similaridad
Ganadero Ecológico ATP Soltero Estudios1 1 1 0 02 0 1 1 13 1 1 0 14 0 0 0 15 1 1 1 0
1 01 1 20 1 0
2
1
a bc d
![Page 17: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/17.jpg)
Medidas:
- D2 = b + c
- D = √ b + c
- Diferencia de tamaño = (b–c)2/(a+b+c+d)2
- Diferencia de configuración = (b*c)/(a+b+c+d)2
- Diferencia de forma = [(a+b+c+d)*(b+c)-(b–c)2]/(a+b+c+d)2
medidas de similaridad
![Page 18: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/18.jpg)
Formación de grupos:
- Análisis jerárquico: Inicialmente cada caso es un grupo en sí mismo y sucesivamente se van fusionando grupos cercanos hasta que todos los individuos confluyen en un solo grupo.
- Análisis no jerárquico: Inicialmente se establece el número de grupos y cada caso se asigna a uno de ellos.
Nótese que si elegimos p.e. 3 grupos, en el método jerárquico los grupos proceden de fusionar dos grupos de la anterior
combinación de 4 y en el método no jerárquico los 3 grupos se habrán confeccionado para maximizar la heterogeneidad
entre grupos y la homogeneidad dentro de grupos.
análisis jerárquico
![Page 19: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/19.jpg)
análisis jerárquico
Ejemplo:
- 12 casos (explotaciones ecológicas de vacuno lechero)
- Agrupar según las siguientes variables:
- NHT (superficie ´dedicada a la actividad en ha)
- NHT_NHP (superficie en propiedad %)
- NVAC (número de vacas)
- TREP (tasa de reposición)
- TMORT (tasa de mortalidad)
- CARGA (carga ganadera UGM/ha)
- ITC (índice terneros comerciales)
- ILC (índice de litros comerciales)
![Page 20: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/20.jpg)
análisis jerárquico
- Utilizando el análisis jerárquico con la distancia euclídea y el método de Ward:
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 21: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/21.jpg)
análisis jerárquico
- Utilizando el análisis jerárquico con la distancia euclídea y el método de Ward:
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 22: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/22.jpg)
análisis jerárquico
- Utilizando el análisis jerárquico con la distancia euclídea y el método de Ward:
- Grupo I: 1, 3, 5, 6, 7, 10
- Grupo II: 4, 8, 9, 11
- Grupo III: 12
- Utilizando el análisis no jerárquico con la distancia euclídea:
- Grupo I: 1, 7, 12
- Grupo II: 4, 8, 9, 10
- Grupo III: 2, 3, 5, 6, 11
![Page 23: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/23.jpg)
Métodos de agrupación jerárquica:
- Método del centroide
- Método del vecino más cercano
- Método del vecino más lejano
- Método de la vinculación promedio
- Método de Ward
análisis jerárquico
![Page 24: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/24.jpg)
Métodos del centroide:
- Comienza uniendo las dos observaciones más cercanas.
- A continuación, el grupo se sustituye por una observación que lo representa (centroide) y en el que todas las variables toman un valor medio.
- Se vuelven a calcular la matriz de distancias (D, D2, etc.), se unen otro par de observaciones y se recalcula la matriz.
- Así hasta que todas las observaciones quedan en un solo grupo.
análisis jerárquico
![Page 25: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/25.jpg)
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
![Page 26: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/26.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 27: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/27.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 28: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/28.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 29: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/29.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 30: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/30.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 31: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/31.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 32: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/32.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 33: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/33.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 34: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/34.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más cercano:
- Igual que el método del centroide pero varía el cálculo de la distancia.
- Las distancias entre los grupos a fusionar se calculan tomando las observaciones más cercanas de cada grupo (en vez del valor medio).
![Page 35: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/35.jpg)
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
![Page 36: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/36.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
![Page 37: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/37.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
![Page 38: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/38.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
![Page 39: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/39.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
![Page 40: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/40.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
![Page 41: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/41.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
![Page 42: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/42.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
![Page 43: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/43.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
![Page 44: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/44.jpg)
Métodos del vecino más lejano:
- Igual que el método anterior pero utiliza las observaciones más lejanas de cada grupo para calcular las distancias.
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
![Page 45: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/45.jpg)
Métodos de la vinculación promedio:
- La distancia entre los grupos se obtiene calculando la distancia promedio entre todos los pares de observaciones que pueden formarse entre los dos grupos fusionar.
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
![Page 46: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/46.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Métodos de la vinculación promedio:
- La distancia entre los grupos se obtiene calculando la distancia promedio entre todos los pares de observaciones que pueden formarse entre los dos grupos fusionar.
![Page 47: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/47.jpg)
Métodos de la vinculación promedio:
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
![Page 48: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/48.jpg)
Métodos de Ward:
- El método de Ward es el más utilizado (maximiza la homogeneidad dentro de los grupos).
- Para ello, plantea todas las posibles fusiones en cada etapa concreta y elige la que maximiza la homogeneidad:
- Calcula los centroides de los grupos resultantes de las posibles fusiones
- A continuación calcula la distancia al centroide de todas las observaciones del grupo (suma de cuadrados total)
- La solución con menor suma de cuadrados total es la elegida
análisis jerárquico
![Page 49: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/49.jpg)
Ejemplo método de Ward (distancia D2):análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
8
4 7
3
5 6
1
2
![Page 50: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/50.jpg)
Ejemplo método de Ward (distancia D2):
Posibles fusiones:
(1,2,3,4) y (5,6)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
8
4 7
3
5 6
1
2
![Page 51: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/51.jpg)
Ejemplo método de Ward (distancia D2):
Posibles fusiones:
(5,6) y (7,8)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
8
4 7
3
5 6
1
2
![Page 52: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/52.jpg)
Ejemplo método de Ward (distancia D2):
Posibles fusiones:
(1,2,3,4) y (7,8)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
8
4 7
3
5 6
1
2
![Page 53: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/53.jpg)
Ejemplo método de Ward (distancia D2):
Posibles fusiones:
(1,2,3,4) y (5,6)
(5,6) y (7,8)
(1,2,3,4) y (7,8)
análisis jerárquico
0
5
10
15
20
25
30
35
40
45
100 250 400 550
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
8
4 7
3
5 6
1
2
![Page 54: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/54.jpg)
Ejemplo método de Ward (distancia D2):análisis jerárquico
Grupos Producción leche Rendimiento quesero(1,2,3,4) (5,6) 260,0 22,5
(5,6) (7,8) 412,5 30,0(1,2,3,4) (7,8) 301,7 27,5
0
5
10
15
20
25
30
35
40
45
100 200 300 400 500 600
![Page 55: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/55.jpg)
Ejemplo método de Ward (distancia D2):análisis jerárquico
Grupos Producción leche Rendimiento quesero(1,2,3,4) (5,6) 260,0 22,5
(5,6) (7,8) 412,5 30,0(1,2,3,4) (7,8) 301,7 27,5
0
5
10
15
20
25
30
35
40
45
100 200 300 400 500 600
![Page 56: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/56.jpg)
Ejemplo método de Ward (distancia D2):análisis jerárquico
Grupos Producción leche Rendimiento quesero(1,2,3,4) (5,6) 260,0 22,5
(5,6) (7,8) 412,5 30,0(1,2,3,4) (7,8) 301,7 27,5
0
5
10
15
20
25
30
35
40
45
100 200 300 400 500 600
![Page 57: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/57.jpg)
Ejemplo método de Ward (distancia D2):análisis jerárquico
Grupos Producción leche Rendimiento quesero(1,2,3,4) (5,6) 260,0 22,5
(5,6) (7,8) 412,5 30,0(1,2,3,4) (7,8) 301,7 27,5
0
5
10
15
20
25
30
35
40
45
100 200 300 400 500 600
![Page 58: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/58.jpg)
Ejemplo método de Ward (distancia D2):análisis jerárquico
Grupos Producción leche Rendimiento quesero(1,2,3,4) (5,6) 260,0 22,5
(5,6) (7,8) 412,5 30,0(1,2,3,4) (7,8) 301,7 27,5
0
5
10
15
20
25
30
35
40
45
100 200 300 400 500 600
![Page 59: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/59.jpg)
Ejemplo método de Ward (distancia D2):análisis jerárquico
Grupos Producción leche Rendimiento quesero(1,2,3,4) (5,6) 260,0 22,5
(5,6) (7,8) 412,5 30,0(1,2,3,4) (7,8) 301,7 27,5
0
5
10
15
20
25
30
35
40
45
100 200 300 400 500 600
![Page 60: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/60.jpg)
Ejemplo método de Ward (distancia D2):
- D1,2,3,4,5,6 = 26437
- D1,2,3,4,7,8 = 111625
- D5,6,7,8 = 103137
análisis jerárquico
Grupos Producción leche Rendimiento quesero(1,2,3,4) (5,6) 260,0 22,5
(5,6) (7,8) 412,5 30,0(1,2,3,4) (7,8) 301,7 27,5
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
![Page 61: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/61.jpg)
Ejemplo método de Ward (distancia D2):
- D1,2,3,4,5,6 = 26437
- D1,2,3,4,7,8 = 111625
- D5,6,7,8 = 103137
análisis jerárquico
Grupos Producción leche Rendimiento quesero(1,2,3,4) (5,6) 260,0 22,5
(5,6) (7,8) 412,5 30,0(1,2,3,4) (7,8) 301,7 27,5
Cabra Producción leche Rendimiento quesero1 225 102 225 153 210 304 200 355 325 206 375 257 450 408 500 35
![Page 62: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/62.jpg)
Elección del método de agrupación jerárquica:
- Sigue planteando interrogantes a resolver
- Probar varios métodos y comparar los resultados
- Método del vecino más cercano: Tiende a crear pocos grupos, aunque es muy sensible a outliers
- Método del vecino más lejano: Grupos muy homogéneos
- Método de Ward: Tiende a grupos muy compactos de tamaño similar
análisis jerárquico
![Page 63: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/63.jpg)
Selección del número de conglomerados:
- Problema que aún plantea dudas.
- Dos criterios:
- Debe detenerse la fusión cuando los grupos a unir están a una distancia significativamente mayor de los que previamente se han fusionado.
- El investigador debe interpretar adecuadamente cada grupo de la solución final.
análisis jerárquico
![Page 64: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/64.jpg)
Selección del número de conglomerados:
- Distancia de los conglomerados (DC)
- Tasa de variación del coeficiente de conglomeración
- Raíz cuadrada de la media de las D.T. del nuevo cluster (RC)
- R2 semiparcial (R2S)
- R cuadrado (R2)
análisis jerárquico
![Page 65: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/65.jpg)
Distancia de los conglomerados (DC):
- Indica la homogeneidad dentro del nuevo conglomerado.
- Responde a la distancia utilizada.
- El valor debe ser pequeño.
análisis jerárquico
Num. Cluster DC7 3,66 5,385 5,654 7,073 11,882 13,51 35,03
![Page 66: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/66.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
Agglomeration Distance PlotWard's Method,Squared Euclidean
0 2 4 6 8 10 12
Stage
0
20
40
60
80
100
Dis
tanc
e
![Page 67: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/67.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
Agglomeration Distance PlotWard's Method,Squared Euclidean
0 2 4 6 8 10 12
Stage
0
20
40
60
80
100
Dis
tanc
e
![Page 68: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/68.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 69: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/69.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 70: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/70.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 71: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/71.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 72: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/72.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 73: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/73.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 74: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/74.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 75: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/75.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 76: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/76.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 77: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/77.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 78: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/78.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
DendrogramWard's Method,Squared Euclidean
Dis
tanc
e
0
20
40
60
80
100
1 2 3 45 67 8 910 11 12
![Page 79: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/79.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
Agglomeration Schedule----------------------Clustering Method: Ward'sDistance Metric: Squared Euclidean
Clusters Combined Stage First Appears NextStage Cluster 1 Cluster 2 Coefficient Cluster 1 Cluster 2 Stage-------------------------------------------------------------------------- 1 2 3 0,91948 0 0 4 2 5 6 2,27928 0 0 4 3 9 11 3,92254 0 0 7 4 2 5 6,44183 1 2 6 5 1 7 9,0135 0 0 8 6 2 10 13,4301 4 0 8 7 8 9 19,2448 0 3 9 8 1 2 25,2716 5 6 10 9 4 8 40,384 0 7 10 10 1 4 60,5273 8 9 11 11 1 12 88,0 10 0 0--------------------------------------------------------------------------
![Page 80: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/80.jpg)
Tasa de variación del coeficiente de conglomeración:
- El coeficiente de conglomeración refleja la distancia a la que estaban los grupos fusionados en la etapa
análisis jerárquico
Agglomeration Schedule----------------------Clustering Method: Ward'sDistance Metric: Squared Euclidean
Clusters Combined Stage First Appears NextStage Cluster 1 Cluster 2 Coefficient Cluster 1 Cluster 2 Stage-------------------------------------------------------------------------- 1 2 3 0,91948 0 0 4 2 5 6 2,27928 0 0 4 3 9 11 3,92254 0 0 7 4 2 5 6,44183 1 2 6 5 1 7 9,0135 0 0 8 6 2 10 13,4301 4 0 8 7 8 9 19,2448 0 3 9 8 1 2 25,2716 5 6 10 9 4 8 40,384 0 7 10 10 1 4 60,5273 8 9 11 11 1 12 88,0 10 0 0--------------------------------------------------------------------------
![Page 81: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/81.jpg)
Raíz cuadrada de la media de las D.T. del nuevo cluster (RC):
- Indica la homogeneidad del nuevo conglomerado.
- La suma de todas las desviaciones típicas de todas las observaciones del nuevo conglomerado respecto al centroide.
- El valor debe ser pequeño.
análisis jerárquico
Num. Cluster DC RC7 3,6 1,86 5,38 2,695 5,65 2,824 7,07 3,533 11,88 5,222 13,5 6,071 35,03 14,24
![Page 82: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/82.jpg)
R2 semiparcial (R2S):
- Indica la pérdida de homogeneidad que se produce en la fusión.
- Su cálculo se basa en el ratio entre la pérdida de homogeneidad en cada fusión (suma de cuadrados tras la fusión menos la suma de cuadrados de los grupos que se unen) y la homogeneidad máxima (cada observación es un grupo).
- El valor debe ser pequeño.
análisis jerárquico
Num. Cluster DC RC R2S7 3,6 1,8 06 5,38 2,69 05 5,65 2,82 04 7,07 3,53 03 11,88 5,22 0,042 13,5 6,07 0,061 35,03 14,24 0,86
![Page 83: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/83.jpg)
R2:
- Indica la heterogeneidad entre conglomerados en cada fusión.
- Ratio entre la heterogeneidad entre conglomerados y la total.
- El valor debe ser alto.
análisis jerárquico
Num. Cluster DC RC R2S R27 3,6 1,8 0 0,996 5,38 2,69 0 0,995 5,65 2,82 0 0,984 7,07 3,53 0 0,973 11,88 5,22 0,04 0,922 13,5 6,07 0,06 0,861 35,03 14,24 0,86 0
![Page 84: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/84.jpg)
DC: homogeneidad clusters fusionados Pequeño
T. Var. CC: pérdida homogeneidad en la fusión Pequeño
RC: homogeneidad del nuevo cluster Pequeño
R2S: pérdida homogeneidad en la fusión Pequeño
R2: heterogeneidad entre clusters Grande
análisis jerárquico
Num. Cluster DC RC R2S R27 3,6 1,8 0 0,996 5,38 2,69 0 0,995 5,65 2,82 0 0,984 7,07 3,53 0 0,973 11,88 5,22 0,04 0,922 13,5 6,07 0,06 0,861 35,03 14,24 0,86 0
![Page 85: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/85.jpg)
DC: homogeneidad clusters fusionados Pequeño
T. Var. CC: pérdida homogeneidad en la fusión Pequeño
RC: homogeneidad del nuevo cluster Pequeño
R2S: pérdida homogeneidad en la fusión Pequeño
R2: heterogeneidad entre clusters Grande
análisis jerárquico
Num. Cluster DC RC R2S R27 3,6 1,8 0 0,996 5,38 2,69 0 0,995 5,65 2,82 0 0,984 7,07 3,53 0 0,973 11,88 5,22 0,04 0,922 13,5 6,07 0,06 0,861 35,03 14,24 0,86 0
![Page 86: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/86.jpg)
análisis jerárquico
0
5
10
15
20
25
30
35
40
0 1 2 3 4 5 6 7 8
DC RC
00,10,20,30,40,50,60,70,80,9
1
0 1 2 3 4 5 6 7 8
R2S R2
![Page 87: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/87.jpg)
Analizar e interpretar los resultados:
- ANOVA entre clusters con las variables utilizadas en el análisis.
- ANOVA con las demás variables.
- Tabla de contingencia entre clusters para variables categóricas.
- Interpretar los resultados con las agrupaciones sucesivas.
análisis jerárquico
![Page 88: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/88.jpg)
Análisis no jerárquico:
- Se conoce a priori el número de k grupos
- Cada observación es asignada a un grupo
- Maximiza la homogeneidad dentro de los grupos
- Maximiza la heterogeneidad entre grupos
- Etapas:
1. Determinar los centroides iniciales de los k grupos
2. Formación de los grupos
3. Recalcular los centroides y formar grupos hasta la estabilidad
análisis no jerárquico
![Page 89: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/89.jpg)
1. Determinar los centroides iniciales de los k grupos:
- Se utilizan las k primeras observaciones del fichero como centroides de partida.
- Se calculan las distancias entre las k observaciones y se retiene la correspondiente a las 2 observaciones más cercanas (O1-O2).
análisis no jerárquico
![Page 90: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/90.jpg)
1. Determinar los centroides iniciales de los k grupos:
- A continuación se determina si alguna de las 2 observaciones puede ser sustituida en el centroide por la observación Ok+1.
- Si la distancia de Ok+1 a la observación más cercana perteneciente a las k observaciones centroides es mayor que la distancia entre las dos observaciones más cercanas, Ok+1 sustituye a O1 o a O2 (la más cercana).
- Si la distancia de Ok+1 a cualquiera de las k observaciones centroides (exceptuando la más cercana) es más grande que la menor distancia de la más cercana a todas las que integran el centroide, Ok+1 sustituye a Ok
análisis no jerárquico
![Page 91: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/91.jpg)
- A continuación se determina si alguna de las 2 observaciones puede ser sustituida en el centroide por la observación Ok+1.
- Si la distancia de Ok+1 a la observación más cercana perteneciente a las k observaciones centroides es mayor que la distancia entre las dos observaciones más cercanas, Ok+1 sustituye a O1 o a O2 (la más cercana).
O1 O2 Ok
Ok+1
análisis no jerárquico
![Page 92: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/92.jpg)
- A continuación se determina si alguna de las 2 observaciones puede ser sustituida en el centroide por la observación Ok+1.
- Si la distancia de Ok+1 a la observación más cercana perteneciente a las k observaciones centroides es mayor que la distancia entre las dos observaciones más cercanas, Ok+1 sustituye a O1 o a O2 (la más cercana).
O1 Ok
Ok+1
análisis no jerárquico
![Page 93: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/93.jpg)
- A continuación se determina si alguna de las 2 observaciones puede ser sustituida por en el centroide por la observación Ok+1.
- Si la distancia de Ok+1 a cualquiera de las k observaciones centroides (exceptuando la más cercana) es más grande que la menor distancia de la más cercana a todas las que integran el centroide, Ok+1 sustituye a Ok
O1 O2 Ok
Ok+1
análisis no jerárquico
![Page 94: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/94.jpg)
- A continuación se determina si alguna de las 2 observaciones puede ser sustituida por en el centroide por la observación Ok+1.
- Si la distancia de Ok+1 a cualquiera de las k observaciones centroides (exceptuando la más cercana) es más grande que la menor distancia de la más cercana a todas las que integran el centroide, Ok+1 sustituye a Ok
O1 O2
Ok+1
- El proceso se repite hasta que los k centroides se estabilizan.
análisis no jerárquico
![Page 95: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/95.jpg)
2. Formación de los nuevos grupos:
- Se calcula distancia de cada observación a los k centroides y se asigna al más cercano.
- Se recalculan los centroides (etapa 1) y se vuelven a asignar las observaciones.
- El proceso finaliza cuando las observaciones no cambian de grupo o cuando se alcanza un determinado número de iteraciones (marcadas por el investigador)
análisis no jerárquico
![Page 96: ANÁLISIS DE CONGLOMERADOS - Universidad de Córdoba · ANÁLISIS DE CONGLOMERADOS 1. Introducción 2. Medidas de similaridad 3. Análisis jerárquico 4. Análisis no jerárquico](https://reader033.fdocuments.net/reader033/viewer/2022041819/5e5ca78113b67b1f3c2eb7f9/html5/thumbnails/96.jpg)
Elección entre conglomerado jerárquico o no jerárquico:
- Sigue planteando dudas.
- Depende de los objetivos del estudio y de las propiedades de los distintos métodos.
- Lo ideal sería un enfoque jerárquico inicial y complementario a un enfoque no jerárquico final:
- El análisis jerárquico inicial determinaría cuál es el número de grupos y los centroides iniciales del posterior análisis no jerárquico.
- El posterior análisis no jerárquico maximiza la homogeneidad dentro de grupos y la heterogeneidad entre grupos.
elección