Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

30
Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010

Transcript of Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Page 1: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Representaciones Gráficas

Análisis de Datos I

Semestre Otoño 2010

Page 2: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Gráficos para variables cualitativas (categóricas)

1. Gráfico de Sectores o de Torta

Se divide un círculo en tantas porciones como clases tenga la variable

A cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa

La información que se debe mostrar en cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje del total que estos representan

Si el número de categorías es excesivamente grande (ej. Más de 3) la imagen proporcionada por el gráfico de sectores se empieza a tornar confusa.

Page 3: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ejemplo Nº 1: Gráfico de sectores variable “Tipo de Fumador”

¿Cómo interpretamos este

gráfico?

Page 4: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ejemplo Nº 2: Gráfico de sectores variable “Género”

¿Cómo interpretamos este

gráfico?

91 / 71%

38 / 29%

Mujeres

Hombres

Page 5: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ej. Nº 3: Hay veces en que el sector que nos interesa describir se desagrupa

7 / 5%

57 / 44%

54 / 42%

11 / 9%

divorciado separado

casado

soltero

Omitido

¿Cómo interpretamos este

gráfico?

Page 6: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

2.1 Gráfico de Barras SimplesLos diagramas de barras son similares a los gráficos de sectores. Se representan tantas barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase Estos mismos gráficos pueden utilizarse también para describir variables numéricas discretas que toman pocos valores (número de hijos, número de evaluaciones, etc.)

2. Gráficos de Barras

Page 7: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

ESTCIVIL

divorciado separadocasadosolteroOmitido

Fre

cuen

cia

60

50

40

30

20

10

0

7

5754

11 ¿Cómo interpretamos este

gráfico?

Ejemplo Nº 4: Gráfico de Barras variable “Estado Civil” (cualitativa)

Page 8: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Número de Hijos

4 Hijos3 Hijos2 Hijos1 HijoSin Hijos

Fre

cue

nci

a

60

50

40

30

20

10

0

11

23

31

57

7

¿Cómo interpretamos este

gráfico?

Ejemplo Nº 5: Gráfico de Barras variable “Número de Hijos” (cuantitativa discreta)

Page 9: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

2.2 Gráfico de Barras Agrupadas

• En Ocasiones se requiere agrupar dos variables en un mismo gráfico

• Para lo cual se sugiere ocupar un Gráfico de Barras Agrupadas

• Ayuda a comparar categorías de una variable en función de las Categorías o Intervalos de la otra variable

Page 10: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

ESTCIVIL

divorciado separadocasadosolteroOmitido

Fre

cue

nci

a

50

40

30

20

10

0

GENERO

hombre

mujer

Ej. 6 “Gráfico de Barras agrupadas para las variables Estado civil y Género

¿Cómo interpretamos este

gráfico?

Page 11: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

2.3 Gráfico de Barras Apiladas

• Cumple con las mismas características que el gráfico de barras agrupadas

• Busca Comparar dos variables superponiendo sus categorías o Intervalos

Page 12: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ej. 7 “Gráfico de Barras Apiladas para las variables Categoría edad y Género

categoria edad

54 y más44 a 5334 a 4324 a 33Omitido

Fre

cue

nci

a

60

50

40

30

20

10

0

GENERO

mujer

hombre

6

19

19

42

554

1215 ¿Cómo

interpretamos este gráfico?

Page 13: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

• Se utiliza cuando una variable Cualitativa tiene muchas categorías

• Es útil para entregar un ordenamiento de las categorías para realizar comparaciones

• Se ordenan las categorías de mayor a menor cantidad de apariciones o frecuencia y se les asigna cada categoría una barra

• El gráfico se complementa con una línea que representa la acumulación porcentual de las categorías

2.4 Gráfico de Pareto

Page 14: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

ORIENTAC

Fre

cue

nci

a

140

120

100

80

60

40

20

0

Po

rcen

taje

100

50

0911131317

2126

Ej. 8 “Gráfico de Pareto Orientación Psicoterapeutica”

¿Cómo interpretamos este

gráfico?

Page 15: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

1. HistogramasPara variables numéricas continuas, tales como la edad, la tensión arterial o el índice de masa corporal, el tipo de gráfico más utilizado es el histograma.Para construir un gráfico de este tipo, se divide el rango de valores de la variable en intervalos de igual amplitud, representando sobre cada intervalo un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de los datos en cada intervalo y el área de los rectángulos.

Gráficos para variables Cuantitativas

Page 16: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Tabla I.  Distribución de frecuenciasde la edad en 100 pacientes.

Edad Nº de pacientes

18 1

19 3

20 4

21 7

22 5

23 8

24 10

25 8

26 9

27 6

28 6

29 4

30 3

31 4

32 5

33 3

34 2

35 3

36 1

37 2

38 3

39 1

41 1

42 1

Page 17: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

• Como ejemplo, la anterior muestra la distribución de frecuencias de la edad de 100 pacientes, comprendida entre los 18 y 42 años.

• Como se vio en clases, se divide este rango en intervalos de dos años, el primer tramo está comprendido entre los 18 y 19 años, entre los que se encuentra el 4/100=4% del total.

• Por lo tanto, la primera barra tendrá altura proporcional a 4.

• Procediendo así sucesivamente, se construye el histograma que se muestra en la siguiente Diapositiva

Page 18: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ej. 9 “Histograma Variable Edad

¿Cómo interpretamos este

gráfico?

Page 19: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

2. Polígono de Frecuencias

• Uniendo los puntos medios del extremo superior de las barras del histograma, se obtiene una imagen que se llama polígono de frecuencias.

• Dicha figura pretende mostrar, de la forma más simple, en qué rangos se encuentra la mayor parte de los datos.

• Un ejemplo, utilizando los datos anteriores, se presenta en la siguiente Diapositiva

Page 20: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ej. 10 “Polígono de Frecuencias Variable Edad

¿Cómo interpretamos este

gráfico?

Page 21: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

3. Diagramas de Caja

• Otro modo habitual, y muy útil, de resumir una variable de tipo numérico es utilizando el concepto de percentiles, mediante diagramas de cajas

• Como se apreciará en el Ejemplo 11, la caja central indica el rango en el que se concentra el 50% central de los datos.

• Sus extremos son, por lo tanto, el 1er y 3er cuartil de la distribución.

• La línea central en la caja es la mediana.

• De este modo, si la variable es simétrica, dicha línea se encontrará en el centro de la caja.

Page 22: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

• Los extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores extremos de la distribución.

• Se suelen también representar aquellas observaciones que caen fuera de este rango (outliers o valores extremos).

• Esto resulta especialmente útil para comprobar, gráficamente, posibles errores en nuestros datos.

• En general, los diagramas de cajas resultan más apropiados para representar variables que presenten una gran desviación de la distribución normal.

Page 23: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

8636N =

GENERO

mujerhombre

ED

AD

80

70

60

50

40

30

20

6366

Ej. 11 “Polígono de Frecuencias Variable Edad

¿Cómo interpretamos este

gráfico?

Page 24: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

4. Gráficos de Líneas

• Los gráficos de líneas pueden resultar especialmente interesantes, sobre todo cuando interesa estudiar tendencias a lo largo del tiempo

• No son más que una serie de puntos conectados entre sí mediante rectas

• Cada punto puede representar distintas cosas según lo que nos interese en cada momento (el valor medio de una variable, porcentaje de casos en una categoría, el valor máximo en cada grupo, etc).

Page 25: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ej. 12 “Gráfico de Líneas Variable Número de pacientes trasplantados renales en el Complejo Hospitalario “Félix Bulnes" durante el periodo 1981-1997”

¿Cómo interpretamos este

gráfico?

Page 26: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ej. 13 Gráfico de Líneas Superpuestas Variable Variación en el peso medio de una muestra de recién nacidos según el control

ginecológico del embarazo y el hábito de fumar de la madre

¿Cómo interpretamos este

gráfico?

Page 27: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

5. Gráfico de Dispersión

• Cuando lo que interesa es estudiar la relación entre dos variables continuas, el método de análisis adecuado es el estudio de la correlación.

• Los coeficientes de correlación (Pearson, Spearman, etc.) valoran hasta qué punto el valor de una de las variables aumenta o disminuye cuando crece el valor de la otra.

• Cuando se dispone de todos los datos, un modo sencillo de comprobar, gráficamente, si existe una correlación alta, es mediante diagramas de dispersión,

• Se confronta, en el eje horizontal, el valor de una variable y en el eje vertical el valor de la otra.

Page 28: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

• Un ejemplo sencillo de variables altamente correlacionados es la relación entre el peso y la talla de un sujeto.

• Partiendo de una muestra arbitraria, podemos construir el diagrama de dispersión en el Ejemplo 14

• En él puede observarse claramente como existe una relación directa entre ambas variables

Page 29: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ej. 14 Histograma de Variables Talla y Peso

¿Cómo interpretamos este gráfico?

Page 30: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010.

Ejemplo Final: Relación entre Nivel de Estrés y Edad

EDAD

706050403020

Niv

el d

e E

str

és

5,0

4,5

4,0

3,5

3,0

2,5

2,0

¿Cómo interpretamos este gráfico?