Estadistica descriptiva-inicios

Post on 12-Jun-2015

1.789 views 0 download

description

Diapositivas sobre aspectos introductorios de Estadística Descriptiva

Transcript of Estadistica descriptiva-inicios

Juan Moncada Herrera

Dpto. De Cs. Matemáticas y Físicas

Universidad Católica de Temuco

Introducción a la Estadística Descriptiva

Población

Página 2

Problema Conocer

IndividuoUnidad de observación

Observar

VariablesMuestra

Registro deobservación

EL CONTEXTO:

LOS ELEMENTOS DE BASE:

IndividuoUnidad de observación

Muestra

Variables

Cualitativas Cuantitativas

Página 3

IndividuoUnidad de observación

Muestra

Variables

Cualitativas Cuantitativas- Nominales

- Ordinales

- Discretas- Continuas

LOS ELEMENTOS DE BASE:

Página 4

Variables

Cualitativas Cuantitativas- Nominales

- Ordinales

- Discretas- Continuas

LOS ELEMENTOS DE BASE:

Indiv. X1 … Xp

1

n

Tabla de datos Materia prima delanálisis estadístico

Página 5

SU OBJETIVO: Análisis de la Tabla de Datos

Indiv. X1 … Xp

1

n

RESUMEN O SÍNTESIS

Lo más representativo Lo esencial Lo más típico

Lo más relevante La «forma» La «estructura» La «diversidad»

RETORNO A LOS DATOSPágina 6

SU OBJETIVO: Análisis de la Tabla de Datos

Indiv. X1 … Xp

1

n

RESUMEN O SÍNTESIS

NUMÉRICO GRÁFICO

Página 7

ANALIZANDO LA TABLA DE DATOS:

RESUMEN O SÍNTESIS

NUMÉRICO GRÁFICO

TENDENCIA CENTRALPromedio o mediaModa, mediana

DISPERSIÓNRangoDesviación estándar

Página 8

RESUMEN O SÍNTESIS

NUMÉRICO GRÁFICO

POSICIÓNValores extremosCuartiles, quintiles deciles

FORMASimetríaCurtosis

ANALIZANDO LA TABLA DE DATOS:

Página 9

RESUMEN O SÍNTESIS

NUMÉRICO GRÁFICO

Vestuario

Alimentación

Ocio

Transporte

Gráfico de sectores:Variables cualitativasFrecuencias

Informa de:Distribución

ANALIZANDO LA TABLA DE DATOS: Recursos gráficos

Página 10

RESUMEN O SÍNTESIS

NUMÉRICO GRÁFICO

Gráfico de barras:Variables cualitativasFrecuencias

Vestuario Alimentación Ocio Transporte

0

5

10

15

20

25

30

35

40

45

Informa de:Distribución

ANALIZANDO LA TABLA DE DATOS: Recursos gráficos

Página 11

RESUMEN O SÍNTESIS

NUMÉRICO GRÁFICO

0 0,3 0,6 0,9 1,2 1,5 1,8 2,1 2,4 2,7 3

Valores de la variable

0

4

8

12

16

20

24

28

32

36

Fre

cuen

cia

Histograma:Variables cuantitativas continuasGran cantidad de observaciones

Informa de:Forma, tendencia central

ANALIZANDO LA TABLA DE DATOS: Recursos gráficos

Página 12

RESUMEN O SÍNTESIS

NUMÉRICO GRÁFICO

Box-Plot:Variables cuantitativas continuas

Pes

o0

0,3

0,6

0,9

1,2

1,5

1,8

2,1

2,4

2,7

3

Val

ores

de

la v

aria

ble

Informa de:Forma, posición

ANALIZANDO LA TABLA DE DATOS: Recursos gráficos

Página 13

RESUMEN O SÍNTESIS

NUMÉRICO GRÁFICO

Lineas:Variables cuantitativas

1 2 3 4 5 6 7 8 9 10 11 121,0

1,2

1,4

1,6

1,8

2,0

2,2

2,4

2,6

2,8

3,0 Variación mensual del IPC

Mes del año

Informa de:Tendencia

ANALIZANDO LA TABLA DE DATOS: Recursos gráficos

Página 14

MEDIDAS NUMÉRICAS DE RESUMEN

Media:

Mediana:X0.5 = Valor central (promedio de valores centrales) de la serie

ordenada de X

Moda:Valor(es) más frecuente(s) de X (datos cuantitativos y cualitativos)

n

iixn

X1

1

Tendencia central:

ANALIZANDO LA TABLA DE DATOS: Recursos numéricos

Página 15

MEDIDAS NUMÉRICAS DE RESUMEN

Rango: R(X) = Max(X) – min(X)

Desviación estándar:

Coeficiente de variación:

2)(1

1xx

nS i

%100)(X

SXCV

Dispersión:

ANALIZANDO LA TABLA DE DATOS: Recursos numéricos

Página 16

MEDIDAS NUMÉRICAS DE RESUMEN

Posición:

0% 25% 50% 75% 100%| | | | |

Cantidad acumulada de información

min Q1 Q2 Q3 Max

Serie creciente de valores observados

Primer cuartil Segundo cuartil - mediana Tercer cuartil

ANALIZANDO LA TABLA DE DATOS: Recursos numéricos

Página 17

EL RETORNO A LOS DATOS

Regla empírica de Chebyshev:

Si la distribución de los datos es simétrica en torno de su media, entonces:

• Aproximadamente el 67% de los datos se encuentra a una distancia igual a una desviación típica de la media.

• Aproximadamente el 95% de los datos se encuentra a una distancia de dos desviaciones típicas de la media.

• Aproximadamente el 99% de los datos se encuentra a tres desviaciones típicas de la media.

ANALIZANDO LA TABLA DE DATOS: Recursos numéricos

Página 18

RECURSOS INFORMÁTICOS

Programa R

Programa SPSS

Planilla de OpenOffice

MS Excel

Calculadora conmodo estadístico

Programa PAST

ANALIZANDO LA TABLA DE DATOS: Recursos informáticos

Página 19

ALTERNATIVAS COMERCIALES ALTERNATIVAS GRATUITAS O LIBRES

SINTETIZANDO:

Numérico Gráfico

BarrasTablas de frecuencias

Pictogramas

Información cualitativa o discreta

Resumiendo …

El Resumen puede ser:

ModaCircular - Sectores

Página 20

SINTETIZANDO:

Numérico Gráfico

Dispersión HistogramaTendencia central Posición

Ojiva

Box-plot (Gráfico de Cajas)

Información Continua

Resumiendo …

El Resumen puede ser:

Media

Mediana

Moda

Rango

Varianza

D. estándar

Polígono de frecuenciasCuartiles

Quintiles

Deciles

C. Variación Percentiles

Página 21

ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos

UN EJEMPLO

Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima

Nivel de autoestima

Nivel1 Nivel2 Nivel3 Nivel4

n 56 292 291 24

Min 4,3 3,87 3,67 4,27

Max 5,93 6,13 6,3 6,17

Mean 5,03446 5,0874 5,21608 5,18583

Variance 0,171756 0,207481 0,224896 0,345547

Stand. dev 0,414435 0,455501 0,474232 0,587833

Median 5,015 5,1 5,23 5,15

25 prcntil 4,7 4,77 4,93 4,69

75 prcntil 5,33 5,4225 5,57 5,5825

= 663 estudiantes

Rendimiento similar

Grupo Nivel 1 menos disperso

Mediana similar a media: Simetría

Página 22

ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos

UN EJEMPLO

Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima

Rendimiento ligeramente “cargado” a valores superiores

3,2 3,6 4 4,4 4,8 5,2 5,6 6 6,4

Promedio en Nivel 3 de Autoestima

0

6

12

18

24

30

36

42

48

54

Fre

cuen

cia

Página 23

ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos

UN EJEMPLO

Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima

Gráficos de caja permitiendo una lectura comparativa del rendimiento, según nivel de autoestima.

En Nivel 3 se observan dos “out liers” o valores atípicos.

Niv

el1

Niv

el2

Niv

el3

Niv

el4

3,2

3,6

4

4,4

4,8

5,2

5,6

6

6,4

Pro

med

ios

¿Qué grupo requiere intervención pedagógica?

Página 24

RECURSOS DE APOYO:

SUGERENCIAS BIBLIOGRÁFICAS:

Página 25

1. Webster A. (2000): Estadística aplicada a los negocios y la economía. McGraw-Hill, Colombia.

2. Lind, Marchal & Wathen (2008): Estadística aplicada a los negocios y la economía. McGraw-Hill, México.

3. Canavos G. (1988): Probabilidad y Estadística. Aplicaciones y métodos. McGraw-Hill, México.

4. Walpole, Myers, Myers & Ye (2007): Probabilidad y estadística para ingeniería y ciencias. Pearson-Prentice Hall, Octava edición, México.

SOFTWARE ESTADÍSTICOS GRATUÍTO O LIBRE:

1. Programa PAST. Website: http://folk.uio.no./ohammer/past/2. Programa R. Website: www.r-project.org3. Programa OpenOffice. Website: www.openoffice.org

Juan Moncada Herrera

Dpto. De Cs. Matemáticas y Físicas

Universidad Católica de Temuco

Introducción a la Estadística Descriptiva