Estadística Descriptiva - Instituto Claret · Opción 1 Opción 2 Opción 3 Opción 4 Clase Frec....
Transcript of Estadística Descriptiva - Instituto Claret · Opción 1 Opción 2 Opción 3 Opción 4 Clase Frec....
Estadística
Descriptiva Jeanette Badilla
PLANTEAMIENTO DEL PROBLEMA
PLANIFICACION
RECOLECCION DE DATOS ANALISIS
CONCLUSIONES
CICLO DE INVESTIGACION
Entender y definir el problema
¿Cómo podemos responder
la pregunta?
¿Qué debemos medir
y cómo?
Adquisición y registro
de la información
Ordenamiento de los
datos, construcción de
tablas y gráficos,
búsqueda de patrones
Interpretación y
comunicación de
conclusiones, y
generación de nuevas
preguntas
• En la actualidad, nos vemos enfrentamos a información
entregada a través de tablas y gráficos, tanto en medios
de comunicación o en situaciones cotidianas, como en
publicaciones o estudios más específicos sobre temas
de nuestro interés personal, o en relación a nuestro
quehacer laboral. Esta información es, por lo general, el
resultado de estudios originados por preguntas o temas
de interés.
ORGANIZACIÓN DE DATOS Y REPRESENTACION DE LA INFORMACION
¿En que caso es preferible una de las tablas sobre la otra?
TABLAS DE FRECUENCIA
Nombre Deporte favorito
Matías Fútbol
Andrea Tenis
María José Gimnasia rítmica
Pablo Básquetbol
Antonia Fútbol
Catalina Gimnasia rítmica
Tomás Básquetbol
Diego Tenis
Lucas Fútbol
Patricio Básquetbol
Fernanda Fútbol
Hernán Básquetbol
Daniel Básquetbol
Manuel Fútbol
Eugenio Gimnasia rítmica
Deporte
favorito
Número de niños
Fútbol 6
Básquetbol 4
Gimnasia
rítmica
3
Tenis 2
En un curso de 15 alumnos, los niños
están interesados en conocer su deporte
favorito. Dos alumnos del curso, Antonia
y Diego, registran la información
recolectada como se muestra en las
siguientes tablas.
Antonia
Diego
Propósitos de las tablas de frecuencia
1. Resumir las observaciones. Es decir, representar de manera sucinta la información conjunta entregada por estas. Eliminando información individual de cada una que pudiese dificultar la identificación de patrones globales.
2. Organizar las observaciones. Las tablas de frecuencias en ocasiones son un paso intermedio entre las observaciones y una representación gráfica.
3. Comunicar información de las observaciones recolectadas lo que permite la extracción de conclusiones generales.
Frecuencia TABLAS DE FRECUENCIA PARA UNA VARIABLE CUALITATIVA
1. Frecuencia absoluta, relativas y relativas porcentuales
La construcción de un tabla de frecuencia se basa en el conteo de las
observaciones en cada categoría de la variable. Una manera en que los
niños en edad temprana pueden realizar esta labor corresponde a la
construcción de lo que se denomina tablas de conteo.
Deporte Favorito Conteo
Fútbol
Básquetbol
Gimnasia Rítmica
Tenis
/ / / / / /
/ / / /
/ / /
/ /
////
¿Cuál es el deporte favorito de los niños?
¿Cuántos niños prefieren el basquetbol?
Número reducido de observaciones
TABLAS DE FRECUENCIA PARA UNA VARIABLE CUALITATIVA
Cuando el número de observaciones (muestra) es de mayor tamaño se
hace difícil identificar a simple vista cuántas observaciones hay en cada
categoría y por esto también comparar una categoría con otra. En este
caso es conveniente cuantificar la información de la tablas de conteo
pasando a una tabla de frecuencia.
Deporte Favorito Registro Frecuencia
absoluta
Fútbol
Básquetbol
Gimnasia Rítmica
Tenis
//////
////
///
//
6
4
3
2
Total 15
Las frecuencias absolutas nos permiten comparar las magnitudes de dos categorías del conjunto de datos.
TABLAS DE FRECUENCIA PARA UNA VARIABLE CUALITATIVA
Las frecuencias relativas nos ayudan a entender de mejor manera la
información..
La frecuencia relativa corresponde a la proporción de observaciones de
una categoría respecto del total de observaciones y, para calcularla,
debemos dividir el número de observaciones de la categoría por el
número total de observaciones.
Deporte Favorito Frecuencia
absoluta
Frecuencia
relativa
Fútbol
Básquetbol
Gimnasia Rítmica
Tenis
6
4
3
2
0,40
0,27
0,20
0,13
Total 15 1.00
Estandariza la frecuencia de
acuerdo al tamaño de la muestra
EJEMPLO
«5ª Encuesta Nacional de la Juventud» realizada entre Noviembre y
Diciembre 2006 por el Instituto nacional de la juventud.
Situación del entrevistado Frecuencia Porcentaje
Sólo estudia
Sólo trabaja
No estudia ni trabaja
Sólo buscando trabajo
Buscando trabajo y
estudiando
Trabaja y estudia
No responde
1.256.734
1.120.307
509.557
462.761
377.880
258.027
15.125
31,4%
28,0%
12,7%
11,6%
9,4%
6,5%
0,4%
Total 4.000.391
De la tabla leemos que un 0,4% de la muestra no responde.
¿Cuál es la importancia de reportar esta cantidad?
DEFINICION DE LAS CATEGORIAS UTILIZADAS
La regla general al construir las categorías de una variable es que cada
individuo o elemento de la muestra debe pertenecer a una y solo una de
estas categorías.
Eso debe reflejarse claramente al asignar nombres a las categorías
definidas.
Situación del entrevistado Frecuencia Porcentaje
Sólo estudia
Sólo trabaja
No estudia ni trabaja
Sólo buscando trabajo
Buscando trabajo y
estudiando
Trabaja y estudia
No responde
1.256.734
1.120.307
509.557
462.761
377.880
258.027
15.125
31,4%
28,0%
12,7%
11,6%
9,4%
6,5%
0,4%
Total 4.000.391 100%
TABLAS DE FRECUENCIA PARA UNA VARIABLE CUALITATIVA ORDINALES
El orden de las categorías en la tabla es relevante. Y éste dependerá de la
información que se desea comunicar.
Ejemplo: Información entregada por la misma encuesta juvenil donde se
expresa la asistencia de los entrevistados a ceremonias religiosas.(Excluye
bautizos, matrimonios y funerales)
Asistencia a
ceremonias
religiosas
Porcentaje
Nunca
Sólo ocasionalmente
Semanalmente
Una vez al mes
No responde
44,1%
33,7%
13,4%
6,7%
2,1%
¿Cuál cree que ha sido criterio al ordenar las categorías en la
tabla?
¿Le parece esto razonable?
TABLAS DE FRECUENCIA PARA UNA VARIABLE CUANTITATIVA
Las categorías deben ser excluyentes al igual que las cualitativas, son
ordenables y se debe respetar el orden en la tabla, en este caso creciente.
Ejemplo: Supongamos que la edad de los profesores de una escuela
corresponde a
32 37 36 32 51 53 33 61 35 45 55 39
76 37 42 40 32 60 38 56 48 48 40 43
62 43 42 44 41 56 39 46 31 47
Categoría Frecuencia
absoluta
Frecuencia relativa
Porcentual
Frecuencia relativa
Porcentual Acumulada
30 - 39 años
40 - 49 años
50 - 59 años
60 - 69 años
70 - 79 años
14
11
6
2
1
41%
32%
18%
6%
3%
41%
73%
91%
97%
100%
Total 34 100%
REGLAS PARA CONSTRUIR TABLAS DE FRECUENCIA PARA DATOS
CUANTITATIVOS
1. En la medida de lo posible, todos los intervalos de la clase deben ser
de la misma amplitud.
2. Los intervalos de clase(categorías) no deben superponerse.
3. En la medida de lo posible, no deben haber intervalos de clase vacía,
o con frecuencia 0.
4. Deben de haber suficientes intervalos de tal manera que no todos los
datos se acumulen en una o dos clases.
• La amplitud de la clase es una manera de medir el tamaño de la muestra.
• La amplitud de la clase se entiende como la diferencia entre límites inferiores de las clases.
• Como regla general, podemos decir que a medida que aumentamos el número de clases, obtendremos conclusiones mas detalladas del comportamiento de la variable de interés.
• Por otra parte, al disminuir el número de clases, podremos tener una visión más general de este comportamiento.
AMPLITUD DE LA CLASE
Elección de clases en la construcción de tablas de
frecuencia para una variable cuantitativa.
16 27 26 5 11 33 23 17 15 20 3 14
29 21 23 31 16 8 14 28 19 20 24 35
7 12 22 27 18 20
Ejemplo: Considere los siguientes datos que representan el número de visitas a un sitio de internet en días sucesivos de un mes
Clases
Opción 1 Opción 2 Opción 3
0 a 4
5 a 9
10 a 14
15 a 19
20 a 24
25 a 29
30 a 34
35 a 39
0 a 9
10 a 19
20 a 29
30 a 39
3 a 7
8 a 12
13 a 17
18 a 22
23 a 27
28 a 32
33 a 37
Elección de clases en la construcción de tablas de
frecuencia para una variable cuantitativa.
16 27 26 5 11 33 23 17 15 20 3 14
29 21 23 31 16 8 14 28 19 20 24 35
7 12 22 27 18 20
Ejemplo: Considere los siguientes datos que representan el número de visitas a un sitio de internet en días sucesivos de un mes
Clases
Opción 1 Opción 1
modificada
0 a 4
5 a 9
10 a 14
15 a 19
20 a 24
25 a 29
30 a 34
35 a 39
0 a 5
5 a 10
10 a 15
15 a 20
20 a 25
25 a 30
30 a 35
35 a 40
Condición de no superposición
Clases
Opción 1 Opción 2 Opción 3 Opción 4
Clase Frec. Clase Frec. Clase Frec. Clase Frec.
0 a 4
5 a 9
10 a 14
15 a 19
20 a 24
25 a 29
30 a 34
35 a 39
1
3
4
6
8
5
2
1
0 a 9
10 a 19
20 a 29
30 a 39
4
10
13
3
3 a 7
8 a 12
13 a 17
18 a 22
23 a 27
28 a 32
33 a 37
3
3
6
7
6
3
2
0 a 19
20 a 39
14
16