Docente Ana Clarisa Ruiz Quintero Fecha Abril 9 Institución Universitaria Escolme Medellín 2012
description
Transcript of Docente Ana Clarisa Ruiz Quintero Fecha Abril 9 Institución Universitaria Escolme Medellín 2012
Docente
Ana Clarisa Ruiz Quintero
Fecha Abril 9
Institución Universitaria Escolme
Medellín
2012
ESTADISTICA DESCRIPTIVA INTRODUCCION
1. ¿Qué es estadística?
• La estadística es un conjunto de técnicas y procedimientos
matemáticos que estudia la recolección, análisis e interpretación de
datos. Permite llevar a cabo el proceso relacionado con la
investigación científica. Se usa para la toma de decisiones en áreas
de: negocios, salud, demografía, de instituciones públicas, privadas
e investigación, etc.
• La información se recolecta, clasifica, organiza e interpreta.
• Se tabula, procesa, grafica y analiza para la toma de decisiones.
La estadística descriptiva es una ciencia que analiza series de datos
(por ejemplo, edad de una población, altura de los estudiantes de una
escuela, peso de animales para consumo humano, temperatura en los
meses del año, etc.) y trata de extraer conclusiones sobre el
comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir
numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: cuando los valores que asume o toma son el
resultado de un conteo, tienen valor numérico (edad, precio de un
producto, ingresos anuales).
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).
Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y estatura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros positivos (1, 2, 8, etc.) o que se originan de un conteo. Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3,5, es decir, no se puede tener tres hermanos y medio).
Continuas: puede tomar valores decimales. Por ejemplo, la velocidad de un carro puede ser 80,3 km/h, 94,57 km/h...etc.
Estadística
ESTADISTICA DESCRIPTIVA ESTADISTICA INFERENCIAL
Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente.
Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones.
Definición de
Estadística
Palabras claves• Población: Se usa para referirnos a conjuntos de cosas,
personas o situaciones, con alguna característica común que
permite agruparlas.
• Muestra: Es un subconjunto de una determinada población.
Es la parte más representativa, elegida al azar.
Población
Muestra
• Variable estadística: Es la característica de los elementos de la
población que se estudia.
• Variable Cualitativa: Aquella variable que no es medible.
Ejemplo: sexo, estado civil, color de ojos, tipo de cabello.
• Variable Cuantitativa: Aquella variable que se puede contar o
medir. Ejemplo: peso, edad, número de hijos, etc.
• Variable Cuantitativa Discreta: Número de hijos, número de
hermanos, número de llegadas tarde, edad promedio, etc.
• Variable Cuantitativa Continua: talla, peso, suelo,
temperatura, velocidad, etc.
Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos.Las medidas de posición son de dos tipos:
a) Medidas de posición central: informan sobre los valores medios de la serie de datos.
b) Medidas de posición no centrales: informan cómo se distribuye el resto de los valores de la serie.
a) Medidas de posición centralLas principales medidas de posición central son las siguientes:
1. Media: es el valor medio ponderado de la serie de datos. Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite, y la
suma de todos estos productos se divide por el total de datos de la muestra:
Medidas de posición central
_ (X1 * n1) + (X2 * n2) + (X3 * n3) +.....+ (Xn-1 * nn-1) + (Xn * nn)
Xm=---------------------------------------------------------
n
Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información. Sin embargo, presenta el problema de que su valor se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad.
2.- Mediana (Me): es el dato que divide la distribución de frecuencia
en dos partes iguales, (es el valor que se sitúa justamente en el centro
de la muestra), es decir, un 50% por debajo o a la izquierda, y 50% por
encima o a la derecha.
No presentan el problema de estar influido por los valores extremos,
pero en cambio no utiliza en su cálculo toda la información de la serie
de datos (no pondera cada valor por el número de veces que se ha
repetido).
3.- Moda: es el dato que en la muestra, más se repite o el que
corresponde a la mayor frecuencia.
Tabla de distribución de frecuencia de datos no agrupados
Se tiene un grupo de 27 estudiantes a cada uno se le pidió la talla de los
zapatos.
Los datos obtenidos en este ejercicio son:
Xi 38,38,37,38,39,37,35,35, 37,34,38,35,38,36,37,37,39,37,36,38,38,42,35,44,41,38,37
Se pide calcular:
1. Cuanto calzan en promedio en este salón de clase.
2. ¿Cual es la moda?
3. ¿Cual e la mediana?
Ejercicio
Tabla de distribución de frecuencia
Organizamos los números de los zapatos de menor a
mayor y contamos cuantas veces se repite cada número fi
como vemos en la tabla.
Xi Son los datos que se presentan en el ejercicio.
fi Es el número de datos que hay por cada número de
zapatos.
Fi Se realiza sumando el Fi con el fi sucesivamente.
Xifi Se multiplica el Xi con el fi . Se suman y da 1014
N es la ∑ fi
∑ Xifi es 1014
Xi fi Fi Xifi
34
1 1 34
35
4 5 140
36
2 7 72
37
7 14 259
38
8 22 304
39
2 24 78
41
1 25 41
42
1 26 42
44
1 27 44
1. Cuanto calzan en promedio en este salón de clase. ∑Xifi /N
1014 /27 = 37,5 se aproxima a 38
El promedio de las tallas de los zapatos es 38.
2. ¿Cual es la moda? La talla mas común de los zapatos, el dato que más se
repite es en este caso 38.
3. ¿Cual e la mediana? Es el dato que cubre el 50% de la muestra.
Se suma el total de todo lo que hay en fi y se le saca el 50 %
dependiendo del dato que nos de, lo buscamos en Fi teniendo en cuenta
que si no tenemos el mismo número miramos el que se aproxima más,la
mediana es en este caso 37.
34 35 35 35 35 36 36 37 3737 37 37 37 37 38 38 38 3838 38 38 38 39 39 41 42 44
Edad de los alumnos Xi
Número de alumnos fi
Frecuencia absoluta Acumulada Fi
Frecuencia relativa hi
Frecuencia relativa Acumulada Hi ∑Xifi
34 1 1 0,04 0,04 3435 4 5 0,15 0,19 14036 2 7 0,07 0,26 7237 7 14 0,26 0,52 25938 8 22 0,30 0,81 30439 2 24 0,07 0,89 7841 1 25 0,04 0,93 4142 1 26 0,04 0,96 4244 1 27 0,04 1,00 44
Total 27 1,00 1014 Talla promedio 37,56
∑Xifi /N 1014/27 = 37,56Talla promedio
Ejercicio: Se tiene un grupo de 27 estudiantes a cada uno se le pidió la talla de los zapatos.Calcular: El porcentaje por número y la talla promedio.
∑Xifi /NEdad promedio
1. Recolección de Datos 2. Organización de Datos
11 11 11 11 11 11 11 11 12 1212 12 12 12 12 12 12 12 12 1212 12 12 12 12 12 12 12 12 1213 13 13 13 13 13 13 13 13 1313 13 13 13 13 13 13 13 13 1313 13 13 13 13 13 13 13 13 1314 14 14 14 14 14 14 14 14 1414 14 14 14 14 14 14 14 14 14
Edad de los alumnos Xi
Número de alumnos fi
Frecuencia absoluta Acumulada Fi
Frecuencia relativa hi
Frecuencia relativa
Acumulada Hi
∑Xif
i 11 8 8 0,1 0,1 8812 22 30 0,275 0,375 26413 30 60 0,375 0,75 39014 20 80 0,25 1 280
Total 80 1 10221022/80= 12,775
1022/80= 13
11 12 12 13 12 13 14 12 13 13
13 11 11 13 14 13 13 13 13 12
13 14 12 13 12 13 12 14 12 12
14 12 11 14 12 13 14 13 13 12
11 14 14 13 14 11 12 13 11 13
14 12 14 12 14 13 12 14 13 13
13 12 12 12 14 14 13 13 13 11
13 14 13 14 13 12 14 12 14 13
Ejercicio:Para estudiar la edad de los alumnos , de una institución educativa, se hizo una encuesta a 80 de ellos. Calcular: el porcentaje por edades, la edad promedio.
∑Xi/NEdad promedio
1. Recolección de Datos 2. Organización de Datos
2045/80 = 25,563
2045/80 = 26
Ejercicio: Edad de 80 pacientes que asistieron al hospital municipal el lunes pasado.
Edad mínima 12Edad máxima 39k 6Amplitud del intervalo de clase 5
Clases (edades) fi Fi
Li - Ls (pacientes)Acumula
da12 - 16 12 1217 - 21 12 2422 - 26 18 4227 - 31 23 6532 - 36 7 7237 - 41 8 80
19 24 36 15 2436 25 14 16 1917 28 39 17 1538 26 35 24 1524 26 28 29 2435 36 24 15 1612 31 17 28 2935 26 25 23 2429 28 27 29 2634 38 18 19 1617 15 16 27 2839 28 26 27 1826 38 29 38 1827 29 27 28 3927 28 19 38 2816 24 26 27 19