Post on 10-Jun-2018
ESTADÍSTICA DESCRIPTIVA
Se refiere a aquella parte del estudio de los datos que incluye la obtención, organización,presentación , descripción e interpretación de información numérica
Estadística Descriptiva
Presentación de datos
Métodos gráficos
Medidas descriptivas
Medidas de tendencia central
y de dispersión
ESTADÍSTICA INFERENCIAL
Es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones con base a una información parcial o incompleta obtenida mediante técnicas descriptivas
Nos permite elegir procedimientos para analizar, interpretar y tomar decisiones sobre una población, con base en la información que se obtiene de una muestra
ESTADÍSTICA
Se refiere a un conjunto de métodos para la obtención, presentación y análisis de observaciones numéricas.
Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las posibles observaciones bajo consideración
TOMA DE DECISIONES
• Secuencia en la resolución de problemas• 1.-Delimitar el objetivo que se persigue
• 2.- Búsqueda de la información Define dónde, cuándo, cómo y qué datos buscar
Se puede partir de datos existentes o iniciar recopilación de los mismos
• 3.-Análisis de la información Debe sustentarse en un trabajo estadístico de los datos
• 4.-Conclusiones
• 5.- Acciones a tomar y monitoreo de resultados
Cuando una variable es medida en un conjunto de unidades experimentales,
resulta un conjunto de mediciones o datos
Una unidad experimental es el individuo u objeto en el que se mide una variable
VARIABLES
Una variable es una propiedad que puede fluctuar y cuya variación es susceptible de medirse u observarse
También podemos considerar a una variable como una característica que cambia o se modifica con el tiempo y/o para diferentes individuos u objetos en consideración.
Atributos .- Son las características o cualidades que describen un objetoHombre, africano, conservador, honesto..
Las variables son agrupamientos de atributos Por ejemplo : género, raza, ocupación …
DATOS
Medidas que se realizan sobre los sujetos u objetos de un experimentos
Normalmente son las medidas cuantitativas de la variable dependiente o algunas características cualitativas del sujeto
“ es lo que estamos midiendo o contando”
TIPO DE VARIABLES
Variable Independiente
Es aquella característica o propiedad que se supone tiene una relación con el fenómeno o variable estudiada.
En una investigación experimental se llama así, a la variable que el investigador manipula
Variable de predicción, normalmente en el eje de las coordenadas (x)
VARIABLES
Variable Dependiente
Se define como la propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.
Variable que se predice o se calcula a partir de la variable independiente, situada en el eje de la abscisas ( y ).
TIPOS DE VARIABLES
CualitativasSon las variables que expresan distintas cualidades, características o modalidades . Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos.
Por ejemplo
Colores : rojo, azul , blanco …
Profesiones : Ingeniería, Médico, Administrador
Genero : Hombre o mujer
TIPOS DE VARIABLESCualitativas
Los sujetos u objetos se agrupan sobre la base de alguna característica en común , esto es, se coloca en cada categoría con el fin de hacer comparaciones
Por ejemplo : El promedio de gasto en celular de los estudiantes que trabajan es 300 pesos al mes, mientras que el gasto de los estudiantes que no trabajan es de 200 peso
VARIABLES CUANTITATIVAS
Son las variables que se expresan mediante cantidades numéricas y no tienen categorías que las diferencien
Por ejemplo : EstaturaPedro tiene una estatura de 1.86
Karla tiene una estatura de 1.65
Sigo con dudas
En Los datos de variables cualitativas , la media carece de significado 20 hombres y 10 mujeres ¿ cuál es la media?? No son 15 medios hombres
En los datos cuantitativos si podemos obtener un valor medio que tenga significado , por ejemplo el promedio de peso de los alumnos de este grupo Por ejemplo podemos saber el peso promedio de este grupo, o el tiempo en que tardan en llegar a clase…
POBLACIÓN Y MUESTRA
PoblaciónMuestra
La población es el conjunto de elementos de interés en
determinado estudio
La muestra es un subconjunto de la
población
Población
Muestra
Un parámetro es una medición numérica que
describe las características de una población
Un estadístico es una medición numérica que describe las
características de la muestra
POBLACIÓN
Si un conjunto de datos consta de todas las observaciones concebidas o hipotéticamente posibles de un fenómeno determinado, lo llamamos una población.Por ejemplo si queremos estudiar los hábitos de alimentación de los estudiantes de Unitec, tendríamos que tomar datos de TODOS los alumnos de Unitec.
MUESTRA
Si un conjunto de datos consiste sólo en una parte de estas observaciones se le conoce como : muestraLos datos deben ser representativos de la población
En el caso de una muestra representativa de los alumnos de Unitec se deben considerar la composición de los siguientes factores
Género
Carrera
Edad …etc.
NIVEL DE MEDICIÓN NOMINAL
Las unidades de la escala nominal son categorías. Los objetos se clasifican y cuentan al determinar la categoría a la cual pertenecen. En esta escala de medición ,determinamos la frecuencia en cada categoría… o sea contamosSon variables cualitativas
No tienen una relación de magnitud entre ellas
Tiene la propiedad de la equivalencia, lo que implica que deben tener ciertas características determinadas y especificas en cada categoría .
Las categorías deben de ser mutuamente excluyentes y exhaustivas
Ejemplos:
Colores: azul, blanco, negro…
Respuesta a encuestas, como: si, no , indeciso
Se puede hacer un análisis de datos , pero cualquier promedio carece de sentido.
Nominal
2.- Nivel de medición ordinal
Tienen las propiedades de los datos nominales y estos datos pueden acomodarse en algún orden de manera significativa.
Dichas categorías se clasifican o se ordenan ( de manera jerárquica) de acuerdo con las características particulares que poseen
Esto es, representan posiciones de rango
2.- Nivel de medición ordinal
Los datos ordinales ofrecen información sobre comparaciones relativas, aunque no sobre las magnitudes de las diferencias.
Por ejemplo designar etiquetas como :
calidad de vida ( alto, medio, bajo)
calificaciones (A, B, o C)
Nivel de motivación ( bueno, regular, malo)
Cuatrimestre ( primero, segundo, tercero..)
ESCALA DE INTERVALO
Nivel de medición de intervalo
Comparte las características de la medición ordinal pero tiene la propiedad adicional de que la diferencia entre dos valores de datos tiene un tamaño constante ( intervalo)
Un intervalo indica una distancia constante entre cada valor.
Por ejemplo las medidas de temperatura en la escala de un termómetro ( de grado en grado)
Una línea de tiempo ( años, o meses, o días)
Calificaciones ( 10, 9, 8 , 7…)
ESCALA DE INTERVALOEn este caso las diferencias iguales en las características están representadas por diferencias iguales en los números asignados a las categorías
Por ejemplo en una escala de temperatura la diferencia entre 10 y 20 grados es la misma entre 30 y 40 grados
ESCALA DE RAZÓNLa escala de razón: posee las propiedades de magnitud, intervalos iguales entre unidades adyacentes y un punto de cero absoluto, lo que le permite que se puedan establecer razones y realizar todas las operaciones asociadas a los números
El punto o valor cero, representa la ausencia de la característica y se pueden obtener valores dentro de un intervalo Por ejemplo : tiempo de reacción … 10.5 min
Peso…. 5.4 kg
longitud y la frecuencia de cualquier evento, etc.
EJERCICIOS
Determine: La variable dependiente, variable independiente,
´Cuál es la variable cualitativa (s)?
Cuál es la variable cuantitativa (s) ?
Es un estudio descriptivo o inferencial?
Escalas de medición
Cuál es el parámetro de la población?
Cuál es el estadístico de la MUESTRA?
Un investigador en ginecología quiere determinar si un tipo de implante para el control natal tiene efectos colaterales sobre el peso y sobre el nivel de depresión ( alto, medio , bajo) en las mujeres . El grupo de estudio lo conforman 5000 mujeres del Estado de México que se han ofrecido como voluntarias para el experimento. El investigador elige a 200 de esas mujeres para que participen en el experimento. Se dividen en dos grupos, en el grupo 1 se le administra un tratamiento y al grupo 2 se controlo la natalidad por métodos naturales . Al inicio del tratamiento se les mide el peso promedio y el nivel de depresión. Al final del experimento se midieron el peso y el nivel de depresión y se comparan los datos para la toma de decisiones
EJERCICIO
Un investigador está interesado en evaluar tres métodos para tratar la depresión: a).- la medicación, b).- la reestructuración cognoscitiva y c).- el ejercicio de relajación . Se recluta a 60 estudiantes entre los 350 alumnos de la universidad que tienen reporte de depresión grave . Los tratamientos se administran durante seis meses, después de lo cual cada estudiante recibe un cuestionario diseñado para medir el grado de depresión. El cuestionario tiene una escala de 0 a 100, donde los puntajes mayores indican un mayor nivel de depresión. Se determina que aquellos que tienen valores menores 50 como depresión leve; entre 51 y 70 como depresión media y los que obtienen valores mayores 71 se consideran con depresión grave. Una vez que terminó el experimento se calcularon los valores promedio de depresión y se emplearon para determinar si la eficacia de cada tratamiento es diferente .
El área de producción de cierto envasado de un refresco de cola quiere saber cuáles son las causas de la fuga de gas en sus productos, para ello realiza muestras a los tres proveedores que le proporcionan los envases. El área de calidad determina el diámetro interno de los envases; la resistencia a la ruptura (medido en Kg/cm2), ´tipo de polímero empleado en la elaboración del envase.
Por otro lado determina los factores dentro de la operación dentro de los que considero: equipo empleado ( línea de producción); años de experiencia del operador del equipo; turno de producción en la que se realiza el proceso; nivel educativo del operador.
De cada proveedor se determinan analizar un lote de 10 000 unidades y de allí se toma una muestra de 125 unidades.
Un psicólogo de la salud está interesado en saber si la motivación por miedo es eficaz para reducir la incidencia en el uso del cigarro. Se eligen 40 individuos adultos fumadores entre los 700 individuos que se reportan como fumadores en la empresa donde labora el psicólogo. El experimento consiste en mostrar imágenes sobre los daños que ocasiona el cigarro a un grupo de 20 individuos, mientras que al otro grupo de 20 individuos no se le muestran ninguna clase de imágenes. El experimentador mantiene un registro de la cantidad de cigarros que fuman diariamente los participantes en la investigación. Se calcula, entonces, para cada grupo el promedio de cigarros fumados diariamente y se comparan los resultados entre los grupos para determinar si la motivación por miedo tuvo un efecto entre los fumadores
EJERCICIO
Cuál es el nivel de medición utilizado en cada una de las siguientes variables A.-Nivel de stress clasificado como alto, medio y bajo
B.- Las diferentes carreras que ofrece la Universidad
C- Clasificación de los alumnos de acuerdo al estado donde nacieron
D.-Clasificación de alumnos según el año escolar en que se encuentren.
E.- Número de horas de estudio de los estudiantes a la semana.
Identifique tipo de medición en la encuesta siguiente?
1.-¿ Estado civil?
2.-¿ Cuáles son sus ingresos?
3.-¿ Qué explorador de Internet utiliza?
4.-¿ Cómo califica el servicio de esta compañía?
5.-¿ Estaría dispuesto a viajar? Si_______ no____________
6.-Consumo alimentos “chatarra” Siempre
frecuentemente_______
Pocas veces
Nunca
VARIABLES CUALITATIVAS
ESCALAS NOMINALES Y ORDINALES
1.- Empleo de Tablas de Distribución de frecuencias
2.- Uso Gráfica de barras o sectores
3.- Estadístico descriptivo: MODA
ESTADÍSTICA DESCRIPTIVA PARA VARIABLES CUALITATIVAS
Clase.- es un conjunto de valores o categorías en que son agrupados los datos de una serie
En el caso de género : hombre , mujeres
Colores : rojo, verde, azul …
Frecuencia.- Es la cantidad de datos que están incluidos en cada una de las clases
Por ejemplo, cuántos hombres y cuántas mujeres?
La frecuencia es Contar ¡¡¡¡
TABLA DISTRIBUCIÓN DE FRECUENCIAS
Una distribución de frecuencias es el resumen tabular de un conjunto de datos que muestra el número o frecuencia de artículos en cada una de las clases.
Organiza los datos según su clase y su frecuencia de acuerdo a el siguiente procedimiento:
1.- Definimos clase o categoría
2.- Contamos el número dentro de la categoría ( frecuencia)
3-Cuando empleamos una tabla de distribución de frecuencia para datos cualitativos, normalmente las clases se ordenan de la mayor a la menor frecuencia
ESTADÍSTICA DESCRIPTIVA PARA VARIABLES CUALITATIVAS
Qué información debe tener una tabla de frecuencias :
1.- Distribución de frecuencia
2.- Distribución de frecuencia acumulada
3.- Distribución de Frecuencias relativas .- Es la proporción de mediciones en cada categoría
Frecuencia relativa= Frecuencia individual
Número total
ESTADÍSTICA DESCRIPTIVA PARA VARIABLES CUALITATIVAS
Qué información debe tener una tabla de frecuencias :
4.- Distribución de frecuencias relativas acumuladas
5.- Porcentaje Este lo podemos calcular multiplicando la frecuencia
relativa por 100.
Una bolsa de cacahuates de M&M contiene 21 dulces de diferentes colores y la distribución de los datos es la siguiente:
Categoría frecuencia
Café 6
anaranjado 5
verde 3
amarillo 3
rojo 2
azul 2
Total (N) 21
Frecuenciaacumulada
Frecuenciarelativa
6 6/21= 0.2857
6+5=11 5/21=0.2380
11+3=14 3/21=0.1428
14+3= 17 3/21=0.1428
17+2=19 2/21=0.0952
19+2=21 2/21=0.0952
1
Frecuencia relativa PORCENTAJE PORCENTAJE ACUMULADO
fr x 100
6/21= 0.2857
28.57 28.57
5/21=0.2380 23.8 52.37
3/21=0.1428 14.28 66.65
3/21=0.142814.28 80.93
2/21=0.0952 9.52 90.45
2/21=0.0952 9.52 99.97
1
DIAGRAMAS PARA VARIABLES CUALITATIVAS
1.-Diagrama circular (pastel).- Se emplea para mostrar el porcentaje de cada clase en el total
2.- Diagrama de barras.- Está compuesto por barras rectangulares separadas que representan una clase o categoría.
0
1
2
3
4
5
6
frecuencia
6
5
3 32 2
Café anaranjado verde amarillo rojo azul
Empleemos el ejercicio de los
dulces
Calcule para los siguientes ejercicios :1-frecuencia
2.- frecuencia acumulada3.- frecuencia relativa
3.1- Porcentaje
4.-Construya un gráfico circular y un gráfico de barras
EJERCICIO
La siguiente tabla muestra las preferencias de los usuarios de Internet sobre los buscadores de la Web, en el año 2003 en los Estados Unidos
buscador Frecuencia
Ask jeeeves 6
AOL TIME WARNER 19
GOOGLE 32
MSN 15
YAHOO 25
OTROS 3
Los siguientes datos representan las quejas acerca de las habitaciones de un hotel
razón Frecuencia
Habitación sucia 32
Habitación sin equipamiento 17
Habitación que no está lista 12
Ruido 10
Camas en mal estado 13
Falla de aire acondicionado 19
Falla de agua caliente 29
Ver PARETO
EJERCICIO
La siguiente tabla representa la fuentes de energía eléctrica utilizadas en Estados Unidos en 1999.
fuente Porcentaje
Carbón 51
Plantas hidroeléctricas 6
Gas natural 16
Nuclear 21
Petróleo 7
Otras 3
Elabore un diagrama de Pareto
¿Qué gráfica prefiere usar? ¿Por qué?
Un analista registró las causas de las caídas de una red durante los pasados seis meses Razón de la falla Frecuencia
Conexión física 4
Falla de energía 3
Software del servidor 29
Hardware del servidor 2
falta de capacidad de memoriaDel servidor
32
Banda ancha inadecuada 5
Un egresado de licenciatura desea continuar sus estudios de maestría y observó que en el proceso de admisión los estudiantes muestran cierta preferencia por algunas áreas de conocimiento que se muestran en la siguiente tabla
ARTES 9ADMON 24LEYES 2CIENCIAS 13SOCIALES 26INGENIERIA 21OTRAS 5
FRECUENCIAFRECUENCIA ACUMULADA
FRECUENCIA RELATIVA
SOCIALES 26 26 0.26ADMON 24 50 0.24INGENIERIA 21 71 0.21CIENCIAS 13 84 0.13ARTES 9 93 0.09OTRAS 5 98 0.05LEYES 2 100 0.02TOTAL 100 200 1
200 2
TIPOS DE VARIABLES
Variables aleatorias discretas Son aquellas que toman un número finito de posibles valores y de manera general
enteros no negativos y que de manera general podemos decir que es el resultado de contar
Variables aleatoria continuas pueden tomar un número infinito de posibles valores y los valores pueden diferir unos de otros de manera infinitesimal Sus distribuciones son llamadas distribuciones continuas y que de manera general
podemos decir que es el resultado de medir y que pueden asociarse a puntos de una escala continua.
DIAGRAMA DE PARETOEl diagrama de Pareto parte de la idea de que el 80% de los resultados en un problema se concentran en un 20% de las causas
DIAGRAMA DE PARETOEs una distribución de frecuencias de datos ordenados por categoría
Los objetivos del Diagrama de Pareto son:Determinar cuáles son los problemas más importantes de una situación. Identificar las causas que producen la mayor parte de los problemas.Puede emplearse como un paso inicial en un proceso de mejoraNos permite objetividad en el análisis de datos para la toma de decisiones
DIAGRAMA DE PARETO
Se sirve de la estratificación para ponderar el resultado del análisis
La gráfica de Pareto no identifica los defectos más importantes, sino sólo los que ocurren con más frecuencia Hay que hacer un análisis costo-beneficio para tal propósito
Es proceso continuo para profundizar en las causas de un problema
ELABORACIÓN
1.- Clasificación por categorías del eje
horizontal
2.- En el eje vertical izquierdo se deben
representar la unidades de medida que
den una clara idea de la frecuencia de
cada categoría
Ensamble 98
Laca 60
Eléctrico 20
Abolladura 12
Otros 10
TOTAL 200
ELABORACIÓN3.- En el eje vertical
derecho se representa una
escala en porcentajes del 0
al 100 que permita evaluar
la importancia de cada
categoría respecto a las
demás
En el caso de Ensamble es
98/200= 49%
En el caso de Laca es
60/200 = 30%
Y así en cada caso HASTA
SUMAR CIEN %
redondeo: usar dos cifras
después del punto
ELABORACIÓN4.- Trazar una línea acumulativa que
represente los porcentajes
acumulados de las categorías
5.- Hay que recordar qué es un
análisis jerárquico que implica ir de
mayor a menor grado de importancia
en el caso de las categorías con el fin
de visualizar los problemas que
tienen mayor incidencia
Usted acaba de ser contratado en el
área de producción con el fin de
disminuir los desperdicios en la
operación de llenado, los resultados
presentados en la tabla adjunta es el
promedio de desperdicios obtenidos en
el último mes de producción de una
refresco de marca conocida.
Realice un diagrama de Pareto y
establezca de acuerdo al mismo la
estrategia para disminuir el desperdicio
en esta operación.
DEFECTO NÚMERO DE
PIEZAS
COSTO POR
REPROCESO (
PESOS POR
PIEZA)
TAPA 35 0.5
ETIQUETA 60 0.20
ROTURA DE ENVASE 28 2.00
RAYADO DE ENVASE 12 1.00
MAL SELLADO 13 2.00
VOLUMEN FUERA DE
ESPECIFICACIONES
15 1,75
CAJA DE EMPAQUE 34 0.75