Metodo 1 y 2 ricardo
-
Upload
sara-estrada-beltran -
Category
Business
-
view
172 -
download
2
Transcript of Metodo 1 y 2 ricardo
UNIVERSIDAD CÉSAR VALLEJOEscuela de Postgrado
MÉTODOS ESTADÍSTICOS
MCs. Carlos Yengle Ruiz
*ESTADISTICA LEVINE-KREHBIEL-
BERENSON
La estadística es rama de las matemáticas que examina las formas de procesar y analizar datos. La estadística ofrece procedimientos para recolectar y transformar los datos de manera que sean útiles a quienes toman decisiones
MENDENHALL
La Estadística es la ciencia que se ocupa de la extracción de la información contenida en datos numéricos y de su uso para hacer inferencias acerca de la población de la que se extraen los datos
MOOD-GRAYBILL
La Estadística es la tecnología del método científico. Proporciona instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre.
*ESTADÍSTICA INFERENCIAL Conjunto de métodos para hacer
generalizaciones o inferencias hacia una población a partir de una muestra representativa
Una parte específica muy importante de la inferencia estadística, que se aplica en la
investigación científica, es la contrastación de hipótesis.
ESTADÍSTICA DESCRIPTIVA Conjunto de métodos para procesar, organizar,
resumir y presentar los datos de manera informativa.
Los datos pueden ser resumidos en forma tabular y numérica. Asimismo se puede visualizar
su comportamiento mediante gráficos.
CLASIFICACION DE LA ESTADÍSTICA
Paso 1:Concebir la idea a investigar.
Paso 2:Plantear el problema de investigación:•Establecer los objetivos de investigación.•Desarrollar las preguntas de investigación.•Justificar la Investigación y su viabilidad.
Paso 3:Elaborar el marco teórico:•Revisión de la literatura.
• Detección de la literatura.• Obtención de la literatura.• Consulta de la literatura.• Extracción y recopilación de la información de interés.
•Construcción del marco teórico.
NUEVAS IDEAS
LA ESTADÍSTICA EN EL PROCESO DE INVESTIGACIÓN CIENTÍFICA
Paso 4:Tipo de Investigación:Definir si la investigación se inicia como exploratoria, descriptiva, correlacional o explicativa y hasta que nivel llegará.
Paso 5:Establecer las hipótesis.
Detectar las variables.
Definir conceptualmente las variables.
Definir operacionalmente las variables.
Paso 6:Seleccionar el diseño apropiado de investigación:•Diseño experimental pre-experimental o cuasi-experimental.•Diseño no experimental.
Paso 7:Selección de la muestra:•Determinar la(s) población(es)•Extraer la(s) muestra(s)
Paso 8:Recolección de los datos:
•Elaborar el instrumento de medición y aplicarlo.•Calcular validez y confiabilidad del instrumento de medición.•Crear un archivo que contenga los datos.
Paso 9:Descripción y análisis de los datos:•Procesamiento de datos•Descripción de resultados•Procesamiento para probar hipótesis•Interpretar los análisis.
Paso 10:Presentar los resultados:•Elaborar el reporte de investigación.•Presentar el reporte de investigación.
NUEVOS CONOCIMIENTOS
*DEFINICIONES BÁSICAS
POBLACIÓNConsiste en todos los elementos o unidades de análisis acerca de los cuales se desea obtener
una conclusión. Un censo es un intento de medir todos los elementos de una población de interés.
MUESTRAEs una parte de la población seleccionada para el análisis.
En la mayor parte de las investigaciones estadísticas, los censos son bastantes costosos y difíciles, o incluso imposibles. Una alternativa es seleccionar una muestra.
*PARÁMETRO Y ESTADÍSTICO
VALOR PARÁMETRO
ESTADÍSTICA
MEDIA Media poblacional
(µ o X )
Media muestral
(x)
DESVIACIÓN ESTÁNDAR
σ s
PROPORCIÓN
P p
PARÁMETRO
Es una medida numérica que describe una característica de la población.
ESTADÍSTICO
Es una medida numérica que describe alguna característica de la muestra. También se le denomina estadígrafo o estadística
*CARACTERÍSTICAS DE LA MUESTRA
La muestra para que tenga valor, debe ser representativa, esto significa que la muestra debe
contener todos los tipos de elementos de la población (Si la población está conformada por todos los trabajadores de una institución, deberá contener a trabajadores de todas las categorías laborales) y adecuada, es decir debe ser lo suficientemente grande para contener la cantidad necesaria de
representación (cálculo del tamaño de la muestra).
La muestra puede ser probabilística o no probabilística
MARCO MUESTRAL, UNIDAD DE ANÁLISIS Y UNIDADE MUESTREO
Marco Muestral. Es la totalidad de los elementos de la población objetivo, puede ser una lista de personas o de unidades de vivienda, un archivo de registros, un mapa subdividido o una guía de nombres y direcciones
Unidad de Análisis. Para seleccionar una muestra, primero se define la Unidad de Análisis que puede ser un cliente, un votante, una organización, un libro contable, un periódico, un hospital, un paciente, etc. Esta definición nos permite identificar “Quien va a ser medido”, “Quien nos va a dar la información” y por lo tanto precisar claramente el problema a investigar y los objetivos de la investigación.
Unidad de Muestreo. Es una unidad seleccionada del marco muestral o marco de muestreo, puede ser la unidad de análisis. Por ejemplo para obtener información acerca de personas podríamos usar una lista o un registro y seleccionar directamente una muestra de personas. Sin embargo, también podríamos seleccionar una muestra de familias e incluir en la encuesta a una persona de cada familia seleccionada..
* VARIABLES.CLASIFICACIÓN DEFINICIÓN. Las variables son las características de las unidades de análisis de la población o muestra
CLASIFICACIÓN VARIABLES TIPOS EJEMPLOS
POR SU NATURALEZA
CUALITATIVAIndican una característica o cualidad de un elemento, las operaciones aritméticas, no son significativas.
NOMINAL género, nacionalidad, nombre, marca de auto, color, estado civil, etc
ORDINAL grado de instrucción, opinión sobre la atención, rendimiento, etc
CUANTITATIVACuando los datos que se estudia son números y es posible operarlas aritméticamente
DISCRETASolo adoptan ciertos valores y existe espacio entre ellos.
número de días, número de personas atendidas, número de llamada s telefónicas recibidas, etc
CONTINUACuando adopta cualquier valor dentro de un rango especifico.
Edad, longitud, superficie, volumen, peso, tiempo, etc.
POR SU RELACION DE DEPENDENCIA O CAUSAL
INDEPENDIENTESEs la variable asociada a la causa de la relación.
motivación intrínseca, tiempo de estudio, edad, género
DEPENDIENTESEs la variable asociada al efecto de la relación.
productividad
POR LA ESCALA DE MEDICIÓN
NOMINALESLos elementos solo pueden ser clasificados en categorías pero no se da un orden o jerarquía
estado civil, marca de
ORDINALESExiste un orden o jerarquía entre las categorías.
ciclo de estudios, calidad de atención
DE INTERVALO Establece la distancia entre una medida y otra. Carece de un cero absoluto.
temperatura, calificación en un examen
DE RAZÓNEs posible establecer la proporcionalidad. Existe el cero absoluto. Se permiten todas las operaciones aritméticas.
Peso, edad, n
1. POR SU NATURALEZA
2. POR SU ESCALA DE MEDICION
3. POR SU RELACION
4. POR EL NUMERO DE VARIABLES
CUALITATIVA
CUANTITATIVA
DISCRETA
CONTINU
NOMINAL
ORDINAL
INTERVALO
RAZON
DEPENDIENTE
INDEPENDIENT
INTERVINIENTE
UNIDIMENSIONAL
BIDIMENSIONAL
PLURIDIMENIONAL
CLASIFICACION DE LAS VARIABLES
*
OPERACIONALIZACION DE VARIABLES
Es un proceso para transformar una variable conceptual, abstracta o general, que no se
puede medir directamente, en otras que en conjunto tengan el mismo o aproximado
significado y sean factibles de medir. A las variables que son factibles de medir se les
denomina indicadores o variables indicadores.
Definición Conceptual. Es la definición de la variable de interés que se toma de los marcos
teóricos o enfoques teóricos relacionados al tema de investigación. Esta definición es
importante para no dejar margen a la ambigüedad en la interpretación y es de vital
importancia en aquellas disciplinas en las cuales existen varios enfoques o teorías sobre un
mismo objeto de estudio.
Dimensiones de la variable. Son las subvariables que se desagregan o se desprenden del
concepto de la variable.
Definición Operacional. Especifica los procedimientos necesarios para la identificación de
un concepto en términos observables, medibles o manipulables, señalando sus dimensiones
o aspectos, sus indicadores e índices.
Indicador. Llamada también variable empírica, es aquel que se desprende de una dimensión o una definición operacional. A partir de los indicadores se pueden elaborar los items o reactivos de los instrumentos para la recolección de información.
*RECOLECCIÓN DE DATOS
Para administrar una organización de forma efectiva se requiere obtener datos apropiados, para luego procesarlos estadísticamente y obtener información objetiva que permita apoyar la toma de decisiones. Algunos ejemplos:
Un analista de investigación de la opinión pública necesita evaluar el nivel y razones de aceptación de una obra pública.
Un analista de investigación de mercados necesita evaluar la efectividad de una nueva campaña publicitaria.
Un auditor requiere revisar las transacciones de una organización para determinar si cumple o no con principios contables aceptables.
Un jefe de recursos humanos de una institución necesita conocer si existe relación entre el grado de satisfacción de los trabajadores con la edad y el género.
La recolección de datos proporciona la materia prima para el proceso estadístico. La veracidad de los resultados depende de la calidad de datos que se recolecten.La recolección de datos implica tres actividades:
Seleccionar o desarrollar un instrumento de medición
Aplicar ese instrumento de medición
Elaboración de la matriz de datos
Fuentes de datos. Tipos
Se pueden considerar cuatro importantes fuentes de datos:
Los que proporciona una organización o un individuo.
Una encuesta.
Un experimento.
Un estudio observacional (observación cuantitativa, observación cualitativa, focus group o grupo focal )
Cuando el recolector de datos es quien los usa para el análisis la fuente es primaria. Cuando una organización o individuo han compilado los datos que utiliza otra organización o individuo, la fuente es secundaria.
* TÉCNICAS E INSTRUMENTOS DE RECOLECCION DE DATOS
*
*LA ENCUESTALa encuesta es una técnica desarrollada especialmente para las investigaciones sociales, entre las
que se incluyen los estudios de opinión y de mercado. Su instrumento es el cuestionario que es un
formulario impreso, destinado a obtener respuestas sobre el tema o variables de interés.
La encuesta puede ser aplicada a grupos o individuos estando presente el
investigador o encuestador, o también enviando por correo el
cuestionario para ser respondido y devuelto. También se pueden
realizar encuestas breves por teléfono.
Los items o preguntas de un cuestionario de encuesta deben
elaborarse teniendo en consideración los objetivos específicos del
estudio y los indicadores obtenidos mediante el proceso de
operacionalización de variables.
* VENTAJAS Y DESVENTAJAS DE LA ENCUESTA
Costo relativamente bajo.
Proporciona información sobre un mayor número de personas en un período breve.
Fácil para obtener, cuantificar, analizar e interpretar datos.
Menores requerimientos de personal capacitado.
Mayor posibilidad de mantener anonimato de los encuestados.
Eliminación de los sesgos que introduce el encuestador.
Es poco flexible, la información no puede variar ni profundizarse.
Si el cuestionario se envía por correo, es posible que no sean devueltos o que no se obtengan respuestas.
No utilizable en personas que no saben leer ni escribir.
No permite aclarar dudas.
Resulta difícil obtener cuestionarios completamente contestados.
Se deben obtener grandes muestras.
RECOMENDACIONES PARA ELABORAR UN CUESTIONARIO
1. Determinar los objetivos específicos de la investigación que
describan de la forma mas completa posible el tipo de información requerida y los indicadores de las variables conceptuales.
2. Investigación exploratoria.
3. Experiencia con estudios similares. 4. Prueba de la versión preliminar del cuestionario.
TIPOS DE PREGUNTAS
Las preguntas se pueden clasificar en abiertas o cerradas.
En las preguntas abiertas el encuestador plantea la pregunta y anota la respuesta del encuestado, no existen respuestas predeterminadas en el cuestionario.
Por el contrario en las preguntas cerradas el encuestador se limita a elegir una o varias de las respuestas previamente definidas.
La ventaja que presentan las preguntas abiertas es que es posible descubrir nuevas respuestas y que el entrevistado se mueve con mayor libertad en la encuesta. Los principales inconvenientes son la dificultad de codificación para el procesamiento y el tiempo de aplicación
Un tipo de pregunta intermedia son las cerradas con un ítem abierto para permitir incorporar otras respuestas dadas por el entrevistado.
PREGUNTAS SEGÚN EL ROL QUE DESEMPEÑAN EN EL CUESTIONARIO
1. Preguntas de introducción o de contacto: se colocan al comienzo del cuestionario y su misión es crear un clima de confianza e interés en el entrevistado consiguiendo que la entrevista se desarrolle en las mejores condiciones.
2. Preguntas filtro: se utilizan para seleccionar a personas con unas características concretas dentro de una muestra.
3. Preguntas de control: tienen por objeto contrastar la veracidad de la información que se esta obteniendo.
4. Preguntas de cambio de tema: a veces cuando se va a cambiar de tema conviene introducir alguna pregunta previa que sirva de puente entre los dos temas, dando tiempo al entrevistado para que prepare su mente para el nuevo tema.
5. Preguntas de recuerdo: son aquellas preguntas dirigidas a la obtención de un recuerdo respecto a determinadas variables. El recuerdo puede ser espontáneo o dirigido En el primero el encuestado es preguntado sin sugerirle nada, en el segundo se leen nombres de marcas, productos, etc.
EJEMPLO DE CUESTIONARIO
SATISFACCIÓN DE LOS EMPLEADOS DE UNA FÁBRICACUESTIONARIO
1. ¿Cuántas horas trabajó la semana pasada? __________ 2. ¿Cuál es su ocupación?
Gerencial ( )1 Profesional ( )2 Técnico/ventas ( )3 Apoyo administrativo ( )4 Servicio ( )5 Producción ( )6 Obrero ( )7
3. ¿Cuál es su edad en años cumplidos? ____________ 4. ¿Cuántos años de estudio concluídos? ____________ 5. ¿Cuál es su género? Masculino ( )1 Femenino ( )2
6. Entre los miembros de su familia que viven en su casa actualmente, ¿cuántos, incluyéndose usted, estuvieron empleados el año pasado? ________________
7. ¿Cuáles fueron sus ingresos, “antes de impuestos”, el año pasado (en miles de dólares)? ________________
8. ¿Cuáles fueron sus ingresos familiares totales, “antes de impuestos”, el año pasado (en miles de dólares) _______________
9. En general, ¿qué tan satisfecho está con su trabajo?Muy satisfecho ( )1 Moderadamente satisfecho ( )2Un poco insatisfecho ( )3 Muy insatisfecho ( )4
10. Si de la noche a la mañana se enriqueciera por una herencia, un regalo o la lotería, ¿dejaría de trabajar y se retiraría?
Si ( )1 No ( )2 No está seguro ( )3
11. ¿Cuál de las siguientes características del trabajo es la más importante para usted?
Altos ingresos ( )1 Ningún riesgo de ser despedido ( )2Horario flexible ( )3 Oportunidades de progreso ( )4Disfrute del trabajo ( )5
18. En los siguientes cinco años, ¿qué tan probable es que sea promovido?
Muy probable ( )1 Probable ( )2 No está seguro( )3Improbable ( )4 Muy improbable ( )5
19. ¿Las oportunidades promocionales son mejores o peores para personas de su género?
Mejores ( )1 Peores ( )2 No tiene efecto ( )3 20. Desde su primer trabajo de tiempo completo con esta organización, ¿cómo describiría
su avance?
Avance rápido ( )1 Avance intermedio ( )2 Casi en el mismo lugar ( )3 Pérdida de terreno ( )4 21. ¿Su trabajo le permite tomar parte de la toma de decisiones que le afectan en su
trabajo?
Siempre ( )1 Gran parte del tiempo ( )2 Algunas veces( )3 Nunca ( )4 22. Como parte de su trabajo, ¿participa en decisiones presupuestales? Si ( )1 No
( )2
23. ¿Qué tan orgulloso se siente de trabajar para esta organización?
Muy orgulloso ( )1 Algo orgulloso ( )2 Indiferente( )3 Nada orgulloso ( )4
24. ¿Rechazaría otro trabajo de más paga para poder quedarse en esta organización?
Muy probable ( )1 Probable ( )2 No está seguro ( )3Improbable ( )4 Muy improbable ( )5
25. En general, ¿cómo describiría las relaciones en su lugar de trabajo entre la gerencia y los
empleados?
Muy buenas ( )1 Buenas( )2 Regulares ( )3Malas ( )4 Muy malas ( )5
26. En general, ¿cómo describiría las relaciones en su lugar de trabajo entre compañeros de
trabajo y colegas?
Muy buenas ( )1 Buenas( )2 Regulares ( )3Malas ( )4 Muy malas ( )5
27.¿Qué tan importante fue su formación académica formal para el trabajo que ahora hace? Muy importante ( )1 Importante( )2 Algo importante( )3 Nada importante
( )4
28. ¿Qué tan importante fue la capacitación formal para el trabajo que ahora hace?
Muy importante ( )1 Importante ( )2Algo importante ( )3 Nada importante ( )4
NOCIONES DE MUESTREO Y
TAMAÑO DE MUESTRA
DEFINICIONES
TAMAÑO DE MUESTRA
ASIGNACIÓN PROPORCIONAL
TABLA DE NÚMEROS ALEATORIOS
DEFINICIONES
MUESTREO
Proceso mediante el cual se elige una muestra representativa de la población con el propósito de hacer inferencias
VENTAJAS Costo reducido / mayor rapidez / Mayor factibilidad / mayor
exactitud
TIPOS DE MUESTREO
NO PROBABILÍSTICOElección de los elementos o unidades muestrales no depende de la probabilidad sino de las características de la investigación.
PROBABILÍSTICO Cada elemento de la población tiene una probabilidad conocida de ser seleccionado
TIPOS DE MUESTREO PROBABILISTICO
MUESTREO ALEATORIO SIMPLE (MAS)Consiste en seleccionar una muestra de n unidades de una población de tamaño N de tal manera que cada muestra posible de tamaño n tiene igual probabilidad de ser seleccionada.
MUESTREO ALEATORIO ESTRATIFICADO (MAE)Consiste en la separación de los elementos de la población de tamaño N en grupos o subpoblaciones, llamados estratos, y la selección posterior de una muestra aleatoria simple de cada estrato
MUESTREO SISTEMÁTICOConsiste en seleccionar una muestra de n unidades de la población de tamaño N de tal manera que el primer elemento de la muestra se obtiene seleccionando al azar un elemento de los primeros k elementos en el marco y después cada k-ésimo elemento. ( k ≤ N/n )
MUESTREO POR CONGLOMERADOSConsiste en seleccionar una muestra aleatoria en la cual cada unidad de muestreo es una colección o conglomerado de elementos.
FÓRMULAS PARA TAMAÑO DE MUESTRA, EN EL MAS, PARA VARIABLES CUALITATIVAS
1. Cuando la población es finita y se conoce el tamaño N de la población
N : Tamaño de la población
Z : Coeficiente técnico (valor crítico Normal que depende del Nivel de Confianza)
P : Probabilidad de éxito o proporción de unidades de estudio que poseen las características de interés
Q = 1 – P
E : Margen de error
PQZEN
PQNZn
22
2
)1(
2. Cuando la población es muy grande o no se conoce el tamaño la población
2
2
E
PQZn
Valores Críticos y Niveles de Confianza más Utilizados
Nivel de Confianza (NC) 90 % 95% 99%
Valor Crítico (Z) 1.645 1.96 2.58
Muestra Probabilística Estratificada
Cuando las poblaciones son muy heterogéneas se recomienda estratificar. Existen formulas especiales para el muestreo aleatorio estratificado sin embargo es usual realizar la estratificación proporcional después de calcular el tamaño de muestra según el MAS.
Simbología:
N : Tamaño de la población.
n : Tamaño de la muestra.
Nh: Tamaño del estrato h.
nh: Tamaño de la muestra en el estrato h.
N
Nn
N
Nnn hhh
)(
TABLA DE NÚMEROS ALEATORIOS
Las Tablas de Números Aleatorios contienen los dígitos 0, 1, 2,..., 7, 8, 9. Tales dígitos se pueden leer individualmente o en grupos y en cualquier orden, en columnas hacia abajo, columnas hacia arriba, en fila, diagonalmente, etc., y es posible considerarlos como aleatorios.
Los números aleatorios también se pueden general por sorteo o utilizando funciones generadoras de calculadora científica o de computadora.
COMO UTILIZAR UNA TABLA DE NÚMEROS ALEATORIOS
1- Numerar consecutivamente los elementos de la población.
2-Tomar los números de una Tabla de Números Aleatorios, de manera que la cantidad de dígitos de cada uno sea igual a la del último elemento numerado de su lista. De este modo, si el último número fue 18, 56 ó 72, se deberán tomar números de dos dígitos.
3-Omitir cualquier dígito que no corresponda con los números de la lista o que repita cifras seleccionadas anteriormente de la tabla. Continuar hasta obtener el número de observaciones deseado.
4-Utilizar dichos números aleatorios para identificar los elementos de la lista que se habrán de incluir en la muestra.
PARTE DE UNA TABLA DE NÚMEROS ALEATORIOS
(1-4) (5-8) (9-12) (13-16) (17-20) (21-24) (25-28) (29-32) (33-36)
( 1 ) 3690 2492 7171 7720 6509 7549 2330 5733 4730
( 2 ) 0813 6790 6858 1489 2669 3743 1901 4971 8280
( 3 ) 6477 5289 4092 4223 6454 7632 7577 2816 9002
( 4 ) 0772 2160 7236 0812 4195 5589 0830 8261 9232
( 5 ) 5692 9870 3583 8997 1533 6466 8830 7271 3809
( 6 ) 2080 3828 7880 0586 8482 7811 6807 3309 2729
( 7 ) 1039 3382 7600 1077 4455 8806 1822 1669 7501
( 8 ) 7227 0104 4141 1521 9104 5563 1392 8238 4882
( 9 ) 8506 6348 4612 8252 1062 1757 0964 2983 2244
( 10 ) 5086 0303 7423 3298 3979 2831 2257 1508 7642
PRACTICA
CASO 1
1. Una institución tiene 1252 trabajadores en una región. Se desea conocer la proporción de trabajadores de esta región que se encuentran satisfechos con su trabajo. Se aplicará el muestreo probabilístico para estimar esta proporción, con un nivel de confianza del 95% y un margen de error del 4% . (a)¿Cuál debe ser el tamaño de la muestra?, (b) ¿Cuál sería el tamaño de la muestra, si se tiene referencia que en la sucursal de otra ciudad de características similares, el porcentaje de trabajadores que están satisfechos con su trabajo es 70%?, (c) Si el número de trabajadores hombres es 862, ¿Cuál debe ser el tamaño de la muestra para este estrato?.
EJERCICIOS
1. Resolver el caso 1 considerando un margen de error del 5% .2. Resolver el caso 1, considerando un margen de error del 3% .3. Analizar comparativamente las tres soluciones.
CASO 2
El personal que labora en una institución está clasificado en tres estratos. El número de trabajadores en cada uno de los estratos es el siguiente:
ESTRATO Nº de Trabajadores
Directivos 10 Profesionales 52 Administrativos 125 Obreros 758
La institución está interesada en conocer un perfil actitudinal de sus trabajadores y decide aplicar una encuesta, aplicando el muestreo estadístico.(a) ¿Se debe aplicar de todas maneras el muestreo en el estrato de directivo?, (b) Calcular el tamaño de la muestra para un nivel de significación del 5% y un margen de error de 3%. (c) Calcular el tamaño de muestra para cada estrato aplicando la asignación proporcional.
EJERCICIOS
Resolver el caso 2, asumiendo que se tiene referencias que en otros estudios similares, P = 0.85 Analizar comparativamente las soluciones anteriores.
*PRESENTACIÓN DE LA INFORMACIÓN
GRÁFICOS ESTADÍSTICOS
• Un gráfico estadístico es la representación del patrón de comportamiento de una variable
por medio de figuras, cuyas dimensiones son proporcionales a la magnitud de los datos
representados. Los gráficos estadísticos más utilizados son.
• Para variables cuantitativas:
• Histograma de frecuencias (variables cuantitativas)
• Polígono de frecuencias (variables cuantitativas)
• Diagrama de series de tiempo (variables cuantitativas)
• Barras (variables cualitativas)
• Pastel (variables cualitativas con pocas categorías)
• Pareto (variables cualitativas)
• Otros
*EJEMPLOS DE GRÁFICOS
APROBADO; 70
DESAPROBADO;
16
INHABILITADO;
10
RESERVA DE
MAT; 4
Distribución de sexos según estado nutricional en Pacientes
25
32
45
5356
3328
10
0
10
20
30
40
50
60
Delgado Normal Sobrepeso Obeso
Estado NutricionalHombres Mujeres
Porcentaje de diabetes por
sexo.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
mujeres hombres sexo
diabetes no diabetes
Verticales HorizontalesComparativasProporcionales Apiladas
GráficosSeries de Tiempo.
Año 1860 70 80 90 1900 10 20 30 40 50 60 70 80 Población 31 40 50 63 76 92 106 123 132 151 179 203 227
0
50
100
150
200
250
1860 70 80 90 1900 10 20 30 40 50 60 70 80
Años
Mill
on
es
GráficosLa misma información puede representarse
como un gráfico o diagrama de barras.
0
50
100
150
200
250
1860 70 80 90 1900 10 20 30 40 50 60 70 80
Años
Mill
on
es
Series de tiempo comparativas
0
50
100
150
200
250
75 76 77 78 79 80 81 82
Años
TnTrigo
Maiz
Gráfico de Barras
0
50
100
150
200
250
300
75 76 77 78 79 80 81 82
Años
TnTrigo
Maiz
Gráfico de Barras Porcentuales
0
20
40
60
80
100
120
75 76 77 78 79 80 81 82
Años
TnMaiz
Trigo
GráficosGráfico de barras horizontales
0 50 100 150 200 250 300
75
77
79
81
Años
Tn
Trigo
GráficosGráfico circular abierto.
areas urbanas6%
desiertos10%
bosques12%
praderas34%
huertas10%
areas sembradas28%
areas urbanas
desiertos
bosques
praderas
huertas
areas sembradas
DIAGRAMA DE PARETO
CUADROS ESTADÍSTICOS
Un cuadro estadístico es un arreglo de datos ordenado en filas y columnas, con el
propósito de facilitar la descripción y análisis de la información que contiene. Los
cuadros permiten presentar en forma resumida y ordenada muchos datos
La estructura de un cuadro estadístico es la siguiente:
1. Número: Es el código de identificación. El número se anota junto a la palabra tabla o
cuadro, Ejm: Cuadro Nº 1 o Tabla Nº 1
2. Título: Se refiere a la descripción del contenido del cuadro. Debe indicar la
característica principal en estudio, lugar y tiempo que se realizó el trabajo.
3. Encabezamiento: Es la descripción de las filas y columnas de un cuadro
estadístico. El encabezamiento se ubica en la parte superior del cuerpo del cuadro.
4. Columna Matriz: En esta columna se designa la naturaleza del contenido de cada
fila. Se anotan las categorías o las diferentes clases de la escala de clasificación
utilizada.
5. Cuerpo del Cuadro: Se ubica la distribución de los datos estadísticos de acuerdo a
las indicaciones del encabezamiento y la columna matriz.
6. Fuente: Sirve para indicar de donde se obtuvo la información estadística
7. Notas explicativas (opcional): Se refiere a cualquier nota aclaratoria sobre el
contenido del cuadro estadístico EJEMPLO
Cuadro N° 1.Intervenciones por delitos, registrados por la Policía Nacional,
en el País y en el Departamento de La Libertad, según tipo de falta: 2009
TIPO DE FALTA INTERVENCIONES EN DELITOS
TOTAL PAIS
DPTO LA LIBERTAD
RESTO PAIS
Contra la vida el cuerpo y la salud 23681 2137 21544 Contra la tranquilidad pública 1/ 1296 1 1295 Contra el patrimonio 109112 7793 101319 Contra la familia 6669 21 6648 Contra la libertad 8531 424 8107 Contra la seguridad pública 7736 17 7719 Contra el orden económico 4247 -- 4247 Delito tributario 15081 -- 15081 Contra la fe pública 1483 6 1451 Contra la administración pública 314 6 308 Otros 924 36 888
TOTAL 179074 10467 168607
Fuente: Policía Nacional del Perú- División de Estadística
DISTRIBUCIONES DE FRECUENCIAS
Una distribución de frecuencias es un cuadro estadístico en el que se
presentan los datos resumidos y organizados con el propósito de describir
el comportamiento de las variables de interés. Esta organización tabular,
consiste en presentar, en una columna, la lista de valores de la variable, clases o
categorías y en otras columnas, las frecuencias, los porcentajes simples y los
porcentajes acumulados.
Las distribuciones de frecuencias pueden ser univariantes y multivariantes. Sin
embargo las de uso más frecuente , en la investigación científica, son las
univariantes y una especial de las distribuciones bivariantes denominada tabla de
contingencia.
*MEDIDAS ESTADÍSTICASLas medidas estadísticas son medidas de resumen que se calculan a partir de una
muestra o población y que describen ciertos aspectos de una serie de datos para poder
tener un mejor conocimiento de la población.
Clasificación de las medidas estadísticas
Coeficiente de variación
* MEDIA ARITMÈTICA
Es el valor representativo de una población o conjunto de datos
También se llama esperanza matemática , valor medio o promedio aritmético
Se obtiene sumando todos los valores de los datos observados y dividiendo entre el
número total de ellos.
Solo es aplicable para el tratamiento de datos cuantitativos.
Fórmulas de cálculo de la media aritmética: POBLACION (N) MUESTRA (n)
Datos sin Agrupar
Datos Agrupados
* MEDIANA Y MODALa mediana es el valor central que divide en dos partes iguales un conjunto de datos
ordenados.
. 50% 50%
Me
* Cálculo de la mediana, datos originales
1. Se ordenan en forma ascendente o descendente los datos
2. La mediana es el valor central.
Cuando el número de datos es par: la mediana se obtiene promediando los dos valores centrales
Cuando el número de datos es impar: la mediana es el valor central.
La moda es el valor que más se repite o el valor más frecuente
* MEDIDAS DE DISPERSIÓNSon medidas que cuantifican el grado de dispersión de un conjunto
de datos.
* DEFINICIONES - FÓRMULAS
Varianza (s2 , σ2, v(x) )
Varianza poblacional Varianza muestral
Desviación Estándar (S,σ): Es la raíz cuadrada de la varianza.
Coeficiente de Variación (cv): es una medida de dispersión relativa. Se calcula dividiendo la desviación estándar entre la media aritmética. Es decir: cv=s/
Rango (R): Es la diferencia entre los valores máximo (Xmax) y mínimo (Xmin)de los datos. Es decir: R = Xmax - Xmin .
CORRELACIÓN Y REGRESIÓN
CORRELACIÓN
Mide el grado de relación (intensidad) entre variables. Cuando se consideran dos variables se trata de una correlación bivariante. Si las variables son cuantitativas se mide mediante el coeficiente de correlación de Pearson (r) . El coeficiente de correlación puede ser positivo (relación directa), negativo (relación inversa) o cero (no existe relación).
-1 ≤ r ≤ +1
r = +1 : Correlación positiva perfectar = -1 : Correlación negativa perfectaR = 0 : Correlación nula
Es importante notar que el uso del coeficiente de correlación sólo tiene sentido si la
relación a analizar es del tipo lineal. Si ésta no fuera no lineal, el coeficiente de
correlación sólo indicaría la ausencia de una relación lineal más no la ausencia
de relación alguna.
El coeficiente de correlación de Pearson se puede calcula r usando la fórmula:
Donde:
: Suma Cruzada de X e Y.
: Suma de Cuadrados de X.
: Suma de Cuadrados de Y.
Correlación negativa perfecta (r=-1)Correlación Positiva perfecta (r=1)
Correlación NulaCorrelación positiva
OTRA FÓRMULA PARA CALCULAR EL COEFICIENTE DE CORRELACIÓN DE PEARSON (r)
COEFICIENTE DE DETERMINACIÓN (R2)
El coeficiente de determinación, se define como la proporción de la
variación total en la variable dependiente que es explicada por las variables
independientes, según el modelo de regresión que corresponda. Su valor
varía entre 0 y 1 . En términos porcentuales, varía entre 0% y 100%.
Es decir: R2 = Variación explicada
Variación total
0 ≤ R2 ≤ 1 o 0% ≤ R2 ≤ 100%
Si el modelo de regresión es lineal simple (recta de regresión y una sola
variable independiente), el coeficiente de determinación se puede calcular
elevando al cuadrado el coeficiente de correlación simple.
Este coeficiente es muy importante porque hace posible desarrollar
investigaciones explicativas no experimentales, asimismo permite
medir el grado de explicación de la variable dependiente por un
conjunto de variables independientes.
REGRESIÓN
El análisis de regresión consiste en establecer una relación funcional entre una variable dependiente y un conjunto de variables independientes. El modelo general muestral de la regresión lineal (multivariante) es:
1 + 2 + … + p
Donde:
: estimador de la variable dependiente
1, 2,p : variables independientes
, : estimadores de los coeficientes de regresión
REGRESIÓN LINEAL SIMPLE
Es un modelo de regresión lineal muestral con una sola variable independiente, es decir es la recta de regresión:
Donde:
: variable dependiente (estimador)
: variable independiente
: coeficientes de regresión (estimadores) : ordenada en el origen : pendiente
OTRAS FORMULAS PARA LA REGRESIÓN LINEAL SIMPLE
MODELO DE REGRESION LINEAL SIMPLE
PARAMETROS DE LA ECUACION DE REGRESION:
DIAGRAMA DE PUNTOS Y RECTA DE REGRESIÓN MUESTRAL
𝑌′ = 𝛽′0 +𝛽′1𝑋