Manual - Estadisitca Descriptiva

69
ESTADÍSTICA APLICADA Separata de Estadística Descriptiva ING. WILMER JULIO BERMÚDEZ PINO Docente de la Facultad de Ing. Informática y Sistemas. Universidad Nacional Agraria de la Selva. Tingo María

Transcript of Manual - Estadisitca Descriptiva

Page 1: Manual - Estadisitca Descriptiva

ESTADÍSTICA APLICADA

Separata de Estadística Descriptiva

ING. WILMER JULIO BERMÚDEZ PINODocente de la Facultad de Ing. Informática y Sistemas.

Universidad Nacional Agraria de la Selva.Tingo María

Page 2: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

1

Introducción

El término estadística es utilizado frecuentemente para hacer referencia a datos

individuales, un conjunto de datos o cualquier información derivada de ellos; sin

embargo, la estadística es mucho más que l simple colección o tabulación de datos pues

involucra todo un conjunto de procesos que tienen como objetivo alcanzar un mayor

conocimiento de una realidad que es desconocida y sobre la cual se desea tomar

decisiones confiable.

Cualquiera que sea la actividad que realiza una persona, siempre se enfrentará al reto de

tomar decisiones. Cada día, iniciamos un juego en decisiones que va de la mano con

nuestro trabajo diario. Del mismo modo, para la gestión diaria de una empresa, de un

sector, de un país, etc. se requiere tomar continuamente decisiones; por ejemplo, para

dar una medida económica sobre modificación de aranceles a los productos importados

se pueden tener algunas interrogantes como: ¿De qué manera afectaran las medidas a

otros sectores productivos? ¿Generarán condiciones favorables para una mejora en la

tecnología? ¿Permitirán generar una mayor oferta de trabajo?, etc. Para tomar una

decisión al respecto es necesario tener información sobre el comportamiento de los

diferentes sectores económicos y de la forma como se relacionan entre sí. Obviamente,

para esto se requiere disponer de datos apropiados (suficientes, oportunos y de buena

calidad), de metodologías y procesos que permitan alcanzar el conocimiento deseado de

la realidad sobre la cual se tomaran decisiones. La estadística también brinda apoyo a

otras ciencias mediante el desarrollo de procesos dirigidos a la aceptación y análisis de

datos; de esta manera, se pueden asociar ciertos niveles de confiabilidad con los

procesos de toma de decisiones.

Page 3: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

2

I. PRINCIPALES DEFINICIONES

1. ESTADÍSTICA

Ciencia que proporciona un conjunto de métodos y técnicas que se utilizan pararecolectar, organizar, presentar, analizar e interpretar el comportamiento delos datos con respecto a una característica materia de estudio e investigación.En primer lugar se encarga de obtener información, describirla y luego en base aesta información, realizar predicciones y una óptima toma de decisiones frente a laincertidumbre.

El objeto de estudio de la Estadística ES EL ESTUDIO DE LOS DATOS: Haceruna inferencia óptima a partir de los datos, para la toma de decisiones.

1.1. ¿QUIÉN UTILIZA LA ESTADÍSTICA?

Las técnicas estadísticas se aplican de manera muy general en mercadotecnia,contabilidad, control de calidad, estudio de consumidores, administradores deinstituciones, en la educación, órganos políticos, en la medicina y pordiferentes profesionales que intervienen en la toma de decisiones.

1.2. DIVISIÓN DE LA ESTADÍSTICA: El campo de la estadística generalmenteestá divido en dos grandes áreas: Estadística Descriptiva o Deductiva yEstadística Inferencial o Inductiva.

1.2.1. ESTADÍSTICA DESCRIPTIVA:

Es el conjunto de métodos que implican la recolección, presentación ycaracterización de un conjunto de datos a fin de describir en formaapropiada las diversas características de estas. Es decir, un estudioestadístico se considera “descriptivo” cuando sólo se analiza ydescribe un conjunto datos de una muestra o de una población sinsacar conclusiones de tipo general.

1.2.2. ESTADÍSTICA INFERENCIAL:La inferencia estadística es un conjunto de métodos o técnicas queposibilitan la generalización o toma de decisiones en base a unainformación parcial obtenida mediante técnicas descriptivas.

En este aspecto es inferir o predecir conclusiones que atañen a todafuente de información de donde provienen los datos. Ahora bien estapredicción se hace con un cierto grado de confianza; este grado deconfianza se mide por la “probabilidad”.

2. OBJETIVOS GENERALES DE LA ESTADÍSTICA:La estadística tiene tres objetivos:

2.1 Describir colecciones de datos empíricos2.2 Inferir las propiedades de una población.

Page 4: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

3

2.3 Realizar predicciones sobre el comportamiento de fenómenos.2.1. DESCRIBIR COLECCIONES DE DATOS EMPÍRICOS: Para lograr este

objetivo general de la estadística es necesario realizar algunos procesos básicos,tales como:

- Evaluar y corregir los datos.- Clasificar los datos en categorías adecuadas.- Tabular los datos clasificados.- Representar los datos adecuadamente, ya sea en forma de tablas o gráficos.- Obtener medidas de resumen.

2.2. INFERIR LAS PROPIEDADES DE UNA POBLACIÓN: Esta cienciapretende inferir las propiedades de toda una población en estudio a partir delanálisis e interpretación de los datos conocidos de una muestra de dichapoblación. Para lograr este segundo gran objetivo general de la estadística sehan desarrollado conceptos, métodos y técnicas relacionadas con:

- El muestreo estadístico.- La estimación estadística.- El cálculo de probabilidades.- Las pruebas estadísticas.

2.3. REALIZAR PREDICCIONES SOBRE EL COMPORTAMIENTO DEFENÓMENOS: El comportamiento de los fenómenos en el futuro constituyela máxima aspiración práctica de toda ciencia, puesto que el interésfundamental en este caso es la toma de decisiones con vigencia y efecto en elfuturo. Esta ciencia ha desarrollado y sigue creando conceptos, métodos ytécnicas para tal fin; los mismos que la convierten en poderosa ciencia auxiliarpara el progreso de otras ciencias.

3. TÉRMINOS DE ESTADÍSTICA.

La estadística usa diversos términos con un significado especial. Para ello esconveniente especificar el significado de algunos de los más importantes yfrecuentes. A continuación se incluyen algunos términos.

ESTADÍSTICAS. Es cualquier conjunto sistemático de datos estadísticosreferentes a un determinado fenómeno o asunto. Por ejemplo: estadísticaseconómicas, estadísticas policiales, número de enfermos según causas en unhospital, etc.

Estadística: Es Ciencia, y siempre se escribe con mayúscula la primera letra

Estadístico: Profesional que se dedica al estudio de la Estadística.

Estadista: Es el hombre de estado, ejemplo el presidente de la república, ministros,congresistas, etc.

Page 5: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

4

POBLACIÓN(N)

Es el conjunto de todos los individuos, objetos u observaciones que poseen

alguna característica observable en común. Conjunto formado por todaslas unidades de análisis (elementos) que son cobertura de la investigaciónplanteada

POBLACIÓNOBJETIVO

Conjunto formado por todas las unidades de análisis para el cual

se deben hacer las extrapolaciones e inferencias a manera degeneralización de los hallazgos realizados.

POBLACIÓNMUESTREADA

Conjunto formado por todas las unidades de análisis (elementos) queintegran al directorio o marco de muestreo que permite ver suidentificación y forma de acceder a ella para efectuar las medicionesrespectivas.

MUESTRA (n)

Es una parte o subconjunto representativo de la población y al proceso deobtener la muestra se le llama muestreo.Subconjunto de elementos elegidos de la población muestreada a travésmétodos de selección determinados y del cual se obtendrá la informaciónprimaria cualitativa o cuantitativa que permitirá estudiar, analizar y evaluar adicha población

UNIDAD DEANÁLISIS

Es el elemento u objeto de la población que será analizado y sobre loscuales se obtendrán los datos.Eslaunidadbásicaenlaquesegeneralainformaciónprimariaqueesobjetodelestudio

UNIDAD DEMUESTREO

Agrupaciones de unidades de análisis claramente delimitadas no solapadas odisjuntas que cubren completamente al arco de muestreo. En ciertasinvestigaciones la unidad de muestreo coincide con la unidad de análisis, sinembargo, con frecuencia la unidad de muestreo es un conglomerado quecomprende a un conjunto de unidades de análisis

MARCO DEMUESTREO

Conjunto conformado por el listado de unidades de muestreo que:•Permite su identificación y localización de cada unidad de muestreo.•Dispone de información suficiente para su estratificación respectiva.•Permite establecer la probabilidad de incluir cada unidad en la muestrarespectiva.

DOMINIOSSubdivisiones de la población para las cuales se prevé elegir muestrasindependientes y representativas con el fin de generar estimaciones deconfiabilidad predeterminada.

CENSODecimos que realizamos un censo cuando se observan todos los elementosde la población estadística.

CARACTERES

La observación del individuo la describimos mediante uno o máscaracteres. El carácter es, por tanto una cualidad o propiedad inherente enel individuo.

TIPOS DE CARACTERES :Cualitativos : aquellos que son categóricos, pero no son numéricos.

p. ej. <Color de los ojos>, <profesión>, <marca de coche>,...Ordinales: aquellos que pueden ordenarse, pero no son numéricos.p. ej. <Grado de instrucción: primaria, secundaria, superior>.Cuantitativos: son numéricos.

p. ej. <Peso>, <talla>, <núm. de hijos>,...

Page 6: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

5

MODALIDADVALOR

Un carácter puede mostrar distintas modalidades o valores, es decir, sondistintas manifestaciones o situaciones posibles que puede presentar uncarácter estadístico. Las modalidades o valores son incompatibles yexhaustivos.

Generalmente se utiliza el término modalidad cuando hablamos decaracteres cualitativos y el término valor cuando estudiamos caracterescuantitativos.p. ej. El carácter cualitativo <Estado Civil> puede adoptar las modalidades:casado, soltero, viudo. El carácter cuantitativo <Edad> puede tomar losvalores: diez, once, doce años, ……

VARIABLEESTADÍSTICA

Al conjunto de los distintos valores numéricos que adopta un caráctercuantitativo se llama variable estadística.

TIPOS DE VARIABLES ESTADÍSTICAS:Discretas: Aquellas que toman valores aislados (números naturales), y queno pueden tomar ningún valor intermedio entre dos consecutivos fijados.p. ej. <núm. de goles marcados>, <núm. de hijos>, <núm., de discoscomprados>, <núm. de pulsaciones>,...Continuas: Aquellas que toman infinitos valores (números reales) en unintervalo dado, de forma que pueden tomar cualquier valor intermedio, almenos teóricamente, en su rango de variación.p. ej. <talla>, <peso>, <presión sanguínea>, <temperatura>, ...

OBSERVACIONES

Una observación es el conjunto de modalidades o valores de cada variableestadística medidos en un mismo individuo.

p. ej. en una población de 100 individuos podemos estudiar, de formaindividual, tres caracteres : <edad : 18, 19, ...>, <sexo : Hombre, Mujer> y<si ha votado en las elecciones : Si, No>.

PARÁMETROS.

Son aquellas medidas que describen numéricamente las características deuna población. Una población puede tener varias características y, por tanto,varios parámetros.

Ejemplo: La media poblacional (µ), la desviación estándar poblacional (σ),la varianza poblacional (σ² )Son aquellas medidas que describen numéricamente las características deuna muestra. También conocido como estimador puntual. Por ejemplo: Lamedia aritmética, la mediana (Me), la moda (Mo).

ESTADÍGRAFOS.

Son aquellas medidas que describen numéricamente las características deuna muestra. También conocido como estimador puntual. Por ejemplo: Lamedia aritmética, la mediana (Me), la moda (Mo).

4. ETAPAS EN LA INVESTIGACIÓN ESTADÍSTICA

El método estadístico, parte de la observación de un fenómeno, y como no puedesiempre mantener las mismas condiciones predeterminadas o a voluntad delinvestigador, deja que actúen libremente, pero se registran las diferentesobservaciones y se analizan sus variaciones.

Page 7: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

6

Para el planeamiento de una investigación, por norma general, se siguen lassiguientes etapas:

4.1. Planteamiento del problema.4.2. Fijación de los objetivos.4.3. Formulación de la hipótesis.4.4. Definición de la unidad de observación y de la unidad de medida4.5. Determinación de la población y de la muestra.4.6. La recolección.4.7. Crítica, clasificación y ordenación.4.8. Tabulación.4.9. Presentación.4.10. Análisis.4.11. Publicación.

4.1.PLANTEAMIENTO DEL PROBLEMA

Al abordar una investigación se debe tener bien definido qué se va a investigary por qué se pretende estudiar algo. Es decir, se debe establecer unadelimitación clara, concreta e inteligible sobre el o los fenómenos que sepretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, larevisión bibliográfica del tema, para ver su accesibilidad y consultar losresultados obtenidos por investigaciones similares, someter nuestrasproposiciones básicas a un análisis lógico; es decir, se debe hacer unaubicación histórica y teórica del problema.

4.2.FIJACIÓN DE LOS OBJETIVOS

Luego de tener claro lo que se pretende investigar, Debemos presupuestar hastadónde queremos llegar; en otras palabras, debemos fijar cuáles son nuestrasmetas y objetivos.Estos deben plantearse de tal forma que no haya lugar a confusiones oambigüedades y debe, además, establecerse diferenciación entre lo de corto,mediano y largo plazo, así como entre los objetivos generales y los específicos.

4.3. FORMULACIÓN DE LAS HIPÓTESIS

Una hipótesis es ante todo, una explicación provisional de los hechos objeto deestudio, y su formulación depende del conocimiento que el investigador poseasobre la población investigada. Una hipótesis estadística debe ser susceptiblede docimar, esto es, debe poderse probar para su aceptación o rechazo.Una hipótesis que se formula acerca de un parámetro (media, proporción,varianza, etc.), con el propósito de rechazarla, se llama Hipótesis de Nulidad yse representa por Ho; a su hipótesis contraria se le llama Hipótesis Alternativa(H1).

4.4. DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDADDE MEDIDALa Unidad de Observación, entendida como cada uno de los elementosconstituyentes de la población estudiada, debe definirse previamente,

Page 8: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

7

resaltando todas sus características; pues, al fin de cuentas, es a ellas a las quese les hará la medición.La unidad de observación puede estar constituida por uno o varios individuos uobjetos y denominarse respectivamente simple o compleja.El criterio sobre la unidad de medición debe ser previamente definido yunificado por todo el equipo de investigación. Si se trata de medidas delongitud, volumen, peso, etc., debe establecerse bajo qué unidad se tomarán lasobservaciones ya sea en metros, pulgadas, libras, kilogramos, etc.Asociado a la unidad de medida, deben establecerse los criterios sobre lascondiciones en las cuales se ha de efectuar la toma de la información.

4.5. DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA.

Estadísticamente, la población se define como un conjunto de individuos o deobjetos que poseen una o varias características comunes. No se refiere estadefinición únicamente a los seres vivientes; una población puede estarconstituida por los habitantes de un país o por los peces de un estanque, asícomo por los establecimientos comerciales o las unidades de vivienda de unaciudad.Existen desde el punto de vista de su manejabilidad poblaciones finitas einfinitas.

Muestra es un subconjunto de la población a la cual se le efectúa la medicióncon el fin de estudiar las propiedades del conjunto del cual es obtenida.En la práctica, estudiar todos y cada uno de los elementos que conforman lapoblación no es aconsejable, ya sea por la poca disponibilidad de recursos, porla homogeneidad de sus elementos, porque a veces es necesario destruir lo quese está midiendo, por ser demasiado grande el número de sus componentes ono se pueden controlar; por eso se recurre al análisis de los elementos de unamuestra con el fin de hacer inferencias respecto al total de la población. Existendiversos métodos para calcular el tamaño de la muestra y también para tomarlos elementos que la conforman, pero no es el objetivo de este cursoestudiarlos. Diremos solamente que la muestra debe ser representativa de lapoblación y sus elementos escogidos al azar para asegurar la objetividad de lainvestigación.

4.6. LA RECOLECCIÓN

Una de las etapas más importantes de la investigación es la recolección de lainformación, la cual ha de partir, a menos que se tenga experiencia conmuestras análogas, de una o varias muestras piloto en las cuales se pondrán aprueba los cuestionarios y se obtendrá una aproximación de la variabilidad dela población, con el fin de calcular el tamaño exacto de la muestra queconduzca a una estimación de los parámetros con la precisión establecida.El establecimiento de las fuentes y cauces de información, así como la cantidady complejidad de las preguntas, de acuerdo con los objetivos de lainvestigación son decisiones que se han de tomar teniendo en cuenta ladisponibilidad de los recursos financieros, humanos y de tiempo y laslimitaciones que se tengan en la zona geográfica, el grado de desarrollo, laausencia de técnica, etc.

Page 9: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

8

Es, entonces, descubrir dónde está la información y cómo y a qué "costo" sepuede conseguir; es determinar si la encuesta se debe aplicar por teléfono, porcorreo, o si se necesitan agentes directos que recojan la información; establecersu número óptimo y preparar su entrenamiento y/o capacitación adecuada.

4.7. CRITICA, CLASIFICACIÓN Y ORDENACIÓN

Después de haber reunido toda la información pertinente, se necesita ladepuración de los datos recogidos. Para hacer la crítica de una información, esfundamental el conocimiento de la población por parte de quien depura parapoder detectar falsedades en las respuestas, incomprensión a las preguntas,respuestas al margen, además de todas las posibles causas de nulidad de unapregunta o nulidad de todo un cuestionario.Separado el material de "desecho" con la información depurada se procede aestablecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, enlas que se establecen los cruces necesarios entre las preguntas, se ordenan lasrespuestas y se preparan los modelos de tabulación de las diferentes variablesque intervienen en la investigación.El avance tecnológico y la popularización de los computadores hacen que estastareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.

4.8. LA TABULACIÓN.

Una tabla es un resumen de información respecto a una o más variables, queofrece claridad al lector sobre lo que se pretende describir; para su fácilinterpretación una tabla debe tener por lo menos: Un titulo adecuado el cualdebe ser claro y conciso. La Tabla propiamente dicha con los correspondientessubtítulos internos y la cuantificación de los diferentes ítems de las variables, ylas notas de pie de cuadro que hagan claridad sobre situaciones especiales de latabla, u otorguen los créditos a la fuente de la información.

4.9. LA PRESENTACIÓN

Una información estadística adquiere más claridad cuando se presenta en laforma adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero sedebe tener cuidado con las variables que se van a presentar y la forma dehacerlo. No es aconsejable saturar un informe con tablas y gráficos redundantesque, antes que claridad, crean confusión.Además la elección de determinada tabla o gráfico para mostrar los resultados,debe hacerse no sólo en función de las variables que relaciona, sino del lector aquien va dirigido el informe.

4.10. EL ANÁLISIS

La técnica estadística ofrece métodos y procedimientos objetivos queconvierten las especulaciones de primera mano en aseveraciones cuyaconfiabilidad puede ser evaluada y ofrecer una premisa medible en la toma deuna decisión.Es el análisis donde se cristaliza la investigación. Esta es la fase de ladeterminación de los parámetros y estadísticos muestrales para las

Page 10: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

9

estimaciones e inferencias respecto a la población, el ajuste de modelos y laspruebas de las hipótesis planteadas, con el fin de establecer y redactar lasconclusiones definitivas.

4.11. PUBLICACIÓN

Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otrosestudiosos del mismo problema a quienes se les puede aportar información,conocimientos y otros puntos de vista acerca de él.

5. MÉTODOS PARA RECOLECTAR DATOS:

Existen tres principales métodos con los cuales el investigador puede obtener losdatos:

5.1. El investigador puede recurrir a datos ya publicados por fuentes gubernamentales,industrias, compañías o individuales.

5.2.El investigador puede diseñar un experimento para obtener los datos necesarios.5.3.Puede efectuar una encuesta.

5.1. FUENTES DE INFORMACIÓN: Es el lugar, la institución, la persona, dondeestán los datos que se necesitan para cada una de las variables o aspectos de lainvestigación. Las fuentes de datos pueden ser:

5.1.1. FUENTES DE DATOS INTERNOS. Es la información recopilada por laempresa de los resultados de una propia gestión.

Ejemplo:• reportes financieros• Reportes de operaciones, que están dadas por la información de la

producción, compras, ventas, estados de pérdida y ganancias.• Reportes especiales, es la información adicional para el análisis

estadístico.

5.1.2. FUENTES DE DATOS EXTERNOS. Son informaciones estadísticaselaboradas por instituciones de investigación, que pueden ser públicas oprivadas.

5.1.3. FUENTES PRIMARIAS. Cuando la información estadística es obtenidadirectamente de la unidad de observación.

Por ejemplo: los resultados de los censos de población y vivienda, lainflación, la tasa de interés bancaria, índice de precios al consumidor, etc.

5.1.4. FUENTES SECUNDARIAS. Cuando la información estadística eselaborada a base de los datos de fuentes primarias.El organismo oficial fundamental de datos estadísticos es el InstitutoNacional de Estadística e Informática (INEI).

Page 11: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

10

5.2. DISEÑO DE EXPERIMENTO: Es un segundo método de recolección de lainformación. Los diseños experimentales deben utilizarse siempre que seaposible cuando se desee construir modelos explicativos.

5.3. ENCUESTAS: Proceso de recopilar la información a través de una muestra.

6. PRINCIPALES PROCEDIMIENTOS PARA RECOLECTARINFORMACIÓN.

Toda información tiene dos aspectos fundamentales: Fuente de obtención y métodospara su recolección.

FUENTE DE OBTENCIÓN. La fuente de obtención puede ser primaria ysecundaria.

Primarios. Cuando se recogen directamente de su origen.Secundarios. Cuando no se recogen directamente de su origen.

MÉTODOS DE RECOLECCIÓN. Cuando es utilizada una fuente primaria pararecolectar información se distinguen dos procedimientos fundamentales: Laobservación y el interrogatorio.

MÉTODOS DE INTERROGATORIOS.El interrogatorio puede hacerse mediante dos métodos:

Método directo (se efectúa por medio de entrevistas)Método indirecto (se efectúa por medio de cuestionarios)

SISTEMAS DE RECOLECCIÓN.

Son procedimientos que se utilizan para recoger información.Pueden ser:

a) Los Registros: son libros, padrones en donde se anotan en forma regular,permanente y obligatoria los hechos ocurridos.Ejemplo: Registros Civiles, RENIEC, Registros Públicos, etc.

b) Las Encuestas:son procedimientos de obtención de información estructuradasegún criteriosprevios de sistematización que se efectúa con un propósitoespecífico en la población o en un sector de ella. Pueden ser:

b.1) Encuesta Censal:Cuando abarca toda la población en estudio.Ejemplo: censos de población y vivienda en una localidad o país

b.2) Encuesta Muestral:Cuando abarca una parte de la población en estudio.Ejemplo: llevar a cabo una encuesta de preferencia electoral.

Page 12: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

11

TÉCNICAS DE RECOLECCIÓN

Son procedimientos que se utilizan para recolectar información según la naturaleza deltrabajo de investigación. Pueden ser:

a) La observación: Es la acción de mirar con rigor, en forma sistemática yprofunda, con el interés de descubrir la importancia de aquello que se observa.

b) El cuestionario: En un instrumento constituido por un conjunto de preguntassistemáticamente elaboradas que se formulan al encuestado o entrevistado con elpropósito de obtener datos de las variables consideras en estudio.

c) La entrevista: Es un dialogo entre personas, es una técnica donde una personallamada entrevistador, encuestador o empadronador solicita al entrevistado leproporcione algunos datos e información.

d) Análisis de contenido: El fin o propósito del análisis de contenido consiste endeterminar los puntos más importantes de un documento para observar yreconocer el significado de los mismos en sus elementos, como palabras, frases,etc., y en clasificarlos adecuadamente para su análisis y explicación.

DATO: Es el valor que toma una variable en cada unidad de análisis. Los datos estánclasificados en:

SEGÚN EL NÚMERO DE VARIABLES.

1. DATOS UNIDIMENSIONALES: Cuando el registro es de una sola variable deinterés. Por ejemplo: El promedio semestral de los estudiantes del tercer año delFIIS-UNAS.2009 - II

2. DATOS BIDIMENSIONALES: Cuando el registro es de dos variables deinterés. Por ejemplo: La edad y el promedio semestral de los estudiantes deltercer año del FIIS-UNAS.2009 - II

3. DATOS TRIDIMENSIONALES: Cuando el registro es de tres variables deinterés. Por ejemplo: La edad, el ingreso mensual y el promedio semestralde los estudiantes del tercer año del FIIS-UNAS.2009 - II

7. TIPOS DE DATOS.Sea cual fuere la fuente de la que obtenemos la información, esta puede estarreferida a características cualitativas o cuantitativas.

VARIABLE.Es una característica de la población que se va investigar y que puede tomardiferentes valores.

Ejemplo.Las horas extras trabajadas por los trabajadores de una empresa y los valores de estavariable vendrían dadas por las diferentes horas trabajados por cada trabajador fuerade la jornada normal: ninguna, una, dos, tres, ……….

Page 13: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

12

Notación. Las variables se denotaran por X, Y, etc.Las variables se clasifican en: cualitativas y cuantitativas.

VARIABLE CUALITATIVA.

Se llama así, cuando la variable está asociada a una característica cualitativa. Esdecir, son variables cuyos valores son cualidades que presenta la población.

Ejemplos.La variable “profesión” puede adoptar las modalidades: Ingeniero, Médico,

Biólogo, Contador, Economista, etc.

Calidad de servicio del supermercado (Malo, Bueno, Muy Bueno, Excelente)Estado civil o conyugal (Soltero, Casado, Viudo, Divorciado, Conviviente)Régimen de tenencia de la vivienda (Propia, Alquilada)

Estos datos a su vez se clasifican en: Nominales y ordinales

VARIABLE CUALITATIVA NOMINAL: Son aquellos que establecen distinciónde los elementos en las categorías sin implicar orden entre ellos.

Ejemplo:Clasificar un grupo de individuos por sexo: masculino, femenino.Por estado civil: soltero, casado, viudo. Etc.

VARIABLE CUALITATIVA ORDINAL.Son aquellos datos que agrupan a los objetos, individuos, en categorías ordenadas,para establecer relaciones comparativas. Es decir, se puede establecer un orden entresus atributos.Ejemplo.Calidad de servicio del supermercado (Malo, Bueno, Muy Bueno, Excelente)Nivel de educación (primaria, secundaria, superior).

VARIABLE CUANTITATIVA: Es el resultado de un proceso que cuantifica, esdecir, estas surgen cuando se puede establecer cuanto o en que cantidad se poseeuna determinada característica.

Ejemplo:Ingreso por familiaNúmero de ventas diarias de cierto establecimiento.Número total de habitaciones que tiene la vivienda.Longitud, tiempo, etc.

Las variables cuantitativas se dividen en discretas y continuas.

VARIABLE CUANTITATIVA DISCRETA. Son aquellas que surgen por elprocedimiento de conteo, suelen tomar valores enteros (positivos).Ejemplo.El número de hijos por familia.Número de estudiantes por colegio, universidad.

Page 14: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

13

VARIABLE CUANTITATIVA CONTINUA. Cuando el valor de la variablepuede tomar cualquier valor dentro de un rango dado, por tanto se expresa porcualquier número real.

Ejemplo.El peso, la estatura, la tensión arterial de las personas, los ingresos, el tiempo deservicio, precio en soles, etc.En general, todas las magnitudes relacionadas con el tiempo (edad, duración de unfenómeno,...), la masa (volumen; peso,….), el espacio (longitud, superficie,…) ouna combinación de estos (velocidad, densidad, capacidad,…) son variablescontinuas.

MUESTREOPara estudiar, analizar y evaluar una población con el fin de efectuar un diagnosticorequerirá de contar con información cuantitativa y cualitativa:

• Representativa,• Oportuna,• Confiable y• Suficiente

Esto se logrará a través de observaciones y mediciones sobre una muestra de elementosadecuadamente elegidos de la población bajo en estudio.

1) Población y muestra.Población.Conjuntos formado por todas las unidades de análisis (elementos) que soncobertura de la investigación planteada.

2) Muestra. Es una parte o subconjunto representativo de la población y al procesode obtener la muestra se le llama muestreo.

Motivos para la realización de un muestreo. Consideraciones necesarias

Imagine que va a realizar estudios para conocer la siguiente información:

El porcentaje de peruanos que tiene acceso a internet. La duración media de una determinada marca de pilas.

Para el primer caso, la población a la que debes preguntar es de más de 30 millones depersonas. Es obvio que entrevistar a más de 30 millones de personas supone un granesfuerzo en varios sentidos.Primero, de tiempo, y segundo de dinero, puesto que es necesario contratar a muchosencuestadores, pagarles viajes para que lleguen a todos los pueblos, etc. Además, hayuna dificultad añadida: es difícil llegar a todos y cada uno de los ciudadanos peruanos,ya que cuando vayamos a entrevistar, habrá personas que esté de viaje fuera del país,habrá gente que esté enferma en el hospital, etc. En este caso, por motivos económicos,de tiempo y de dificultad de acceso a toda la población, sería conveniente entrevistar auna cierta parte de la población, una muestra, elegida convenientemente para poderextraer después conclusiones a toda la población.

Page 15: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

14

En el segundo caso tenemos una problemática diferente. Para poder estudiar la duraciónde una pila, debemos usarla hasta que se gaste, lo que nos impide volver a usar la pila.Es decir, de alguna manera “destruimos” este elemento de la población. Si quisiéramosprobar todas y cada una de las pilas, nos quedaríamos sin ellas. En este caso, de nuevosería conveniente estudiar sólo un conjunto de esas pilas y luego extraer conclusionesmás generales a partir del conjunto que hemos estudiado.Por las razones anteriores, en muchos casos es conveniente el uso de muestras, peropara que podamos extraer conclusiones, es importante que elijamos bien las muestraspara nuestros estudios.Por ejemplo, para el caso del acceso a internet de los peruanos, elegir a 10 personas de30 millones es insuficiente, no es representativo. Tampoco lo sería preguntarle, porejemplo a 100 personas de Lima, o elegir a todos sus amigos y su familia. Haycuestiones que debemos especificar a la hora de elegir una muestra:

1. El método de selección de los individuos de la población (tipo de muestreo quese va a utilizar).

2. El tamaño de la muestra.3. El grado de fiabilidad de las conclusiones que vamos a presentar, es decir, una

estimación del error que vamos a cometer (en términos de probabilidad).

Como ya hemos mencionado, la selección no adecuada de los elementos de la muestraprovoca errores posteriores a la hora de estimar las correspondientes medidas en lapoblación. Pero podemos encontrar más errores: el entrevistador podría no serimparcial, es decir, favorecer que se den unas respuestas más que otras. Puede ocurrirtambién que, por ejemplo, la persona que vayamos a entrevistar no quiera contestar aciertas preguntas (o no sepa contestar). Clasificamos todos estos posibles errores de lasiguiente manera:

1. Error de sesgo o de selección: si alguno de los miembros de la población tienemás probabilidad que otros de ser seleccionados. Imagine que queremos conocerel grado de satisfacción de los clientes de un gimnasio y para ello vamos aentrevistar a algunos de 10 a 12 de la mañana. Esto quiere decir que las personasque vayan por la tarde no se verán representadas por lo que la muestra norepresentará a todos los clientes del gimnasio. Una forma de evitar este tipo deerror es tomar la muestra de manera que todos los clientes tengan la mismaprobabilidad de ser seleccionados.

2. Error o sesgo por no respuesta: Es posible que algunos elementos de lapoblación no quieran o no puedan responder a determinadas cuestiones. Otambién puede ocurrir, cuando tenemos cuestionarios de tipo personal, quealgunos miembros de la población no contesten sinceramente. Estos errores son,en general, difíciles de evitar, pero en el caso de la sinceridad, se suelenincorporar cuestiones (preguntas filtro) para detectar si se está contestandosinceramente.

Después de lo que se acaba de ver, podemos decir que una muestra es sesgada cuandono es representativa de la población.

MÉTODOS DE MUESTREO.

Page 16: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

15

Ya hemos hecho referencia a la importancia de la correcta elección de la muestra paraque sea representativa para nuestra población pero ¿cómo clasificamos las diferentesformas de elegir una muestra? Podemos decir que hay dos tipos de muestreo:

Muestreo probabilístico: Es aquel en el que cada muestra tiene la mismaprobabilidad de ser elegida de la población en estudio.

Muestreo no probabilístico: Corresponden a las muestras en las cuales no hayforma de conocer la probabilidad de los elementos de la población y serincluidos como parte de la muestra.

Fortalezas y debilidades de los métodos de muestreo:

MUESTREO PROBABILÍSTICOFORTALEZAS DEBILIDADES• Es aceptado con facilidad • Requiere de costos, marcos de muestreo• Asegura representatividad • Requiere de trabajos de campo costosos• Asegura muestras insesgadas • Requiere de supervisión rigurosa• Los resultados son generalizables• Permite calcular el error de muestreo• Permite hacer inferencias estadísticas• Probabilidad conocida de elegir a la

unidad como parte de la muestra

MUESTREO NO PROBABILÍSTICOFORTALEZAS DEBILIDADES• Bajo costo y requiere menor tiempo • No permite calcular errores de muestreo• Elige solo a las unidades queridas • Sus resultados no son generalizables• Permite entrar información inesperada • Pueden ser rechazadas por los usuarios• Diseño y cobertura flexible e informal • Puede haber sesgo en la selección

• No permite hacer inferencia estadística• Requiere de personal muy especializado• La supervisión es difícil de realizar• Probabilidad no conocida de elegir a la

unidad como parte de la muestra.

Selección de muestras bajo un enfoque cuantitativo.

Ante la necesidad de generar información cuantitativa representativa y confiable, elmétodo a seguir para la selección del subconjunto de unidades de análisis comomuestra, deberá asegurar la representatividad de los elementos elegidos a fin de permitiral investigador efectuar inferencias, extrapolaciones y generalizaciones de los resultadosencontrados hacia toda la población objetivo; en este enfoque, se deberá asegurar que lamuestra será estadísticamente representativa con el fin de permitir:

• Calcular el error de muestreo que afectan a las estimaciones resultantes.• Conocer el nivel de confianza con el cual se realizan las estimaciones resultantes.

Page 17: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

16

• Generalizar los resultados observados en la muestra a toda la población.• Utilizar pruebas estadísticas para verificar hipótesis planteadas en la investigación.

En caso que el investigador requiera de presentar resultados estadísticamenterepresentativos, deberá asegurar selecciones de muestras imparciales e insesgadas locual se lograra eligiendo las unidades con base a las leyes de la probabilidad.

Diseños de Muestreo:

Muestreo Aleatorio Simple.

Es el método de muestreo que asegura que cada una de las unidades de análisis tieneigual probabilidad de ser incluida en la muestra, igualmente, cada una de las muestrasposibles tendrá la misma probabilidad de ser elegida; esta característica asegura larepresentatividad e imparcialidad de la muestra elegida para el estudio.

Procedimiento:• Elabore el marco de muestreo.• Determine un tamaño de muestra “n”.• Seleccione “n” números aleatorios “sin reemplazo” de la tabla de números

aleatorios o generados por un computador.• Recopile la información de cada una de las unidades de análisis seleccionadas.• Estimar: Promedios, totales o porcentajes y su error estándar respectivo.

Estimación del promedio

Estimación del total poblacional

Estimación de la proporción de elementos que tienen un determinado atributo.

Page 18: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

17

Donde “a” es total de elementos de la muestra que tienen el atributo.

Ejemplo.

Población de alumnos matriculados en 5to. Año de secundaria (N). N = 7 154alumnos1.

Conociendo la población de alumnos matriculados en 5to. Año de secundaria.

La muestra inicial estaría dado por:

Muestra inicial:

= ∗ ∗ ∗( − 1) + ∗ ∗Donde:

N = tamaño de la población. Entonces: N = 7 154

Z = Valor de distribución normal estandarizado con probabilidad (1 – ). Para 95% deconfianza Z = 1.96

Como se desconoce la probabilidad de éxito esperada, se tendría que utilizar elcriterio conservador (p = q = 0.5), lo cual maximiza el tamaño de muestra.

p = probabilidad de éxito. p = 0.5

q = probabilidad de fracaso. (1 – p) = (1 – 0.5) = 0.5

e = precisión (Error máximo admisible) = 5%

1 [Fuente: MINISTERIO DE EDUCACIÓN - Censo Escolar./ http://escale.minedu.gob.pe/magnitudes]

Page 19: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

18

= 1.96 ∗ 0.5 ∗ 0.5 ∗ 7 1540.05 (7 154 − 1) + 1.96 ∗ 0.5 ∗ 0.5 = 365Muestra final corregida a encuestar: = 1 +

= 3651 + = 347 .Se requeriría encuestar a no menos de 347 estudiantes del 5to año de secundaria parapoder tener una seguridad del 95%.

8. DISEÑO O ELABORACIÓN DE FORMULARIOS.

En toda actividad de carácter científico, lo que se hace en última instancia, es darrepuestas a ciertas preguntas. De acuerdo con esto, necesitamos un documento dondeplantear preguntas y registrar sus respuestas, resultando así que una de las primeras yrealmente más decisiva etapa en cualquier investigación es la confección deformularios.Antes de elaborar un formulario debe considerarse:

1. El propósito para el cual será utilizado.2. Circunstancias bajo las cuales se recogerán la información.

Lo primero tiene importancia para decidir sobre los datos que se recogerán y lo segundopara la determinación del tamaño de muestra y del material más conveniente.

9. PRINCIPIOS BÁSICOS QUE SE DEBEN TENER EN CUENTA EN LACONFECCIÓN DE FORMULARIOS.

En todo formulario se debe recoger sólo los datos útiles y adecuados al estudio.Formularios muy extensos conspiran contar la exacta recolección de los datos. Es pues,entonces conveniente:

a. Hacer una lista de todos los datos que sean necesario recoger de acuerdo a lafinalidad del estudio.

b. Considerar cuales datos son factibles de recoger y exacta.c. Limitar a aquellos datos prácticos a recoger y que se usará.

DECIDIR SOBRE EL ORDEN QUE SE ACEPTARAN LOS DATOS. Laspreguntas deben hacerse de manera lógica y ordenada. Por ejemplo, preguntas sobreocupación, educación, vivienda, y otras referentes a condiciones económicas y socialesno deben estar separadas.

CONSIDERAR COMO SE HARÁN LAS PREGUNTAS.

Page 20: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

19

a. Considerar si hay alguna ambigüedad en la pregunta como consecuencia de larespuesta recibida.

b. Toda pregunta debe tener respuesta.c. Debe usarse un leguaje claro y poco técnico.d. Evitar respuestas inducidas. Por ejemplo, ¿Ud., nunca ha padecido de

tuberculosis? con esta pregunta estamos induciendo a la persona a que surespuesta sea negativa.

PLANEAR COMO SE ANOTARAN LAS RESPUESTAS.

El espacio que se deja debe ser adecuado para las respuestas que se esperan y siempreque sea posible se adoptará el sistema que exige el menor esfuerzo.Ejemplo.

a. Sexo:……………………; b.Sexo:………..Femenino………..Masculino.

En el inciso (a), se pone nombre y en el (b), se marca con una cruz, este último es demenor esfuerzo.

Puede usarse otro método que sea la utilización de un código, por ejemplo, ¿Debeexistir una revisión periódica de salario mínimo?

SiNoNo sabe o no opina.

ELECCIÓN DE VARIAS RESPUESTAS.

Debe procurarse que se puede elegir varias respuestas, evitando la ambigüedad uomisión de datos.Ejemplo.¿Enfermedades que Ud. Ha padecido?Sarampión___________________Bronquitis___________________Asma ___________________

REALIZAR ESTUDIO PILOTO.

Debe realizarse un estudio piloto antes que el formulario sea impreso de maneradefinitiva, con el fin de probarlo y ver la operatividad del formulario y para darse cuentade las fallas que pueda tener y hacer las correcciones necesarias.

Se debe redactar las instrucciones de como anotar las respuestas.

Ver la validez y confiabilidad del instrumento de medición (Encuesta).

120

Page 21: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

20

CASO PRÁCTICO DE DISEÑO DE ENCUESTA

“Proyecto Gimnasio Sport Time”

Un grupo de inversionistas ha formado una mediana empresa llamada Sport Time, cuyonegocio es el servicio de preparación y mantenimiento físico de las personas. Deacuerdo con sus experiencias empresariales, este gimnasio será dirigido a los integrantesdel nivel socio económico A y B de la ciudad de Tingo María, teniendo como área deinfluencia a la ciudad. Sin embargo les gustaría poder contar con mayor información delmercado con la finalidad de crear y ofrecer un centro deportivo de calidad, incorporandolos gustos y preferencia del futuro cliente.Frente a esta necesidad, uno de los socios propuso realizar una investigación demercado, propuesta que fue aceptada por todos para tal efecto se procedió a determinarlos parámetros que definen correctivamente las características de la población queconforma su mercado:

1.- El segmento estará compuesto por hombres y mujeres con edades entre 18 y 60 años.2.- El gimnasio estará orientado al segmento A y B de la ciudad de Tingo María.

Una vez determinado estos parámetros se considero que los más convenientes pararealizar esta investigación era aplicar una encuesta cuyo proceso de elaboración implicaseguir los siguientes pasos:

A.- Definir el propósito y los objetivos específicos.B.- Diseñar la encuesta.

Page 22: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

21

Solución

A.- Propósito y Objetivos específicos de la encuesta.

Propósito: Sera evaluar las actitudes y preferencias de las personas respecto a losgimnasios.

Objetivo Específico: Se desea obtener información sobre características delconsumidor que permitan tipificarlo, determinar sus expectativas en cuanto al servicio:Además identificar la competencia y los niveles de precio vigente en el mercado.

OBJETIVOS ESPECIFICOS PREGUNTAS DE INVESTIGACIÓNCONSUMIDOR PREGUNTAS DE INVESTIGACIÓN

• Identificación de hábitos

• ¿Acudes al gimnasio?• ¿Por qué acudes al gimnasio?• ¿Con que frecuencia vas al gimnasio?• ¿Qué instalaciones utilizas con más

frecuencia en el gimnasio?• ¿A qué gimnasio acudes?• ¿Desde cuándo acude al gimnasio?

• Intención de compra• ¿Asistirías a un gimnasio ubicado en

el centro de la ciudad?

SERVICIO PREGUNTAS DE INVESTIGACIÓN

• Características del servicio

• ¿Qué servicio te gustaría encontraren el gimnasio?

• ¿Qué tipo de decoración tegustaría encontrar?

COMPETENCIA PREGUNTAS DE INVESTIGACIÓN• Identificación de competidores • ¿Qué gimnasios conoces?

PRECIO PREGUNTAS DE INVESTIGACIÓN

• Precio máximo y mínimo• ¿Cuánto estaría dispuesto a pagar

mensualmente por el servicio?

Page 23: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

22

B). Diseño de Encuesta.

1. ¿Asiste Ud. a gimnasios?a. Si (pasar a la pregunta 3)b. No (pasar a la pregunta 2)

2. ¿Le gustaría asistir a un gimnasio?a. Si (pasar a la pregunta 3)b. No (fin de la encuesta)

3. ¿Con que frecuencia asiste y/o legustaría asistir gimnasio?a. Diariamente.b. Una vez por semana.c. Dos veces por semana.d. Tres veces por semana.

4. ¿Qué tipo de servicios prefieresutilizar en el gimnasio?a. Aeróbicos.b. Pesas.c. Baile.d. Masajes.e. Otros. (Especifique)………….

5. ¿Con quien acude al gimnasio?a. Solo.b. Amigo(a).c. Pareja.d. Familia.e. Otros (Especifique)………….

6. ¿A qué gimnasio asiste?………….…………………

7. ¿Qué gimnasio conoce?a. Benavidesb. Universal Gymc. Shape spad. Alan Wong Spaf. Otros (Especifique)………….

8. Si contara con un gimnasioubicado en la ciudad de tingomaría, el cual le ofreciera losservicios que usted desea:a. Definitivamente asistiría.b. Probablemente asistiría.c. Indeciso.d. Probablemente no asistiría.e. No asistiría.

9. ¿A qué hora prefieres asistir?

a. 6 : 00 am a 8 : 00 amb. 8 : 00 am a 10 : 00 amc. 10 : 00 am a 12 : 00 amd. 12 : 00 am a 2 : 00me. 12 : 00 m a 4 : 00 pmf. 4 : 00 pm a 6 : 00 pmg. 6 : 00 pm a 8 : 00 pmh. 8 : 00 pm a 10 : 00 pm.

10. ¿Cuánto estaría dispuesto a pagarmensualmente por el servicio?a. Menos de S/. 30.00b. Entre S/. 30.00 y S/. 39.00c. Entre S/. 40.00 y S/. 49.00d. Mas de S/. 50.00.

DATOS DE CONTROL

11. Sexo: Femenino……..Masculino…….

12. Edad.a. 18 a 25 años.b. 26 a 33 años.c. 34 a 41 años.d. 42 a 49 años.e. 50 a 60 años.f.

13. Ingreso promedio mensual familiara. Menos de S/. 700.00.b. Entre S/. 701.00 y S/. 1000.00c. Entre S/. 1001.00 y S/. 1300.00d. Mas de S/. 1301.

DATOS DE IDENTIFICACIÓN DELENTREVISTADO

Nombre:………………………………

Dirección:…………………………….

Teléfono:……………………………..

Page 24: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

23

VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE MEDICIÓN(ENCUESTAS):

Estos procesos se aplican en el desarrollo de una investigación, con la finalidad deevaluar la consistencia del diseño de la estructura de los instrumentos de recolecciónque se usaran para el acopio y recolección de la información necesaria para la ejecuciónde una investigación.

II.- CONFIABLIDAD DE LOS INSTRUMENTOS (Encuestas):

La confiabilidad de un instrumento de medición, se refiere al grado en que suaplicación repetida al mismo sujeto u objeto produce resultados iguales.La confiabilidad de un instrumento se refiere a la constitución interna de las personas, ala mayor o menor acescencia de errores de medida. Un instrumento confiable significaque si lo aplicamos por más de una vez a un mismo elemento entoncesobtendríamos iguales resultados.

METODOS PARA CALCULAR LA CONFIABILIDAD DE UNINSTRUMENTO DE MEDICIÓN:

Hay diversos métodos para determinar la confiabilidad de un instrumento de medición.Todos utilizan formulas que producen coeficientes de confiabilidad estos coeficientespueden oscilar entre 0 y 1, donde un coeficiente de o significa nulo confiabilidad y 1representa un máximo de confiabilidad (confiabilidad total).

CONFIABILIDAD

Muy Baja Baja Regular Aceptada Elevada

0 10% 100%

Confiabilidad del instrumento debe ser: Mayor al 50 %

2.1.- METODO DE LA MEDIDA DE ESTABILIDAD: METODO DE TEST – RETEST.

Consiste en la aplicación de dos veces o más veces un mismo instrumento de medición a unmismo grupo de personas, después de cierto período. Si la correlación entre los resultados delas diferentes aplicaciones es altamente positiva, el instrumento se considera confiable.Se determinará mediante el cálculo de Coeficiente de Correlación de Pearson (r).= ∗ ∑ − (∑ )(∑ )∑ – ∑ ∑ – ∑Donde:

n = Número de parejas.Xi : valores obtenidos en el momento 1Yi : valores obtenidos en el momento 2

Page 25: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

24

2.2.- METODO DE DIVIDIR EN MITADES (Ver Ejemplo en el presente módulo)

Consiste en calcular el coeficiente de correlación de Pearson entre las dos mitades decada factor (pares o impares) de los elementos y luego corregir los resultados según lafórmula de Sperman – Brown, que es una fórmula de corrección, que da comoresultado un estimulo corregido de confiabilidad. Este método requiere solo unaaplicación de la medición. Específicamente el conjunto total de ítems (ocomponentes) se divide en dos mitades y se comparan las puntuaciones o losresultados de ambas. Si el instrumento es confiable, las puntuaciones de ambasmitades deben estas muy correlacionadas.

Procedimiento de dos mitades (divisón de items en pares e impares)Primero : Se calcula el Índice de Correlación (Pearson)

= ∗ ∑ − (∑ )(∑ )∑ – ∑ ∑ – ∑Alumnos

Items Impar ParI II III Xi Yi Xi*Yi Xi2 Yi2

Campos (1) 3 5 5 8 5 40 64 25Gómez (2) 5 4 5 10 4 40 100 16Linares (3) 4 4 5 9 4 36 81 16Rodas (4) 4 5 3 7 5 35 49 25Saavedra (5) 1 2 2 3 2 6 9 4Tafur (6) 4 3 3 7 3 21 49 9

= 44 23 178 352 95

Reemplazando:

= 6 ∗ 178 − (44 ∗ 23)[6 ∗ 352 − (44) ] [6 ∗ 95 − (23) ] = 0.66Indice de correlación de Pearson ( r ) = 0.66.

Segundo: Corrección de r con la ecuación de Spearman – Brown ( R ) :

Coeficiente de fiabilidad = 0.79

2.3.- MÉTODO COEFICIENTE ALFA DE CRONBACH:

Requiere de una sola administración del instrumento de medición y se basa en lamedición de la respuesta del sujeto con respecto a los ítems del instrumento.Su ventaja reside en que no es necesario dividir en dos mitades a los ítems delinstrumento de medición; simplemente se aplica la medición y se calcula el coeficiente.

r

rR

+=

12

Page 26: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

25

CÁLCULO DEL COEFICIENTE:

= − 1 1 − ∑Donde:K : Es el número de ítems.∑ : Sumatoria de varianzas de los ítems.

: Varianza de la suma de los ítems.: Coeficiente de Alfa de cronbach.

EJEMPLO:Se tienen los resultados referidos a la opinión de 06 alumnos respecto a los ítemsformulados en un cuestionario

AlumnosItems

I II IIICampos (1) 3 5 5Gómez (2) 5 4 5Linares (3) 4 4 5Rodas (4) 4 5 3Saavedra (5) 1 2 2Tafur (6) 4 3 3

PROCEDIMIENTO:Paso 1: Calcular las varianzas de cada uno de los ítems; en el cuadro de cálculo.

AlumnosItems

Suma de ItemsI II III

Campos (1) 3 5 5 13

Gómez (2) 5 4 5 14

Linares (3) 4 4 5 13

Rodas (4) 4 5 3 12

Saavedra (5) 1 2 2 5

Tafur (6) 4 3 3 10

VAR. ( ) 1.90 1.37 1.77 = 10.97

Paso 2: Calcular la sumatoria de varianzas de los ítems.

Paso 3: Calcular la varianza de la suma de los ítems.= 10.97

Paso 4: Calcular el coeficiente de Alfa de Cronbach. α = 0.81Paso 5: Interpretación de la significancia de α = 0.81; lo que significa que los resultadosde opinión de los 06 alumnos respeto a los ítems considerados se encuentrancorrelacionado de manera altamente confiable y muy aceptable.

∑ = 5.03

Page 27: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

26

Ejercicio 1. Con el fin de medir los niveles de actitud adversa hacia la fauna silvestre enuna comunidad rural, se propone aplicar la escala de medición siguiente:

Asignando los puntajes de medición a cada ítem de ponderaciones iguales y partiendode 1 tenemos:

[1 = Nunca (N), 2 = Pocas Veces (PV), 3 = A veces (AV), 4 = Muchas Veces (MV), 5 =Siempre (S)]

Solución: Para probar la escala se entrevista a 10 agricultores y se obtienen lasrespuestas:

Cuadro Nº 01: Distribución de Agricultores entrevistados según los niveles de actitud2

adversa hacia la fauna silvestre en una comunidad rural – Junio de 2012.

Encuesta I1 I2 I3 I4 I5 I6 TotalE1 2 1 1 1 2 1 8E2 1 1 1 1 2 1 7E3 1 2 2 1 2 2 10E4 2 2 2 1 2 3 12E5 3 3 3 3 3 3 18E6 2 3 3 3 3 4 18E7 4 4 4 3 5 4 24E8 4 4 4 3 5 4 24E9 5 5 4 5 5 5 29E10 5 5 5 5 5 4 29

Variancia 2.322 2.222 1.878 2.489 2.044 1.878 ∑ = 70.54= 12.833

Fuente: Elaboración propia.

Determinación del Coeficiente Alfa de Cronbach ( ):

= − ∑ = 1 − . . = 0.982

Donde:n: Es el número items incluidos en la escala de medición =6S2

j: Variancia del j-ésimo item de la escala =12.833S2

x: Variancia del puntaje total obtenido a través de la escala de medición = 70.54Comentario:De 10 agricultores entrevistados la fiabilidad de las respuestas de los 6 items según elcoeficiente alfa de Cronbach ( = 0.982), indica que las respuestas o resultados de losindividuos entrevistados son muy consistentes, es decir presenta una confiabilidadaceptable.Salida de SPSS vs 20.0:

2 [1 = Nunca (N), 2 = Pocas Veces (PV), 3 = A veces (AV), 4 = Muchas Veces (MV), 5 = Siempre (S)]

Page 28: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

27

Estadísticos de fiabilidad

Alfa de CronbachAlfa de Cronbach basada en

los elementos tipificadosN de elementos

,982 ,982 6

Matriz de correlaciones inter-elementos

I1 I2 I3 I4 I5 I6

I1 1,000 ,929 ,899 ,906 ,938 ,803I2 ,929 1,000 ,979 ,945 ,938 ,925I3 ,899 ,979 1,000 ,905 ,930 ,893I4 ,906 ,945 ,905 1,000 ,867 ,843I5 ,938 ,938 ,930 ,867 1,000 ,828I6 ,803 ,925 ,893 ,843 ,828 1,000

Estadísticos de resumen de los elementos

Media Mínimo Máximo Rango Máximo/mínimo Varianza N deelementos

Varianzas delos elementos

2,139 1,878 2,489 ,611 1,325 ,062 6

Ejercicio 2. Estime el índice de fiabilidad del cuestionario con base en la correlaciónpar impar.

El coeficiente de fiabilidad par impar se calcula con base en la correlación entre lospuntajes totales obtenidos con los ítems pares e impares utilizando la función EXCEL:

Suma de puntos de ItemsImpares Pares

5 34 35 56 69 98 1013 1113 1114 1515 14

rPI = 0.949

COEF.DE.CORREL (Impares; Pares) = rPI = 0.949

Coeficiente de fiabilidad: = = ( . ). = 0.974

Page 29: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

28

Comentario: se registra un alto índice de fiabilidad para la alta consistencia interna quese registra entre los ítems pares e impares del instrumento.Ejercicio 3. Encuentre los índices de homogeneidad corregidos para cada ítem.

Cuadro Nº 02: Distribución de Agricultores entrevistados según los niveles de actitudadversa hacia la fauna silvestre en una comunidad rural – Junio de 2012.

Encuesta I1 I2 I3 I4 I5 I6E1 6 7 7 7 6 7E2 6 6 6 6 5 6E3 9 8 8 9 8 8E4 10 10 10 11 10 9E5 15 15 15 15 15 15E6 16 15 15 15 15 14E7 20 20 20 21 19 20E8 20 20 20 21 19 20E9 24 24 25 24 24 24E10 24 24 24 24 24 25

Índices de homogeneidadcorregidos para cada ítem

0.932 0.991 0.963 0.929 0.938 0.885

Fuente: Elaboración propia.

Interpretación: El ítem 6 es el menos relacionado con la prueba general.

Ejercicio 4. Un índice de validez del cuestionario previsto.

En base la valoración global efectuada por los entrevistados, estime:

EntrevistaPuntajeTotal

CalificativoGlobal

1 8 52 7 73 10 74 12 75 18 146 18 147 24 178 24 179 29 2010 29 20

Correlación entre puntajesCOEF.DE.CORREL (total; global) = rxx = 0.984

Interpretación: Este coeficiente alto indica una aceptable validez de constructo

5. Calcule el coeficiente de fiabilidad de pruebas paralelas.

Page 30: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

29

Cuestionario A

Encuesta I1 I2 I3 I4 I5 I6 Total

E1 2 1 1 1 2 1 8E2 1 1 1 1 2 1 7E3 1 2 2 1 2 2 10E4 2 2 2 1 2 3 12E5 3 3 3 3 3 3 18E6 2 3 3 3 3 4 18E7 4 4 4 3 5 4 24E8 4 4 4 3 5 4 24E9 5 5 4 5 5 5 29E10 5 5 5 5 5 4 29

Coeficiente de Fiabilidad = COEF.DE.CORREL (A; B) = -0.062

Interpretación: El Coeficiente de Fiabilidad es bajo por lo tanto no indica unaaceptable validez de constructo.

Cuestionario B

Encuesta I1 I2 I3 I4 I5 I6 I7 I8 Total

E1 2 1 2 2 3 1 1 3 15E2 4 5 5 3 4 3 1 2 27E3 4 3 4 4 3 4 3 3 28E4 4 4 4 4 4 4 5 4 33E5 1 1 2 2 3 2 2 1 14E6 3 3 4 4 4 5 5 4 32E7 2 2 2 2 1 1 1 1 12E8 4 4 5 4 3 5 3 1 29E9 4 3 1 3 3 3 2 1 20E10 4 5 4 5 4 4 3 2 31

Page 31: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

30

II. ORGANIZACIÓN DE DATOS

1. DISTRIBUCIÓN DE FRECUENCIAS

Después de recoger toda la información correspondiente a la investigación, es decir, alagotar todo el trabajo de campo, nuestro escritorio se llena de un cúmulo de datos ycifras desordenadas los cuales, al ser tomados como observaciones individuales, dicenmuy poco sobre la población estudiada; es, entonces, tarea del investigador “hacerhablar las cifras”, comenzando por la clasificación y ordenación, consignando lainformación en tablas inteligibles que denominamos distribuciones de frecuencias.

ORDENACIÓN DE DATOS

• CARACTERES CUALITATIVOS

Consideremos una muestra de tamaño “n” sacada de una población estadística de la queobservamos un carácter cualitativo A que presenta las modalidades siguientes: a1, a2,a3,..., ak, llamamos

FRECUENCIAABSOLUTA

SIMPLEfi

De la modalidad ai al número de veces que aparecerepetida dicha modalidad en el conjunto de lasobservaciones realizadas.= ; 0 ≤ ≤ ; = 1, 2, 3, ….

FRECUENCIARELATIVA

SIMPLEhi

De la modalidad ai al cociente entre la frecuencia absolutay el número de datos (= tamaño de la muestra “n”).ℎ = ; ℎ = 1 ; 0 ≤ ℎ ≤ 1 ; = 1, 2, 3, ….

Los datos de las observaciones se puedenrecoger en la siguiente tabla de distribución :

Modalidadesde carácter A fi hi

a1 f1 h1

a2 f2 h2……

..

……

..

……

..

ak fk hk

Total. = ℎ = 1• CARACTERES CUANTITATIVOS

Page 32: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

31

Consideramos una variable estadística X que, en una muestra de tamaño “n” extraídade una población estadística, toma los valores x1<x2<x3< ...<xk , definimos lossiguientes conceptos :

Tamaño de lamuestra n

Llamamos tamaño muestral al número de observacionesrealizadas, es decir, al número total de datos.= + +⋯+ =

FrecuenciaAbsoluta fi

Llamamos frecuencia absoluta de un valor xi de la variableestadística X al número de veces que aparece repetido dichovalor en el conjunto de las observaciones realizadas.= ; 0 ≤ ≤ ; = 1, 2, 3, ….

FrecuenciaAbsoluta

AcumuladaFi

Llamamos frecuencia absoluta acumulada en el valor xi ala suma de las frecuencias absolutas de los valores inferioreso iguales a él.Evidentemente, los valores xi han de estar ordenados deforma creciente, como ya se ha indicado, y la frecuenciaabsoluta acumulada del último valor será igual a “n”.=

FrecuenciaRelativa hi

Llamamos frecuencia relativa de un valor xi de la variableestadística X al cociente entre la frecuencia absoluta y elnúmero de observaciones realizadas.ℎ = ; ℎ = 1 ; 0 ≤ ℎ ≤ 1.

FrecuenciaRelativa

AcumuladaHi

Llamamos frecuencia relativa acumulada en el punto xi alcociente entre la frecuencia absoluta acumulada y el númerode observaciones realizadas.= ; = 1

En las observaciones realizadas en una muestra o población, puede ocurrir:

1. Que la variable estadística tome pocos valores diferentes (ya sea grande opequeño el tamaño de la muestra).

2. Que, en una muestra de gran tamaño, la variable estadística tome muchosvalores diferentes, ya se trate de variable estadística discreta como de variableestadística continua (este último caso es el más habitual).

En el primer caso no esnecesario agrupar los datos, yla tabla de distribución presentael siguiente aspecto (ordenando

Xi fi hi Fi Hi

x1 f1 h1 F1 H1

x2 f2 h2 F2 H2

Page 33: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

32

los datos de menor a mayor) :

……

..

……

..

……

..

……

..

……

..xk Fk hk Fk=n Hk=1

Total. = ℎ= 1En el segundo caso por tratarse de variable continua o discreta pero con un número dedatos muy grande, es aconsejable AGRUPAR LOS DATOS EN CLASES.

Rango (R).= á −Número de clases (m).Determinamosatreves de la regla de sturges.= 1 + 3.322 ∗ Log ( )Amplitud de clases (C).=Tabla de frecuencias deuna variable estadísticaagrupada en intervalos.

Intervalosde clase

Marcasde clase

Xifi hi Fi Hi

[a0 – a1) x1 f1 h1 F1 H1

[a1 – a2) x2 f2 h2 F2 H2……

..

……

..

……

..

……

..

……

..

……

..

[ak– ak+1) xk Fk hk Fk=n Hk=1

Total. = ℎ= 1MEDIDAS DE TENDENCIA CENTRAL.

Son estadígrafos de posición que son interpretados como valores que permiten a unconjunto de datos dispersos, podría asumirse que estas medidas equivalen a un centrode gravedad que adoptan un valor representativo para todo un conjunto de datospredeterminados.

Estas medidas son:

1. Promedio Aritmético (Media Aritmética).2. Mediana.3. Moda.4. Promedio Geométrico.5. Promedio Total.

Page 34: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

33

6. Media armónica.

MEDIDAS DE POSICIÓN

Percentiles.CuartilesDeciles

MEDIDAS DE VARIABILIDAD (dispersión)

Son estadígrafos de dispersión que permiten evaluar el grado de homogeneidad,dispersión o variabilidad de un conjunto de datos. Estas medidas son:

1. Amplitud o rango.2. Varianza.3. Desviación estándar.4. Coeficiente de variabilidad.

MEDIDAS DE FORMA

Evalúa la forma que adopta la distribución de frecuencias respecto al grado dedistorsión (inclinación) que registra respecto al valor promedio tomado comocentro de gravedad, el grado de apuntamiento (elevamiento) de la distribución defrecuencias. A mayor elevamiento de la distribución de frecuencia significarámayor concentración de los datos en torno al promedio, por tanto, una menordispersión de los datos. Estas medidas son:

1. Asimetría o sesgo.2. Curtosis.

Page 35: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

34

1. LA MEDIA ARITMÉTICA.

Para Datos no Agrupados.El promedio aritmético de un conjunto de valores (X1, X2, X3,….., Xn) es:

= ∑ n = 1 + 2 + 3 + ⋯+Ejemplo:Durante los últimos 32 días el valor de las compras (soles) en periódicos fue:

5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 8.26.6 7.8 6.8 7.2 8.4 9.6 8.5 5.7 6.4 10.1 9.19.0 7.8 8.2 5.3 6.2 8.6 7.0 7.7 8.3 7.5

El promedio aritmético del valor de las compras en periódicos es:

= ∑ n = 250.232 = 7.82 Para Datos Agrupados.

Rango (R).= á − = 10.2 − 5.2 = 5Número de clases (m).Determinamos atreves de la regla de sturges.= 1 + 3.3 ∗ Log( ) = 1 + 3.3 ∗ (32) = 5.97 ≅ 6Amplitud de clases (C).= = 56 = 0.83

= ∑ ∗Donde: fi = frecuencia en la clase K –ésima.

Xi = marca de clase en el intervalo K – éimo.

Ejemplo.

Para los gastos diarios en periódicos del hotel agrupados en una tabla defrecuencia:

Intervalo Xi fi hi Fi Hi

[5.2 - 6.0) 5.62 3 0.09 3 0.09[6.0 - 6.9) 6.45 5 0.16 8 0.25[6.9 - 7.7) 7.28 6 0.19 14 0.44[7.7 - 8.5) 8.12 8 0.25 22 0.69[8.5 - 9.4) 8.95 5 0.16 27 0.84[9.4 - 10.2] 9.78 5 0.16 32 1.00

Total 32 1

02468

10

5.62 6.45 7.28 8.12 8.95 9.78

fi

Xi

Page 36: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

35

El promedio aritmético es:

= ∑ ∗ = 5.62 ∗ 3 + 6.45 ∗ 5 +⋯+ 9.78 ∗ 532 = 251.4032 = .Durante los 32 días el hotel tuvo un gasto promedio en periódicos de 7.86 soles

2. LA MEDIANA.

Es al valor que ocupa la posición central de un conjunto de observaciones ordenadas. El50% de las observaciones son mayores que este valor y el otro 50% son menores.

Para Datos no Agrupados.La ubicación de la mediana de n datos ordenados se determina por: (n+1)/2.Ejemplos.

En los 7 datos ordenados: {4, 5, 5, 6, 7, 8, 9}.

La ubicación de la mediana es:( ) = 4, Luego el valor de la mediana: Me = 6.

En los 8 datos ordenados: {3, 4, 5, 5, 6, 7, 8, 9}.

La mediana se ubica en el lugar( ) = 4.5, Luego el valor de la mediana es:= ( ) = 5.5

Para Datos Agrupados. = + − ∗Li: Limite inferiordel intervalo que contiene a la mediana.Fi-1 : Frecuencia acumulada en la clase anterior i – ésima.Fi : Frecuencia en la clase que contiene a la mediana.Hi-1 : Frecuencia relativa acumulada en la clase anteriori – ésima.hi : Frecuencia relativa en la clase que contiene a la mediana.Ci: Amplitud del intervalo de clase

Ejemplo. Para los gastos diarios en periódicos del hotel en una tabla de frecuencias.

L

a mediana es: = 7.7 + ∗ 0.83 = 7.9El 50% de los días el hotel gastó menos de 7.9 soles en la compra de periódicos.

IntervaloDe clase

Marcade clase

Xi

FrecuenciaAbsoluta

fi

FrecuenciaRelativa

hi

Frec. Acum.Absoluta

Fi

Frec. Acum.Relativa

Hi

[5.2 - 6.0) 5.62 3 0.09 3 0.09[6.0 - 6.9) 6.45 5 0.16 8 0.25[6.9 - 7.7) 7.28 6 0.19 14 0.44[7.7 - 8.5) 8.12 8 0.25 22 0.69[8.5 - 9.4) 8.95 5 0.16 27 0.84[9.4 - 10.2] 9.78 5 0.16 32 1.00

Total 32 1

Page 37: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

36

3. LA MODA.

Es el valor; clase o categoría que ocurre con mayor frecuencia y sus características son:

° Puede no existir o existir más de una moda.° Su valor no se ve afectado por los valores extremos en los datos.° Se utiliza para analizar tanto la información cualitativa como la cuantitativa.° Es una medida inestable cuando en número de datos es reducido.

Para Datos no Agrupados.

Por ejemplo, Durante los últimos 32 días el valor de las compras en periódicosfue:

5.2 10.2 7 7.1 10.2 8.3 9.4 9.26.6 7.8 6.8 7.1 8.4 9.6 7.1 5.7

Moda =Mo= 7.1; es el valor más frecuente, ocurre tres veces.

Ejemplo: 2, 2, 5, 5, 7, 7, 7, 7, 9, 9, 9, 10; Mo = 7 y 9 Serie bimodalEjemplo: 6, 5, 6, 6, 3, 4, 6, 6, 7 Mo = 6 Serie UnimodalEjemplo: 13, 15, 12, 11, 20, 22 No tiene Moda o se dice quecada dato es una moda

Para Datos Agrupados. = + + ∗Donde: = ( − ) = ( − )fi= valor de mayor frecuencia.Ejemplo.El gasto diario en periódicos del hotel “***” agrupados en una tabla defrecuencias.

= 7.7 + 22 + 3 ∗ 0.83 = 8.03Donde:= 7.7= (8 − 6) = 2= (8 − 5) = 3El gasto diario en periódicos más frecuente es 8.03soles.

Intervalo Xi fi hi Fi Hi

[5.2 - 6.0) 5.62 3 0.09 3 0.09[6.0 - 6.9) 6.45 5 0.16 8 0.25[6.9 - 7.7) 7.28 6 0.19 14 0.44[7.7 - 8.5) 8.12 8 0.25 22 0.69[8.5 - 9.4) 8.95 5 0.16 27 0.84[9.4 - 10.2] 9.78 5 0.16 32 1.00

Total 32 1

Page 38: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

37

4. MEDIA GEOMÉTRICA.

La media geométrica simple de n observaciones X1, X2, X3,…..,Xn positivos, estadado por la raíz enésima del producto de los n valores observados. El promediogeométrico de los valores: (X1, X2, X3,…..,Xn) es :

Para Datos no Agrupados. = ………….Ejemplo.Hallar la media geométrica de los números 3, 5, 8, 3, 5, 2.

Solución.En este caso n = 6, entonces la media geométrica es:= √ = 3.915

Para Datos Agrupados.

Si los datos están agrupados en clases, la media geométrica ponderada, es la raízenésima del producto de las marcas de clases elevadas a sus respectivasfrecuencias, es decir. = ( ) ( ) … … … ( )Donde: = ∑ , Xi = Marca de clase, fi = Frecuencia absoluta simple,m = número de clases.Aplicando logaritmo a ambos lados miembros de la ecuación anterior se tiene:

Log = [ + +, … , + ]= ∑ ; Luego.= ∑ =1Ejemplo.

= 28.46= 7.749

Intervalo Xi fi log (Xi) fi * log(Xi)[5.2 - 6.0) 5.62 3 0.749 2.248[6.0 - 6.9) 6.45 5 0.81 4.048[6.9 - 7.7) 7.28 6 0.862 5.174[7.7 - 8.5) 8.12 8 0.909 7.275[8.5 - 9.4) 8.95 5 0.952 4.759[9.4 - 10.2] 9.78 5 0.99 4.952Total ( ∑ ): 32 28.46

Page 39: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

38

Desventajas de la media geométrica.

• Está limitado para valores positivos para que pueda ser interpretado.• Si algún valor de la variable es cero, la media geométrica será cero.• Si aparece algún valor negativo, el estadígrafo toma un valor imaginario.

5. PROMEDIO PONDERADO

Cuando se desea encontrar el promedio de valores (X1, X2, X3,…..,Xn) que ocurren confrecuencias (f1,f2,….fn)diferentes se deberán ponderar los valores observados con pesosdiferentes:

= ∗Donde Wi = fi/n se denominan “ponderaciones o pesos”.

Ejemplo.

En una agencia de viajes se han vendido 200 pasajes a los precios siguientes:

Precio de venta (soles)Xi

Numero de pasajesfi

PonderaciónWi

Xi*Wi

12 60 0.30 3.6014 100 0.50 7.0016 40 0.20 3.20

Total 200 1 ∑ = 13.8

El precio promedio de venta de los 200 pasajes es de 13.8 soles

6. PROMEDIO TOTAL

Corresponde al valor promedio representativo de grupos de observaciones separadas odiferentes y que podrían estar consolidadas en tablas de frecuencia independientes, portanto: = + ……+ +⋯ . +ni: Numero de observaciones en el grupo i-ésimo.

: Promedio correspondiente el grupo i-ésimo

Page 40: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

39

Ejemplo.

Promedio del grupo A: Promedio del grupo B:

X = 4(7.5) + 16(12.5) + 5(17.5)25 = 12.7 X= 8(2.5) + 10(7.5) + 16(12.5) + 6(17.5)40 = 10X = 25(12.7) + 40(10)65 = 11.04

7. MEDIA ARMÓNICA.

La media armónica “Mh” o “X ” de n términos no nulos X1, X2, X3,…..,Xn, es el reciprocode la media aritmética de los recíprocos de esos términos. Es decir.

Para Datos no Agrupados.X = n+ +⋯… … … … . +Ejemplo.Calcular el rendimiento promedio para el caso de tres automóviles querecorrieron 500 kilómetros y cada auto tuvo el rendimiento siguiente:

Auto A B CRendimiento(Km/galón) 50 62.4 77.6

X = 3+ . + . = 30.0489121 = 61.334 KmgalónVerificación.

Auto Km Rendimiento Total de galones X = 150024.4561 = 61.334A 500 50 10B 500 62.4 8.0128C 500 77.6 6.4433

Total 1500 24.4561

GUPO ANota Xi fi5 – 10 7.5 410 – 15 12.5 1615 – 20 17.5 5Total 25

GUPO BNota Xi fi0 – 5 2.5 85 – 10 2.5 10

10 – 15 12.5 1615 – 20 17.5 6Total 40

PromedioTotal

Grupo X fi

A 12.7 25B 10 40

Total 65

Page 41: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

40

Para Datos Agrupados.La media armónica para datos tabulados (mediaarmónica ponderada) se define por:X = Mh = n∑

Donde:m = número de clases, Xi = marca de clase, fi = frecuencia absoluta de cada clase.

MEDIDAS DE POSICIÓN.

Las medidas de posición equivalen a los valores que puede tomar una variablecaracterizados por agrupar a cierto porcentaje de observaciones en la muestra opoblación.Las medidas de posición son ideales para obtener información adicional a partir dedatos resumidos, es decir, que presentan perdida de información por agrupamiento enintervalos de clase.

PERCENTILES.

Son 99 valores que dividen a un conjunto de datos en 100 partes iguales.

Para Datos Agrupados. = + − ∗= Límite inferior del intervalo que contiene al percentil= Frecuencia acumulada en la clase anterior K-ésima= Frecuencia en la clase que contiene al percentil

C =Amplitud del intervalo de clasek = 1%, 2%, 3%,……..,97%, 98%, 99% Percentiles.

Ejemplo.

El percentil 80% de los gastos diarios en periódicos es.

1. Se determina 80*n/100.

IntervaloDe clase

Marcade clase

Xi

FrecuenciaAbsoluta

fi

FrecuenciaRelativa

hi

Frec. Acum.Absoluta

Fi

Frec. Acum.Relativa

Hi

[5.2 - 6.0) 5.62 3 0.09 3 0.09[6.0 - 6.9) 6.45 5 0.16 8 0.25[6.9 - 7.7) 7.28 6 0.19 14 0.44[7.7 - 8.5) 8.12 8 0.25 22 0.69[8.5 - 9.4) 8.95 5 0.16 27 0.84[9.4 - 10.2] 9.78 5 0.16 32 1.00

Total 32 1

Page 42: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

41

2. De la tabla, la frecuencia absoluta acumulada inmediatamente superior a 80*n/100 = 25.6 esF5 = 27, luego F5-1 = 22. Por tanto en intervalo de clase que contienen a % es [8.5 – 9.4)

% = + − ∗ = 8.5 + ( . − 22)5 ∗ 0.83 = 9.09El 80% de los datos analizados serán menores de 9.09 y el 20% restante serán superiores.

CUARTILES.

Son tres valores Q1, Q2, Q3 que dividen a los datos en cuatro partes iguales.

25% Q1 25% Q2 25% Q3 25%

= + − ∗ ; = ; = + − ∗Ejemplo.Calcular el tercer cuartil (Percentil 75%) de los gastos diarios en periódicos de la tablaanterior.

Solución.

1. Se determina n/4.

2. De la tabla, la frecuencia absoluta acumulada inmediatamente superior a 3n/4 = 24 es F5 = 27,luego F5-1 = 22. Por tanto en intervalo de clase que contienen a es [8.5 – 9.4)

= + − ∗ = 8.5 + ( − 22)5 ∗ 0.83 = 8.8El 75% de los datos analizados serán menores a 8.8 y el 25% restante serán superiores.

DECILES.

Son nueve valores D1, D2, D3, D4, D5, D6, D7, D8, y D9, que dividen a un conjunto dedatos en 10 partes iguales.

1. Se construye la tabla de frecuencias absolutas acumuladas.2. Se determina k*n/10.3. Se identifica a la clase que contiene a Dk, identificado a la frecuencia absoluta

acumulada Fi inmediatamente superior a k*n/10.

Page 43: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

42

Ejemplo.

Calcular el decil siete (Percentil 70%) de los gastos diarios en periódicos de la tabla defrecuencia anterior.

= + − ∗ = 8.5 + ( . − 17)5 ∗ 0.83 = 9.39670% de los datos serán menores a 9.396 y el 30% restante serán superiores a 9.396.

Para Datos no Agrupados.

El lugar o posición donde se encuentran los cuartiles para n datos ordenados es:

Cuartil Q1 = P25% Q2 = P50% Q3 = P75%

Posición25(n + 1)100 50(n + 1)100 75(n + 1)100

Ejemplo.

Supóngase que los siguientes datos representan los salarios por día de 12 trabajadoresde una compañía muy grande seleccionados aleatoriamente (en soles)

9 10 12 3 5 7 15 10 9 11 13 11

Determinar el primer cuartil de la muestra.

Solución.

1. Los datos ordenados en forma ascendente son:

3 5 7 9 9 10 10 11 11 12 13 15X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12

2. Como n = 12, = = 3.25. Esto significa que el valor de Q1 es el tercer

dato más 25% de la diferencia entre los valores de las observaciones tercero ycuarto. Así, el valor de la tercera observación es 7 y el del cuarto es 9, entonces

Q1 = 7 + (9-7)*0.25 =7.5 soles.

Page 44: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

43

Ejemplo:

Determine los cuartiles y decil 8 de los 13 datos ordenados siguientes:

10 11 11 12 12 13 13 13 14 15 17 18 20X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13

Percentil Posición Incremento % Valor del cuartilQ1 = P25 0.25(13+1) = 3.5 50% Q1 = 11+(12-11)*0.50 =11.5Q2 = P50 0.50(13+1) = 7 0% Q2 = 13Q3 = P75 0.75(13+1) = 10.5 50% Q3 = 15+(17-15)*0.50 = 16Q8 = P80 0.80(13+1) = 11.2 20% P80 = 17+(18-17)* 0.20 = 17.2

MEDIDAS DE VARIABILIDAD.

1. AMPLITUD O RANGOSean los valores:x1, x2, x3,…..,xnla amplitudo rango de estos datos esR = (Xmax - Xmin).

2. VARIANZA Y DESVIACIÓN TÍPICA.Estas medidas son las más utilizadas en el estudio de la dispersión. La varianzamide la dispersión de los datos con respecto a su media aritmética y ladesviación típica o desviación estándar es simplemente la raíz cuadrada positivade la varianza.

• Para Datos no Agrupados.

Definición de de varianza poblacional. La varianza poblacional finita de Nelementos X1, X2, X3,…..,Xn, se define como la media aritmética del cuadradode las desviaciones de las observaciones con respecto a su media µ, y se denotapor es decir.

N

xn

ii∑

=

−= 1

2

2

)(

Definición de de varianza de una muestra. La varianza de una muestra, x1, x2,x3,…..,xn, de una variable o una característica x (que abreviadamente escribimos“V(x)”), se define como la media del cuadrado de las desviaciones de lasobservaciones con respecto de la media aritmética de esos datos. Si denotamospor “S2”.

Es fácil verificar que: ∑∑==

−=−n

ii

n

ii xnxxx

1

22

1

2)(

n

xs

n

ii∑

=

−= 1

2_

2

)X(

Page 45: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

44

Por lo tanto,

21

2

2 xn

xs

n

ii

−=∑

=

La diferencia entre∑ ( ̅) ∑ ( ̅)

es grande para muestras pequeñas, y

es mínima para muestras grande, prácticamente son iguales. Entonces, paramuestras grandes ≥ 60 , puede usarse cualquiera de las formulas. Para

muestras pequeñas se usa∑ ( ̅)

, lo cual es llamada varianza muestral o

también varianza corregida, y se acostumbra denotar por . Es decir la varianzamuestral estará definida por:= ∑ ( − ̅)− 1 ó = ∑ −− 1Ejemplo.Calcular la varianza de los cuatro datos siguientes: (Xi: 3, 4, 6 y 7)

= ∑ n = 3 + 4 + 6 + 74 = 204 = 5∑ −− 1 = 3 + 4 + 6 + 74 − 1 = 103 = 3.333• Para datos Agrupados.

n

fXxs

n

iii∑

=

−= 1

2

2

*)(

= ∑ ( − ̅) ∗− 1 ó = ∑ ∗ −− 1Ejemplo.

Los gastos diarios en periódicos del hotel agrupados en la tabla de frecuencias.

= .

IntervaloDe clase

Marcade clase

Xi

FrecuenciaAbsoluta

fi

Xi*Fi ( Xi - )2*fi

[5.2 - 6.0) 5.62 3 16.85 15.10[6.0 - 6.9) 6.45 5 32.25 9.94[6.9 - 7.7) 7.28 6 43.70 2.00[7.7 - 8.5) 8.12 8 64.93 0.53[8.5 - 9.4) 8.95 5 44.75 5.94[9.4 - 10.2] 9.78 5 48.92 18.50

Total ∑= 32 ∑ = 251.40 ∑ = 52.00

Page 46: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

45

= ∑ ( − ̅) ∗− 1 = 5231 = 1.683. DESVIACIÓN ESTÁNDAR.

Es una medida de variabilidad que corresponde a la raíz cuadrada de la varianza.Este indicador tiene la misma unidad de medida en la que se expresa elpromedio.

= = ∑ ( − ̅) ∗− 1Entonces, = √1.68 = 1.3 soles.

Propiedades dela varianza.

• La varianza de un conjunto de observaciones x1, x2, x3,…..,xn,siempre es un número no negativo. Esto es( ) ≥ 0

• La varianza de una constante es cero.( ) = 0• Si a cada observación x1, x2, x3,…..,xn, se adiciona o resta una

constante k>0, la varianza del nuevo conjunto de valores y1, y2,y3,…..,yn, donde yi=xi ± K, i=1, 2,….,n, coincide con la varianza delconjunto original. Es decir

• ( ∗ ) = ( ).

• ( ) = ( ± ) = ( ) ó ( ) = ( ), donde a y b son

constantes.

4. COEFICIENTE DE VARIACIÓN.Es una medida de variabilidad de los datos que se expresa en porcentaje en lacual se compara la desviación estándar con el respectivo valor del promedio delos datos.

. . =Grado de variabilidad de los datos Coeficiente de variabilidadCon variabilidad baja Menos de 10%Con variabilidad moderada De 10% a 30%Con variabilidad alta Más de 30%

En el ejemplo anterior el coeficiente de variabilidad es:

. . = .. = . %

Page 47: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

46

MEDIDAS DE FORMA.

1. ASIMETRÍA O SEGO.Evalúa el grado de distorsión o inclinación que adopta la distribución de losdatos respecto a su valor promedio tomando como centro de gravedad. Elcoeficiente de asimetría de pearson es:= 3( − )

Grado de asimetría Valor del sesgoSimetría perfecta Cero: El promedio es igual a la medianaSesgo positivo Positivo: Promedio mayor que la medianaSesgo negativo Negativo: Promedio menor que la mediana

Asimetría Positiva Simétrica Asimetría Negativa(Promedio > Mediana) Promedio = Mediana Promedio < Mediana

En el ejemplo anterior losgastos diarios en periódicos el promedio es 7.8, lamediana es 7.90 y la desviación estándar 1.3, por lo tanto es sesgoesligeramente negativo -0.23.

CURTOSIS.

Evalúa el grado de apuntamiento de la distribución, el coeficiente es:= −( − )Grado de Apuntamiento Valor de CurtosisMesocúrtica (distribución normal) 0.263Leptocúrtica (Elevada) Mayor a 0.263 ó se aproxima a 0.5Platicúrtica (Aplanada) Menor a 0.263 ó se aproxima a 0.

Ku =0.263 Ku> 0.263 Ku< 0.263 MesocurticaLeptocúrticaPlaticúrtica(Normal)

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

46

MEDIDAS DE FORMA.

1. ASIMETRÍA O SEGO.Evalúa el grado de distorsión o inclinación que adopta la distribución de losdatos respecto a su valor promedio tomando como centro de gravedad. Elcoeficiente de asimetría de pearson es:= 3( − )

Grado de asimetría Valor del sesgoSimetría perfecta Cero: El promedio es igual a la medianaSesgo positivo Positivo: Promedio mayor que la medianaSesgo negativo Negativo: Promedio menor que la mediana

Asimetría Positiva Simétrica Asimetría Negativa(Promedio > Mediana) Promedio = Mediana Promedio < Mediana

En el ejemplo anterior losgastos diarios en periódicos el promedio es 7.8, lamediana es 7.90 y la desviación estándar 1.3, por lo tanto es sesgoesligeramente negativo -0.23.

CURTOSIS.

Evalúa el grado de apuntamiento de la distribución, el coeficiente es:= −( − )Grado de Apuntamiento Valor de CurtosisMesocúrtica (distribución normal) 0.263Leptocúrtica (Elevada) Mayor a 0.263 ó se aproxima a 0.5Platicúrtica (Aplanada) Menor a 0.263 ó se aproxima a 0.

Ku =0.263 Ku> 0.263 Ku< 0.263 MesocurticaLeptocúrticaPlaticúrtica(Normal)

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

46

MEDIDAS DE FORMA.

1. ASIMETRÍA O SEGO.Evalúa el grado de distorsión o inclinación que adopta la distribución de losdatos respecto a su valor promedio tomando como centro de gravedad. Elcoeficiente de asimetría de pearson es:= 3( − )

Grado de asimetría Valor del sesgoSimetría perfecta Cero: El promedio es igual a la medianaSesgo positivo Positivo: Promedio mayor que la medianaSesgo negativo Negativo: Promedio menor que la mediana

Asimetría Positiva Simétrica Asimetría Negativa(Promedio > Mediana) Promedio = Mediana Promedio < Mediana

En el ejemplo anterior losgastos diarios en periódicos el promedio es 7.8, lamediana es 7.90 y la desviación estándar 1.3, por lo tanto es sesgoesligeramente negativo -0.23.

CURTOSIS.

Evalúa el grado de apuntamiento de la distribución, el coeficiente es:= −( − )Grado de Apuntamiento Valor de CurtosisMesocúrtica (distribución normal) 0.263Leptocúrtica (Elevada) Mayor a 0.263 ó se aproxima a 0.5Platicúrtica (Aplanada) Menor a 0.263 ó se aproxima a 0.

Ku =0.263 Ku> 0.263 Ku< 0.263 MesocurticaLeptocúrticaPlaticúrtica(Normal)

Page 48: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

47

REPRESENTACIÓN GRÁFICA.

GRÁFICOS DE CAJAS.Existe una gran variedad de graficas estadísticas para extraer información acerca de laspropiedades de un conjunto de datos.

Una grafica útil para reflejar propiedades de los datos es la grafica de caja (“boxplots”) que se basa en la medida(o en la media), los cuartiles y valores extremos. Lacaja representa el rango intercuartil que encierra el 50% de los valores y tiene lamediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil75, P75 (cuartil superior) y el percentil 25, P25 (cuartil inferior).

Además de la caja se incluya la extensión de los datos mediante segmentos que seextienden de la caja hacia el valor máximo (U) y hacia el valor mínimo (L) de los datos.Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como seindica en la figura que sigue.

De un grafico de caja, se obtiene información de los datos acerca de:La centralización (observado la ubicación de la mediana)La dispersión o variabilidad (mediante en rango intercuartil: RI=P75-P25)La asimetría (comparado: Me - P25con P75 - Me)Las colas (por la longitud de los segmentos que salen de los lados de la caja)

Los datos atípicos o discordantes o raros llamados “outliers” (aislados) son aquellosque se ubican fuera del intervalo.

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

47

REPRESENTACIÓN GRÁFICA.

GRÁFICOS DE CAJAS.Existe una gran variedad de graficas estadísticas para extraer información acerca de laspropiedades de un conjunto de datos.

Una grafica útil para reflejar propiedades de los datos es la grafica de caja (“boxplots”) que se basa en la medida(o en la media), los cuartiles y valores extremos. Lacaja representa el rango intercuartil que encierra el 50% de los valores y tiene lamediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil75, P75 (cuartil superior) y el percentil 25, P25 (cuartil inferior).

Además de la caja se incluya la extensión de los datos mediante segmentos que seextienden de la caja hacia el valor máximo (U) y hacia el valor mínimo (L) de los datos.Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como seindica en la figura que sigue.

De un grafico de caja, se obtiene información de los datos acerca de:La centralización (observado la ubicación de la mediana)La dispersión o variabilidad (mediante en rango intercuartil: RI=P75-P25)La asimetría (comparado: Me - P25con P75 - Me)Las colas (por la longitud de los segmentos que salen de los lados de la caja)

Los datos atípicos o discordantes o raros llamados “outliers” (aislados) son aquellosque se ubican fuera del intervalo.

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

47

REPRESENTACIÓN GRÁFICA.

GRÁFICOS DE CAJAS.Existe una gran variedad de graficas estadísticas para extraer información acerca de laspropiedades de un conjunto de datos.

Una grafica útil para reflejar propiedades de los datos es la grafica de caja (“boxplots”) que se basa en la medida(o en la media), los cuartiles y valores extremos. Lacaja representa el rango intercuartil que encierra el 50% de los valores y tiene lamediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil75, P75 (cuartil superior) y el percentil 25, P25 (cuartil inferior).

Además de la caja se incluya la extensión de los datos mediante segmentos que seextienden de la caja hacia el valor máximo (U) y hacia el valor mínimo (L) de los datos.Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como seindica en la figura que sigue.

De un grafico de caja, se obtiene información de los datos acerca de:La centralización (observado la ubicación de la mediana)La dispersión o variabilidad (mediante en rango intercuartil: RI=P75-P25)La asimetría (comparado: Me - P25con P75 - Me)Las colas (por la longitud de los segmentos que salen de los lados de la caja)

Los datos atípicos o discordantes o raros llamados “outliers” (aislados) son aquellosque se ubican fuera del intervalo.

Page 49: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

48

Diagrama de Causa-Efecto

1.- El espesor de recubrimiento de un material de acero es evaluado en una sesión detormenta de ideas. El problema de variación del espesor (la cual es del 10%) que se señalaes por una serie de causas, que fueron clasificadas en: equipos sin calibración, personal sinentrenamiento, especificaciones mal estructuradas, mal diseño de la maquina, variación delmaterial, antigüedad de la maquina, personal mal seleccionado, sin procedimientos,velocidad sin control, alta temperatura, ambiente de trabajo contaminado, materialdefectuoso, personal sin experiencia, sin instrumentos de control.

Las causas fueron clasificadas según se muestra en el cuadro 1:

CUADRO 1Material Variación del material

Material defectuoso Materia prima de mala calidadProveedores no adecuados

Maquinaria Antigüedad de la maquinariaMal diseño de la maquinaEquipos sin calibración

Método Sin procedimientosEspecificaciones mal estructuradas

Medio Ambiente Alta temperaturaAmbiente de trabajo contaminado

Mano de Obra Personal sin entrenamientoPersonal sin experienciaPersonal mal seleccionado

Medición Sin instrumentos de controlVelocidad sin control

10%espesor enVariacion del

Ento rno

Med ic iones

Métodos

Material

Máquinas

Personal

Persona l mal se leccionado

Persona l sin exper iencia

Persona l sin entrenamiento

Equipos sin ca l ibración

Mal diseño de la maquina

Antigüedad de la maquinar ia

Mater ia l defectuoso

mater ia lVar iación de l

estructuradasEspecificaciones mal

Sin procedimientos

Ve locidad sin control

controlSin instrumentos de

contaminadoAmbiente de trabajo

Alta temperatura

Proveedo re s noade cuados

Ma te ri aprima

dema la c al ida d

diagrama de causa efecto

Page 50: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

49

Diagrama de Pareto

1.- En la empresa Las Malvinas el ensamblaje de mangueras ha sido criticado debido a quepresenta muchos defectos. De 14993 ensamblajes inspeccionados en un año, un total de1509, el 10.1% estaban defectuosos. El reporte de inspección se muestra en el cuadro 2:

CUADRO 2

Defectos Turno 1 Turno 2 Turno 3 TotalMuy corto 30 35 26 91Muy largo 44 44 44 132Sin roscas 70 69 70 209Fugas 330 321 347 998Dañadas 8 11 5 24Retrabajado 22 20 13 55Total 504 500 505 1509

La gerencia expresó su preocupación por que los tres turnos no cuentan con igual supervisión,lo que puede contribuir al problema. Desarrolle un Diagrama de Pareto para el total dedefectos en los tres turnos y un Diagrama de Pareto para cada turno.

Diagrama de Pareto para el total de defectos en los tres turnos.

Total 998 209 132 91 55 24Porcentaje 66.1 13.9 8.7 6.0 3.6 1.6

% acumulado 66.1 80.0 88.7 94.8 98.4 100.0

Defectos OtroRetrabajadoMuy cortoMuy largoSin roscasFugas

1600

1400

1200

1000

800

600

400

200

0

100

80

60

40

20

0

Tota

l

Porc

enta

je

Diagrama de Pareto de Defectos

Page 51: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

50

Diagrama de Pareto para cada turno.

Turno 1 330 70 44 30 22 8Porcentaje 65.5 13.9 8.7 6.0 4.4 1.6

% acumulado 65.5 79.4 88.1 94.0 98.4 100.0

Defectos OtroRetrabajadoMuy cortoMuy largoSin roscasFugas

500

400

300

200

100

0

100

80

60

40

20

0

Turn

o1

Porc

enta

je

Diagrama de Pareto de Defectos

Diagrama de Dispersión

1.- En un equipo de mejora se obtienen los siguientes datos, que recogen el número dedefectos por lote e conjuntos de 10 000 piezas en función del tiempo detratamiento al que se someten:

Obs #Defectos

Tiempo(Seg)

MateriaPrima

Obs #Defectos

Tiempo(seg)

MateriaPrima

1 48 809 B 26 47 837 A2 52 834 B 27 53 840 A3 54 838 B 28 58 850 B4 50 854 A 29 54 843 A5 48 822 A 30 43 819 A6 51 842 A 31 54 856 A7 52 851 A 32 52 862 A8 59 868 B 33 56 835 B9 54 841 B 34 55 844 B

10 54 844 B 35 55 852 A11 44 811 A 36 58 858 B12 54 819 B 37 57 843 B13 48 830 A 38 52 825 B14 47 836 A 39 58 867 B15 58 850 B 40 57 851 B16 57 857 B 41 51 812 B17 54 863 A 42 51 821 B

Page 52: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

51

18 49 811 B 43 50 831 B19 49 820 A 44 56 841 B20 48 826 A 45 50 843 A21 52 832 B 46 49 850 A22 50 837 A 47 52 841 B23 49 839 A 48 50 855 A24 54 839 B 49 46 829 A25 56 842 B 50 49 838 A

a) Realice un diagrama de dispersión entre la variable número de defectos por lote y lavariable tiempo de tratamiento al que se someten. Que comentarios puede hacer alrespecto.

2.- Fiber Borrad fabrica forros interiores de techo para la industria automotriz. Lagerente de manufactura está preocupada por la calidad de este producto. Sospechaque un defecto en particular, las rasgaduras de la tela, está relacionado con eltamaño de las actuales partidas de producción. Un asistente ha recopilado los datosque se encuentran en la tabla, basándose en los registros de producción:

Partida Tamaño Defecto (%) Partida Tamaño Defecto (%)1 1000 3.5 1 6500 1.52 4100 3.8 2 1000 5.53 2000 5.5 3 7000 1.04 6000 1.9 4 3000 4.55 6800 2.0 5 2200 4.26 3000 3.2 6 1800 6.07 2000 3.8 7 5400 2.08 1200 4.2 8 5800 2.09 5000 3.8 9 1000 6.2

10 3800 3.0 10 1500 7.0

y = 0.164x - 85.57R² = 0.399

40

42

44

46

48

50

52

54

56

58

60

800 810 820 830 840 850 860 870 880

Page 53: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

52

a) Dibuje un diagrama de dispersión para estos datosb) ¿Existe alguna relación entre el tamaño de la partida y el porcentaje de defectos?

¿Qué consecuencias tiene esto para los negocios de Fiber Borrad?

7000600050004000300020001000

7

6

5

4

3

2

1

Tamaño

Def

ecto

(%)

Gráfica de dispersión de Defecto (%) vs. Tamaño

GRÁFICO DE BARRAS

Cuadro N° 01: Distribución de plántulas de tornillo según su altura (en milímetros).Brunas-UNAS/Tingo María. Mayo 2011

mi Li LsMarca de Clase

(Xi)Grupos

Frecuencia(fi)

(Fi) (hi) (Hi) (hi%) (Hi%)

1 14 18.0 16 17.0 29 29 0.121 0.121 12.1% 12.1%

2 18.0 22.0 20 21.0 24 53 0.100 0.221 10.0% 22.1%

3 22.0 26.0 24 25.0 27 80 0.113 0.333 11.3% 33.3%

4 26.0 30.0 28 29.0 30 110 0.125 0.458 12.5% 45.8%

5 30.0 34.0 32 33.0 34 144 0.142 0.600 14.2% 60.0%

6 34.0 38.0 36 37.0 24 168 0.100 0.700 10.0% 70.0%

7 38.0 42.0 40 41.0 24 192 0.100 0.800 10.0% 80.0%

8 42.0 46.0 44 45.0 26 218 0.108 0.908 10.8% 90.8%

9 46.0 50.0 48 50.0 22 240 0.092 1.000 9.2% 100.0%

Total 240 1.000 100%Fuente: Facultad de Recursos de la UNAS.Del cuadro anterior realice el grafico de barras.

Gráfico N° 01. Distribución porcentual de plántulas de tornillo según su altura(en milímetros). Brunas-UNAS/Tingo María. Mayo 2011

Page 54: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

53

Fuente: Facultad de Recursos de la UNAS.

GRÁFICO DE SECTORES.

1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad deTingo María en Julio – Agosto del 2012 para analizar su opinión sobre lacalidad de una nueva conserva que se desea introducir en el mercado. Losresultados observados fueron los siguientes: (2 pts)

Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular

Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente

Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno

Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo

Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo

Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo

Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente

Solución

Cuadro N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.Opinión sobre la conserva fi Fi hi Hi hi% Hi%

Bueno 13 13 0.15 0.15 15% 15%Regular 14 27 0.17 0.32 17% 32%

Malo 33 60 0.39 0.71 39% 71%Excelente 24 84 0.29 1.00 29% 100%

Total 84 1.00 100%Fuente: Elaboración Propia

0.0%

2.0%

4.0%

6.0%

8.0%

10.0%

12.0%

14.0%

16.0%

[14 - 18>

12.1%

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

53

Fuente: Facultad de Recursos de la UNAS.

GRÁFICO DE SECTORES.

1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad deTingo María en Julio – Agosto del 2012 para analizar su opinión sobre lacalidad de una nueva conserva que se desea introducir en el mercado. Losresultados observados fueron los siguientes: (2 pts)

Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular

Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente

Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno

Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo

Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo

Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo

Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente

Solución

Cuadro N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.Opinión sobre la conserva fi Fi hi Hi hi% Hi%

Bueno 13 13 0.15 0.15 15% 15%Regular 14 27 0.17 0.32 17% 32%

Malo 33 60 0.39 0.71 39% 71%Excelente 24 84 0.29 1.00 29% 100%

Total 84 1.00 100%Fuente: Elaboración Propia

[14 - 18> [18- 22> [22 - 26> [26 - 30> [30 - 34> [34 - 38> [38 - 42>

12.1%10.0%

11.3%12.5%

14.2%

10.0% 10.0%

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

53

Fuente: Facultad de Recursos de la UNAS.

GRÁFICO DE SECTORES.

1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad deTingo María en Julio – Agosto del 2012 para analizar su opinión sobre lacalidad de una nueva conserva que se desea introducir en el mercado. Losresultados observados fueron los siguientes: (2 pts)

Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular

Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente

Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno

Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo

Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo

Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo

Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente

Solución

Cuadro N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.Opinión sobre la conserva fi Fi hi Hi hi% Hi%

Bueno 13 13 0.15 0.15 15% 15%Regular 14 27 0.17 0.32 17% 32%

Malo 33 60 0.39 0.71 39% 71%Excelente 24 84 0.29 1.00 29% 100%

Total 84 1.00 100%Fuente: Elaboración Propia

[38 - 42> [42 - 46> [46 - 50]

10.0% 10.8%9.2%

Page 55: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

54

Gráfico N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.

Fuente: Elaboración PropiaHISTOGRAMA.

1. La Biomasa de los recursos hidrobiológicos del Perú en los años de 2004 a 2009se da en la siguiente tabla:

Recurso 2004 2005 2006 2007 2008 2009Jurel 5300 5000 4330 7000 2800 4303Caballa 1511 450 1700 1900 1300 1052Sardina 4200 2500 2700 1750 4500 3680Anchoveta 1500 6500 6000 4500 5900 3060

a) Construya su grafico correspondiente para los recursos hidrobiológicos del Perúen los años 2005, 2008 y 2009 e interprete. (2 pts)

Grafico N° 03. Biomasa de los recursos hidrobilogicos: 2005 – 2009.

Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)

Malo39%

Excelente29%

0

1000

2000

3000

4000

5000

6000

7000

2005

JUREL ANCHOVETA

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

54

Gráfico N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.

Fuente: Elaboración PropiaHISTOGRAMA.

1. La Biomasa de los recursos hidrobiológicos del Perú en los años de 2004 a 2009se da en la siguiente tabla:

Recurso 2004 2005 2006 2007 2008 2009Jurel 5300 5000 4330 7000 2800 4303Caballa 1511 450 1700 1900 1300 1052Sardina 4200 2500 2700 1750 4500 3680Anchoveta 1500 6500 6000 4500 5900 3060

a) Construya su grafico correspondiente para los recursos hidrobiológicos del Perúen los años 2005, 2008 y 2009 e interprete. (2 pts)

Grafico N° 03. Biomasa de los recursos hidrobilogicos: 2005 – 2009.

Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)

Bueno15%

Regular17%

Malo39%

2008 2009

ANCHOVETA SARDINA CABALLA

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

54

Gráfico N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.

Fuente: Elaboración PropiaHISTOGRAMA.

1. La Biomasa de los recursos hidrobiológicos del Perú en los años de 2004 a 2009se da en la siguiente tabla:

Recurso 2004 2005 2006 2007 2008 2009Jurel 5300 5000 4330 7000 2800 4303Caballa 1511 450 1700 1900 1300 1052Sardina 4200 2500 2700 1750 4500 3680Anchoveta 1500 6500 6000 4500 5900 3060

a) Construya su grafico correspondiente para los recursos hidrobiológicos del Perúen los años 2005, 2008 y 2009 e interprete. (2 pts)

Grafico N° 03. Biomasa de los recursos hidrobilogicos: 2005 – 2009.

Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)

Regular17%

Page 56: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

55

GRÁFICO DE LINEAS.

PROBLEMAS RESUELTOS.

1. Los siguientes datos corresponden a un muestra aleatoria de la altura en milímetros(mm) de plantulas de tornillo (cedrelingacatenaeformis) perteneciente a la familia delas Fabaceae en una parcela de 50x10 mts2, realizada en el Brunas-UNAS de laciudad de Tingo María en mayo 2011.

32 26 26 44 32 15 48 22 22 39 15 26 21 45 16 2346 26 44 42 36 43 19 29 35 42 37 44 32 41 33 2117 29 32 29 50 14 24 14 49 35 17 32 33 26 30 1632 32 26 35 32 41 20 32 47 18 28 17 29 50 26 2821 28 44 14 39 27 17 15 28 14 37 32 34 27 40 3217 45 28 31 17 33 41 18 36 26 17 31 38 31 44 3622 26 33 39 19 49 50 33 22 33 50 31 42 27 21 2338 48 34 22 48 36 29 23 33 41 32 17 20 18 24 2543 15 17 31 27 22 39 28 31 19 23 37 32 19 39 4333 40 22 44 23 15 14 44 23 25 14 35 41 50 21 2035 41 38 30 29 40 22 39 41 18 42 37 34 46 39 3050 46 35 44 42 27 18 15 37 39 16 50 20 50 34 2941 20 36 25 42 19 36 39 21 17 43 44 36 23 30 2341 23 45 15 37 27 18 23 14 22 35 33 15 30 49 4933 45 45 22 15 46 49 45 29 24 19 25 45 27 49 21

La información fue obtenida de la Facultad de Recursos de la UNAS.

a) Construya un cuadro de distribución de frecuencias adecuado. (3pts)b) Determine las medidas de tendencia central e interprete. (6pts)c) Determine las medidas de dispersión e interprete. (4pts)d) Construya su gráfico correspondiente e interprete. (3pts)

Solución

PASOS PARA AGRUPAR DATOS Función en Excel DelEjemplo

Tamaño de muestra: ( n ) = CONTAR(Seleccionar BD3) 240Valor Máximo = MAX() 50Valor Mínimo = MIN() 14

Rango (R)= Valor Máximo - Valor Mínimo 36Aplicando la regla de STURGES:

N° de intervalos (m) = 1+3.3*log (n) 8.855m redondeado = REDONDEAR() 9Amplitud (C ) = R/[m = redondeado] 4

3 BD: base de datos.

Page 57: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

56

Cuadro N° 01: Distribución de plántulas de tornillo según su altura (en milímetros).Brunas-UNAS/Tingo María. Mayo 2011

mi Li LsMarca de Clase

(Xi)Grupos

Frecuencia(fi)

(Fi) (hi) (Hi) (hi%) (Hi%)

1 14 18.0 16 17.0 29 29 0.121 0.121 12.1% 12.1%

2 18.0 22.0 20 21.0 24 53 0.100 0.221 10.0% 22.1%

3 22.0 26.0 24 25.0 27 80 0.113 0.333 11.3% 33.3%

4 26.0 30.0 28 29.0 30 110 0.125 0.458 12.5% 45.8%

5 30.0 34.0 32 33.0 34 144 0.142 0.600 14.2% 60.0%

6 34.0 38.0 36 37.0 24 168 0.100 0.700 10.0% 70.0%

7 38.0 42.0 40 41.0 24 192 0.100 0.800 10.0% 80.0%

8 42.0 46.0 44 45.0 26 218 0.108 0.908 10.8% 90.8%

9 46.0 50.0 48 50.0 22 240 0.092 1.000 9.2% 100.0%

Total 240 1.000 100%Fuente: Facultad de Recursos de la UNAS.

~ Promedio muestral (X).= ∑ ( ∗ )Promedio muestral = 31.4333333

Mediana muestral (Me).= + − ∗Mediana muestral = 31.1764706Moda muestral (Mo).= + + ∗

Donde: = ( − )= ( − )Moda muestral = 31.1428571

Varianza muestral ( )= ∑ ( ̅) ∗Varianza muestral = 101.70265

Desviación estándar.= = ∑ ( − ̅) ∗− 1Desviación estándar muestral =10.0847732

Marca de Clase (Xi) Frecuencia (fi) Xi*fi

16 29 46420 24 48024 27 64828 30 84032 34 108836 24 86440 24 96044 26 114448 22 1056∑ ( ∗ ) = 7544

( − ) ∗6907.4463137.3071491.870353.63310.918

500.5071761.3074105.9496037.998∑ ( − ) ∗ = 24306.933

Page 58: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

57

Coeficiente de Variación muestral porcentual:. . =Coeficiente de Variación muestral = 32.083%

Gráfico N° 01. Distribución porcentual de plántulas de tornillo según su altura (enmilímetros). Brunas-UNAS/Tingo María. Mayo 2011

Fuente: Facultad de Recursos de la UNAS.

2. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de TingoMaría en Julio – Agosto del 2012 para analizar su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Los resultados observados fueronlos siguientes: (2 pts)Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular

RegularExcelente

Excelente Regular Regular

Excelente

Excelente Regular

Excelente

Excelente Regular

Excelente

Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo BuenoExcelente Malo Regular

Excelente

Excelente Malo Regular

Excelente Malo Regular

Excelente Malo

Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo MaloExcelente Malo

Excelente

Excelente

Excelente Malo

Excelente

Excelente Malo

Excelente

Excelente Malo

MaloExcelente Bueno Regular Malo

Excelente Bueno Regular Malo

Excelente Malo

Excelente

Solución

Cuadro N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.Opinión sobre la conserva fi Fi hi Hi hi% Hi%

Bueno 13 13 0.15 0.15 15% 15%Regular 14 27 0.17 0.32 17% 32%

Malo 33 60 0.39 0.71 39% 71%Excelente 24 84 0.29 1.00 29% 100%

Total 84 1.00 100%

0.0%

2.0%

4.0%

6.0%

8.0%

10.0%

12.0%

14.0%

16.0%

[14 - 18> [18- 22>

12.1%10.0%

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

57

Coeficiente de Variación muestral porcentual:. . =Coeficiente de Variación muestral = 32.083%

Gráfico N° 01. Distribución porcentual de plántulas de tornillo según su altura (enmilímetros). Brunas-UNAS/Tingo María. Mayo 2011

Fuente: Facultad de Recursos de la UNAS.

2. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de TingoMaría en Julio – Agosto del 2012 para analizar su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Los resultados observados fueronlos siguientes: (2 pts)Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular

RegularExcelente

Excelente Regular Regular

Excelente

Excelente Regular

Excelente

Excelente Regular

Excelente

Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo BuenoExcelente Malo Regular

Excelente

Excelente Malo Regular

Excelente Malo Regular

Excelente Malo

Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo MaloExcelente Malo

Excelente

Excelente

Excelente Malo

Excelente

Excelente Malo

Excelente

Excelente Malo

MaloExcelente Bueno Regular Malo

Excelente Bueno Regular Malo

Excelente Malo

Excelente

Solución

Cuadro N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.Opinión sobre la conserva fi Fi hi Hi hi% Hi%

Bueno 13 13 0.15 0.15 15% 15%Regular 14 27 0.17 0.32 17% 32%

Malo 33 60 0.39 0.71 39% 71%Excelente 24 84 0.29 1.00 29% 100%

Total 84 1.00 100%

[18- 22> [22 - 26> [26 - 30> [30 - 34> [34 - 38> [38 - 42> [42 - 46>

10.0%11.3%

12.5%14.2%

10.0% 10.0% 10.8%

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

57

Coeficiente de Variación muestral porcentual:. . =Coeficiente de Variación muestral = 32.083%

Gráfico N° 01. Distribución porcentual de plántulas de tornillo según su altura (enmilímetros). Brunas-UNAS/Tingo María. Mayo 2011

Fuente: Facultad de Recursos de la UNAS.

2. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de TingoMaría en Julio – Agosto del 2012 para analizar su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Los resultados observados fueronlos siguientes: (2 pts)Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular

RegularExcelente

Excelente Regular Regular

Excelente

Excelente Regular

Excelente

Excelente Regular

Excelente

Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo BuenoExcelente Malo Regular

Excelente

Excelente Malo Regular

Excelente Malo Regular

Excelente Malo

Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo MaloExcelente Malo

Excelente

Excelente

Excelente Malo

Excelente

Excelente Malo

Excelente

Excelente Malo

MaloExcelente Bueno Regular Malo

Excelente Bueno Regular Malo

Excelente Malo

Excelente

Solución

Cuadro N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.Opinión sobre la conserva fi Fi hi Hi hi% Hi%

Bueno 13 13 0.15 0.15 15% 15%Regular 14 27 0.17 0.32 17% 32%

Malo 33 60 0.39 0.71 39% 71%Excelente 24 84 0.29 1.00 29% 100%

Total 84 1.00 100%

[42 - 46> [46 - 50]

10.8%9.2%

Page 59: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

58

Fuente: Elaboración Propia

Gráfico N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.

Fuente: Elaboración Propia

3. La Biomasa de los recursos hidrobiológicos del Perú en los años de 2004 a 2009 se daen la siguiente tabla:

Recurso 2004 2005 2006 2007 2008 2009Jurel 5300 5000 4330 7000 2800 4303Caballa 1511 450 1700 1900 1300 1052Sardina 4200 2500 2700 1750 4500 3680Anchoveta 1500 6500 6000 4500 5900 3060

b) Construya su grafico correspondiente para los recursos hidrobiológicos del Perúen los años 2005, 2008 y 2009 e interprete. (2 pts)

Grafico N° 03. Biomasa de los recursos hidrobilogicos: 2005 – 2009.

Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)

Malo39%

Excelente29%

0

1000

2000

3000

4000

5000

6000

7000

2005

JUREL ANCHOVETA

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

58

Fuente: Elaboración Propia

Gráfico N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.

Fuente: Elaboración Propia

3. La Biomasa de los recursos hidrobiológicos del Perú en los años de 2004 a 2009 se daen la siguiente tabla:

Recurso 2004 2005 2006 2007 2008 2009Jurel 5300 5000 4330 7000 2800 4303Caballa 1511 450 1700 1900 1300 1052Sardina 4200 2500 2700 1750 4500 3680Anchoveta 1500 6500 6000 4500 5900 3060

b) Construya su grafico correspondiente para los recursos hidrobiológicos del Perúen los años 2005, 2008 y 2009 e interprete. (2 pts)

Grafico N° 03. Biomasa de los recursos hidrobilogicos: 2005 – 2009.

Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)

Bueno15%

Regular17%

Malo39%

2008 2009

ANCHOVETA SARDINA CABALLA

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

58

Fuente: Elaboración Propia

Gráfico N° 02: Distribución de personas según su opinión sobre la calidad de unanueva conserva que se desea introducir en el mercado. Tingo María. Julio – Agosto del2012.

Fuente: Elaboración Propia

3. La Biomasa de los recursos hidrobiológicos del Perú en los años de 2004 a 2009 se daen la siguiente tabla:

Recurso 2004 2005 2006 2007 2008 2009Jurel 5300 5000 4330 7000 2800 4303Caballa 1511 450 1700 1900 1300 1052Sardina 4200 2500 2700 1750 4500 3680Anchoveta 1500 6500 6000 4500 5900 3060

b) Construya su grafico correspondiente para los recursos hidrobiológicos del Perúen los años 2005, 2008 y 2009 e interprete. (2 pts)

Grafico N° 03. Biomasa de los recursos hidrobilogicos: 2005 – 2009.

Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)

Regular17%

Page 60: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

59

Problemas Propuestos

1. Identifique las siguientes variables según su clasificación, ya sea cuantitativa (discreta ocontinua) y cualitativa (nominal u ordinal).

a) Ficha de productos que elabora una fábrica: Nombre del producto: ............................................................................................... Tipo de envase: .................................... .................................................................... Peso por unidad: ................................... .................................................................... Tiempo de procesamiento: ................... .................................................................... Costo por unidad: ................................. .................................................................... Precio de venta por unidad: ................... ..................................................................

b) Ficha del personal que entra a trabajar en una empresa: Nombre y Apellido: .................................... ............................................................. Edad (en años): .......................................... ............................................................... Estado Civil: ............................................... .............................................................. Estudios: ................................................... ................................................................ Sección en la que ingresa: .......................... .............................................................. Sueldo básico: ............................................ .............................................................. Estatura: ................................................... ................................................................. Peso: .......................................................... ...............................................................

2. El tiempo diario (en horas) de permanencia en la Universidad Nacional Agrariade la Selva de la ciudad de Tingo María de 200 estudiantes matriculados en elsemestre académico en estudio.Identifique:a) Población, muestra, parámetro, estimador, unidad de análisis, variable, tipo

de variable.

3. En cada uno de los siguientes enunciados identifique la unidad de análisis, lavariable y su tipo.

a) Desde hace dos años las compañías gastan en protección de la información.Estos gastos incluyen los costos de personal, hardware, software, serviciosexternos y seguridad física. Se eligieron dos empresas transnacionales y seregistraron sus gatos mensuales, en miles de dólares, correspondientes a laprotección de la información de los últimos seis meses.

b) La oficina de gestión de calidad de la UNAS está realizando un estudio paraconocer, según el criterio de los profesores, que tan importante es laaplicación de un modelo de planeamiento de largo plazo en la mejora de lacalidad en las instituciones de educación superior. De los 200 profesoresconsultados, el 30% lo consideró poco importante, el 50% importante y el20% muy importante.

Page 61: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

60

4. Los siguientes datos corresponden a una muestra aleatoria de 20 trabajadores delbanco de crédito del Perú según sus retenciones al sistema privado de pensionesen febrero del 2011.

100 200 150 160 179 130 135 150 155 158180 190 170 175 120 115 140 139 145 144

Los datos fueron brindados por el departamento de personal de dichainstitución.Se pide:a) Identificar la unidad de análisis y la variable en estudio.b) Construya un cuadro de distribución de frecuencias en intervalos de clase o

datos agrupados. Utilice la regla de Sturges.c) Interprete f3, h3%, F3 y H3%.d) Determinar qué porcentaje de trabajadores tienen una retención de 140 soles

o más, pero menos de 180 soles.e) Determinar cuántos trabajadores tienen una retención de 160 a 200 soles.f) Construir un histograma de frecuencias porcentuales y comente.

5. La siguiente tabla muestra la cantidad de clientes que entran en el horario de 14a 15 horas en 60 importantes locales de ventas de automóviles de cierta ciudad:

0 2 5 0 1 4 1 0 2 1 5 0 1 3 0 0 2 1 3 11 4 0 2 4 1 2 4 0 4 3 5 0 1 3 6 4 2 0 20 2 3 0 4 2 5 1 1 2 2 1 6 5 0 3 3 0 0 4

a) Determinar la variable a analizar e indicar cuál es su tipo.b) Construir una distribución de frecuencias absolutas y representarla mediante

un diagrama de líneas.c) Construir una distribución de frecuencias relativas y relativas porcentuales e

interpretar el significado de la cuarta frecuencia.d) Construir una distribución de frecuencias acumuladas crecientes y

decrecientes, representarlas gráficamente e interpretar el significado de lasegunda y quinta frecuencia.

e) Si en el 80% o más de los locales entran como máximo 4 personas, sedecidirá no atender al público en ese horario (de 14 a 15 horas) y comenzara atender a partir de las 15 horas. En base a los datos, ¿qué decisión setomará? Justificar.

6. A fin de decidir cuántos mostradores de servicio se necesitarán en tiendas queserán construidas en el futuro, una cadena de supermercados quiso obtenerinformación acerca del tiempo (en minutos) requerido para atender a los clientes.Se registró la duración de 60 casos:

3,6 1,9 2,1 0,3 0,8 0,2 1,0 1,4 1,8 1,61,1 1,8 0,3 1,1 0,5 1,2 0,6 1,1 0,8 1,71,4 0,2 1,3 3,1 0,4 2,3 1,8 4,5 0,9 0,70,6 2,8 2,5 1,1 0,4 1,2 0,4 1,3 0,8 1,31,1 1,2 0,8 1,0 0,9 0,7 3,1 1,7 1,1 2,21,6 1,9 5,2 0,5 1,8 0,3 1,1 0,6 0,7 0,6

a) ¿Cuál es la variable a analizar? ¿Es cuantitativa o cualitativa?

Page 62: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

61

b) Elaborar un diagrama de tallos y hojas con esos datos.c) Organizarlos de la manera que le resulte más conveniente (de forma simple

o en intervalos) y justificar la organización elegida.d) Construir una distribución de frecuencias absolutas y relativas.e) Representar gráficamente las frecuencias anteriores mediante un histograma

y un polígono de frecuencias.f) Construir las frecuencias acumuladas crecientes y decrecientes y graficarlas

mediante una ojiva.g) Interpretar en cada caso el significado de la cuarta frecuencia.h) ¿Qué proporción de los tiempos de servicio es menor a un minuto?

7. Una empresa consultora ha entrevistado un grupo de 50 personas a las cuales leshan preguntado la edad. Se obtuvieron los siguientes datos:

23 34 21 41 42 35 32 36 27 2019 31 39 38 41 26 24 27 30 3323 32 40 34 25 28 29 30 22 2426 36 38 21 39 22 33 35 32 2827 26 24 32 37 39 32 24 35 26

Se ha decidido organizar los datos en intervalos de tal manera que las marcas declase de los mismos sean: 20, 24, 28, etc.a) Construir una distribución de frecuencias absolutas, porcentuales y

acumuladas.b) Representar gráficamente las frecuencias porcentuales y las acumuladas.c) Obtener conclusiones.

8. Un ingeniero agrónomo visita 25 cooperativas agrarias de naranjas en la ciudadde Tingo María y en cada uno anotó el número de plantas atacadas por ciertohongo de la cual resultaron los siguientes datos:

15 20 25 15 16 18 18 18 16 19 17 17 1819 18 15 18 17 20 18 19 17 16 17 19

a) Identifique la variable en estudio y el tipo de variable.b) Construya un cuadro de distribución de frecuencia adecuada a este conjunto

de datos.c) ¿Cuántas cooperativas agrarias tiene a lo más 20 plantas atacadas por

hongos?d) ¿Cuántas cooperativas agrarias tienen por lo menos 17 plantas atacadas por

hongos?e) ¿Qué proporción de cooperativas bajo estudio tienen 18 plantas atacadas por

hongos?f) ¿Qué proporción de cooperativas tienen 18 o menos plantas atacadas por

hongos?g) ¿Qué porcentaje de cooperativas tienen 18 o menos plantas atacadas por

hongos?

9. El ministerio de educación realizó un estudio para determinar los indicadoressobre las condiciones en las que operan los institutos dedicados a la enseñanzade carreras profesionales en computación. El estudio se realizo en todo el paíscon la selección al azar de 40 de estos institutos. Los directores o promotores de

Page 63: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

62

los institutos seleccionados fueron entrevistados, encontrándose la siguienteinformación:• El número promedio de computadoras para la enseñanza es 40.• En promedio, el pago mensual por enseñanza es de 120 nuevos soles.• El 60% de los institutos utiliza el software “pirata”.

Utilice esta información para identificar: población, muestra, unidad deanálisis, variables y tipos de variables.

10. El consumo mensual de agua de 150 hogares, se tabularon en una distribuciónde frecuencias simétrica de 6 intervalos, siendo las frecuencias: f2 = 25, F3 = 75,F5 = 130. Si el límite inferior del sexto intervalo igual a 60, y si el 75% de losconsumos son mayores de 43.5m3, completar la distribución de frecuencias.

11. En una investigación agrícola en Tulumayo- Tingo María, en Julio de 2011, sedeterminó la producción total (en kilogramos) de un cierto cultivo, el cual fuesembrado en parcelas experimentales. Los datos se tabularon en una distribuciónde frecuencias simétrica de cinco intervalos de igual amplitud, siendo lasfrecuencias: f4 – f5 = 10, f4 – f3 – f1 = 0, el límite superior en el cuarto intervalopor f4 es igual a 975, el límite inferior en el primer intervalo es igual a 12.5 y n= 110.a) Reconstruir el cuadro de frecuencias.b) Calcular e interpretar la mediana (Me), moda (Mo).

12. Las notas de 50 alumnos de la UNAS – Tingo María, se clasifican en una tablade distribución de frecuencias con cuatro intervalos de clase de igual amplitud.Sabiendo además que: X2 = 50, f1 =4, F2 = 20, f3 = 25, ̅ = 62.4.a) Calcular e interpretar la mediana (Me).b) Determine la proporción de estudiantes cuyos puntajes se encuentran por lo

menos de 35 puntos pero a lo más 65 puntos.

13. Sabiendo que la siguiente tabla de frecuencias, es simétrica, completar con losdatos, dados. Si además se sabe que la mediana es igual a 27.5. Reconstruir latabla de frecuencias y calcular la media aritmética.

[Li Ls> Xi fi Fi hi Hi

0.20.65

50 0.95

Total 60

14. En base a la siguiente información que corresponde a la visita de cooperativasagrarias en la ciudad de Tingo María en mayo de 2010 y en cada una de ellas seanoto el número de árboles atacadas por cierto hongo.X2 = 550; X5 = 850; h6 = 2/50 = H1; m = 6; h2 = 0.14; H4 = 0.76; h5 =0.20; H3 – h2 = 0.26 y C = constante.a) Reconstruir la tabla de frecuencias e intérprete los puntos más importantes.

Page 64: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

63

b) Calcule e interprete la desviación estándar, mediana y moda.15. Al agrupar 400 datos en intervalos, la mediana resulta 58.833 y el límite inferior

del intervalo que la contiene es 50.5. Si el intervalo tiene por encima al 47.5%de los datos y por debajo al 37.5% de los datos.a) ¿Qué amplitud tienen los intervalos de la distribución sabiendo que esta es

constante?b) ¿Cuál es límite superior del intervalo que contiene a la mediana?

16. Los intervalos y las frecuencias absolutas de los salarios quincenales de 45empleados desarrollan en el cuadro siguiente:

Intervalosde salarios ($)

[Li - Ls>

FrecuenciasAbsolutas

fiRelativas

HiPorcentual

Hi%[26 - 34> 1 0.022 2.2%[34 - 42> 2 0.044 4.4%[42 - 50> 4 0.089 8.9%[50 - 58> 10 0.222 22.2%[58 - 66> 16 0.356 35.6%[66 - 74> 8 0.178 17.8%[74 - 82] 4 0.089 8.9%

Total: 45 1.000 100.0%a) Calcule el porcentaje de empleados que tienen salarios entre $52 y $75.b) Obtenga el salario que divide en dos partes iguales.

17. La altura de diámetro de pecho de capirona se organizaron en una distribuciónde frecuencia, cuyos resultados incompletos se dan en la siguiente tabla:

[Li Ls>Marca de clase

XiFrecuencia relativa simple

HiFrecuencia relativa

acumulada Hi0.15

6 0.450.70

13.50.10

Total

18. Los siguientes datos corresponden a la inversión real anual en miles de dólaresde un grupo de pequeñas empresas. Completar la siguiente tabla de distribuciónde frecuencia. (4 Ptos)

[ Li - Ls > Xi fi Fi hi Hi[20 - 24 > 0.10[24 - 28 > 0.25[ - 32 > 11 0.55[32 - > 0.85[ - 40] 1

Totala) Identificar la unidad de análisis y la variable en estudio.b) Interpretar el f4 y el h4%.

Page 65: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

64

19. En una tabla de distribución simétrica con siete intervalos de clase de iguallongitud, se conocen los datos siguientes: C =10, f1=8 y X3*f3=1260; f2 + f5

= 62; h3=0.21, H6 = 0.96.Reconstruir la tabla de frecuencias y determinar la media geométrica.

20. En base a la siguiente información que corresponden a la inversión real anual enmiles de dólares de un grupo de pequeñas empresas. Construir la tabla dedistribución de frecuencia.X2=550; X5=850; h6 =2/50 = H1; m=6; h2=0.14; H4 = 0.76; h5=0.20; H3-h2 =0.26y c = constantea) Interpretar el f4 y el h4%.

21. De las edades de cuatro personas, se sabe que la media es igual a 24 años, lamediana es 23, y la moda es 22. Encuentre las edades de las cuatro personas.

22. La inversión real en miles de dólares anual de un grupo de pequeñas empresasen el banco de Crédito de la ciudad de Tingo María fueron:

807 811 620 650 817 732 747900 753 1050 918 857 867 675500 872 869 841 847 833 829766 787 923 792 803 933 9471056 1076 958 970 776 828 831

La información fue obtenida por el Instituto nacional de Estadística eInformática en mayo de 2010.Se pide:a) Construir una tabla de distribución de frecuencias, con intervalos (datos

agrupados) y hacer gráfico correspondiente e interpretar.b) Calcular e interpretar: La media, desviación estándar, mediana y la moda.

23. A continuación se muestra una tabla con los datos acerca de la distribución deexportaciones e importaciones de diferentes países (en millones de euros).

País Exportaciones ImportacionesEEUU 512 690Alemania 425 380Japón 390 275Francia 235 230Reino Unido 205 220Italia 190 170Canadá 160 150Holanda 155 140Hong Kong 150 165Bélgica-Luxem 140 130China 120 115Singapur 95 100Corea Sur 95 105Taiwán 90 85España 75 90

Page 66: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

65

a) ¿Cuáles son las variables que intervienen en este análisis? ¿Cuál es el tipode las mismas?

b) Realizar un diagrama de dispersión considerando las exportaciones comovariable dependiente. ¿Puede observarse algún tipo de relación entre ambasvariables? En tal caso, ¿qué tipo de relación se observa?

Page 67: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

66

TRABAJO PRÁCTICO: ESTADÍSTICA DESCRIPTIVA(trabajo práctico a entregar de manera individual para ser calificado)

Ejercicio: (Se recomienda el uso del Software Estadístico Minitab 16 o SPSS 20.0)

“Estudio sobre nutrición en el comedor de una Empresa”Fuente: “Estadística básica en Administración. Conceptos y Aplicaciones”. SextaEdición. Berenson, Mark L., Levine, David M. Prentice Hall Hispanoamericana, S. A.Páginas 166 - 168.

La vicepresidenta de los servicios al personal obrero de una empresa en lasafueras de la ciudad, sostuvo una reunión con la recién nombrada directora de losservicios de comida, y con la profesora de nutrición, sobre una serie de quejas de losempleados relacionadas con el menú ofrecido en la cafetería de la empresa. Puesto quelos obreros transcurrían la mayor parte del día dentro de la empresa, se veían obligadosa comprar el menú que allí se servía y que no siempre ofrecía una comida barata, rápiday saludable.

Cuando la vicepresidenta pidió una respuesta sobre estos comentarios, ladirectora de los servicios de comida aseveró que sólo llevaba 3 semanas en la empresa yque había seguido preferentemente el menú establecido por su predecesor, al mismotiempo que experimentaba con una selección de comida gastronómica cada día.Estableció, además, que a partir del llamado de atención respecto a estas inquietudes,seguiría otra pauta. Considerando el hecho de que la empresa está situada en un árearural y que, en particular, se requiere el almacenamiento de productos alimenticiosenlatados para los meses de invierno en que las provisiones de la ciudad más cercanapueden retrasarse, estudiaría el contenido nutricional de la sopa enlatada porque podríadisponerse fácilmente de este artículo en todos los almuerzos, e incluso podríaproporcionar los nutrientes de la comida saludable, barata y rápida que se solicita.

La profesora de nutrición estuvo de acuerdo en que tal estudio sería de utilidad yproporcionaría la información necesaria para tomar una decisión respecto a lainstrumentación.

Los datos obtenidos fueron los siguientes:

MMAARRCCAA

PPRROODDUUCCTTOO TTIIPPOO CCOOSSTTOO

CCAALLOORRÍÍAASS GGRRAASSAA

CCAALLOORRÍÍAASSDDEE GGRRAASSAA

SSOODDIIOO

1 CN CC 0,35 60 2 30 8802 CN CR 0,66 75 2 24 7303 CN CC 0,18 60 2 30 8704 CN DI 0,33 170 8 42 9705 CN CR 0,77 80 2 23 4606 CN DC 0,21 80 2 23 7007 CN DC 0,09 190 8 38 9708 CN DC 0,11 200 9 41 9609 CN DC 0,26 100 2 18 70010 CN CC 0,17 60 2 30 84011 CN CC 0,19 60 2 30 84012 CN DC 0,09 190 9 43 78013 CN CC 0,19 60 2 30 84014 CN CR 0,76 60 1 15 790

Page 68: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

67

15 CN DC 0,54 110 2 16 80016 CN CR 0,74 105 3 26 86017 CN CR 0,96 110 4 33 80018 CN DC 0,12 70 2 26 90019 CN DI 0,48 105 3 26 119020 CN DI 0,36 65 1 14 89021 CN CR 0,74 120 4 30 81022 CN CR 0,70 80 2 23 47023 CN CR 0,97 80 1 11 18024 CN CR 0,80 125 4 29 6525 CN CR 0,78 95 2 19 58026 V CR 0,53 125 3 22 67027 V CR 0,83 110 2 16 68028 V CR 0,73 120 3 23 80029 V CR 0,51 105 1 9 60030 V CR 0,46 75 2 24 94031 V CR 0,44 75 1 12 68032 V CR 0,73 140 3 19 54033 V CC 0,34 60 2 30 88034 V CR 0,53 110 1 8 64035 V CC 0,23 90 2 20 83036 V CR 0,92 55 1 6 28037 V CR 0,55 90 1 10 48038 V CR 0,94 90 1 10 16039 T CC 0,15 90 2 20 67040 T CC 0,20 90 2 20 41041 T CC 0,13 100 1 9 71042 T CC 0,14 100 1 9 63043 T CC 0,16 80 0 0 70044 T CC 0,15 100 1 9 63045 T CC 0,18 100 1 9 71046 T CR 0,87 75 1 12 30047 T CC 0,28 90 0 0 740

Donde:Producto: CN = Pollo. - V = Vegetales. - T = Tomate.Tipo: CC = enlatada / condensada. - CR = enlatada / lista para servirse. –

DC = deshidratada / cocinada. - DI = deshidratada / instantánea.Costo en centavos.Calorías por ración de 8 onzas.Grasa en gramos por ración de 8 onzas.Calorías de grasa como porcentaje de grasa por ración de 8 onzas.Nivel de sodio en miligramos por ración de 8 onzas.

Se pide:

1.- En base a los datos de la tabla, indicar cuáles fueron las variables relevadas. Paracada una de ellas indicar si es cualitativa o cuantitativa y especificar las categorías ovalores.

Page 69: Manual - Estadisitca Descriptiva

Ing. Wilmer J. Bermúdez Pino Estadística Aplicada

68

2.- Realizar una tabla de distribución de frecuencias (absolutas, relativas y porcentuales)para las variables Producto y Tipo. Representar gráficamente las frecuenciasporcentuales y obtener conclusiones.

3.- Realizar una tabla de distribución de frecuencias (absolutas, relativas y acumuladas)para las variables Costo y Sodio - en cada caso, decidir si es conveniente organizar losdatos de forma simple o en intervalos.

4.- Construir todos los gráficos posibles para las distribuciones del ítem anterior.

5.- Realizar un análisis exploratorio para Calorías. ¿Qué puede decirse de ladistribución? ¿Se observan outliers?