APUNTES DE ESTADISTICA DESCRIPTIVA

64

Click here to load reader

Transcript of APUNTES DE ESTADISTICA DESCRIPTIVA

Page 1: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

1 Ing. Wilson A. Velastegui. Ojeda. Msc

WILSON ANTONIO VELASTEGUI OJEDA

ESTADÍSTICA DESCRIPTIVA

“Las cosas complejas y estadísticamente

improbables, son por naturaleza más

difíciles de explicar que las cosas simples y

estadísticamente probables”. Richard

Dawkins

Page 2: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

2 Ing. Wilson A. Velastegui. Ojeda. Msc

WILSON ANTONIO VELASTEGUI OJEDA

LUGAR DE NACIMIENTO Riobamba –Ecuador

ESTUDIOS REALIZADOS: SECUNDARIA:

Colegio Nacional de Comercio y Administración “Juan de Velasco” (Riobamba)

Título: Bachiller en Ciencias de Administración y Contabilidad

SUPERIOR:

Escuela Superior Politécnica de Chimborazo (ESPOCH), Riobamba – Ecuador

Título: Ingeniero en Empresas

Universidad Regional Autónoma de los Andes (UNIANDES), Ambato – Ecuador

Título: Diplomado Superior en Investigación de la Educación a Distancia y Abierta

Universidad Regional Autónoma de los Andes (UNIANDES), Ambato – Ecuador

Título: Especialista en Diseño Curricular y Material Educativo para la Educación a Distancia

Universidad Regional Autónoma de los Andes (UNIANDES), Ambato – Ecuador

Título: Magister en Educación a Distancia y Abierta

PRÁCTICA DOCENTE:

Catedrático universitario de la Escuela Superior Politécnica de Chimborazo Facultad de Administración de Empresas, Escuela: Ingeniería en Contabilidad y Auditoría por cinco años en las asignaturas de Contabilidad General, Contabilidad Comercial, Contabilidad de Sociedades, Paquetes Contables, Proyecto Integrador, Control de

Page 3: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

3 Ing. Wilson A. Velastegui. Ojeda. Msc

Costos y Presupuestos por ordenador, Auditoría Interna, Informática Aplicada y Matemáticas para los Negocios

Catedrático universitario de la Escuela Superior Politécnica de Chimborazo Facultad de Administración de Empresas en la Unidad de Educación a Distancia de la FADE, por cuatro años en las asignaturas de Contabilidad General, Paquetes Contables, Presupuestos, Contabilidad Superior, Contabilidad Financiera, Contabilidad de Costos, Contabilidad del Sector Financiero y Auditoria Financiera.

Docente del Instituto Tecnológico República Federal de Alemania (Riobamba – Ecuador), por cinco años en las asignaturas de Contabilidad General, Contabilidad Comercial, Contabilidad de Costos, Presupuestos, Auditoria Financiera, Auditoria Administrativa, Mónica 8.0, Tmax 2000, Planificación Estratégica, Administración General, Administración de Recursos Humanos y Matemática Financiera

DATOS DE CONTACTO: Celular: 0999775143

Teléfono: 2962018 Mail: [email protected]

Página web: www.wavo.galeon.com Publicaciones: www.slisdeshare.net/wilsonvelas

Page 4: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

4 Ing. Wilson A. Velastegui. Ojeda. Msc

CONTENIDOS DEL MÓDULO

PRIMERA UNIDAD: CONCEPTOS BÁSICOS

Objetivos Contenidos 1. Introducción Histórica 2. Concepto de Estadística Descriptiva 3. Clasificación de la Estadística

3.1. Estadística Descriptiva (Deductiva) 3.2. Estadística Inferencial (Inductiva) 3.3. Esquema de Estadística Inductiva

4. Organización de Datos 5. Variables Estadísticas

5.1. Variables Discretas 5.2. Variables Continuas

Actividad de Aprendizaje No.1 Auto evaluación No. 1

SEGUNDA UNIDAD: DESCRIPCION DE UN CONJUNTOS DE DATOS Objetivos Contenidos 1. Descripción de Datos 2. Procedimiento para agrupar los datos. 3. Distribución de Frecuencias, intervalos y marcas de clase. 4. Representación gráficas de los datos

4.1 Histograma 4.2 Polígono de frecuencia 4.3 Diagrama de distribución u ojiva 4.4 Diagrama de pastel o ciclograma 4.5 Diagrama de barras

Actividad de Aprendizaje No. 2 Auto evaluación N.2

TERCERA UNIDAD: MEDIDAS DE TENDENCIA CENTRAL

Objetivos Contenidos 1. Introducción Histórica 2. Medida Aritmética o promedio para datos no agrupados 3. Mediana para datos no agrupados 4. Moda para datos agrupados 5. Media aritmética para datos agrupados 6. Mediana para datos agrupados 7. Moda para datos agrupados

Actividad de Aprendizaje No. 3 Auto evaluación No.3

Page 5: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

5 Ing. Wilson A. Velastegui. Ojeda. Msc

CUARTA UNIDAD: MEDIDAS DE DISPERSION

Objetivos Contenidos 1. Cuartiles, Deciles, y Percentiles para datos no agrupados. 2. Cuartiles, Deciles, y Percentiles para datos agrupados. 3. Medidas de dispersión para datos no agrupados y agrupados. 4. Desviación Media para datos no agrupados y agrupados. 5. Varianza y desviación típica para datos agrupados y no agrupados 6. Forma de Distribución de frecuencias 7. Curtosis

Actividad de Aprendizaje No. 4 Auto evaluación No.4

Page 6: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

6 Ing. Wilson A. Velastegui. Ojeda. Msc

PRE – TEST O PRUEBA DE DIAGNOSIS

1. Escriba los diez primeros múltiplos del número 7 2. ¿Halle el divisor de los números: 12, 15, 30, 39? 3. Si hay 15 mujeres en un grupo de 65 estudiantes. ¿Qué porcentaje del grupo

representan las mujeres? y ¿Qué proporción de grupo representan los varones?

4. Suponga que: X1 = 4, X2 = 8, X3 = 8, X4 = – 6, Halle el resultado de:

4

1i

Xi X1 + X2 + X3 =

5. Redondee los siguientes números decimales:

a) 1,0519 a tres dígitos b) 125,84 a tres cifras enteras c) 425,45 a una cifra decimal d) 1 25,0126 a tres dígitos

6. Si n1 = 7; n2 = 9; y n3 = -6. ¿Cuánto vale n = ?

7. ?)2/5/()3(/22/9()53(21

8. Dé los valores absolutos de 1.96 y –1.96

9. Si X1 = 25 y X = 29, y si K = X1 – X, ¿Cuál es el valor absoluto de (K)?

10. Si ?¿,20;10,45000, 22222 xcuántovaleynysinyyx

11. Si 22 )(

))((

1 xxn

yxxynB

, donde

.22420;82;460;3995,10 2 xyxxyn Halle B1

12. Dado los siete valores de X y de Y aquí indicados:

X = 8, 12, 10, 11, 8, 7, 6 Halle X =

Y = 9, 10, 8, 9, 8, 7, 7 Halle Y =

13. Dado el siguiente conjunto de datos: 2, 1, 8, 5, -1, 3, 9. Ordene en forma ascendente y en forma descendente.

Page 7: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

7 Ing. Wilson A. Velastegui. Ojeda. Msc

14. Si tengo los siguientes números: 48.5 y 20.2. ¿Cuál es el mayor valor y cuál es el menor valor? y cuál es su diferencia?

15. Usted como estudiante considere ser una variable Y quién financia sus estudios sea una variable X ¿Cuál es la variable dependiente y cuál la variable independiente?

16. Si )()( 22 yx

xyr

, despeje ( 2)( x

Page 8: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

8 Ing. Wilson A. Velastegui. Ojeda. Msc

PRIMERA UNIDAD: CONCEPTOS

BÁSICOS

“No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)

OBJETIVOS:

Al término de esta unidad el estudiante estará en capacidad de:

Dar el concepto de estadística.

Diferenciar entre una población y muestra

Distinguir entre variable continua y una variable discreta

DESARROLLO DE CONTENIDOS

1.- INTRODUCCION HISTORICA.

La Estadística se estructuró como disciplina científica, en el siglo pasado pero ya se conocía

y se utilizaba en la antigüedad. La misma puede catalogarse en orden cronológico en los

siguientes antecedentes:

a.- Las antiguas civilizaciones, como por ejemplo la de Egipto realizaban relevantamientos

estadísticos (captación de datos), debido a las inundaciones del río Nilo, efectuaban censos

anuales, los mismos que permitan conocer como distribuir los bienes y reparto de

propiedades para que fueran restituidos.

También., se sabe que los griegos levantaban censos demográficos (nacimientos, muertes,

casamientos, etc.) y de propiedad.

b.- En la época del Imperio Romano se aplicaba censos poblacionales y de bienes a los

pueblos sometidos al imperio con objeto de aplicar el régimen de impuestos.

En la época moderna, la técnica censal adquirió un gran desarrollo llegando constituirse un

eficaz auxiliar de las tareas gubernamentales.

2.- CONCEPTO DE ESTADISTICAS DESCRIPTIVA

La Estadística es la ciencia de recolectar, organizar, representar, analizar e interpretar datos

para ayudar en una toma de decisiones más efectiva.

Dicho de otro modo la Estadística se refiere a la colección, representación y utilización de

datos numéricos para realizar inferencias y alcanzar decisiones ante la incertidumbre que

plantean muchas disciplinas que van desde las ciencias, la ingeniería, las leyes, la medicina, la

economía, la administración y otras ciencias, sociales y físicas.

Page 9: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

9 Ing. Wilson A. Velastegui. Ojeda. Msc

El aspecto más importante de la estadística es la obtención de conclusiones basadas en los

datos experimentales.

3.- CLASIFICACIÓN DE LA ESTADÍSTICA

La Estadística se subdivide en: Descriptiva e Inductiva.

3.1.- Estadística Descriptiva:- Se refiere a la recopilación y descripción de un grupo de datos.

Es aquella que estudia toda la población.

3.2.- Estadística Inductiva:- Es el proceso para lograr generalizaciones acerca del todo

(llamado la población) examinando una parte de ella (llamada la muestra). Para que esto

sea valido, la muestra debe ser representativa de la población.

3.3.- Esquema de Estadística Inductiva

Veamos que significa población y muestra

Población:- Es la colección de toda la posible información que caracteriza a un fenómeno.

La población- o Universo puede ser tan grande o pequeña.

Muestra:- Es mi subconjunto representativo seleccionado de una población.

4.- ORGANIZACION DE DATOS

Los datos sin organizar carecen de sentido, es decir los datos brutos no permiten interpretar

nada acerca de la información obtenida. Por esta razón es necesario organizar los datos, lo

cual se realiza dependiendo del tipo de variable con la que se esta trabajando. Veamos que

significa variable.

Variable:- Es la que asume distintos valores en un evento o proceso, y pueden ser números

o cantidades/ Ejemplo: salarios, precios, edades, peso, estatura, etc.

5.- VARIABLES ESTADISTICAS

Las variables estadísticas pueden ser de dos clases: discretas y continuas.

INDUCCION

Encuesta

Muestra Población

Page 10: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

10 Ing. Wilson A. Velastegui. Ojeda. Msc

5.1.- VARIABLES DISCRETAS.- Son aquellas que asumen valores específicos o

determinados, en general son números enteros y sirve para contar o enumerar. Eje: El

número de trabajadores de una empresa, el número de habitantes de un país, el numero de

alumnos del ISTRA, etc. La variable discreta no tiene un límite determinado.

5.2.- VARIABLES CONTINUAS

Son aquellas que asumen valores determinados en un rango, pueden ser enteros o

fraccionarios y sirven para medir.

Ejemplo: La temperatura, el peso, la estatura, la edad, etc.

Page 11: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

11 Ing. Wilson A. Velastegui. Ojeda. Msc

1.- Narre de dos a cinco Historias de la humanidad, o de su país, provincia, cantón,

parroquia, o comunidad, donde se haya aplicado el concepto de Estadística de forma

empírica. Es decir sin que haya sido considerada como ciencia.

2.- Describa en forma general desde cuando usted conoció la ciudad de Riobamba.

3.- De los siguientes ítems compare y diga cual es población y cual es muestra

a) Número de periódicos vendidos a la semana en el mundo

b) Número de periódicos vendidos a la semana en Ecuador

c) Número de periódicos vendidos a la semana en la ciudad de Riobamba

d) Estudiantes de todas las universidades del mundo

e) Estudiantes de todas las universidades europeas

f) Estudiantes de todas las universidades españolas

g) Estudiantes de todas las universidades americanas

h) Estudiantes de todas las universidades ecuatorianas

i) Estudiantes de todas las universidades de la ciudad de Riobamba

4.- Escriba 10 ejemplos de Población y 10 de muestra

5.- ¿A que tipo de variable corresponde las siguientes expresiones?:

a) Promedio de calificación de los estudiantes

b) Distancia que los estudiantes recorren para llegar a clases

c) Calificaciones de estudiantes en el primer examen parcial de Estadística

d) Clasificación de alumnos de acuerdo a la provincia que nacieron

e) Número de horas de estudio de los estudiantes del ISTRA

f) Edad de los estudiantes del Unidad Educativa Sultana de los Andes

ACTIVIDAD DE APRENDIZAJE No. 1

Page 12: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

12 Ing. Wilson A. Velastegui. Ojeda. Msc

g) Peso de todos los que integran el Instituto República de Alemania “ISTRA”

6.- Escriba 10 ejemplos de variable discreta y 10 ejemplos de variable continua

7.- Luego de haber leído cualquier periódico o revista relacionado a la economía. Haga un

resumen y diga que tipo de variable o variables intervienen en la misma.

8.- Describa con sus propias palabras cómo se puede utilizar la estadística para resolver

problemas en diversas disciplinas y puestos de trabajo

9.- El presidente de una asociación de estudiantes quiere tomar una muestra de las

opiniones de los 150 miembros en relación con las actividades de recreación para el período

académico que empezará en el mes octubre.

a) ¿Cuál es la población? b) ¿Cuál sería la mejor manera de tomar la muestra?

10.- ¿Qué tipo de variable representan las siguientes designaciones?

a) Los estudiantes califican a su profesor de estadística en una escala de: Horrible, no tan

malo, bueno, magnífico. serio, estricto.

Page 13: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

13 Ing. Wilson A. Velastegui. Ojeda. Msc

SEGUNDA UNIDAD: CONCEPTOS

BÁSICOS

“No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)

OBJETIVOS:

Al término de esta unidad el estudiante estará en capacidad de:

Diferenciar entre un conjunto de datos no agrupados y agrupados.

Agrupar un conjunto de datos

Determinar la marca de clase y distribuciones de frecuencias

Realizar representaciones gráficas de los datos de un conjunto.

DESARROLLO DE CONTENIDOS

1. DESCRIPCION DE DATOS U OBSERVACIONES

Al número de datos u observaciones se lo representan con n. Para describir los dates puede

presentar dos casos:

1er CASO:- Cuando el conjunto de observación tiene pocos datos o valores

Ejemplo. Un estudiante durante un semestre dio diez exámenes parciales calificados sobre

diez (10 puntos), obteniendo los siguientes resultados:

6 – 7 – 6 – 8 – 5 – 7 – 6 – 9 – 10 y 6. En este ejemplo, n = 10 (número de datos).

Para este tipo de conjunto (o estadística) primero se hace un cuadro o una tabla, luego en la

primera columna del cuadro se ordenan los datos o valores ya sea en forma ascendente o

descendente (creciente o decreciente) en la segunda columna se ponen el número de los

valores que se repiten, al número que se repite se llama frecuencia (f).

Esto lo visualizamos mediante el siguiente cuadro.

Page 14: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

14 Ing. Wilson A. Velastegui. Ojeda. Msc

Notas

Frecuencia (f)

Absoluta

5

1

6

4

7

2

8

1

9

1

10

1

TOTAL n = 10

2do. CASO. - Cuando el conjunto de observación tiene muchos valores diferentes

Para este caso se emplea un procedimiento llamado “Agrupamiento de datos". Esto es

posible cuando el numero do datos es mayor que 30 (n >30)

OBSERVACIÓN:- El número de clases que se emplea para agrupar los datos en un

conjunto depende del número de datos.

* Si el numero de datos es pequeño, el numero de clases a emplear será cercano a cinco

(5), pero generalmente nunca menos que cinco (5)

* Si existe una cantidad elevada de datos, el número de clases debe encontrarse entre ocho

(8) y doce (12) clases

* En general el número de clases puede encontrarse entre 5 a 15 clases, el número de

clases se puede elegir uno mismo (entre 5 a 15)

Para saber en cuantos grupos o clases agrupamos estos datos, se utiliza la formula de Sturges K= 1+3,322 Log (n), donde K. es el numero de clases y n es el número de dates u observaciones. Esto se clarifica mediante el siguiente ejemplo:

La demanda diaria, en unidades de un producto, durante 30 días de trabajo es:

105 106 105 107 109 111 110 110 107 107 104 99 103 99 103

101 100 101 100 103 98 92 97 94 95 95 93 95 95 95

91 82 91 85 90 86 87 89 87 89

Page 15: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

15 Ing. Wilson A. Velastegui. Ojeda. Msc

El número de datos u observaciones es n = 40. Como el número de datos es mayor que 30,

agrupamos los datos utilizando la fórmula de Sturges:

K = 1+3,322 log (n)

K = 1+3.322 log (40)

K = 1+3,322 (1.60205)

K = 1+5,322

K = 6,32 = 6 Por tanto los 40 datos podernos agrupar en 6 grupos intervalos o

Clases

2. - PROCEDIMIENTO PARA AGRUPAR LOS DATOS

1.- Ordenamos los datos en forma creciente o decreciente (ascendente o descendente)

2.- Encontramos el dato mayor y el dato menor, llamado también observación mayor (OM) y

observación menor (om). Con estos datos encontramos el rango o recorrido, en formula es:

Rango = R = OM – om

3.- Determinamos el numero de clases o grupos (K), utilizando la fórmula de Sturges, (en

nuestro ejemplo anterior K=6).

4.- Hallamos o determinamos la longitud o amplitud del intervalo de la clase, que se designa

con la letra C, en formula es:

K

R

clasesdeNúmero

RangoC

...., C= es la amplitud de la clase

5.- Preparamos un cuadro con 3 columnas, para las clases, limite de clases y en frecuencia,

esto es

CLASE LIMITE DE CLASE FI

Page 16: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

16 Ing. Wilson A. Velastegui. Ojeda. Msc

6.- En la columna de límites de clase anotamos como límite inferior (Li) de la clase a la

observación menor. Luego de acuerdo a la amplitud del intervalo de la clase (C), incluimos

tantos datos hasta el límite superior (Ls), así sucesivamente iremos anotando en clase,

hasta llegar a la última clase en la que debe escribir incluido el dato mayor

7.- Finalmente contamos cuantos datos están incluidos en cada clase y lo ponemos en la

columna de las frecuencias (f)

Ejemplo. Dado conjunto anterior aplique los pasos y agrupe este conjunto de datos

105 106 105 107 109 111 110 110 107 107 104 99 103 99 103

101 100 101 100 103 98 92 97 94 95 95 93 95 95 95

91 82 91 85 90 86 87 89 87 89

1.- Ordenamos los dates del ejemplo que estamos tratando en forma ascendente

82 85 86 87 87 89 89 90 91 91 92 93 94 95 95 95 95 95 97 98

99 99 100 100 101 101 103 103 103 104 105 105 106 107 107

107 109 110 110 111

2.- Hallamos el Rango

R = OM – om

R = 111 – 82 = 29

3.- Determinamos el número de clases. K = 1+3,322 log(40) = 6, (K=6)

4.- Determinamos la amplitud del intervalo de la clase.

C = R/K 29/6 = 4.83

C = 5

5.- Preparamos una tabla con 3 columnas

Page 17: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

17 Ing. Wilson A. Velastegui. Ojeda. Msc

Clases

Límites de Clases

Frecuencia fi

1

82 – 86

3

2

87 – 91

7

3

92 – 96

8

4

97 – 101

8

5

102 – 106

7

6

107 – 111

7

TOTAL n = 40

EJEMPLO.- En un centro distribuidor de electrodomésticos, la demanda diaria de televisores

de 14 pulgadas durante 31 días de trabajo es:

38 – 35 – 76 – 58 – 48 – 59 – 67 – 63 – 33 – 69 – 53 – 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49

– 78 – 48 – 42 – 72 – 52 – 47 – 66 – 58 – 44 – 44 – 56. Agrupe este conjunto de datos

1.- Ordenamos los datos en forma ascendente

25 28 32 33 35 35 38 42 44 44

47 48 48 49 51 52 53 56 57 58

58 59 61 63 66 67 69 72 76 78

2.- R = 78 - 25 = 53

3.- K = 1+ 3,3221og(30)

K = 1+ 4.9 = 5.90 = 6

4.- C = R / K = 53 / 6 = 8.833 = 9

5.- Presentamos los datos en columnas

CLASE Li – Ls F

1 25 – 33 4

2 34 – 42 4

3 43 – 51 7

4 52 – 60 7

5 61 – 69 5

6 70 – 78 3

TOTAL n = 30

Page 18: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

18 Ing. Wilson A. Velastegui. Ojeda. Msc

NOTA:- Para ordenar los datos es conveniente saber si los datos se trata de atributos o

variables

Atributo:- Son los que expresan cualidades. Eje: bueno, malo, masculino femenino

Variable:- Es la que asume distintos valores en un evento, generalmente son números.

Para ordenar datos que son atributos es conveniente clasificar de acuerdo con las

categorías, el atributo puede dividirse. Por Ejemplo: si queremos ordenar datos

correspondientes a calificaciones de exámenes serán, sobresaliente, muy buena, buena,

regular, insuficiente.

Pero, si queremos ordenar datos correspondientes a variables, hay que ordenar los valores

en forma creciente o decreciente (ascendente o descender, (e)

3.- DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS Y MARCA DE CLASE.

Para hacer la descripción gráfica de los datos es necesario conocer algunos elementos de la

estadística

3.1.- LIMITES DE INTERVALOS DE CLASE

Todo grupo, intervalo o clases tiene dos límites: Límite inferior (Li) y límite superior (Ls)

3.2.- PUNTOS MEDIOS 0 MARCAS DE CLASES (Xc)

Cuando estamos trabajando con datos agrupados es conveniente buscar para cada

intervalo un valor que lo represente. Este valor se llama punto medio o marca de clase, que

se representa con Xc, en formula es:

Por ejemplo: en el intervalo

29

2/58

33,25,3325

23325

Xc

Xc

LsLi

Xc = 29 es el punto medio o marca de clase

2

sic

LLX

Page 19: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

19 Ing. Wilson A. Velastegui. Ojeda. Msc

3.3.- FRECUENCIA ABSOLUTA

Es el número de veces que se repite un dato, o el número de datos que sc encuentre dentro

de un intervalo o clase, se lo representa con la letra "F minúscula, es decir a este tipo de

frecuencia se llama Frecuencia Absoluta.

3.4.-FRECUENCIA RELATIVA

Se obtiene dividiendo el número de datos u observaciones de la clase o grupo para el

número total de datos u observaciones:

se representa con la letra (fr), en fórmula es:

n

f

datosdetotalNúmero

clasededatosdeNúmerofr

......

........

3.5. FRECUENCIA ACUMULADA ( Fa )

Se obtiene de la siguiente forma: En la primera clase se pone la frecuencia absoluta del

mismo, en la segunda clase se pone la suma de la frecuencia de la primera clase con la

segunda clase, y así sucesivamente hasta la suma con la frecuencia de la última clase.

3.6.- FRECUENCIA RELATIVA ACUMULADA

Se obtiene de forma similar que la frecuencia acumulada, pero sumando las frecuencias

relativas correspondientes. La suma de todas las frecuencias relativas es igual a 1en

formula es:

K

Ikr ffff

121 1.....

3.7.- PORCENTAJE

El porcentaje se obtiene multiplicando la frecuencia relativa por 100, en formula es:

P = 100(%) xfN

f

r

Page 20: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

20 Ing. Wilson A. Velastegui. Ojeda. Msc

Aplicando esta formula se obtiene el porcentaje, cuyo resultado debe expresarse con %

(tanto por ciento). La suma de todos los porcentajes es igual a 100%

Ejemplo: Dada la siguiente tabla hallar:

a) El punto medio, b) Frecuencia acumulada, c) frecuencia relativa, d) frecuencia relativa

acumulada y e) el porcentaje.

Clase

Límite de clase

Li – Ls

Frecuencia

f

Punto Medio

Xc

Fa

fr

fra Porcentaje %

P 1

25 – 33

4

29

4

0.13

0.13

0.13X100=13

2

34 – 42

4

38

8

0.13

0.26

0.13X100=13

3

43 – 51

8

47

16

0.26

'0.52

0.26X100=26

4

52 – 60

7

56

23

0.23

0.75

0.23X100=23

5

61- 69

5

65

28

0.16

0.91

0.16X100=16

6

70 – 78

3

74

31

0.09

1.00

0.09X100=9

TOTAL n = 31 1.00 100%

4.- REPRESENTACION GRAFICA DE LOS DATOS

La representación gráfica de los datos es un medio eficaz para el análisis de las

estadísticas, que nos permiten ver el comportamiento de los datos en mi conjunto del cual

se este investigando. Para luego sacar sus conclusiones.

La representación gráfica de los datos constituye mi medio auxiliar de la investigación

estadística pues esta se fluidamente en la descripción.

SISTEMAS DE REPRESENTACION.- El sistema de representación mas usual es el

PLANO CARTESIANO, en el eje X se ponen los valores distintos de la variable para dates

no agrupados y los límites de clases para los datos agrupados, en el eje Y se ponen las

frecuencias absolutas (o frecuencias relativas), Veamos las representaciones gráficas mas

usuales en la estadística

4.1.- HISTOGRAMA.- El histograma es un gráfico que tiene un conjunto de rectángulos de

igual base y de altura igual a su respectiva frecuencia absoluta o frecuencias relativas.

Para construir un histograma se traza primero en el primer cuadrando positivo del plano

cartesiano, luego en el ej. X se anotan los limites inferiores; y superiores de las clases,

procurando que haya una continuidad o coincidencia, Esto es que, el límite superior de una

clase se constituye en límite inferior do In siguiente clase

NOTA:- Para esto es necesario hallar los limites reales (L-R) de la clase. En el eje Y que

corresponden a sus alturas se ponen sus respectivas (frecuencias.

Page 21: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

21 Ing. Wilson A. Velastegui. Ojeda. Msc

Ejemplo: dado los siguientes datos de la siguiente tabla grafique el histograma

Clase Límites de clase f L – R

1 25 – 33 4 24,5 – 33,5

2 34 – 42 4 33,5 – 42,5

3 43 – 51 8 42,5 – 51,5

4 52 – 60 7 51,5 – 60,5

5 61 – 69 5 60,5 – 69,5

6 70 – 78 3 69,5 – 78,5

Total N = 31

Histograma: de la demanda diaria de la venta de televisores

4.2.- POLÍGONO DE FRECUENCIA.- Es un gráfico lineal, su construcción es similar al

histograma; para su construcción se unen los puntos medios de cada clase, con sus

respectivas frecuencias; de tal manera que al unir sus puntos medios por segmentos forman

un polígono

Ejemplo: dado los siguientes datos de la tabla construya el polígono de frecuencia

Clase

Limites de Clase

f

L.R

Xc

1

25 – 33

4

24.5 - 33.5

29

2

34 – 42

4

33.5 – 42.5

42.5

38

3

43 – 51

8

42.5 - 51.5

47

4

52 – 60

7

51.5 - 60.5

56

5

61 – 69

5

60.5 - 69.5

65

6

70 – 78 3

69.5 - 78.5

74

Polígono de Frecuencia: de la demanda diaria

8

7

6

5

4

3

2

1

0

24.5 33.5 42.5 51.5 60.5 69.5 78.5

Page 22: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

22 Ing. Wilson A. Velastegui. Ojeda. Msc

29 38 47 56 65 74

4.3.- DIAGRAMA DE DISTRIBUCIÓN U OJIVA (CURVAS DE FRECUENCIAS

ACUMULADAS)

El gráfico de una distribución de frecuencias acumuladas (se llaman OJIVA) o curva de

distribución de frecuencias acumuladas

Para su construcción se procede de la siguiente manera. Se considera el plano cartesiano, en el

eje X se anotan los limites reales (L – R) de la clase, en el eje Y se anotan las frecuencias

acumuladas (desde la menor hasta la mayor)

Ejemplo: dado los siguientes datos de la tabla construya la curva de distribución u (OJIVA)

Clase Li – Ls f Fa L – R

1 25 – 33 4 4 24,5 – 33,5

2 34 – 42 4 8 33,5 – 42,5

3 43 – 51 8 16 42,5 – 51,5

4 52 – 60 7 23 51,5 – 60,5

5 61 – 69 5 28 60,5 – 69,5

6 70 – 78 3 31 69,5 – 78,5

Page 23: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

23 Ing. Wilson A. Velastegui. Ojeda. Msc

Gráfico de la curva de distribución (OJIVA)

4.4.- DIAGRAMA DE PASTEL O CICLOGRAMAS

Los gráficos en sectores o diagramas de pastel se utilizan para representar los datos cuyo

conjunto forman un todo.

Pertenecen a este grupo los CIRCUNGRAMAS O CICLOGRAMAS, que son círculos que

representan al número total de datos (n) divididos en tantos sectores circulares como

categorías tiene el grupo.

Cada sector circular es proporcional a la frecuencia de su clase o categoría.

Para encontrar el número de grados de cada clase o categoría se utiliza la siguiente formula.

GRADO = (fx360)/n

Donde f es la frecuencia de la clase y n el número total de dates

Ejemplo: dado los siguientes datos de la tabla construya el diagrama de pastel

CLASE

O serie

LIMITE DE CLASE FRECUENCIA

F

GRADOS

(fx360)/n

PORCENTAJE

Fr x 100

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6

25 – 33 34 – 42 43 – 51 52 – 60 61 – 69 70 – 78

4 4 8 7 5 3

46.5° 46.5° 93° 81° 58° 35°

0.13x100=13 0.13x100=13 0.26x100=26 0.23x100=23 0.16 x100=16 0.09X100=9

TOTAL n = 31 360° 100%

0

5 10

15

20

25 30

35

Serie1

24.5 33.5 42.5 51.5 60.5 78.5

Page 24: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

24 Ing. Wilson A. Velastegui. Ojeda. Msc

4.5.- DIAGRAMA DE BARRAS O GRÁFICO DE BARRAS.

El diagrama de barras es un gráfico que se representa por medio de rectángulos que se

levantan desde el eje X, hasta una altura que corresponde aI eje Y y que es igual a las

frecuencias de las diferentes categorías de los datos.

La diferencia entre el diagrama de barras y el histograma esta en que el histograma se

refiere a una distribución de frecuencias y los diagramas de barras se utilizan para cualquier

tipo de atributos cualidades o categorías.

Ejemplo: Los siguientes datos corresponden a los campos petroleros existentes en el

Oriente Ecuatoriano.

Campos Petroleros f

1 Yana yacu 20

2 Coca 57

3 Durano Guanto 100

4 Yana Yacu sur 8

5 Lago Agrio 16

6 Shushufindy 14

7 Yana yacu norte 12

8 Sachas 1 28

9 Sachas 2 56

total n= 311

DIAGRAMA DE BARRAS DE CAMPOS PETROLEROS

1

2

3

4

5

6

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8

Series1

Page 25: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

25 Ing. Wilson A. Velastegui. Ojeda. Msc

1.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesías por las Islas

Galápagos a ciudadanos de la tercera edad. El presidente de la agencia quiere información

adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes

que hicieron la travesía el año pasado dio a conocer las siguientes edades.

77 18 63 84 38 54 50 59 54 56 36 26 50 34 44 41 58 58 53 51 62 43 52 53 63 62 62 65 61 52 60 60 45 66 83 71 63 58 61 71

a) Organice los datos en una distribución de frecuencias b) ¿En cuántas clases, grupos o intervalos se puede agrupar este conjunto de datos? c) ¿Cuál es límite inferior que usted recomendaría para la primera clase? d) Comente sobre la distribución de frecuencias

2.- De Ia tabla siguiente: Construya el Histograma, el polígono de frecuencia y la curva de

distribución u ojiva

Li – Ls f

19,2 – 19,4 1

19,5 – 19,7 2

19,8 – 20,0 8

20,1 – 20,3 4

20,4 – 20,6 3

20,7 – 20,9 2

TOTAL n = 20

3) Dada la siguiente tabla que representa el número de carros vendidos en una feria

internacional. Grafique el diagrama de barras

MARCA DE CARROS

f

Datsun Ford

Toyota Vitara

Montero San Remo

40 45 32 44 38 46

TOTAL n = 204

4.- El director del programa de investigaciones científicas de la Universidad Estatal tiene 16

solicitudes para su admisión en el próximo año. Las calificaciones de la prueba de los

solicitantes es:

ACTIVIDAD DE APRENDIZAJE No. 2

Page 26: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

26 Ing. Wilson A. Velastegui. Ojeda. Msc

27 27 27 28 27 25 25 28 26 28 26 28 31 30 26 26

Tales calificaciones deben organizarse en una distribución de frecuencias.

a) ¿Cuántas clases grupos o intervalos recomendaría? b) ¿Qué intervalo de clase sugeriría? c) ¿Cuál es el límite inferior que recomendaría para la primera clase?

5.- En la siguiente serie estadística de intervalos: Determine:

x F

120 – 125

114 – 119

108 – 113

102 – 107

96 – 101

90 – 95

5

6

10

9

15

2

Total N=47

a) La marca de clase. e) El histograma

b) La frecuencia relativa f) El polígono de frecuencia

c) La frecuencia acumulada g) La curva de distribución (OJIVA)

d) El porcentaje de la frecuencia relativa h) El diagrama de pastel

Page 27: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

27 Ing. Wilson A. Velastegui. Ojeda. Msc

PARTE A: APLICACIÓN DE LOS CONCEPTOS Y DEFINICIONES

Señale con una (X) la alternativa o alternativas verdaderas que corresponda a cada

pregunta.

1.- En el siguiente redondeo de datos señale las aproximaciones que son correctas de

acuerdo al Sistema Internacional

a) 125,85 aproximado a tres cifras enteras es 126

b) 235,135 aproximado a dos cifras decimales es 235,14

c) 425,45 aproximado a una cifra decimal es 425,5

d) 1 250,1245 aproximado a una cifra decimal es 1250,2.

2.- Señale con una (x) las variables continuas.

a) Provincias del Ecuador b) Habitantes del Ecuador

c) La estatura de los alumnos de un colegio. d) La edad de los alumnos de la

Modalidad Abierta y a distancia

3.- La variable familias del Ecuador es:

a) Continua b) Discreta

c) Cualitativa d) Ninguna de las anteriores

4.- Señale con una (x) las proposiciones que son correctas.

a) C = Ls – Li +1 b) xc = Ls+Li/2 c) xc = (Ls+Li)/2

d) La marca de clase es el valor medio de cada intervalo.

5.- determine los límites reales que le corresponden al siguiente intervalo: 46 – 50

a) 46,5 - 50,5 b) 45,5 - 49,5

c) 45,5 - 50,5 d) Ninguna de las soluciones anteriores.

AUTO EVALUACIÓN No.1 y 2

Page 28: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

28 Ing. Wilson A. Velastegui. Ojeda. Msc

6.- Un colegio tiene 3 200 estudiantes. Si los alumnos matriculados en el primer curso

son 400, el porcentaje que le corresponde a este curso es de:

a) 8,5% b) 12,5% c) 80%

d) Ninguna de las soluciones anteriores

7.- El ancho del intervalo 51 – 57 es:

a) C = 5 b) C = 6

c) C = 7 d) Ninguna de las anteriores

8.- La marca de clase del intervalo 30 – 35 es:

a) 4 b) 5

c) 32 d) Ninguna de las soluciones anteriores

9.- Para el cálculo de la frecuencia relativa debemos utilizar la fórmula

a) n

fxr

100 b) nff r . c)

n

ff r d) Ninguna de las soluciones anteriores

10) La fórmula para calcular el porcentaje de la frecuencia es:

a) N

fp

100. b)

100

.,Nfp c)

n

fp d) Ninguna de las anteriores

11.- ¿Cuál de las siguientes es una gráfica de superficie?

a) Curva de magnitud b) Polígono de frecuencia

c) Barras compuestas d) Pictograma

12.- En un polígono de frecuencias, los valores representados en el eje vertical

corresponden

a) Los intervalos de clase b) Las frecuencias acumuladas

c) Los puntos medios d) las frecuencias

Page 29: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

29 Ing. Wilson A. Velastegui. Ojeda. Msc

13.- En un histograma, las frecuencias se ubican en el eje vertical y en el eje horizontal

a) Los limites reales de clase b) La variable

c) Los porcentajes de las frecuencias d) las frecuencias relativas

14.- Cuando en el polígono de frecuencia los puntajes se distribuyen en forma uniforme, la

prueba aplicada ha sido:

a) Con un alto grado de dificultad b) Con cierto grado de dificultad.

c) Normal d) Ninguna de las soluciones anteriores

15.- El gráfico que se obtiene al representar la variable y la frecuencia acumulada

a) Pictograma b) Ojiva o curva de magnitud

c) Polígono de Frecuencia d) Diagrama de frecuencias

16.- El polígono de frecuencia es un gráfico

a) De superficie b) Lineal

c) Libre d) Ninguno de los anteriores

17.- Para trazar un diagrama de barras horizontales en el eje de las abscisas se localizan las

frecuencias y en el eje de las ordenadas.

a) la amplitud de la variable b) Los limites reales de clase

c) Los datos de la variable d) Las frecuencias acumuladas

18.- En un diagrama de sectores los 360 grados del ángulo central de un círculo se

distribuyen utilizando la fórmula

a) A° = N

f 100. b) A° =

f

f 360. c) A° =

f

N 100. d) A° = N

f 360.

19.- El diagrama espiral se utiliza para representar:

Page 30: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

30 Ing. Wilson A. Velastegui. Ojeda. Msc

a) Solo series con datos geográficos b) Dos series de datos

c) Una variación expansiva de un fenómeno d) Los porcentajes de la variable

20.- Diga si es variable cuantitativa o variable cualitativa los siguientes ítems

a) Numero de libros que ha leído usted en este año

b) Peso del contenido en kilogramos de varias cajas de cereales

c) Número de pases de semestres otorgados a los estudiantes del ISTRA

d) Número de asignaturas en que los estudiantes del ISTRA se han matriculado este

semestre

Page 31: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

31 Ing. Wilson A. Velastegui. Ojeda. Msc

TERCERA UNIDAD: MEDIDAS

DE TENDENCIA CENTRAL

“No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)

OBJETIVOS:

Al término de esta unidad el estudiante estará en capacidad de:

Definir los conceptos de las medidas de tendencia central como: promedio, mediana, moda, media geométrica y media armónica.

Determinar la media aritmética, mediana y moda de datos no agrupados y agrupados

DESARROLLO DE CONTENIDOS

1.- INTRODUCCION.- En las unidades anteriores se plantearon los conceptos y las

técnicas gráficas para describir las distribuciones ocultas en un conjunto de datos. En esta

unidad se definen algunas “medidas numéricas” que se emplean para describir un

conjunto de datos. Estas medidas son: Medidas de tendencia central o de centralización

Estudiaremos tanto para datos no agrupados y agrupados. Las medidas de tendencia

central se refieren a la localización de una distribución. La más importantes medidas de

tendencia central son: la media ( X ), la mediana (Mdn), la moda (Mo), media geométrica

(MG) y la mediana armónica(MA)

2.- MEDIA ARITMETICA O PROMEDIO PARA DATOS NO AGRUPADOS

DEFINICION.- La media se define como la suma de los valores de un conjunto de datos

dividido para el número total de datos.

Existen dos tipos de medias aritméticas: La media poblacional que se representa por u (miu)

y la media muestral que se representa por ( X ) (equis barra).

La media para datos no agrupados está dada por la siguiente fórmula:

n

xxxx

n

X

X n

n

ii

.....3211

Page 32: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

32 Ing. Wilson A. Velastegui. Ojeda. Msc

Donde

n

iiX

1 a la suma de cada uno de los valores del conjunto de datos y (n) es el

número total de elementos del conjunto.

Ejemplo: Dado el siguiente conjunto de datos hallas su media.

38 – 35 – 76 – 58 – 48 – 59 – 67 – 63 – 33 – 69 – 53 – 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49

78 – 48 – 42 – 72 – 52 – 47 – 66 – 58 – 44 – 44 – 56 – 45

Aquí es este conjunto n = 30

29,5131

1590

31

45564444.....48587635381

n

X

X

n

ii

3. MEDIANA PARA DATOS NO AGRUPADOS

DEFINICIÓN.- La mediana es una colección de datos debidamente ordenados en forma

ascendente o descendente (creciente o decreciente). Es el valor medio o la media aritmética

de los dos valores medios.

La mediana está justamente en el 50% de los datos (en la mitad). Para hallar la mediana,

puede presentar dos casos.

1er. CASO.- Cuando el número de datos es impar.- En este caso la mediana se encuentra

en la mitad de la “serie ordenada” de los datos, se puede encontrar utilizando la siguiente

fórmula

2

1

nMdn

El resultado de esta operación nos indica la posición o el lugar donde está la mediana (este

valor no es la respuesta).

DATOS SIN ORDENAR

DATOS ORDENADOS

38 35 76 58 45 28 32 33 35 36

Page 33: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

33 Ing. Wilson A. Velastegui. Ojeda. Msc

67 63 33 69 53 59

28 25 36 32 61 51

49 78 48 42 72 57

47 66 58 44 44 52 56

42 44 44 45 47 48 48

51 52 53 56 57 58 58

59 61 63 66 67 69 72 76 78

n = 31 (NÚMERO DE DATOS IMPAR)

162

131

2

1

nMdn

El 16 no es la mediana, el 16 nos indica la posición o el lugar donde se encuentra ubicado la

mediana en el ordenamiento de los datos, en nuestro ejemplo el puesto 16 ocupa el número

51. Por lo tanto la mediana es:

Mdn = 51

2do. CASO.- Cuando el número de datos es par.- En este caso se utiliza el mismo

procedimiento que el 1er. Caso, y se obtiene un número entero con decimales, en este caso

la median se encuentra hallando la media aritmética de los dos valores medios

DATOS SIN ORDENAR

DATOS ORDENADOS

38 35 76 58 45

67 63 33 69 53 59

28 25 36 32 61 51

49 78 48 42 72 57

47 66 58 44 44 52 56

28 32 33 35 36

42 44 44 45 47 48 48

51 52 53 56 57 58 58

59 61 63 66 67 69 72 76 78

Posición 5,152

31

2

130

2

1

nMdn

El número 15, 5 no es la mediana, este valor nos dice que la mediana está entre el elemento

15 y el elemento 16 de los datos ordenados, esto es: El puesto 15 está ocupado por el

número 51 y el puesto 16 por el número 52.

Por lo tanto la mediana es:

5,512

103

2

5251

Mdn

Page 34: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

34 Ing. Wilson A. Velastegui. Ojeda. Msc

4.- MODA PARA DATOS NO AGRUPADOS

DEFINICIÓN.- La moda en un conjunto de datos u observaciones es el valor que se repite

con mayor frecuencia. A la moda o modo se lo representa con Mo.

NOTA.- Si existe un solo valor que se repite, el conjunto tiene una sola moda y se llama

UNIMODAL

Ejemplo 1: Hallar la moda del siguiente conjunto de datos.

19 1 3 4 2 5

7 6 6 6 6 6

20 17 8 18 9 10

En este conjunto el número que se repite es el 6, por tanto la moda es Mo = 6

Ejemplo 2: Hallar la moda del siguiente conjunto de datos.

1 2 3 3 3 3

4 5 6 7 8 9

10 11 11 11 11 12

En este conjunto los números que se repiten son el 3 y el 11, por tanto la moda es

Mo = 3

Mo = 11 por lo tanto es bimodal (tiene dos modas)

Si existen dos valores que se repiten, el conjunto tiene dos modas, es BIMODAL.

Si existen más de dos valores que se repiten, se dice que el conjunto tiene varias modas, en

este caso se llama MULTIMODAL

Page 35: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

35 Ing. Wilson A. Velastegui. Ojeda. Msc

5.- MEDIA ARITMÉTICA PARA DATOS AGRUPADOS

La media para datos agrupados se calcula por la siguiente fórmula:

n

XfXfXf

n

Xf

X CkkCC

k

iCi

.....22111

Donde

k

ii Xcf

1= a la suma del producto de las frecuencias por el punto medio o marca de

clase.

n = número total de datos u observaciones

K = número de intervalos grupos o clases

Para hallar la media de datos agrupados, primero encontramos los puntos medios o marca

de clase XC, luego multiplicamos la frecuencia cada clase por el punto medio de la misma

Finalmente sumamos la columna de los productos y su resultado dividimos para el número

total de datos.

Ejemplo: Dado la siguiente tabla de frecuencias halle la media aritmética.

Li – Ls f Xc f. Xc

25 – 33

34 – 42

43 – 51

52 – 60

61 – 69

70 – 78

4

4

8

7

5

3

29

38

47

56

65

74

4x29=116

4x38=152

8x47=376

7x56=392

5x65=325

3x74=222

n = 31

6

11583.

iCXf

06,5131

1583.

6

1

n

XFI

C

X

Page 36: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

36 Ing. Wilson A. Velastegui. Ojeda. Msc

6.- MEDIANA PARA DATOS AGRUPADOS

PROCEDIMIENTO

1.- De la tabla hallamos las frecuencias acumuladas límites de clases

2.- Dividimos el número total de datos para dos utilizando la expresión 2

n

3.- El resultado encontrado en 2) localizamos en la columna de frecuencias acumuladas

4.- Aplicamos la fórmula de la mediana para datos agrupados que esta dado por:

CLMdnm

ia

f

fn

i

)(2

, o también CLMdnm

sa

f

fn

s

)(2

donde;

iL. = significa límite real inferior de la calase mediana.

2

n = es el número de datos del conjunto dividido para dos.

iaf = suma de las frecuencias acumuladas inferiores a la clase mediana

C = amplitud del intervalo o ancho del intervalo

mf = frecuencia de la clase mediana

Ejemplo: Dado la siguiente tabla de frecuencias halle la mediana

Li – Ls f Fa

25 – 33

34 – 42

43 – 51

52 – 60

61 – 69

70 – 78

4

4

8

7

5

3

4

8

16

23

28

31

n = 31

NOTA: La clave primero esta en dividir el número total de datos para dos, esto es:

Page 37: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

37 Ing. Wilson A. Velastegui. Ojeda. Msc

2

n = 5,15

2

31 este valor se encuentra en la clase 3 o el intervalo 43 – 51

iL. = 42,5 iaf = 8 C = 43 – 34 = 9 mf = 8

Reemplazando estos valores en la fórmula de la mediana tenemos su resultado

4375,85,42

8

5,675,42)9(

8

5,75,42)9(5,42

8

85,15

Mdn = 50,9375

7.- MODA PARA DATOS AGRUPADOS

Para hallar la moda para datos agrupados, primeramente se observa en columna da las

frecuencias, el valor más alto (clase con la mayor frecuencia.) Luego se halla la moda

utilizando la siguiente fórmula

CLModd

di

21

1

donde;

iL = Límite inferior de la calase modal (clase con la mayor frecuencia).

1d = Frecuencia de la clase modal menos la frecuencia de la clase anterior

2d = Frecuencia de la clase modal menos la frecuencia de la siguiente clase.

C = Amplitud o longitud del intervalo de clase

Ejemplo: Dado la siguiente tabla de frecuencias halle la moda

Li – Ls f

25 – 33

34 – 42

43 – 51

52 – 60

61 – 69

70 – 78

4

4

8

7

5

3

n = 31

NOTA: La frecuencia mas alta 8 y esta en el intervalo 43 – 51 o tercera clase, donde:

Page 38: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

38 Ing. Wilson A. Velastegui. Ojeda. Msc

f = 8 frecuencia más alta

iL = 42,5 = Límite inferior de la calase modal (clase con la mayor frecuencia)

1d = 8 – 4 = 4 = frecuencia de la clase modal menos la frecuencia de la clase anterior

2d = 8 – 7 = 1 = frecuencia de la clase modal menos la frecuencia de la siguiente

clase.

C = 70 – 61 = 9 = Amplitud o longitud del intervalo de clase

Estos valores reemplazamos en la fórmula de la moda y su valor es:

CLModd

di

21

1

= 45,42

9

365,42)9(5,42

544 = 46,5

EJEMPLO DE RECAPITULACIÓN:

Dado la siguiente tabla de datos agrupados halle la media aritmética, mediana y la moda

Clase Li – Ls fi Xc f. Xc Fa 1 2 3 4 5 6

1.00 – 1.04 1.05 – 1.09 1.10 – 1.14 1.15 – 1.19 1.20 – 1.24 1.25 – 1.29

4 6 10 15 8 5

1.02 1.07 1.12 1.17 1.22 1.27

4.08 6.42

11.20 17.55 9.76 6.35

4 10 20 35 43 48

Total

n = 48

6

136,55.

iCXf

48

36,55.

1

n

Xf

X

k

iC

= 1.1533333 = 1.15

Para la mediana primero dividimos el número total de datos para dos, esto es:

2

n = 24

2

48 este valor se encuentra en la 4º clase o el intervalo 1.15 – 1.19

iL. = 1.15 iaf = 20 C = 1.15 – 1.10 = 0.05 mf = 15

Reemplazando estos valores en la fórmula de la mediana tenemos su resultado

Page 39: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

39 Ing. Wilson A. Velastegui. Ojeda. Msc

CLMdnm

ia

f

fn

i

)(2

0133.015.1)05.0(15/415.1)05.0(15.115

2024

Mdn = 1.1633 = 1.163

Para hallar la moda observamos cual es la frecuencia más alta, en este caso es 15 y está en la cuarta clase, donde se tiene:

iL = 1.15 1d = 15 – 10 = 5 2d = 15 – 8 = 7

C = 1.20 – 1.15 = 0,05

Estos valores reemplazamos en la fórmula de la moda y su valor es:

CLModd

di

21

1

CLModd

di

21

1

= 020833333.015.1

12

25.015.1)05.0(15.1

755 = 1.17083

Mo= 1.170 1.2

Page 40: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

40 Ing. Wilson A. Velastegui. Ojeda. Msc

1.- Los siguientes datos representan las latas de frutas de una muestra de 20 unidades que

contienen pesos netos que oscilan entre 19.3 onzas y 20.9 onzas.

19.7 - 19.9 - 20.2 - 19.9 - 20.0 - 20.6 - 19.3 - 20.4 - 19.9 - 20.3 - 20.1 - 19.5 - 20.9 - 20.3 -

20.8 - 19.9 - 20.0 - 20.6 - 19.9 - 19.8

Hallar: el peso promedio, la mediana y la moda, para este conjunto de datos no agrupados

2.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesías por las Islas

Galápagos a ciudadanos de la tercera edad. El presidente de la agencia quiere información

adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes

que hicieron la travesía el año pasado dio a conocer las siguientes edades.

77 18 63 84 38 54 50 59 54 56 36 26 50 34 44 41 58 58 53 51 62 43 52 53 63 62 62 65 61 52 60 60 45 66 83 71 63 58 61 71

Hallar: la edad promedio, la mediana y la moda, para este conjunto de datos no agrupados

4.- El director del programa de investigaciones científicas de la Universidad Estatal tiene 16

solicitudes para su admisión en el próximo año. Las calificaciones de la prueba de los

solicitantes es:

27 27 27 28 27 25 25 28 26 28 26 28 31 30 26 26

Halle: la calificación promedio, la mediana y la moda, para este conjunto de datos no

agrupados

5.- Los siguientes datos representan las calificaciones obtenidas en un examen de

estadística en una clase de 40 estudiantes. Halle: la calificación promedio, la mediana y la

moda, para este conjunto de datos no agrupados

2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7

ACTIVIDAD DE APRENDIZAJE No. 3

Page 41: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

41 Ing. Wilson A. Velastegui. Ojeda. Msc

7 7 8 8 8 8 9 9 9 9 10 10

6.- a) Determine la media aritmética de los siguientes valores muestrales 5, 9, 4, 10

b) Demuestre que

4

10)(

ixx

7.- Determine el salario medio por hora pagado a carpinteros que obtuvieron los siguientes

pagos por hora: $ 15.40, $ 20.10, $ 18.75, $ 22.76, $ 30.67, $ 18.00

8.- Cual sería el valor modal que reportaría para un conjunto de observaciones si hay un

total de:

a) 10 observaciones y no hay dos valores iguales

b) 6 observaciones y todos son iguales

c) 6 observaciones y los valores son 1, 2, 3, 3, 4 y 4

Para los ejercicios 9 al 11, a) determine la mediana, y b) la moda

9.- Los siguientes datos representa el número de cambios de aceite para los últimos siete

días en el taller denominado Auto – car, localizado en la esquina de la calle Alvarado y Luz

E. Borja

41 15 39 54 31 15 33

10.- Los siguientes datos muestrales representan el cambio en porcentaje para el ingreso

neto del 2002 al 2003, en el caso de 12 compañías de construcción

5 1 - 10 - 6 5 12 7 8 2 5 - 1 11

11.- A continuación se presentan la edad de 10 personas en la tienda de videos en el centro

de la ciudad de Riobamba

12 8 17 6 11 14 8 17 10 8

Page 42: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

42 Ing. Wilson A. Velastegui. Ojeda. Msc

CUARTA UNIDAD: MEDIDAS DE

DISPERSIÓN

“No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)

OBJETIVOS:

Al término de esta unidad el estudiante estará en capacidad de:

Determinar la varianza, la desviación típica o estándar, la desviación media y la desviación mediana de datos no agrupados y agrupados.

Determinar la asimetría, el sesgo de la curva de distribución “curtosis”.

DESARROLLO DE CONTENIDOS

1.- MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS Y AGRUPADOS

La dispersión se refiere a la variabilidad o amplitud los datos dentro de un conjunto del cual

se este investigando.

Las medidas de dispersión o variabilidad se refieren a la dispersión o distanciamiento de los

datos con respecto a su media. Las más importantes son: varianza (S2), la desviación típica

o estándar (S), La desviación media (Dm), la desviación mediana (DMdn), los cuartiles,

deciles y percentiles

2.- VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS NO AGRUPADOS

2.1.- VARIANZA PARA DATOS NO AGRUPADOS

La varianza para datos no agrupados está dada por la siguiente fórmula:

1

.....

1

22

2

2

11

2

2

n

xxxxxx

n

xx

S n

n

i

1

2

1

2

2

n

xnx

S

n

i (Método abreviado)

Page 43: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

43 Ing. Wilson A. Velastegui. Ojeda. Msc

n

ixx

1

2 = Suma de la diferencia de cada valor del conjunto de datos menos la media

aritmética elevado al cuadrado.

n – 1 = número de datos de la observación menos uno.

Ejemplo: Dado el siguiente conjunto de datos no agrupados halle la varianza

82 85 86 87 87 89 89 90 91 91

92 93 94 95 95 95 95 95 97 98

99 99 100 100 101 101 103 103 103 104

105 105 106 107 107 107 109 110 110 111

La media aritmética es: 9.97x donde

40

1

2222 )9.97111(.........)9.9786()9.9782()(i

xx = 2379, 61

Por lo tanto la varianza es

39

61,2370140

)(2

40

1

2

i

xx

S = 61. 015

2.2.- DESVIACIÓN ESTÁNDAR PARA DATOS NO AGRUPADOS

DEFINICIÓN.- La raíz cuadrada más la varianza recibe el nombre de Desviación estándar

Del ejemplo anterior tenemos que la varianza es: S2 = 61.015

Desviación Estándar: S = 81.7015.61 = 7.81

3.- VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS

3.1.- VARIANZA PARA DATOS AGRUPADOS.- en fórmula esta dado por:

Page 44: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

44 Ing. Wilson A. Velastegui. Ojeda. Msc

1

1

2

2

n

xxf

S

k

ic

=

1

.....22

2

2

1

n

xxfxxfxxf ckcc

Ejemplo: Dado el siguiente conjunto de datos agrupados halle la varianza

Li – Ls Punto Medio

cx

f

ci Xf xxc 2xxf ci

82 – 86

87 – 91

92 – 96

97 – 101

102 – 106

107 – 111

84

89

94

99

104

109

3

7

8

8

7

7

252

623

752

792

728

763

13.75

8,75

3.75

1.25

6.25

11.25

567.1875

535.9375

112.5000

12.5000

273.4375

885.9375

TOTAL n = 40 3910

6

1

2

ici xxf 2387.5

75.9740

39101

n

XcfK

ii

x luego la varianza es:

39

5.23871

2

6

1

2

n

xxfi

i

S = 61.2179

3.2.- DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS.- La raíz cuadrada de

la varianza recibe el nombre de Desviación estándar, en fórmula esta dado por:

S=

1

...22

2

2

11

)(1

2

n

xxfxxfxxf ckccn

XXcfk

ii

Del ejemplo anterior la varianza es: S2 = 61.2179 por consiguiente la desviación estándar es

2179.61S

S = 7.824

Page 45: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

45 Ing. Wilson A. Velastegui. Ojeda. Msc

4.- DESVIACIÓN MEDIA PARA DATOS NO AGRUPADOS

La desviación media para datos no agrupados está dada por:

Dm =n

xxn

ii

1

Dm = Desviación media

xxi = valor absoluto de la diferencia entre cada dato de la muestra y la media.

n = Número de datos.

Ejemplo: Del siguiente conjunto da datos: Hallar la desviación media (D.m)

82 85 86 87 87 89 89 90 91 91

92 93 94 95 95 95 95 95 97 98

99 99 100 100 101 101 103 103 103 104

105 105 106 107 107 107 109 110 110 111

40

111110.....868582x 97.9

1.131.12.....9.119.129.15

9.971119.97110.....9.97869.97859.9782

1

1

n

ii

n

ii

xx

xx

n

ii xx

1 = 15.9 + 12.9 + 11.9 + …..+ 12.1 + 13.1 = 264.2

Por lo tanto: la desviación media es:

D m = n

xxn

ii

1 = 40

2.264 = 6. 605 = 6.61

5.- DESVIACIÓN MEDIANA PARA DATOS NO AGRUPADOS

Page 46: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

46 Ing. Wilson A. Velastegui. Ojeda. Msc

La fórmula de la desviación mediana para datos no agrupados en fórmula esta dado por

D Mdn=

n

MdnxMdnxMdnx

n

Mdnxn

n

ii

.....211

Ejemplo: Del mismo conjunto anterior hallamos la desviación mediana, Donde

La posición: Mdn = 2

1n =

2

41

2

140

= 20,5 esta entre el elemento 20 y 21

El elemento 20 es 98 y el elemento 21 es 99, el verdadero valor de la mediana es:

D Mdn = 2

9998 = 98.5 hallamos el valor de la desviación mediana

D Mdn=

40

5.981115.98110....5.98855.98821

n

Mdnxn

ii

= 5.92

6.- DESVIACION MEDIA PARA DATOS AGRUPADOS

La desviación media para datos agrupados esta dado por la siguiente fórmula:

D m =

n

xxfxxf

n

xxfckc

ci

.....1

Donde fi = es la frecuencia de cada clase

xxc = es la diferencia entre la marca de clase (punto medio) y la media.

Ejemplo: De la siguiente tabla de datos agrupados calcular la desviación media.

Li – Ls Punto Medio

cx f

ci Xf xxc xxf ci Fa *

82 – 86 87 – 91 92 – 96 97 – 101

102 – 106 107 – 111

84 89 94 99

104 109

3 7 8 8 7 7

252 623 752 792 728 763

13.75 8.75 3.75 1.25 6.25

11.25

3(13.75) = 41.25 7(8.75) = 61.25 8 ( 3.75) = 30.00 8 (1.25) = 10.00 7 ( 6.25) = 43.75 7 (11.25) = 78.75

3 10 18 26 33 40

TOTAL n = 40 3910 2656

1

ici xxf

Page 47: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

47 Ing. Wilson A. Velastegui. Ojeda. Msc

75.9740

39101

N

XcfK

ii

x la desviación media es D m =

n

xxf ci

= 40

265 = 6.625

6.- DESVIACIÓN MEDIANA PARA DATOS AGRUPADOS

La fórmula de la desviación mediana para datos no agrupados en fórmula esta dado por

D Mdn =

n

MdnxfMdnxfMdnxf

n

Mdnxfckcc

k

ici )(.....)()( 211

Ejemplo: De la tabla anterior de datos agrupados calcular la desviación mediana.

NOTA: La clave primero esta en dividir el número total de datos para dos, esto es:

2

n = 20

2

40 este valor se encuentra en la clase 3 o el intervalo 97 – 101

iL. = 96,5 iaf = 18 C = 106 – 101 = 5 mf = 8

Con estos datos hallamos la mediana

25,15,96

8

105,96)5(

8

25,96)5(5,96

8

1820

Mdn = 97.75

Aquí la mediana es igual a la media aritmética por lo que la desviación media es también

igual a la desviación mediana esto es:

D Mdn =

n

Mdnxfk

ici

1 = 40

265 = 6.625

OSERVACIÓN: No siempre va a ser igual la desviación media con la desviación

mediana en los demás problemas.

Page 48: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

48 Ing. Wilson A. Velastegui. Ojeda. Msc

Para los problemas del 1 al 5 calcule: a) la varianza, b) la desviación típica o estándar, c) la

desviación media y la desviación mediana, todos representan datos muestrales.

1.- Una muestra de archivos personales de 10 empleadas del Hospital General indicó que,

durante un período de de seis meses, no asistieron el siguiente número de días por

enfermedad: 6, 3, 0, 2 10, 2, 1, 4, 12, 7

2.- Cinco representantes de servicio al cliente de la empresa Electro Sony, que trabajaron el

último viernes, vendieron respectivamente 10, 8, 4, 3, 5, 6, 8 y 2 videograbadoras (VCR)

3.- El departamento de Estadística del INEC de la ciudad de Riobamba ofrece ocho cursos

de Estadística Básica. Los siguientes datos son el número de estudiantes inscritos en tales

cursos: 46, 52, 34, 28, 29, 41, 38 y 36

4.- Los siguientes datos representan las calificaciones obtenidas en la clase de Estadística

80, 83, 87, 85, 90, 86, 84, 82, 88

5.- El número de horas trabajadas por Angélica en los últimos meses fueron

52, 48, 37, 54, 48, 15, 42, 12

Para los problemas del 1 al 2 que representan datos agrupados calcule: a) la varianza, b) la

desviación típica o estándar, c) la desviación media, y la desviación mediana, todos

representan datos muestrales.

1.- La siguiente tabla representa el número de días al año en que los empleados de una

empresa manufacturera estuvieron ausentes del trabajo debido a una enfermedad. Además

responda a las siguientes preguntas:

a) ¿Cuántos empleados estuvieron ausentes menos de tres días al año?

b) ¿Cuántos lo estuvieron ausentes menos de seis días debido a la enfermedad?

ACTIVIDAD DE APRENDIZAJE No. 4

Page 49: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

49 Ing. Wilson A. Velastegui. Ojeda. Msc

Número de inasistentes

f

0 a 3 5

3 a 6 12

6 a 9 23

9 a 12 8

12 a 15 8

Total n = 50

2.- El contador en jefe de la empresa XX quiere preparar un informe acerca de las cuentas

por cobrar de la compañía. A continuación se presenta una distribución de frecuencias que

muestra la cantidad sobresaliente.

Cantidad f

0 a 2 000 4

2 000 a 4 000 15

4 000 a 6 000 18

6 000 a 8 000 10

8 000 a 10000 4

10 000 a 12 000 3

Total n = 54

5.- CUARTILES, DECILES Y PERCENTILES, PARA DATOS NO AGRUPADOS

Los cuartiles, deciles y percentiles se asemejan mucho a la mediana porque también

subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias

observadas.

Mientras la mediana divide un conjunto de datos en dos mitades, los cuartiles la dividen en 4

partes, los deciles la dividen en 10 partes y los percentiles la dividen en 100 partes.

Para los datos no agrupados, las fórmulas que se emplean son las siguientes:

CUARTILES:

Primero: Q1 = (N/4) + (1/2) Segundo: Q2 = (2N/4) +(172) Tercer: Q3 = (3N/4) + (1/2).

DECILES

Primero: (N/10) + (1/2) = D1 Segundo: (2N/10) + (1/2) = D2

Tercero: (3N/10) + (1/2) = D3 Cuarto: (4N/10) + (1/2) = D4

Quinto: (5N/10) + (1/2) = D5 Sexto: (6N/10) + (1/2) = D6

Page 50: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

50 Ing. Wilson A. Velastegui. Ojeda. Msc

Séptima: (7N/10) + (1/2) = D7 Octavo: (8N/10) + (1/2) = D8

Noveno: (9N/10) + (1/2) = D9

PERCENTILES

Primero: P1 = (N/100) + (1/2) Segundo: P2 = ( 2N/100) +(1/2)

………………………………………………………………………………………………

Diez P10 = ( 10N/100) +(1/2) Setenta = P70 = ( 70N/100) +(1/2)

Ochenta = P80 = ( 80N/100) +(1/2) Noventa = P90 = ( 90N/100) +(1/2)

Ejemplo: Del siguiente conjunto de datos hallar, los cuartiles, el decil segundo y decil

noveno, además hallar los percentiles décimo, veinticinco avo, setenta y cinco avo (75) y

noventa avo.

82 85 86 87 87 89 89 90 91 91

92 93 94 95 95 95 95 95 97 98

99 99 100 100 101 101 103 103 103 104

105 105 106 107 107 107 109 110 110 111

En este problema el número de datos es n = 40

CUARTILES

Q1 = (n/4) +(1/2) = (40/4) + (1/2) = 10 +0.5; Q1 = 2

183

2

9291

= 91.5

Q2= (2(40)/4) +(1/2) = 20+ 0.5 = 20.5 Q2 = 2

197

2

9998

= 98.5

Q3 = (3(40)/4) +(1/2) = 30+0.5 = 30.5 Q3 = 2

209

2

105104

= 104.5

DECILES

D1 = (2(40)/10) +(1/2) = 8+0.5 = 8.5 D1 = 2

181

2

9190

= 90.5

D9 = (9(40)/10) +(1/2) = 36+0.5 = 36.5 D9 = 2

206

2

109107

= 108.5

PERCENTILES

P10= (10(40)/100) +(1/2) = 4+0.5 = 4.5 P10 = 2

174

2

8787

= 74

Page 51: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

51 Ing. Wilson A. Velastegui. Ojeda. Msc

P25 = (25(40)/100) +(1/2) = 10+0.5 = 10.5 P25 = 2

183

2

9291

= 91.5

P75 = (75(40)/100) +(1/2) = 30 + 0.5 = 30.5 P75 = 2

209

2

105104

= 104.5

P90 = (90(40)/100) +(1/2) = 36+0.5 = 36.5 P90 = 2

216

2

109107

= 108

De todas estas medidas los más utilizados son los Percentiles:

DEFINICIÓN: Se llama recorrido intercuantil a la diferencia entre los percentiles 75 avo. Y

25 avo. En formula es: Recorrido intercuantil = P75 – P25

Del ejemplo anterior tenemos: Recorrido intercuantil = P75 – P25 = 104.5 – 91.5 = 13

DEFINCIÓN: Se llama recorrido interdecil a la diferencia entre los percentiles 90avo. Y 10

avo. En fórmula es: Recorrido interdecil = P90 – P10.

Del ejemplo anterior tenemos: Recorrido interdecil = P90 - P10 = 108 – 87 = 21

6.- CUARTILES, DECILES Y PERCENTILES PARA DATOS AGRUPADOS

Para hallar los cuartiles, deciles y percentiles de datos agrupados, basta recordar la fórmula

de la mediana para datos agrupados.

Esto Es: CLiMdnmf

ifN ])(2/[

Por lo tanto las formulas para los Cuartiles, deciles y percentiles son:

CUARTILES:

CLiQ

cuartilf

ifN.

)(4/

1

CLiQ

cuartilf

ifN.

)(4/2

2

CLiQ

cuartilf

ifN.

)(4/3

3

DECILES

CLiD

decilf

ifN.

)(10/

1

CLiD

decilf

ifN.

)(10/5

5

CLiD

decilf

ifN.

)(10/8

8

Page 52: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

52 Ing. Wilson A. Velastegui. Ojeda. Msc

CLiD

decilf

ifN.

)(10/9

9

PERCENTILES

Dentro de los percentiles los más utilizados son:

CLiP

percentilf

ifN.

)(10/

10

CLiP

percentilf

ifN.

)(10/25

25

CLiP

percentilf

ifN.

)(10/75

75

CLiP

percentilf

ifN.

)(10/90

90

Así tenemos lo siguiente:

Recorrido intercuantil = P75 – P25

Recorrido interdecil = P90 – P10.

Ejemplo: De la siguiente tabla determinar, el recorrido intercuantil y el recorrido interdecil

clase LIMITE DE CLASE FRECDUENCIA

fi

FRECUENCIA

ACUMULADA

1

2

3

4

5

6

82 – 86

87 – 91

92 – 96

97 – 101

102 – 106

107 – 111

3

7

8

8

7

7

3

110

18

26

33

40

Total n =40

CLiP

percentilF

ifN.

)(100/10

10

CLiP

percentilF

ifN.

)(100/25

25

Page 53: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

53 Ing. Wilson A. Velastegui. Ojeda. Msc

4100

400

100

)40(10

100

10

n(2da clase)

Li= 87; ( f)i = 3; f= 7; C=5

P 10 = 87 + (4-3/7) 5

P10 = 87 + (1/7) 5= 87+0.71

P10 = 87.71

10100

1000

100

)40(25

100

25

n(2da clase)

Li= 87; ( f)i = 3; f= 7; C=5

P 25 = 87 + (10-3/7) 5

P25 = 87 + (7/7) 5 = 87+5

P25 = 92

CLiP

percentilF

ifN.

)(100/90

90

90N = 3600=36 (6ta clase).

100

Li= 107; ( f)i = 33; f= 7.

P 90 = 107+ (36-33/7) 5

P90 = 107 + (3/7) 5= 107+2.14

P90 = 109.14

CLiP

percentilF

ifN.

)(100/10

10

75N = 3000=30 (5ta clase).

100

Li= 102; ( f)i = 26; f= 7.

P 75 = 102+ (30-26/7) 5

P75 = 102+ (4/7) 5= 102+2.85

P75 = 104.86

Recorrido intercuantil = P75 – P25 = 104.86 – 92 = 12.86 13

Recorrido interdecil = P90 – P10 = 109.14 – 87.71 = 21.43

EJERCICIO1: Dado el siguiente conjunto de datos no agrupados (20 datos)

Datos no ordenados Datos ordenados

40.2

26.9

44.2

31.7

29.3

28.7

32.3

36.8

35.6

99.8

55.2

45.2

88.2

35.6

50.6

25.1

42.9

37.8

25.4

39.7

25.1

25.4

26.9

28.7

29.3

31.7

32.3

35.6

35.6

36.8

37.8

39.7

40.2

42.9

44.2

45.2

50.6

55.2

88.2

99.8

Page 54: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

54 Ing. Wilson A. Velastegui. Ojeda. Msc

Calcular: el recorrido intercuantil y recorrido interdecil

P10= [10(20)/100 + 0.5 = 2 + 0.5 = 2.5; está entre el elemento 2 y 5 de los datos ordenados

P10= (25.4 + 26.9)/2 = 52.3/2 = 26.15

P25 = (29.3 + 31.7)/ 2 = 61/ 2 = 30.5

P75 = [75(20)/100) + 0.5 = 15 + 0.5 = 15.5; está entre el elemento 15 y 16

P75 = (44.2 + 45.2 / 2 = 89.4 /2 = 44.7

P90 = [90(20)/100) + 0.5 = 18+0.5 = 18.5; está entre el elemento 18 y 19

P90 = (88.2 + 55.2)/ 2 = 134.4/2 = 71.7

Recorrido intercuantil = P75 – P25 = 44.7 – 30.5 = 14.2

Recorrido interdecil = P90 – P10 = 71.7 – 26.15 = 45.55

EJERCICIO 2: Los siguientes datos agrupados representan los pagos por almacenamiento

para los 50 más grandes detallistas durante el año 2003. Hallar, la media, mediana, moda,

la varianza y la desviación típica

Li – Ls

f Xc fA Fi Xc Xc - X F1(Xc- X) (Xc- X)2 F1(Xc - X)2

1.10 - 1.86

1.87 - 2.63

2.64 - 3.40

3.41 - 4.17

4.18 - 4.94

4.95 - 5.71

5.72 - 6.48

6.49 - 7.25

4

14

11

9

7

1

2

2

1.48

2.25

3.02

3.79

4.56

5.33

6.10

6.87

4

18

29

38

45

46

48

50

5.92

31.5

33.22

34.11

31.92

5.33

12.20

13.74

1.88

1.11

0.34

0.43

1.20

1.79

2.76

3.51

7.52

15.54

3.74

3.87

8.40

1.97

5.48

7.02

3.176

1.024

0.059

0.276

1.684

4.277

8.139

13.017

12.704

14.336

.649

2.511

11.788

4.277

16.278

26.034

Total n=50 167.94 53.54 88.577

36.350

99.167

8

1

n

XcFI

I

X n/2 = 50/2= 25 está en la tercera clase

Li = 2.635 (

8

1

)i

if 18; fm=11

Page 55: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

55 Ing. Wilson A. Velastegui. Ojeda. Msc

C= 5.72 – 4.95 = 0.77

m

i

f

yfN

LiMdn

8

1

)2/

Mdn= = 2.635 + (25 –18)/11 (0.77) = 2.635 + (0.636)(0.77) = 2.635 + 0.49 = 3.125

La moda CLiModd

d21

1

d1 = 14 – 4 = 10 d2 = 14 – 11 = 3 Li = 1.865

5923.0865.113

7.7865.1)77.0(

310

10865.1

Mdn = 2.4573 = 2.46

la desviación media

5054.53

)(8

11

n

xXcfiDm = 1.0708

* La varianza

49577.88

1

)(2

28

11

n

xXcfiS = 1, 80769 = 1.81

* La desviación típica o estándar

808.11

)(8

1

2

n

XXcfi

i

S = 1.344 = 1.34

OBSERVACIÓN: Otros autores al límite inferior pueden tomar el mismo valor es decir Li =

2.64 y no restar 0.001, en nuestro caso: Li = 2.64 – 0.001 =2.635

7.- FORMA DE DISTRIBUCION DE FRECUENCIA

La forma de la distribución sobre conjuntos que tienen una sola moda (unimodales) se

refiere a: Su simetría o falta de ella (asimetría)

Page 56: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

56 Ing. Wilson A. Velastegui. Ojeda. Msc

La curtosis (la agudeza de su punta).

SIMETRIA.- Una distribución se dice que es simétrica cuando la media, mediana y la moda

son iguales, es decir

X = Mdn = Mo

Donde su asimetría es igual a cero.

Se dice que una distribución esta sesgada positivamente, si la cola derecha es más larga

que la cola izquierda

X > Mdn > Mo

Se dice que una distribución esta sesgada negativamente si la cola izquierda es más larga

que la cola derecha

Mo > Mdn > X

Esto se puede visualizar mediante el siguiente gráfico

La asimetría (Sk) puede medirse por el coeficiente de simetría de Pearson

Sk = 3(u – med) para poblaciones

Page 57: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

57 Ing. Wilson A. Velastegui. Ojeda. Msc

Sk = 3(X – med) para muestras.

SP

La asimetría puede medirse también por el tercer momento respecto a la media y se puede

hallar también mediante las siguientes fórmulas:

3

3

1

)(

xnk

i

i

Sk para poblaciones

3

3

1

)(

s

xxfik

i

i

Sk

para muestras.

Donde, u3 es el tercer momento central;

Si u3 < 0, se dice que la distribución es asimétrica negativamente

Si u3 > 0, se dice que la distribución es asimétrica positivamente

Si u3 = 0, se dice que la distribución es simétrica.

CURTOSIUS.- La curtosis estudia la puntiagudez de la curva

Una curva de punta aguda se llama leptocúrtica.

Una curva de punta atachada se llama platircúrtica

Una curva que se encuentra entre la leptocúrtica y platicúrtica se llama mesocúrita (ver fig.)

La curtosis puede medirse por el cuarto momento respecto a la media dividido por la

desviación estándar elevada a la cuarta potencia. Es fórmula es:

4

4

1

)(

xnk

i

i

Sk para poblaciones

4

4

1

)(

s

xxfik

i

i

Sk

para muestras.

Donde, u2 es el cuarto momento central

La curtosis para una curva leptocúrtica >3

La curtosis para una curva mesocúrtica = 3

La curtosis para una curva platicúrtica < 3

Page 58: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

58 Ing. Wilson A. Velastegui. Ojeda. Msc

Coeficiente de Pearson: 5

)(3 MdnxP

Si P < 0, los datos están sugados a la izquierda

Si P > 0, los datos están sugados a la derecha

Si P = 0, los datos están distribuidos normalmente.

TEOREMA DE CHEBYSHEY: Afirma que al menos un dato (observaciones) de un conjunto

se encuentra en yKkk

1,1 2

1 desviación típica de la media.

Coeficiente de variación: Mide el grado de dispersión de un conjunto de datos en relación

con su media.

)100(5x

CV

Page 59: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

59 Ing. Wilson A. Velastegui. Ojeda. Msc

INSTRUCCIÓN: Señale con una (x) la(s) alternativa(s) verdadera(s) que correspondan a

cada pregunta.

1.- Las medidas de tendencia central son valores:

a) Que ocupan el centro de una serie ordenada

b) Con los cuales se separan los datos con respecto a su media.

c) Hacia los cuales tienden a acercase o alejarse los demás valores de la serie.

d) Que resultan de multiplicar las desviaciones para el número de casos.

2.- La media aritmética es el valor promedio que resulta de:

a) Multiplicar la sumatoria de valores por el número total de casos.

b) Dividir la suma de las desviaciones para el número de casos.

c) Dividir un conjunto de valores para el número total de los mismos.

d) Ninguna de las proposiciones anteriores.

3.- La fórmula N

fX cX

se la utiliza para hallar la media aritmética de:

a) Una serie estadística b) Una serie estadística de intervalo

c) Una serie estadística de frecuencia d) Datos agrupados

4.- La mediana de la siguiente serie de datos: 19, 15, 18, 16, 17 es:

a) 18 b) 17

c) 16 d) Ninguno de los valores anteriores.

5.- La fórmula 2NMdn se la utiliza para:

a) Determinar el valor de la mediana

POS - TEST

Page 60: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

60 Ing. Wilson A. Velastegui. Ojeda. Msc

b) Encontrar el valor que más se repite en la serie

c) Determinar la posición de la mediana

d) Encontrar el valor de la mediana de una serie estadística

6.- Señale cual de las siguiente medidas individuales es equivalente a la mediana.

a) El percentil 25 b) El segundo cuartil

c) El cuarto decil d) Ninguna de las anteriores

7.- El modo de la siguiente serie estadística es:

X f

145 12

144 10

143 15

142 14

141 9

Total n = 46

a) 14.5 b) 15 c) 143 d) Ninguna de las anteriores

8.- Señale cuál de las siguientes proposiciones es verdadera

a) La media geométrica es la raíz cuadrada del producto de los valores de la

variable

b) La media geométrica es el valor recíproco de la media aritmética.

c) El modo es el valor que se presenta con más frecuencia en el conjunto

d) Ninguna de las anteriores

9.- La media geométrica se la puede aplicar para:

a) Hallar en economía el costo promedio

b) Obtener un promedio exacto de una progresión geométrica

c) Para calcular la desviación típica

d) Hallar promedios de velocidades

10.- Identifique cuál de las siguientes medidas son de dispersión

Page 61: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

61 Ing. Wilson A. Velastegui. Ojeda. Msc

a) Modo b) Varianza

c) Mediana d) Desviación típica

PRUEBA DE ENSAYO

INSTRUCCIONES: Esta prueba consta de seis problemas en las cuales es preciso que

escriba todo el procedimiento

1.- Determine la media aritmética y desviación media de la siguiente serie estadística

X f

66 – 70 16

61 – 65 20

56 – 60 12

51 – 55 22

46 – 50 10

Total n = 80

2.- Si la edad de los profesores de un colegio es la que está en la siguiente tabla: Calcular la

mediana:

X f

26 – 30 25

31 – 35 32

36 – 40 24

41 – 45 15

46 – 50 10

51 – 55 9

Total n = 115

3.- Determine la desviación media de la siguiente tabla ordenada pero no agrupada

Peso en KG. f

60 5

61 8

62 12

63 25

64 16

65 4

Total n = 70

Page 62: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

62 Ing. Wilson A. Velastegui. Ojeda. Msc

4.- Determine la desviación típica de la serie estadística que se encuentra registrada en el

siguiente cuadro estadístico

Descendente Ascendente

EDADES f EDADES f

51 – 57 12 16 – 22 10

44 – 50 21 23 – 29 14

37 – 43 35 30 – 36 26

30 – 36 26 37 – 43 35

23 – 29 14 44 – 50 21

16 – 25 10 51 – 57 12

Total n=118 Total n = 118

5.- En la siguiente serie estadística de intervalos: Determine. El promedio, la mediana y la

moda, para este conjunto de datos agrupados

x F

120 – 125 114 – 119 108 – 113 102 – 107 96 – 101 90 – 95

5 7 10 9 15 4

Total n = 50

6.- De Ia tabla siguiente: Determine. El promedio, la mediana y la moda, para este conjunto

de datos agrupados.

Li – Ls f

19,2 – 19,4 1

19,5 – 19,7 2

19,8 – 20,0 8

20,1 – 20,3 4

20,4 – 20,6 3

20,7 – 20,9 2

TOTAL n = 20

7.- Si la media aritmética es 7 y la varianza es 20, de los datos, X1, X2, X3,…..,Xn. Calcular la

media aritmética de las 223

22

21 ..,,.........,, nXXXX . Rpta. 69

SUGERENCIA: Utilice las siguientes expresiones.

n

xxxx

n

X

X n

n

ii

.....3211

n

xxxxxx

n

xx

S n

n

i

22

2

2

11

2

2 .....

8.- Dos marcas competidoras de calzado para corredores se sometieron a una prueba para

comprobar el desgaste del calzado. Cada una de ellas indicó el siguiente número de horas

de uso necesarios para que se detecte un desgaste significativo.

Page 63: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

63 Ing. Wilson A. Velastegui. Ojeda. Msc

Marca A Marca B

97 78

83 56

75 87

82 54

98 89

65 65

75

n = 7 n = 6

a) ¿Qué calzado parece presentar menor desgaste? b) ¿Qué calzado parece tener el programa de control de calidad que produce u8n

desgaste más uniforme?

Page 64: APUNTES DE ESTADISTICA DESCRIPTIVA

Estadística Descriptiva

64 Ing. Wilson A. Velastegui. Ojeda. Msc

BIBLIOGRAFIA

ALLEN L. WEBSTER: Estadística Aplicada para la Administración y Economía, IRWIN, 1999.

ALLISON, D. E. 1970: “Test anxiety, stress y intelligence perfomance” Sxiencia, 2

CONOVER, W. J y otros 1974: “Some reasons for not using the ytes”.

DIXON, W. J. Y F. J. MASSER, 1980: Introduction to statical Analysis (4ta. Ed.) Nueva York: McGrawHill. FRENCH, J. W. 1946: “Efects of anxiety on verbl and mathematical examination scores”, Educational and Bychological Mea surement, 22, 553 – 564. BURSTEIN, H. 1971: Ttribute Sampling: Tables and Ex Planations o Tubles for Determinig confidence limits and smple sizes based on close aproximations of the binomial distribution.

KENNETH D. HOPKINS y B.R. HOPKINS: Estadística Básica. México 1997 Ingramex. GEORGE CANAYOS: Probabilidades y Estadística. México 1992. McGrawHill

MASON/LIND/MARCHAL: 10ª Edición: Estadística para Administración y Economía 2003