Material de apoyo para extraordinario

48
Probabilidad y Estadística MATEMÁTICAS VI 1 g.f.s. Material de apoyo para extraordinario

Transcript of Material de apoyo para extraordinario

Page 1: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

1 g.f.s.

Material de apoyo

para extraordinario

Page 2: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

2 g.f.s.

CONCEPTOS DE ESTADÍSTICA

INTRODUCCIÓN

En la vida cotidiana se presentan fenómenos que requieren del empleo de una serie de tablas, medidas,

gráficas, de su análisis e interpretación para comprenderlos, lo cual nos lleva a plantearnos una serie de

interrogantes donde para poder responderlas la Estadística día a día va ganando mayores adeptos,

convirtiéndose en un método efectivo para describir con exactitud los valores y datos de situaciones

problemáticas de las distintas ciencias agrícolas, biológicas, de salud, económicas, educativas, físicas,

políticas, psicológicas, sociales, etcétera.

Se llama Estadística a la rama de las matemáticas que se sirve de un conjunto de métodos, normas, reglas y principios para la observación, toma, organización, descripción, presentación y análisis del comportamiento de un grupo de datos para la conclusión sobre un experimento o fenómeno.

Clasificación de la Estadística La estadística tiene básicamente dos divisiones: La Estadística Descriptiva: es la parte de la Estadística que estudia las técnicas y métodos que sirven para la observación, toma, organización, descripción, presentación y análisis de datos. La Estadística Inferencial: es la parte de la Estadística mediante la cual se intenta dar explicación, concluir o inferir sobre los experimentos y fenómenos observados, mediante el auxilio de la probabilidad, estadística descriptiva y distribución de probabilidad, por lo que resulta una herramienta de suma utilidad para la toma de decisiones. Ejemplo 1: como ejemplo podríamos citar el caso de un sociólogo, quien pudiera estar interesado en averiguar si entre las 750,000 personas que conducen automóviles son más agresivos los conductores hombres o mujeres. Para la realización de este experimento, y debido al gran número de personas que habría de sondear, queda fuera de consideración el hecho de observar a todos los conductores de automóvil. Por lo que sería necesario estudiar sólo un pequeño grupo de ellos (muestra), siendo ésta la parte que le corresponde a la estadística descriptiva: El hecho de observar a los conductores, tomar y anotar los datos de forma organizada, hacer una descripción del carácter y sexo del individuo observado, hacer una presentación de los datos obtenidos y, por último, analizar los resultados de la muestra. Sin embargo, al estar en observación sólo un grupo representativo de conductores, cabe la posibilidad de que las conclusiones a las que se pudieran llegar no sean tan precisas y podría no tenerse la certeza de que se ha tomado la inferencia correcta. Es aquí donde entra en juego la estadística inferencial, al considerarse como una ayuda para la toma de decisiones cuando las condiciones de certidumbre están en juego. La estadística inferencial nos proporciona los métodos que nos permiten estimar el grado de confiabilidad de las conclusiones. Por lo que en cada proposición estadística hecha, se debe indicar la probabilidad de ocurrencia de los actos observados o descubrimientos hechos para así tomar decisiones que sean aplicables a todos los conductores de automóviles. Definiciones. Se le llama Población a la cantidad total de cualquier conjunto completo de datos, objetos, individuos o resultados que tengan alguna característica en común que se va a observar o analizar en un problema o experimento. Denotaremos al tamaño de la población por “N”. En nuestro ejemplo 1 se considera como población a todos los conductores de automóviles. Así: N = 750,000

Page 3: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

3 g.f.s.

El significado estadístico que se le da al término población es más amplio que el usual, ya que puede referirse a actos, áreas geográficas, cosas, datos, objetos, individuos, resultados, e incluso a temperaturas o tiempos. Se le llama Muestra a cualquier subconjunto de elementos de la población. El interés de la Estadística es proporcionar métodos que permitan elegir una muestra de datos representativos destinado a suministrar información a cerca de una población, teniendo como característica fundamental que todos sus elementos deben tener todas las características de la población. Denotamos al tamaño de la muestra por “n”. En nuestro ejemplo una muestra podría ser: 500 semiconductores elegidos al azar, en este caso n=500. La muestra y sus características dependen del criterio del muestreo empleado para su determinación. Sin embargo, para que una muestra sea representativa de la población, ésta deberá contener aproximadamente entre el 5 % y el 10 % de los datos de la población cuando ésta es finita, además los elementos de la muestra deben ser escogidos al azar (a la suerte) y se deben observar todas las características que se observan en la población. Se le llama Variable a la cualidad o cantidad medible de cualquier suceso o acción que presente o experimente un cambio, la podemos representar mediante un símbolo (X, Y, Z, α, β, γ, δ) y al cual se le puede asignar un valor cualquiera de un conjunto determinado de datos. Le llamamos Variable Aleatoria a aquella variable cuyos cambios no pueden ser determinados antes de que estos se presenten; es decir, están destinados a la suerte. También se le conoce como Variable Probabilista, Cabalística, de Azar o a la Suerte. Tipos de variables Para su estudio, las variables aleatorias se han clasificado según la naturaleza de los valores que toman en: Variables Numéricas y Variables Categóricas. Variables Numéricas o Cuantitativas: son aquellas que se identifican o se les puede asignar un valor numérico o que corresponden a aspectos que son medibles. Ejemplo: Tiempo de uso, precio, tamaño, velocidades, número de hijos de una familia, número de carros que circulan por determinada calle, alturas, pesos, tallas, temperaturas, tiempo de vida de una persona, cantidad de azúcar para endulzar un café, medida de sombreros, etcétera. Las variables numéricas se dividen en:

Variables Numéricas Discretas: son aquellas que solamente toman valores enteros con rango finito, Ejemplo: Número de hijos en cada familia de una colonia de la ciudad, talla de calzado de cada alumno de un grupo escolar, la cantidad de alumnos por grupo, etc.

Variable Numérica Continua: son aquellas que pueden tomar cualquier valor entre dos valores dados. Es decir, el rango contiene no sólo valores enteros sino un intervalo (finito o infinito) de valores reales (esto es, que puede ser fraccionario, decimal o irracional). Ejemplo: El tiempo de vida de una persona, la cantidad de azúcar para endulzar un café, el nivel de hemoglobina de los habitantes de una colonia, la temperatura ambiental durante un día, etcétera.

Variables Categóricas o Cualitativas: son aquellas a las que no se les puede asignar o identificar con un valor numérico, sino con un aspecto, cualidad o característica que las distinga y que no se pueden medir sino solo observar, a ese aspecto, cualidad o característica se le llama categoría, Ejemplos: Marca, tipo de sangre, deporte preferido, el estado en general de cualquier cosa, idioma, nacionalidad, colores, cabello o piel, himnos nacionales, sexo, estado de ánimo, clima, etcétera. En las variables categóricas, un elemento no puede estar en dos o más categorías a la vez, lo cual las hace excluyentes y además no puede haber elementos de la población que no pertenezcan a alguna categoría, lo cual las hace exhaustivas. Las variables categóricas se dividen en:

Page 4: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

4 g.f.s.

Variables Categóricas Nominales: son aquellas a las que no se les puede asignar un orden, es decir que sólo permite clasificación en categorías por mención de ésta. Ejemplo: La nacionalidad de una persona, idioma, sexo, himnos nacionales.

Variables Categóricas Ordinales: son aquellas que además de clasificar a los elementos en distintas categorías les podemos asignar un orden o que podemos ordenar de acuerdo a cierta característica. Por ejemplo: El estado de salud de una persona; que podemos ordenarla según la urgencia del caso, el color de algún objeto según la tonalidad desde muy clara a más oscuro; que podemos ordenarlo de acuerdo a la intensidad del color, el grado militar, puesto en la empresa, día de la mamá, meses del año, etcétera.

INTRODUCCIÓN Tablas y gráficas de Frecuencias En este tema fundamental aprenderás a agrupar los datos para facilitar los cálculos de los estadígrafos. Para lo cual se te pide que desarrolles la siguiente: TAREA EJERCICIOS DE TABLAS Y GRÁFICAS DE FRECUENCIA I: Datos no agrupados (Por datos diferentes o ponderados). 1. Se visitaron 25 empresas citrícolas de una cierta zona y en cada una se anotó la cantidad de plantas atacadas por un cierto hongo, de lo cual resultaron los siguientes datos: 15, 20, 25, 15, 18, 16, 17, 18, 20, 18, 18, 18, 19, 16, 17, 19, 16, 17, 17, 17, 19, 18, 19, 18, 15 a) Construya una tabla de frecuencias correspondiente a este ejercicio. b) Construya el histograma o gráfica de barras según sea el caso. II: Datos agrupados por intervalos de clase 2. Los resultados siguientes representan las calificaciones del examen final de un curso de estadística elemental.

23 60 79 32 57 74 52 70 82 36

80 77 81 95 41 65 92 85 55 76

52 10 64 75 78 25 80 98 81 67

41 71 83 54 64 72 88 62 74 43

60 78 89 76 84 48 84 90 15 79

34 67 17 82 69 74 63 80 85 61

a) Determina la tabla de distribución de frecuencias b) El histograma y polígono de frecuencias

PROCESO

Ejemplo demostrativo 1. Se preguntó a un grupo de alumnos de primer año del Cobach Plantel Huatabampo, por la asignatura de su preferencia, arrojándose los siguientes resultados:

Page 5: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

5 g.f.s.

Tabla completa:

Ejemplo demostrativo 2. Cierta universidad realizó un experimento sobre el coeficiente intelectual (C.I.) de sus alumnos, para lo cual aplicó un examen de C.I. a un grupo de 20 alumnos escogidos al azar, obteniendo los siguientes resultados:

119, 109, 124, 119, 106, 112, 112 , 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112,106. Toda vez que se tienen los datos, se ordenan de menor a mayor o viceversa. 106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124

Page 6: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

6 g.f.s.

Tabla Completa:

Gráfica de barras:

Gráfica circular:

Gráfico de menor a mayor dato Gráfico circular de mayor a menor porcentaje Ejemplo de Tablas y gráfica de frecuencias. Datos agrupados por intervalos de clase. Ejemplo 1: Un grupo de investigadores pertenecientes a la secretaría de seguridad pública, tomó una muestra aleatoria de las velocidades (km/h) registradas por 30 vehículos en el trayecto Hermosillo – Ures, con el fin de establecer nuevos límites máximos de velocidad para una carretera. La muestra arrojo los datos siguientes:

Page 7: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

7 g.f.s.

90, 99, 104, 99, 119, 98, 95, 112, 95, 120, 100, 90, 116, 96, 114, 108, 98, 118, 100, 106, 114, 100, 112, 106, 100, 115, 111, 105, 114, 97 Toda vez que se tienen los datos, se recomienda ordenarlos de menor a mayor o viceversa 90, 90, 95, 95, 96, 97, 98, 98, 99, 99, 100, 100, 100, 104, 105, 106, 108, 111, 112, 112, 114, 114, 115, 116, 118, 119, 120 Ahora llevamos a la práctica los pasos descritos anteriormente para la construcción de los intervalos. Primero obtendremos el número de intervalos que vamos a utilizar, para lo cual empleamos la Regla de Sturges: K = 1 + 3.3Log (30) = 1+ 3.3 (1.4771212547) =1+ 4.87 = 5.87 ≈ 6 Segundo, calculamos el rango de variación, R = 120 – 90 = 30 Tercero, obtenemos la amplitud de cada intervalo de clase como sigue:

Finalmente construimos los intervalos, el primero de ellos inicia con 90 que es el extremo inferior que, sumado a 5 obtenemos 95, que será el extremo superior; este extremo será el inferior del segundo intervalo; y al sumar nuevamente la amplitud tendremos 100 que será el extremo superior y así sucesivamente hasta completar los 6 intervalos., que se muestran enseguida: [90 – 95), [95 – 100), [100 – 105), [105 – 110) [110 – 115) y [115 – 120] Los corchetes expresan que el valor extremo se incluye en el intervalo y los paréntesis dan a entender que el valor extremo del intervalo no se incluye en el. Para la construcción de distribuciones de frecuencias contabilizamos el número de datos que le corresponden a cada intervalo; es decir obtenemos las frecuencias absolutas y de estas podemos generar los demás tipos de frecuencias y presentarlas en una tabla de resumen como la que a continuación se muestra:

Page 8: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

8 g.f.s.

Histograma:

Polígono de frecuencia:

Page 9: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

9 g.f.s.

Gráfica de Frecuencias Acumuladas u Ojiva:

Conceptos para tablas y gráfica de frecuencias para datos no agrupados y agrupados. Frecuencia absoluta, absoluta acumulada, relativa y relativa acumulada. Frecuencia Absoluta de un dato es el número de veces que se repite ese dato, también se presenta la frecuencia absoluta de un intervalo que se refiere al número de datos que pertenecen a ese intervalo. La denotaremos por f . Frecuencia Absoluta Acumulada: Hasta un dato específico, es la suma de las frecuencias absolutas de todos los datos anteriores, incluyendo también la del dato mismo del cual se desea su frecuencia acumulada. De un intervalo es la suma de las frecuencias absolutas de todos los intervalos de clase anteriores, incluyendo la frecuencia del intervalo mismo del cual se desea su frecuencia acumulada. La denotaremos por fa . La última frecuencia absoluta acumulada deberá ser igual al número total de datos. Frecuencia Relativa: De un dato, se obtiene al dividir la frecuencia absoluta de cada dato entre el número total de datos. De un intervalo se obtiene al dividir la frecuencia absoluta de cada intervalo entre el número total de datos. La denotamos por fr . Frecuencia Relativa Acumulada: Hasta un dato específico, es la suma de las frecuencias relativas de todos los datos anteriores, incluyendo también la del dato mismo del cual se desea su frecuencia relativa acumulada. De un intervalo es la suma de las frecuencias relativas de todos los intervalos de clase anteriores incluyendo la frecuencia del intervalo mismo del cual se desea su frecuencia relativa acumulada, La

denotaremos por f ra. La última frecuencia relativa acumulada deberá ser igual a la unidad. Datos no agrupados Datos diferentes: Consideraremos como un dato diferente, a cada uno de los distintos datos que se presentan en la muestra, los denotaremos por xi. Y al número total de datos diferentes lo denotaremos por m. Datos no Agrupados: Cuando el tamaño de la muestra (n) es finito y el número de datos diferentes es pequeño (consideraremos pequeño k ≤ 10), es fácil hacer un análisis de los datos tomando cada uno de los datos diferentes y ordenándolos tomando en consideración la tabla 2.1.1.

Datos agrupados Datos Agrupados: Cuando el tamaño de la muestra es considerable o grande y los datos numéricos son muy diversos (n>15), conviene agrupar los datos de tal manera que permita establecer patrones, tendencias o

Page 10: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

10 g.f.s.

regularidades de los valores observados. De esta manera podemos condensar y ordenar los datos tabulando las frecuencias asociadas a ciertos intervalos de los valores observados. Intervalos de Clase: Son los intervalos en los que se agrupan y ordenan los valores observados. Cada uno de estos intervalos está delimitado (acotado) por dos valores extremos que les llamamos límites. Pasos a seguir para construir intervalos de frecuencia. 1. Determinar la cantidad de intervalos apropiada. La selección del número adecuado de intervalos y los límites entre ellos dependen del criterio o experiencia de quien realiza el estudio. Sin embargo, existen reglas empíricas para calcular el número de intervalos; la más empleada es la Regla de Sturges, cuya expresión es: K= 1 + 3.3 Log n Donde: K=Número de intervalos el cual siempre debe ser un número entero. Razón por la cual se deberá redondear el resultado al entero más cercano. n= Número de datos. Log = logaritmo en base 10. Otra regla utilizada es la de Velleman que establece que el número de Intervalos se obtiene de la raíz cuadrada del número de datos; es decir K= n , recomendable para tamaños de muestra pequeños (n< 50). El número de intervalos determinado mediante cualquier regla se aproxima al valor entero más cercano pero deberá ser responsabilidad de quien realiza el estudio, pudiendo utilizar éste en ocasiones uno menor o mayor al obtenido por cualquier regla, si esto le permite tener intervalos con la misma amplitud. Sin embargo, la mayoría de las reglas subestiman el número de intervalos. 2.- Calcular el rango de los datos. Llamamos rango al número de unidades de variación presente en los datos recopilados y se obtiene de la diferencia entre el dato mayor y el dato menor. Se representa con la letra R . R = dato mayor – dato menor. 3.- Obtención de la amplitud o anchura que tendrá cada intervalo. Se encuentra dividiendo el rango por el número de intervalos. Se representa con la letra A de tal manera

que:

4.- Construcción de los intervalos. Los intervalos de clase son conjuntos numéricos y deben ser excluyentes y exhaustivos; es decir, si un dato pertenece a un intervalo determinado, ya no podrá pertenecer a otro, esto quiere decir excluyentes y además todos y cada uno de los datos deberá estar contenido en alguno de los intervalos, esto les da el valor de exhaustivos. Las dos caracteres mencionadas anteriormente se logran construyendo intervalos cerrados por la izquierda y abiertos por la derecha; esto se simboliza a través del uso de corchetes y paréntesis respectivamente. Por razones naturales, el último intervalo será cerrado por ambos extremos.. El primer intervalo se construye de la siguiente manera: Habrá de iniciar con el dato menor, el cual será el extremo inferior del intervalo; el otro extremo se obtiene de la suma del dato menor y la amplitud, con este mismo valor iniciamos el segundo intervalo, del cual el segundo extremo se encuentra sumando al valor anterior la amplitud y este proceso se repite sistemáticamente hasta completar el total de intervalos indicado por la regla elegida, por ejemplo la de Sturges.

Page 11: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

11 g.f.s.

Los valores extremos o límites de intervalo. Los intervalos de clase deben estar definidos por límites que permitan identificar plenamente si un dato pertenece a uno u otro intervalo. Estos límites son los valores extremos de cada intervalo. Límite inferior: Es el extremo menor de cada intervalo y lo denotaremos por Li . Límite superior: Es el extremo mayor de cada intervalo y lo denotaremos por Ls.. También será muy útil conocer y calcular la Marca de Clase de cada intervalo: Se refiere al Punto Medio del intervalo y a través de él representaremos a todo el intervalo, lo denotaremos por MC y una de las maneras de calcularla es promediando los valores límite de cada intervalo, es decir:

Representación gráfica Toda vez que se ha hecho el análisis de frecuencias, existe en estadística, un conjunto de imágenes gráficas, las cuales combinando distintos tipos de colores, sombreados, puntos, líneas, símbolos, números o texto, etcétera, y un sistema de referencia (coordenadas), nos permite la representación en forma más resumida y total del experimento o fenómeno en estudio. Los gráficos son muy útiles como apoyos e incluso sustitutos de las tablas o distribuciones y como una herramienta para el análisis de los datos, lo que los convierte, en el medio más efectivo para la presentación, descripción, resumen y análisis de la información. Aquí abordarán los gráficos estadísticos como un vehículo de presentación y herramienta de análisis que permita observar tendencias presentes en los datos obtenidos al realizar un estudio. Una manera sencilla de diferenciar los segmentos es sombreándolos de claro a oscuro, siendo el de mayor tamaño el más claro y el de menor tamaño el más oscuro. Presentación de Datos: Después de la Organización de los datos y su presentación en Tablas Estadísticas, la información contenida en una tabla estadística también se puede presentar mediante graficas, siendo las más comunes para variables discretas (datos no agrupados) las de: Barras y circulares o de pastel; y para variables continuas (datos agrupados) el histograma, polígono de frecuencias y ojiva. Estos gráficos no son los únicos para la presentación y análisis de datos estadísticos, pero si los más comunes y utilizados. Gráfica de Barras: es un método gráfico que consta de dos ejes: Uno horizontal, en el que se representan los valores (Eje de los datos) utilizando barras verticales en forma rectangular y de la misma amplitud, y un eje vertical, en el cual la frecuencia representa la altitud que tendrá la barra rectangular (Eje de las frecuencias), las barras van separadas la misma distancia unas de otras y para distinguirlas puede utilizarse distintos colores o entramados según se considere. Gráfica Circular de Pastel o también llamada del 100%: este gráfico se utiliza fundamentalmente, para representar distribuciones de frecuencias relativas (es decir, porcentajes % o proporciones) haciendo corresponder la medida de la frecuencia relativa con la medida del ángulo en grados; es decir, si el 100 % de los datos, son 360º de la circunferencia, a cada 1% le corresponderán 3.6º; así, para obtener la medida del ángulo del sector, multiplicamos la frecuencia correspondiente por 3.6º. Al utilizar este gráfico se aconseja no sobrepasar los 10 elementos, y ordenar los sectores de acuerdo a una de dos formas, ya sea siguiendo el orden que se les dé a los datos o empezando del mayor al menor segmento, iniciando a partir de las 12 horas y en el sentido de las manecillas del reloj. Por último, si el texto que representa cada sector no puede colocarse dentro del mismo, se elabora una leyenda que se coloca fuera del segmento, unidos por una flecha.

Page 12: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

12 g.f.s.

Histograma: es una grafica en forma de barras que consta de dos ejes, uno horizontal, llamado eje de la variable en observación, en donde situamos la base de una serie de rectángulos o barras contiguas; es decir, que no van separadas, y que se rotula con los límites inferiores de cada clase o intervalo excepto el último que deberá llevar también el límite superior, centradas en la marca de clase. Y un eje vertical llamado eje de las frecuencias, en donde se miden las alturas que vienen dadas por la frecuencia del intervalo que representa. Todos los intervalos deben tener la misma longitud.

Polígono de Frecuencias: es una gráfica del tipo de las gráficas de líneas trazadas sobre las marcas de clase, (de ahí el nombre de polígono), y se traza uniendo con segmentos de recta, de izquierda a derecha, las parejas ordenadas que se forman, al considerar como abscisa la marca de clase (eje horizontal) y como ordenada la frecuencia del intervalo representado (eje vertical); la primera y última parejas ordenadas se unen mediante un segmento de recta al eje horizontal, con las que serían la marca de clase anterior y posterior respectivamente si estas existieran. Este tipo de gráfico adquiere mayor importancia cuando se quiere mostrar en un mismo gráfico más de una distribución o una clasificación cruzada de una variable continua con una discreta, situación que no se puede observar en uno de los gráficos presentados anteriormente por la forma de construcción del mismo gráfico.

Gráfica de Frecuencias Acumuladas u Ojiva: Es un gráfico que igual al histograma y polígono de frecuencias se utiliza para el análisis y representación de variables continuas, sólo que en vez de utilizar las frecuencias absolutas, por sus características se construye uniendo con segmentos de recta, de izquierda a derecha, las parejas ordenadas que se forman, al considerar como abscisa los límites superiores de cada intervalo (eje horizontal) y como ordenada las frecuencias relativas acumuladas hasta cada intervalo representado (eje vertical). Existen dos tipos de ojivas, las llamadas de mayor que, iniciando en la frecuencia más alta 1 hacia la más baja 0 y las llamadas de menor que, iniciando en la frecuencia más baja 0 hacia la más alta 1. El gráfico ojiva representa mayor importancia cuando se trata de comparar las observaciones de una misma característica en dos experimentos distintos, ya que no se puede ejecutar comparaciones sobre frecuencias absolutas, es necesario una comparación sobre frecuencias relativa; además permite ver cuantas observaciones se hallan por arriba o debajo de ciertos valores establecidos.

MEDIDAS DE TENDENCIA CENTRAL En este tema fundamental aprenderás a determinar la media, mediana y moda para datos no agrupados y datos agrupados en intervalos de frecuencia. Para esto desarrolla la siguiente:

TAREA EJERCICIOS DE MEDIDAS DE TENDENCIA CENTRAL Ejercicio 1 Datos no agrupados Instrucciones: en los siguientes ejercicios determina lo que se pide: 1. Hallar la media aritmética de los siguientes valores: 5, 7, 8, 10, 15. 2. Si las calificaciones de un alumno en las distintas asignaturas de un curso durante una evaluación fueron: 7, 5, 6.5, 3.7, 5, 6.2. ¿Qué promedio obtuvo el alumno? 3. La media de 6 elementos se sabe que es 10. Sabiendo que cinco de ellos son: 8, 12, 13, 5 y 9, hallar el elemento que falta. Ejercicio 2 Instrucciones: Determinar la mediana para el siguiente conjunto de datos:

Page 13: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

13 g.f.s.

a) 5, 6, 9, 11, 15, 19, 23, 26, 27. b) 5, 7, 10, 15, 20, 21, 24, 27. c) Las calderas de una planta de energía de vapor a alta presión tuvieron las siguientes eficiencias en porcentajes: 90.3, 91.6, 90.9, 90, 90.3, 91.0, 87.9, 89.4. ¿Cuál es el significado de la mediana en este caso? Ejercicio 3 Determina la moda de: 1. En una cierta ciudad se ha tomado una muestra representativa del total de familias que en ella viven y se ha anotado el número de hijos de cada una. Los valores de esta variable son los siguientes: 0, 1, 0, 4, 2, 2, 1, 2, 3, 2,3, 2, 1, 3, 4, 2, 2, 3, 2, 1 2. Se visitaron 25 empresas citrícolas de una cierta zona y en cada una se anotó la cantidad de plantas atacadas por un cierto hongo, de lo cual resultaron los siguientes datos: 15, 20, 25, 15, 18, 16, 17, 18, 20, 18, 18, 18, 19, 16, 17, 19, 16, 17, 17, 17, 19, 18, 19, 18, 15 Ejercicio 4 Datos agrupados en intervalos de clase 1. Determine media, mediana y moda para la distribución de frecuencias siguiente y localice sobre el histograma cada una de ellas.

PROCESO

Medidas de tendencia central para datos no agrupados. Aunque una distribución de frecuencias y su representación gráfica son verdaderamente muy útiles para tener una idea global del comportamiento que presentan los datos, es también necesario resumirlos aún más calculando algunas medidas descriptivas. Estas medidas son valores que se interpretan fácilmente y sirven para realizar un análisis más profundo y detallado que el obtenido por los resúmenes tabulares y gráficos. Se iniciará con las llamadas medidas de localización, es decir, medidas que buscan cierto lugar del conjunto de datos; cuando el lugar buscado es el centro de los datos les llamamos medidas de tendencia central de las cuales considerarán: la media, la moda y la mediana. Medidas de tendencia central: Promedios Los promedios son una medida de posición que dan una descripción compacta de cómo están centrados los datos y una visualización más clara del nivel que alcanza la variable, pueden servir de base para medir o evaluar valores extremos o raros y brinda mayor facilidad para efectuar comparaciones. El promedio como un valor representativo de los datos es el valor alrededor del cual se agrupan los demás valores de la variable. Se dice que los datos estadísticos no están de forma agrupada cuando no se encuentran resumidos en tablas de distribución de frecuencias.

Page 14: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

14 g.f.s.

Medidas de tendencia central para datos no agrupados Llamaremos datos no agrupados a los que no aparecen resumidos en distribuciones de frecuencias. a) Media Aritmética. La medida más evidente que podemos calcular para describir un conjunto de observaciones numéricas es su valor medio. La media no es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone. Siendo su fórmula la siguiente:

Donde:

Σ Símbolo de sumatoria que indica que se deberá sumar todos los valores que toma

la variable numérica X.

X Cada uno de los datos obtenidos de la muestra.

n Número total de datos.

Como ejemplo, consideremos 10 alumnos de bachillerato cuyas edades en años son: 14, 15, 16, 18, 17, 14, 15, 15, 18 y 17. La media de edad de estos jóvenes es:

Características de la Media:

1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta a la media. 2. La suma de las desviaciones de los valores individuales respecto a la media es cero. 3. Aunque es confiable porque refleja todos los valores del conjunto de datos, puede ser afectada por

los valores extremos, y de esa forma llega a ser una medida menos representativa, por lo que si la distribución es sesgada, la media aritmética no constituye un valor representativo.

b) Mediana Otra medida de tendencia central o de centralización que se utiliza habitualmente es la mediana. Es el dato o valor equidistante o que se encuentran más en medio de todo el conjunto de datos numéricos, se

representa con el símbolo: La mediana del ejemplo anterior sería el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo de él, es decir el 50 % por arriba y el 50% por debajo del valor mediana. Para obtener la mediana para datos no agrupados primeramente deberemos ordenar los datos en forma ascendente o descendente observando la siguiente secuencia de datos: Por ejemplo: Los pesos en kg de ocho alumnos de bachillerato son los siguientes: 52, 60, 58, 54, 72, 65, 55 y 76 Ordenación ascendente: 52, 54, 55, 58, 60, 65, 72, 76 En este caso podemos observar que se tienen dos datos centrales a saber el 58 y el 60, la mediana que se ubica en medio, se obtiene del promedio de los dos datos anteriores es decir:

Si al ejemplo anterior le agregamos el número 78 que representa el peso de un estudiante entonces la mediana se determinará como el dato u observación que se encuentra en el medio, como ahora el número de datos es impar, entonces la mediana es uno de los datos presentes en la muestra, para este caso, al ordenarlos, tenemos:

Page 15: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

15 g.f.s.

Entonces la mediana ( ) es: 60 kg Si la media y la mediana son iguales, la distribución o conjunto de datos de la variable es simétrica. La mediana es muy sensible a la variación de los datos; pero menos sensible a los valores extremos. Geométricamente la mediana es el valor de variable (se ubica en el eje horizontal) que corresponde a la vertical que divide al histograma en dos secciones cuya áreas son de igual magnitud. Cuando algunos valores de un conjunto de datos u observaciones son muy grandes o pequeños con respecto a los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo, en esos casos es conveniente utilizar la mediana como medida de tenencia central. Características de la mediana:

1. Es un promedio de posición no afectado por los valores extremos. 2. La mediana en caso de una distribución sesgada, no resulta desplazada del punto de tendencia

central. c) La moda

La moda, representada por el símbolo ( ) se suele definirse como el valor más frecuente. En el caso de una serie de datos no agrupados, es el valor de la variable que más se repite. Ejemplos 1: en el caso del ejemplo anterior, 5, 21, 32, 59, 60, 60,61, 64, 71, 80. La moda será:

= 60 años. (Unimodal). Ejemplo 2: determinar la moda del siguiente conjunto de datos 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, 3, 4, 6, 3

= 3 y 5 (bimodal). Ejemplo 3: determinar la moda del siguiente conjunto de datos 1, 2, 3, 4, 5, 6, 7, 8, 9 En este caso, como ningún dato se repite será amodal. Gráficamente eso se puede reflejar mediante el análisis de un histograma de frecuencias.

En el caso en que la distribución o conjunto de datos tenga una moda se dirá que el conjunto de datos es unimodal; si tiene dos modas se llamara bimodal, más de dos modas se le llamará polimodal. y En caso que no tenga ninguna moda se denominara amodal. Características de la Moda:

1. Representa más elementos que cualquier otro valor 2. La moda no permite conocer la mayor parte de los datos 3. Puede usarse para datos cuantitativos como cualitativos 4. La moda como estadístico, varía mucho de una muestra a otra 5. Cuando se tienen dos o más modas es difícil su interpretación

Medias de tendencia central para datos agrupados. Llamaremos datos agrupados a los que se presentan en cualquier tipo de distribuciones de frecuencias. Ejemplos:

Page 16: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

16 g.f.s.

a) La siguiente tabla estadística muestra, en forma resumida, las edades de alumnos de bachillerato.

b) La tabla estadística que a continuación se muestra, resume las estaturas de todos los alumnos de un grupo de quinto semestre:

c) A continuación se resume mediante una tabla estadística de distribución de frecuencias, el tipo de sangre de los profesores de un plantel del Cobach:

De los ejemplos anteriores, podemos darnos cuenta que en ocasiones los datos agrupados, no requieren de intervalos de clase para su resumen o agrupación. Cuando nuestra variable de estudio es de tipo numérica y sus valores no se han resumido en intervalos, como en el ejemplo de las edades (a), la media, la moda y la mediana, se calculan de la siguiente manera. La media se obtiene aplicando la siguiente expresión:

Donde:

f = frecuencia absoluta de cada valor de variable.

x representa cada valor de variable.

n = total de datos en la muestra y se obtiene sumando todas las frecuencias

absolutas.

En el ejemplo citado, la edad media de los jóvenes es:

Existen situaciones en las cuales la media no tiene una interpretación acorde a la realidad como lo vemos en el siguiente ejemplo:

d) La siguiente tabla estadística muestra de forma resumida el número de hijos por familia al aplicar una encuesta en hogares Hermosillenses:

Page 17: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

17 g.f.s.

La media es:

Media aritmética para datos agrupados Para calcular esta medida de centralización o tendencia central se tomaran en cuenta las frecuencias absolutas y la marca de clase de cada clase; mediante la siguiente fórmula:

Donde:

X = Media aritmética

Σ = Sumatoria

mc = Marca de clase de cada intervalo.

f = Frecuencia absoluta

n= Número de datos (sumatoria de las frecuencias absolutas) de la distribución.

Del ejemplo de las estaturas (b) visto anteriormente, al extender la tabla incluyendo la columna de las marcas de clase, tenemos: La tabla estadística que a continuación se muestra, resume las estaturas de todos los alumnos de un grupo de quinto semestre:

Mediana para datos agrupados.

Para determinar la mediana nos apoyaremos en la siguiente fórmula

Donde:

= Límite inferior de la mediana

Σn = Suma total de frecuencias absolutas

Σ f a anteriores = Suma de todas las frecuencias absolutas que

anteceden a la mediana

f mediana = Frecuencia de la mediana

A = Amplitud del intervalo de clase

Ejemplo: De la tabla que se muestra a continuación calcularemos la mediana para esta distribución.

Page 18: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

18 g.f.s.

Determinaremos primero

que será en nuestro caso

, después contaremos el total de

frecuencias absolutas de la segunda columna hasta llegar 20 sin exceder de esta cantidad ( (n ≤ 20) , es decir:

A=61-57=4; Sustituyendo los valores encontrados en la fórmula para la mediana, tendremos:

En el caso en que el número de clases de una distribución de frecuencias sea impar como la siguiente distribución de frecuencias, la mediana caerá en la clase que se encuentra a la mitad o en medio de la distribución.

Esto significa que la clase que contiene a la mediana será la tercera clase por lo tanto la mediana será:

Moda para datos agrupados. Para calcular la moda en una distribución de frecuencias absolutas observaremos la columna de las frecuencias absolutas, después escogeremos la frecuencia mayor de todas ellas. Ejemplo. La siguiente distribución de frecuencias nos muestra las estaturas de 35 alumnos elegidos aleatoriamente.

Page 19: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

19 g.f.s.

En este caso específico será 10 la frecuencia mayor de todas las frecuencias absolutas. Después procederemos a determinarla con la siguiente fórmula:

Luego entonces:

Sustituyendo los datos se tiene:

MEDIDAS DE DISPERSIÓN En este tema fundamental aprenderás a determinar las medidas de dispersión: Rango, Desviación media, Desviación típica o Desviación estándar y Varianza, para datos no agrupados (observaciones crudas o agrupados por datos diferentes) y datos agrupados (intervalo de clase). TAREA En esta actividad se te pide que trabajes en binas o en forma colaborativa en tu salón de clases y que contestes de acuerdo a lo que indica cada problema. Ejercicio 1. Datos no agrupados Instrucciones: en los siguientes ejercicios determina lo que se pide: 1. Determina la desviación media de los siguientes valores: 5, 7, 8, 10, 15. 2. Si las calificaciones de un alumno en las distintas asignaturas de un curso durante una evaluación fueron: 7, 5, 6.5, 3.7, 5 y 6.2. Determina la varianza y desviación estandar Ejercicio 2. Datos agrupados en intervalos de clase 1. Los resultados siguientes representan las calificaciones del examen final de un curso de estadística elemental. Desarrolla la tabla de distribución por intervalos de clase, y sobre esta calcula: a) La varianza b) La desviación estandar

Page 20: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

20 g.f.s.

Resuelve los siguientes ejercicios EJERCICIO 3: El número de ordenadores que hay en los hogares de un grupo de personas: A, viene dado en la siguiente tabla:

a) Halla la media y la desviación típica de esta distribución. b) Haciendo el mismo estudio en otro grupo, B, de personas, la media ha sido de 2,1 y la desviación típica de 0,92. Calcula el coeficiente de variación en los dos casos y di en cuál de ellos la variación relativa es mayor. EJERCICIO 4: En un grupo, A, de personas, la estatura media es 165 cm, con una desviación típica de 10,5 cm. En otro grupo, B, la estatura media es 140 cm y su desviación típica, 8,4 cm. Calcula el coeficiente de variación en los dos casos y compara la dispersión de ambos grupos. PROCESO Medidas de dispersión Se llaman medidas de dispersión o variabilidad aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del rango de la variable. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. Como objeto de análisis para variables numéricas podemos hacernos la siguiente pregunta: Puesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿Muy concentrados? o ¿Muy dispersos? Entre las medidas de dispersión o variación se abordará: el rango, la varianza, la desviación típica, la desviación media y el coeficiente de variación. El Rango. Una medida razonable de la variabilidad es la amplitud o rango de variación, que se obtiene de la resta del dato mayor y el dato menor. El rango se simboliza con R.

Su fórmula de cálculo es R = dato mayor – dato menor Propiedades del rango

Es fácil de calcular y sus unidades son las mismas que las de la variable.

Page 21: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

21 g.f.s.

No utiliza todas las observaciones (sólo dos de ellas);

Se puede ver muy afectado por alguna observación extrema; La desviación media se calculara utilizando primordialmente utilizando el valor de la media aritmética mediante la siguiente fórmula:

De donde: D.M = desviación media

Σ = sumatoria = Valor absoluto x= cada uno de los datos de la distribución = Media aritmética de los datos de la distribución

Varianza. La varianza (S2), se define como la media de las diferencias cuadráticas de “n” valores respecto

a su media aritmética. Para efectuar su cálculo y en función de cómo se disponga de la información, se dispone de las siguientes expresiones algebraicas: Para una población de datos no agrupados Para una muestra de datos no agrupados.

Finalmente cuando se dispone de una agrupación de datos por intervalos: Para distribuciones de frecuencias poblacionales agrupadas con intervalos

Para distribuciones de frecuencias muestrales grupadas con intervalos

K en estos casos representa el número de intervalos de clase. Esta medida es siempre una cantidad positiva, con propiedades para la realización de inferencia estadística. La desviación típica o desviación estándar. Puesto que la obtención de la varianza conlleva a registros cuadráticos de las variaciones, se pierde o altera la medición original, Por ejemplo al calcular la varianza de los pesos de algunas personas, la respuesta se expresa en pesos cuadrados ¿qué significa esto? Por tal motivo y con el propósito de recuperar las unidades originales de medición, se calcula la raíz cuadrada de la varianza, a la cual se le llama desviación típica o desviación estándar.

Page 22: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

22 g.f.s.

Propiedades de la varianza y de la desviación típica

Ambas son sensibles a la variación de cada una de las puntuaciones, es decir, si una puntuación cambia, la varianza se modifica. La razón es que si se toma en cuenta su definición, la varianza está en función de cada una de las puntuaciones.

La desviación típica tiene la propiedad de que en el intervalo ( ) se encuentra, al menos, el 75% de las observaciones Incluso si se tienen muchos datos y estos provienen de una distribución simétrica unimodal, se puede llegar al 95 % de los datos contenidos en tal intervalo.

No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de tendencia central, de distribuciones de frecuencias que presentan asimetría.

Ejemplo 1. Los siguientes datos representan la duración en segundos de 8 espacios comerciales televisivos, que fueron elegidos al azar y transmitidos por Telemax. 18, 25, 30, 20, 15, 25, 28, 15 a) Determine la media muestral.

b) Calcular la varianza:

c) Deducir el valor aproximado de la desviación estándar:

Ejemplo 2. Los siguientes datos resumidos en una distribución de frecuencias corresponden a la antigüedad laboral de 22 empleados de una empresa manufacturera:

a) Determina la varianza y desviación estandar para esta muestra de empleados. Primero se agregan las cuatro columnas que permitan facilitar los cálculos. A continuación se muestra la extensión de la tabla:

Page 23: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

23 g.f.s.

Por tanto la varianza es:

Y la desviación estandar:

COEFICIENTE DE VARIACIÓN INTRODUCCIÓN Tal como se expuso en la presentación referente a las medidas de dispersión, el coeficiente de variación (también llamado coeficiente de variación de Pearson), es el cociente entre la desviación típica y la media.

%)100(

X

SCV

Si se comparan dos distribuciones que utilizan las mismas unidades, sus dispersiones se pueden calcular mediante la desviación estándar siempre que sus medias aritméticas sean iguales o muy próximas. En caso contrario, se utilizará el coeficiente de variación que cuanto menor sea, menor será la dispersión y, por tanto, mayor será la representatividad de la media aritmética. El coeficiente de variación mide la dispersión relativa, como cociente entre la dispersión absoluta (desviación estándar) y el promedio (media aritmética). El coeficiente de variación se puede representar en porcentaje, multiplicándolo por 100. UTILIDAD DEL COEFICIENTE DE VARIACIÓN El coeficiente de variación sólo se debe calcular para variables con todos los valores positivos. Todo índice de variabilidad es esencialmente no negativo. Debemos trabajar con variables positivas para asegurarnos de que la media es mayor a cero (recuerda que una división entre cero es una indeterminación). El coeficiente de variación también es muy útil al comparar dos o más conjuntos de datos que son medidos en las mismas unidades pero difieren hasta tal punto que una comparación discreta de las respectivas desviaciones estándar no, es muy útil. Como ejemplo, supón que un inversionista potencial estuviera considerando comprar acciones en una de dos compañías, A o B, que se cotizan en la bolsa de valores. Si ninguna compañía ofreciera dividendos a sus accionistas y si ambas compañías estuvieran igualmente calificadas en términos de crecimiento potencial, el inversionista potencial podría considerar entonces la variabilidad de los dos valores para tomar su decisión. Ahora supón que cada una de las acciones de la

Page 24: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

24 g.f.s.

empresa A ha promediado $50 durante los meses pasados con una desviación estándar de $10. Además, supón que en ese mismo periodo, el precio por cada acción de la compañía B promedio $12 con una desviación estándar de $4. En términos de las desviaciones estándar reales, el precio de las acciones de la compañía A parece ser más volátil que el de las acciones de la compañía B. Sin embargo, puesto que los precios promedio por acción de los dos valores son tan diferentes, sería más apropiado para el inversionista considerar la variabilidad en el precio relativa al precio promedio con el fin de examinar la volatilidad/estabilidad de los dos valores. Para la compañía A, el coeficiente de variación es:

%20%100)50$/10($ CV ; Para la compañía B el coeficiente de variación es:

%3.33%100)12$/4($ CV . Por tanto, en cuanto a la media, el precio del valor B es mucho más variable que el precio del valor A. EJERCICIOS RESUELTOS Ejemplo 1. Con los siguientes datos: 21, 35, 36, 38 y 45 cuya media aritmética es 35 y su desviación estándar 7.823, calcular el coeficiente de variación. Solución.

%35.22%)100(35

823.7CV

Ejemplo 2. Después de haber registrado los datos correspondientes al peso y la estatura de 40 varones, se asentaron en la siguiente tabla los resultados del cálculo de la media y la desviación estándar.

Media )(X Desviación estándar

)(S

Estatura 68.34 pulgadas 3.02 pulgadas Peso 172.55 libras 26.33 libras

Calcula el coeficiente de variación de las estaturas, después el coeficiente de variación de los pesos; finalmente, compara ambos resultados. Solución. Debido a que tenemos estadísticos muestrales, los dos coeficientes de variación se obtienen de la siguiente manera:

Estatura %42.4%)100(

34.68

02.3

pul

pulCV

Pesos %26.15%)100(

55.172

33.26

libras

librasCV

Aún cuando la diferencia en unidades de medida (pulgadas y libras) imposibilita la comparación de la desviación estándar de 3.02 pulgadas, con la desviación estándar de 26.33 libras, es posible comparar los coeficientes de variación, que carecen de unidades. Se observa que las estaturas (con CV = 4.42%) tienen una variación considerablemente menor que los pesos con (CV = 15.26%). Lo anterior tiene sentido, ya que, por lo general, vemos que los pesos de los hombres varían mucho más que sus estaturas. Por ejemplo, es muy raro encontrar un adulto que mida el doble que otro, pero es mucho más común ver a uno que pese el doble que otro.

Page 25: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

25 g.f.s.

Medidas de Forma INTRODUCCIÓN

Las medidas de forma permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución. Para conocer y darnos cuenta que son las medidas de forma, te invito a que observes el video de medidas de

forma

TAREA I. De los siguientes problemas calcula la media, mediana y moda e indica si es simétrica o asimétrica según los resultados. 1) Un psicólogo escribió un programa de computadora para simular la forma en que una persona llena un test estándar del coeficiente intelectual, Para probar el programa, introdujo en la computadora 15 formas diferentes de un test del coeficiente intelectual cuyo conocido y calculo el coeficiente en cada forma. 134, 144, 138, 146, 148 143, 137, 135, 153, 146 136, 144, 138, 147, 146 2) Se pidió a 13 estudiantes de la universidad, seleccionados aleatoriamente, que dijeran el número de horas que habían dormido la noche anterior, Los datos resultantes fueron 5, 6, 6, 7, 7, 9, 5,4, 11, 6, 7, 8, 7. II. De los siguientes problemas calcula el coeficiente de asimetría y de apuntamiento de Fisher. 1) El número de días necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. 2) El precio de un interruptor termo-magnético en 10 comercios de electricidad de una ciudad son: 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 euros. PROCESO

Medidas de forma: Son indicadores estadísticos que permiten identificar si una distribución de frecuencia presenta uniformidad, se pueden clasificar en dos grandes grupos: medidas de sesgo y medidas apuntamiento. Medida de simetría: Cuando los valores de la variable que equidistan de un valor central tienen las misma frecuencias. En este caso se verifica: x = Me = Mo donde: x es la media, Me es la mediana y Mo es la moda.

Medidas de sesgo o asimetría: informa si los extremos de las curvas (colas) asociadas a los datos son mas alargados hacia algunos de los lados.

Page 26: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

26 g.f.s.

Las asimetrías puedes tener sesgo:

Positivo o derecha: tienen las frecuencias más altas a la izquierda de la media y las más pequeñas a la derecha (colas). Mo < Me < x

Negativo o izquierda: tienen las frecuencias más altas a la derecha de la media y las más pequeñas a la izquierda (colas). x < Me < Mo

Ejemplos: 1) A lo largo de una semana del mes de abril de 2010 las cotizaciones del dólar respecto al peso fueron: 12.33, 12.26, 12.24, 12.22, 12.24, 12.19, 12.24

Si comparamos las tres medidas de tendencia central podemos decir que son iguales por lo que la distribución de los datos es simétrica, y concluir que el dólar tuvo un comportamiento normal. 2) Al escribir un artículo sobre los tipos de impresoras disponibles de las denominadas impresoras de matriz de puntos, se investigaron los siguientes precios en dólares de los modelos disponibles. 575, 259, 550, 340, 475, 520, 550, 398

Si comparamos las tres medidas de tendencia central podemos decir que < Me < Mo por lo que la distribución de los datos es asimétrica negativa o por la izquierda. Coeficiente de Fisher El coeficiente de asimetría más preciso es el de Fisher que se define por:

Page 27: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

27 g.f.s.

Medidas de apuntamiento o curtosis.

La palabra curto viene del latín “curtus”, que significa corto o menguado. Se utiliza la palabra curtíos para denominar a las medidas de forma que miden el apuntamiento o el achatamiento de las distribuciones distinguiéndose entre: Leptocúrticas: Distribuciones mas apuntadas que la normal. Mesocúrticas: Distribuciones con apuntamiento normal. Platicúrticas: Distribuciones menos apuntadas que la normal.

El coeficiente de apuntamiento de Fisher nos sirve para medir el mayor o menor apuntamiento, este no es el único coeficiente, pero es el más utilizado y se define como:

Ejemplo: 1) La hemoglobina en gramos de 100 ml de un grupo de pacientes se recoge en la siguiente tabla

Page 28: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

28 g.f.s.

a) Calcula la media y desviación estándar

b) Calcular el coeficiente de asimetría de Fisher.

Page 29: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

29 g.f.s.

Como Sf < 0, entonces la distribución es asimétrica a la izquierda. c) Calcular el coeficiente de apuntamiento.

Si Af < 0 f A , entonces la distribución es Platicúrtica, es decir es más aplanada que una curva normal. MEDIDAS DE CORRELACIÓN

INTRODUCCIÓN

Hasta ahora hemos estudiado temas de estadística que implica una variable, pero en algunas ocasiones es necesario investigar y estudiar la relación entre dos o más variables. Por ejemplo: Pronosticar las ventas futuras de un producto en términos de su precio, la producción promedio de tomate en base a la precipitación pluvial, el peso de personas con respecto a la estatura. Por lo tanto a partir de las técnicas estadísticas de correlación y regresión, podemos realiza una estimación que permita afirmar con mayor o menor facilidad, el comportamiento entre las variables de estudio. TAREA I. En cada uno de los siguientes problemas realiza el diagrama de dispersión y encuentra el coeficiente de correlación y la recta de regresión, para indicar si existe una relación lineal entre las variables, y desarrollar su modelo matemático.

1) Consideremos los siguientes datos, donde “x” representa el número de sucursales que 10 bancos

diferentes tienen en un área metropolitana, e “y” representa la correspondiente cuota del total de depósitos mantenidos por los bancos.

Page 30: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

30 g.f.s.

Solución:

= 96.6 = 101

X Y x= X - y=Y - x2

y2

xy 198 227 198 - 96.6 = 101.4 227 - 101 = 126 101.4

2 = 10281.96 126

2 = 15876 12776.4

186 166 186 - 96.6 = 89.4 166 - 101 = 65 89.42 = 7992.36 65

2 = 4225 5811

116 159 116 - 96.6 =19.4 159 - 101 = 58 19.42 = 376.36 58

2 = 3364 1125.2

89 125 89 - 96.6 = -7.6 125 - 101 = 24 -7.62 = 57.76 24

2 = 576 -182.4

120 102 120 - 96.6 = 23.4 102 - 101 = 1 23.42 = 547.56 1

2 = 1 23.4

109 68 109 - 96.6 = 12.4 68 - 101 = -33 12.42 = 153.76 -33

2 =1089 -409.2

28 68 28 - 96.6 = -68.6 68 - 101 = -33 -68.62 = 4705.96 -33

2 = 1089 2263.8

58 40 58 - 96.6 = -38.6 40 - 101 = -61 -38.62 = 1489.96 -61

2 = 37214 2354.6

34 27 34 - 96.6 = -62.6 27 - 101 = -74 -62.62 = 3918.76 -74

2 = 5476 4632.4

31 28 31 - 96.6 = -65.6 28 - 101 = -73 -65.62 = 4303.36 -73

2 = 5329 4788.8

∑x2 = 33827.8 ∑y

2 = 40746 ∑xy = 33184

r = 0.89 2) En los siguientes datos se presenta la temperatura media diaria en grados Fareheit y el consumo diario correspondiente de gas natural en pies cúbicos.

PROCESO

Coeficiente de correlación La correlación es el grado de relación entre variables e intenta determinar que tan bien una ecuación lineal, describe o explica la relación entre las variables. Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas. El análisis de la correlación implica los siguientes pasos:

• El estudio descriptivo mediante el “grafico de dispersión”; • La estimación del coeficiente de correlación (incluyendo su intervalo de confianza); • La valoración de este coeficiente de correlación (signo y magnitud) y la significación estadística; • La interpretación del coeficiente de correlación evaluando el coeficiente de determinación. Ejemplos 1) Las notas de 10 alumnos en Matemáticas y en lengua vienen dadas en la siguiente tabla:

Page 31: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

31 g.f.s.

Los pares de valores {(2,2),(4,2),(5,5),…;(8,7),(9,10)}, forman la distribución bidimensional. Nube de puntos o diagrama de dispersión La primera forma de describir una distribución bidimensional es representar los pares de valores en el plano cartesiano. El grafico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.

Correlación lineal y recta de regresión: Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal denomina recta de regresión.

Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez mas débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta. En el grafico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado esta próxima a los puntos de la nube. Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir. 2) Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la grafica se describen el número de errores que corresponden a los intentos realizados. Observa que hay una correlación muy

fuerte (los puntos están “casi alineados) y negativa (la recta es decreciente).

3) A 12 alumnos de un centro se les pregunto a qué distancia estaba su residencia del Instituto, con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla:

Page 32: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

32 g.f.s.

Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlación es prácticamente inexistente, es decir, no tiene nada que ver con el rendimiento académico la dista del domicilio al instituto.

Los coeficientes de correlación lineal más frecuentes son: La de Pearson y la de Spearman, pero solo veremos el coeficiente de Pearson. Coeficiente de correlación de Pearson Este tipo de correlación se aplica para variables de intervalo o razón y se calcula con la relación:

• El valor de r = 0 indica que no existe correlación entre las variables. • Los valores +1 y -1 indican una correlación perfecta (lineal) positiva o negativa. Ejemplos: 4) Un partido político ha ordenado los datos relativos a gastos de propaganda y número de diputados obtenidos en diversas campañas electorales, porque está interesado en conocer si efectivamente los gastos de propaganda influyen en el número de diputados.

a) Dibujo del diagrama de dispersión:

b) Se calcula la media de las variables X y Y

Page 33: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

33 g.f.s.

c) Calcular el coeficiente de correlación.

Esto indica que existe una correlación fuerte y positiva entre las variables, aunque es menor que uno, pone de manifiesto la presencia de alguna otra variable no contemplada que también influye en el número de diputados. Recta de regresión La regresión en el análisis de la relación entre dos variable, tiene una gran importancia, no solo porque explica la relación entre dos variables, sino sobre todo, porque, a partir de esta relación, se puede predecir el comportamiento futuro de la variable dependiente sobre la base de nuevo valores de la variable independiente. La relación entre las variables puede adoptar diversas formas: lineal, parabólica, exponencial, etc., pero solo veremos la lineal. La regresión lineal se puede entender también como la técnica por medio de la cual se resume la información contenida en la nube de puntos en una simple recta. Si tenemos una distribución bidimensional y representamos la nube de puntos correspondiente, la recta que mejor se ajusta a esta nube de puntos recibe el nombre de recta de regresión.

Ejemplo 1) Tomando en cuenta los datos del problema 4: Un partido político ha ordenado los datos relativos a gastos de propaganda y número de diputados obtenidos en diversas campañas electorales, porque está interesado en conocer si efectivamente los gastos de propaganda influyen en el número de diputados.

Page 34: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

34 g.f.s.

¿Cuál sería el número de diputados esperado si los gastos de propaganda fueran de 35 millones de pesos? Solución: Para encontrar el número de diputados, debemos localizar la recta de regresión:

por lo tanto:

La recta de regresión es:

, Entonces, para 35 millones de pesos, la predicción del número de diputados es:

, Es decir aproximadamente 13 diputados.

TEORÍA DE CONJUNTOS

INTRODUCCIÓN En este tema fundamental: teoría de conjuntos; aprenderás a interpretar, describir y aplicar en la solución de problemas los conceptos:

Teoría básica

Operación con conjuntos y,

Diagramas de Venn El concepto de conjunto es uno de los más fundamentales en matemáticas, incluso más que la operación de contar, pues se puede encontrar implícita o explícitamente, en todas las ramas de las matemáticas puras y aplicadas. En su forma explícita, los principios y terminología de los conjuntos se utilizan para construir proposiciones matemáticas más claras y precisas. Ahora bien, Todos tenemos la idea de lo que es un conjunto: es una colección, agrupación, asociación, reunión, unión de integrantes homogéneos o heterogéneos, de posibilidades reales o abstractas. Los integrantes pueden ser números, letras, días de la semana, alumnos, países, astros, continentes, etc. a estos integrantes en general, se les denomina "elementos del conjunto". Sin embargo, el concepto que tenemos es un "concepto intuitivo", el cual pues no es correcto pues también existe conjuntos formados por un solo elemento y conjuntos formados sin elementos lo cual contradice la idea que teníamos. TAREA

I. Contesta cada una de las siguientes preguntas. 1) Define que es un conjunto. ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ 2) Menciona tres términos descriptivos que pudieran utilizarse para “nombrar” ciertos conjuntos. ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Page 35: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

35 g.f.s.

3) Escribe los elementos de cada uno de los siguientes conjuntos.

El conjunto de las asignaturas que está usted cursando este semestre.

El conjunto de los meses del año.

El conjunto de los números pares menores de 25.

El conjunto de los días de la semana que comienzan con la letra M.

El conjunto de los planetas del sistema solar.

4) Escribe los elementos de cada uno de los siguientes conjuntos descritos por la notación de conjuntos. B = { x / x es un número impar y menor o igual a 9 }

G = { x / x es un día de la semana que inicia con la letra L }

5) Describe cada uno de los siguientes conjuntos por medio de la notación de conjunto. K= {octubre, noviembre, diciembre}

Page 36: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

36 g.f.s.

G= {a, b, c, d, e, f}

II. Si consideramos los conjuntos: U = {1, 2, 3, 4, 5, 6, 7}, A = {1, 2, 3, 4, 5}, B = {1, 3, 5, 7} y C = {2, 5, 6, 7}. De manera colaborativa. Obtén lo indicado en cada uno de los siguientes casos y representa los resultados por medio del Diagrama de Venn.

1) A U C

6) A - C

2) A U B

7) A - B

3) B ∩ A

8) C - B

4) A U B U C

9) A'

Page 37: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

37 g.f.s.

5) A ∩ B ∩ C

10) B'

III. Desarrolla en binas los problemas propuestos de acuerdo a todo lo desarrollado por tu maestro (Problemas resueltos de operación de conjuntos) 1) Una encuesta sobre 500 personas reveló los siguientes datos acerca del consumo de dos productos A y B :

138 personas consumían A pero no B.

206 personas consumían A y B.

44 personas no consumían ni A ni B. a ¿Cuántas personas consumían A? . b. ¿Cuántas personas consumían B? c. ¿Cuántas personas consumían B pero no A? d. ¿Cuántas personas consumían por lo menos uno de los dos productos? 2) Una encuesta sobre 500 personas reveló los siguientes datos acerca del consumo de dos productos A y B :

410 personas consumían por lo menos uno de los dos productos.

294 personas consumían A.

78 personas consumían A pero no B. a) ¿Qué porcentaje de personas consumía B? b) ¿Qué porcentaje de personas consumía sólo B? c) ¿Qué porcentaje de personas consumía los dos productos? d) ¿Qué porcentaje de personas no consumía ninguno de los dos productos? 3) Una encuesta sobre 200 personas reveló los siguientes datos acerca del consumo de tres productos A , B y C : 5 personas consumían sólo A

25 personas consumían sólo B.

10 personas consumían sólo C

15 personas consumían A y B, pero no C.

80 personas consumían B y C, pero no A.

8 personas consumían C y A, pero no B.

17 personas no consumían ninguno de los tres productos. a. ¿Cuántas personas consumían A? b. ¿Cuántas personas consumían B?. c. ¿Cuántas personas consumían C?. d. ¿Cuántas personas consumían A, B y C?. e. ¿Cuántas personas consumían por lo menos uno de los tres productos?

Page 38: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

38 g.f.s.

f. ¿Cuántas personas consumían A o B? g. ¿Cuántas personas no consumían C ?. h. ¿Cuántas personas no consumían ni C ni A? 4) Una encuesta sobre 200 personas reveló los siguientes datos acerca del consumo de tres productos A, B y C: 30 personas consumían A.

85 personas consumían B.

103 personas consumían C.

10 personas consumían A y C, pero no B.

13 personas consumían A y C.

18 personas consumían B y C. 5 personas consumían A y B, pero no C a. ¿Cuántas personas no consumían ninguno de los tres productos? b. ¿Cuántas personas consumían los tres productos? c. ¿Cuántas personas consumían A pero no B ni C? d. ¿Cuántas personas no consumían A? e. ¿Cuántas personas consumían por lo menos uno de los tres productos? PROCESO TEORÍA DE CONJUNTOS

La idea de un conjunto es básica en el pensamiento humano. Continuamente resulta conveniente agrupar

objetos o cosas para poder clasificar u ordenar. De manera intuitiva podemos decir que conjunto es algo

que tiene “elementos o miembros”

Por ejemplo:

Una colección de monedas antiguas.

Los miembros del Senado forman un conjunto llamado Senado de la República.

Los números 2, 3, 5; forman un conjunto de tres elementos.

CONJUNTO. Es una agrupación, clase o colección de objetos que poseen una característica en común, en

donde a cada uno de los cuáles se le denomina elemento del conjunto.

Métodos para describir un conjunto.

Se cuenta con tres métodos para describir un conjunto:

1.- Descripción verbal de los elementos:

Es la manera más sencilla de dar a conocer el contenido de un conjunto.

Ejemplos:

“El conjunto de los números superiores a 25”

“El conjunto de los días de la semana”

“El conjunto de los billetes actuales en

2.- Lista de los elementos:

Estos se separan por comas y se encierran entre llaves. Esta forma permite denotar simbólicamente el

contenido de un conjunto.

Page 39: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

39 g.f.s.

Ejemplos:

“El conjunto de los números enteros positivos menores que 10”; puede representarse por:

N = {1, 2, 3, 4, 5, 6, 7, 8, 9}

“El conjunto de las vocales del alfabeto castellano”, puede representarse por:

V = {a, e, i, o, u}

Aplicando este método en la descripción de “El conjunto de todos los números positivos inferiores

a 1000”; tendríamos que escribir 999 números; sin embargo puede representarse por:

N = {1, 2, 3,…, 998, 999}

Para representar conjuntos infinitos por ejemplo “El conjunto de todos los números superiores a

5”; lo representaríamos por:

N = {6, 7, 8,…}

Cabe aclarar que utilizamos los puntos suspensivos para dar una idea de cuáles son los elementos que lo

constituyen.

3.- Notación de conjuntos:

Dado “El conjunto de los números impares mayores que 4 y menores que 14” que puede expresarse por:

N = {x | x es un número impar mayor que 4 y menor que 14}

La simbología { | } que se denomina “notación de conjuntos” describe al conjunto en base a las condiciones

de un elemento arbitrario del grupo, es decir, establece las condiciones bajo las cuales un elemento

cualesquiera puede o no pertenecer al conjunto.

Las llaves { } indican el conjunto.

La línea vertical “|” se lee como “tal que” la letra “x” es un elemento arbitrario del conjunto y a su vez es

una variable.

Al lado izquierdo de la línea vertical leemos “el conjunto de las x” y al lado derecho de la línea vertical

enumeramos las propiedades que caracterizan dichos elementos.

Ejemplos 1:

Descripción verbal de los elementos:

“El conjunto de todos los elementos enteros y positivos menores o iguales que 7”

Lista de los elementos:

B = {1, 2, 3, 4, 5, 6,7}

Notación de conjunto:

{ x | x es un número natural, menor o igual que 7 }

Ejemplo 2:

Descripción verbal de los elementos:

Page 40: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

40 g.f.s.

“Los números enteros menores que -2”

Lista de los elementos:

B = {-3,-4,-5,-6,….}

Notación de conjunto:

B = {x | x es un número entero, menor que -2}

CONJUNTO UNIVERSAL

Es el conjunto que contiene a los elementos de los conjuntos que se estén considerando en un análisis

cualesquiera y se representa por la letra mayúscula “U”.

Ejemplos:

1) Sean los conjuntos: A = {aves}, B = {peces}, C = {conejos}, D = {monos}.

Pero existe otro conjunto que incluye a los conjuntos A, B, C y D. Es U = {animales}. Gráficamente se

representa por un rectángulo tal como se observa a continuación:

2) Sean los conjuntos: E = {mujeres}, F = {hombres}

Pero existe otro conjunto que incluye a los conjuntos E y F. Es U = {seres humanos}. Gráficamente se

representa por un rectángulo tal como se observa a continuación:

SUBCONJUNTOS.-

Cuando un conjunto cualquiera “A” en el que todos sus elementos son también miembros de otro conjunto

“B”, se dice que el conjunto “A” es subconjunto del conjunto “B”, el símbolo empleado para indicar esta

relación es "⊂".

Page 41: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

41 g.f.s.

Ejemplos:

1) Sean los conjuntos K = {a, b, c, d, e} y L= {a, c, e}

Se establece que el conjunto “L” es un subconjunto de “K”, simbólicamente se representa por L⊂K.

CONJUNTO INFINITO.-

Se tiene un “conjunto infinito”, cuando no es posible indicar el número de elementos que están contenidos

en él.

Ejemplos:

1) “El conjunto de todos los números naturales”

N = {1, 2, 3, 4,…}

2) “El conjunto de todos los números pares”

M = {2, 4, 6, 8,…}

CONJUNTO FINITO.-

Se tiene un “conjunto finito”, cuando es posible indicar el número de elementos que están contenidos en él.

Simbólicamente el número de elementos de un conjunto finito se expresa por “n”.

Ejemplos:

1) Si tenemos el conjunto de los días de la semana, es decir:

K = {lunes, martes, miércoles, jueves, viernes, sábado, domingo}

Se establece que “K” es un conjunto finito ya que consta de 7 elementos, es decir: n(K) = 7

Es necesario aclarar que un conjunto puede ser finito, aunque puede resultar físicamente mucho muy difícil

o estar fuera de la capacidad humana, el determinar cuántos elementos están contenidos.

2) “El conjunto de estrellas en el firmamento”

Se considera un conjunto finito aunque ¿quién podrá contarlas?

OPERACIONES CON CONJUNTOS

Las operaciones con conjuntos es el proceso que conduce a formar conjuntos a partir de otros conjuntos.

Las principales operaciones de conjuntos son:

UNIÓN.

Si A y B son dos conjuntos, entonces la unión de A y B es el conjunto formado por los elementos que son de

A o de B o de ambos y se denota B U A.

INTERSECCIÓN.

Page 42: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

42 g.f.s.

Si A y B son dos conjuntos, entonces la intersección de A y B es el conjunto formado por los elementos que

los son de A y B simultáneamente y se simboliza por B ∩ A.

DIFERENCIA.

A partir de dos conjuntos A y B, se obtiene otro conjunto, cuyos elementos son aquellos que pertenecen al

conjunto “A” pero no están contenidos en el conjunto “B”; a este proceso se le denomina “diferencia de

conjuntos o complemento relativo de B respecto de A” y se representa simbólicamente por “A - B“.

COMPLEMENTO.

A partir de un conjunto “A” y un conjunto “U”, se obtiene otro conjunto, cuyos elementos deben ser todos

los que estén contenidos en el conjunto “U” y que no pertenecen al conjunto “A”, este proceso de

denomina “complemento de un conjunto cualquiera en relación a un conjunto universal dado”.

Simbólicamente se representa por una “comilla” que se ubica en la parte superior derecha de la literal que

define al conjunto cualquiera. A'

Ejemplos:

Realiza las operaciones con conjuntos en cada uno de los siguientes casos:

1) Sean los conjuntos: A = {1, 2, 3, 4} y B = {3, 4, 5, c, d}

Entonces la unión de los conjuntos es:

A U B = {1, 2, 3, 4, 5, c, d}

2) Sean los conjuntos: S = {a, b, c, d} y M = a, b, 1, 2, 3}

Entonces la intersección de los conjuntos es:

S ∩ M = {a, b}

Puesto que “a, b” son los únicos elementos que lo son tanto de S como de M.

3) Sean los conjuntos: P = {a, e, i, o, u} y Q = {w, x, y, z}

Se observa que los conjuntos no tienen ningún elemento en común, por lo que su “intersección” es el

“conjunto vacío”; es decir:

S ∩ M = Ø

4) Sea los conjuntos: A = {4, 6, 8, 10, 12} y B = {10, 11, 12, 13, 14, 15}

La diferencia de estos conjuntos da como resultado:

A - B = {4, 6, 8}

5) Sea U = {a, b, c, d, e, f, g, h, i, j} y S = {a, g, h, i} que es un subconjunto de U.

Entonces S' = {b, c, d, e, f, j}

Page 43: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

43 g.f.s.

DIAGRAMAS DE VENN

La manera más fácil de comprender las ideas de la teoría de conjuntos es por medio de los diagramas

llamados “Diagramas de Venn”. Dichos gráficos nos ayudan a relacionar entre los conjuntos a la igualdad,

las operaciones de unión, intersección, diferencia y complemento.

En los Diagramas de Venn, los conjuntos se representan mediante óvulos, círculos o nubes y el punto de

referencia es el conjunto universal “U” que se representa por un rectángulo.

Con los conjuntos A y B contenidos en el conjunto universal “U”, por medio de los Diagramas de Venn se

pueden determinar las siguientes relaciones:

En este diagrama el conjunto A representa a un subconjunto propio del conjunto B, es decir, todos

los elementos de A están contenidos en B, mientras que B tiene por lo menos un elemento no

contenido en A.

En este diagrama los conjuntos A y B tienen en común algunos, pero no todos los elementos es

decir, representan la intersección entre A y B.

Las superficies sombreadas en las siguientes figuras, ilustran la unión del conjunto A con el

conjunto B. La unión de los conjuntos A y B es el conjunto formado por todos los elementos que

pertenecen a “A” ó a “B” ó a ambos.

Las superficies sombreadas en la siguiente figura, ilustran la diferencia del conjunto A con el

conjunto B. Se denomina diferencia de dos conjuntos A y B al conjunto formado por todos los

elementos de A pero que no pertenecen a B.

El complemento A’ del conjunto A, se obtiene sombreando la superficie del conjunto universal U no

contenida en A, es decir:

Page 44: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

44 g.f.s.

Ejemplos:

1) Dados los conjuntos: A = {0, 1, 2, 3, 4, 5}, B = {0, 2, 4} y C = {5, 6, 8} efectuar y construir los diagramas

indicados:

a) B ∪A b) C ∪A c) C ∪B

a) A = {0, 1, 2, 3, 4, 5}, B = {0, 2, 4} Representación gráfica de los conjuntos

Representación gráfica de la unión de los conjuntos A y B. A U B = { 0, 1, 2, 3, 4, 5 }

b) A = { 0, 1, 2, 3, 4, 5 } y C = { 5, 6, 8 } Representación gráfica de los conjuntos

Representación gráfica de la unión de los conjuntos A y C A U C = { 0, 1, 2, 3, 4, 5, 6, 7,8 }

c) B = { 0, 2, 4 } y C = { 5, 6, 8 } Representación gráfica de los conjuntos

Representación gráfica de la unión de los conjuntos B y C. B U C = { 0, 2, 4, 5, 6, 8 }

Page 45: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

45 g.f.s.

Ejemplos:

2) Dados los conjuntos: A = {0, 1, 2, 3, 4, 5}, B = {3, 5, 7} y C = {2, 4}, efectuar y construir los diagramas

indicados:

a) A ∩ B b) A ∩ C c) B ∩ C

a) A = { 0, 1, 2, 3, 4, 5 }, B = { 3, 5, 7 } Representación gráfica de los conjuntos

Representación gráfica de la intersección de los conjuntos A y B. A ∩ B = { 3, 5 }

b) A = { 0, 1, 2, 3, 4, 5 } y C = { 2, 4 } Representación gráfica de los conjuntos

Representación gráfica de la intersección de los conjuntos A y C. A∩ C = { 2, 4 }

c) B = { 3, 5, 7 } y C = { 2, 4 } Representación gráfica de los conjuntos

Representación gráfica de la intersección de los conjuntos B y C. B ∩ C = Ø

Page 46: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

46 g.f.s.

Ejemplos de aplicación

1) En una escuela de idiomas hay 120 alumnos de los cuales 65 estudian alemán, 55 ejercitan su inglés; 30

estudian a la vez alemán e inglés. Aplicando el diagrama de Venn, determinar:

a) Los alumnos que sólo estudian alemán.

b) Los alumnos que sólo estudian inglés.

c) El número de alumnos que estudian alemán o inglés.

d) El número de alumnos que no estudian ninguno de estos idiomas

Solución:

Representamos por medio del diagrama de Venn, el conjunto universal “U” de 120 alumnos, el conjunto “A”

de alumnos que estudian alemán, y el conjunto “B” de alumnos que estudian inglés; por la intersección de

ambos conjuntos, tenemos 30 alumnos que estudian alemán e inglés a la misma vez, es decir:

a) Los alumnos que sólo estudian alemán son:

n ( A ) - n ( A ∩ B ) = 65 - 30 = 35

Por lo tanto, solo 35 alumnos estudian alemán

b) Los alumnos que solo estudian inglés son:

n ( B ) - n ( A ∩ B ) = 55 - 30 = 25

Por lo tanto, solo 25 alumnos estudian inglés

c) El número de alumnos que estudian alemán ó inglés son:

n ( A U B ) = n ( A ) + n ( B ) - n ( A ∩ B ) = 65 + 55 - 30 = 90

d) El número de alumnos que no estudian ninguno de estos dos idiomas es:

n ( A U B )' = U - n ( A U B ) = 120 - 90 = 30

2) Una encuesta basada en 250 estudiantes del nivel medio superior dio lugar a la siguiente información

acerca de su ingreso a los cursos de química, física y matemáticas:

101 estudian química

163 estudian física

Page 47: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

47 g.f.s.

163 estudian matemáticas

35 estudian química y física

32 estudian química y matemáticas

70 estudian física y matemáticas

20 estudian química, física y matemáticas

a) ¿Cuántos estudiantes llevan química como único curso?

b) ¿Cuántos no siguen ninguno de los tres cursos?

c) ¿Cuántos estudian química y matemáticas, pero no física?

d) ¿Cuántos alumnos no siguen los cursos de química ni física?

Solución:

Representamos por medio del diagrama de Venn:

El conjunto universal “U” es 250 estudiantes

El conjunto “A” de estudiantes que cursan química

El conjunto “B” de estudiantes que cursan física

El conjunto “C” de estudiantes que cursan matemáticas

Por la intersección de los tres conjuntos, tenemos a los 20 estudiantes que cursan química, física y

matemáticas a la misma vez.

a) Los estudiantes que sólo cursan química son:

n ( A ) - n ( A ∩ B ) - n ( A ∩ C ) + n ( A∩ B ∩ C ) = 101 - 55 - 52 + 20 = 14

Por lo tanto, sólo 14 estudiantes cursan química

b) Los estudiantes que no siguen ninguno de los tres cursos

n ( A U B U C )' = U - n ( A U B U C ) = U - n ( A ) + n ( B ) + n ( C ) - n ( A ∩ B ) - n ( A ∩ C ) - n ( B ∩ C ) + n ( A∩

B ∩ C ) = 250 - 101 + 163 + 163 - 55 - 52 - 90 + 20 = 0

Por lo tanto, todos los estudiantes siguen por lo menos uno de los tres cursos.

c) Los estudiantes que cursan química ó matemáticas, pero no física, son:

n ( A U C ) = n ( A ) + n ( C ) - ( A ∩ B ) - n ( A ∩ C ) - n ( B ∩ C ) + n ( A∩ B ∩ C ) = 101 + 163 - 52 - 55 - 90 +

20 = 87

Page 48: Material de apoyo para extraordinario

Probabilidad y Estadística MATEMÁTICAS VI

48 g.f.s.

ó también:

Solo matemáticas + solo química + solo química y matemáticas = 41 + 14 + 32 = 87

Alumnos que solo cursan matemáticas:

n ( C ) - n ( A ∩ C ) - n ( B ∩ C ) + n ( A∩ B ∩ C ) = 163 - 52 - 90 + 20 = 41

Alumnos que solo cursan química y matemáticas

n ( A ∩ C ) - n ( A∩ B ∩ C ) = 52 - 20 = 32

Por lo tanto, 87 estudiantes cursan química

d) Los estudiantes que no cursan química ni física, son:

n ( A U B )' = U - n ( A U B ) = U -[ n ( A ) + n ( B ) - n ( A ∩ B )] = 250 - [ 101 + 163 - 55 } = 41

Por lo tanto, 41 estudiantes no cursan química ni física