Capítulo Ia.pdf

44
 Capítulo I Métodos Estadísticos Dr. Gabriel Arcos Espinosa

Transcript of Capítulo Ia.pdf

  • Captulo I

    Mtodos Estadsticos

    Dr. Gabriel Arcos Espinosa

  • UNIDADES CONTENIDOS TEMATICOS OBJETIVOS PARTICULARES

    ESTRATEGIAS DEL PROCESO ENSEANZA

    APRENDIZAJE E INVESTIGACION

    ESTRATEGIAS DE EVALUACION

    I.- Introduccin a la estadstica.

    1. Introduccin 2. Qu es la

    estadstica 3. El papel de la

    estadstica en la ingeniera y la ciencia administrativa.

    4. Aplicaciones de la estadstica.

    5. Estadstica descriptiva.

    6. Organizacin y presentacin de datos estadsticos.

    7. Distribucin de frecuencias.

    8. Graficas. 9. Medidas

    descriptivas. 10. Medidas de

    dispersin 11. Ejercicios de fin

    de Capitulo.

    Definir las reas

    de aplicacin de la Estadstica en el campo de las empresas.

    Comprender la metodologa de la Estadstica.

    Resumir y presentar datos desde un punto de vista estadstico.

    Aprender a discriminar, seleccionar y validar el modelo estadstico ms apropiado para cada caso.

    Exposicin del

    profesor, el estudio de casos, uso de proyectos.

    Practica empleando la computadora.

    Se fomentara el uso de software.

    Se propiciara el trabajo en equipo.

    Se har un trabajo practico por equipo, mismo que se expondrn en la ltima sesin del curso.

    Actividades en

    equipo. Tarea. Solucin de

    ejemplos con ayuda de la computadora.

    Examen escrito. Proyecto.

  • Estadstica: Es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones ms eficientes.

    Estadstica descriptiva: conjunto de mtodos para organizar, resumir y presentar los datos de manera informativa.

    Estadstica inferencial: Conjunto de mtodos utilizados para saber algo acerca de una poblacin, basada en una muestra.

  • La estadstica se ha convertido en herramienta vital para los Ingenieros, Administradores y Economistas, ya que les permite comprender fenmenos sujetos a variacin y predecirlo o controlarlo eficazmente.

    PAPEL DE LA ESTADSTICA

  • Razones para estudiar estadstica:

    La primera razn es que en todos lados encontramos informacin numrica:

    La empresa General Electric report que en 1999 sus ganancias fueron de $ 111 630 000 (dlares) mayor que los $ 100 469 000 que obtuvo en 1998. Las egresados de Posgrado del programa de maestra en administracin de empresas de la universidad de Notre Dame, contaron con un sueldo promedio inicial de $ 54 000 dlares y el 91% de ellos consiguieron trabajo en los primeros tres meses de su graduacin. En Estados Unidos hay 26.4 millones de jugadores de golf. Estados Unidos el mayor consumidor de caf en promedio 1.75 tazas diarias por persona.

  • La segunda razn para estudiar estadstica es que las tcnicas estadsticas se utilizan para tomas decisiones que afectan nuestra vida diaria.

    Las compaas de seguros utilizan anlisis estadstico para establecer las tarifas de los seguros de casas, automviles, vida y salud. Mxico primer lugar en obesidad a nivel mundial. Se estima que este ao ser la poca mas seca de los ltimos 12 aos.

    El promedio de vida de los mexicanos se duplic entre 1930 y 2004 de 34.9 aos a 73 en el caso de los hombres y de 36.9 a 77.9 aos en el caso de las mujeres.

  • Distribucin porcentual de la poblacin de 7 a 29 aos que dej de asistir a la escuela segn causa de abandono escolar en el ao 2010.

    Causa de abandono %

    Falta de dinero o necesidad de trabajar. 35.73

    No quiso o no le gust estudiar. 27.48

    Porque termin una carrera o porque dej los estudios hasta el nivel que tena como objetivo estudiar.

    12.31

    Por matrimonio y unin. 8.50

    Porque su familia no lo dej o por ayudar en las tareas del hogar. 2.38

    Otra causa. 2.09

    Porque la escuela estaba muy lejos o no haba. 1.87

    No especificado. 9.64

    Fuente: INEGI. Censo General de Poblacin y Vivienda, 1990; tabulados de la muestra censal del XII Censo General de Poblacin y Vivienda, 2010.

  • Tercera razn que el conocimiento de los mtodos estadsticos ayuda a entender por qu se toman ciertas decisiones y aporta una mejor comprensin respecto a la forma en la que nos afectan las decisiones

    Para tomar estas decisiones se necesitan: Determinar si la informacin existente es adecuada o si se requiere informacin adicional.

    Reunir la informacin adicional, si es necesaria, de tal forma que no haya resultados errneos.

    Resumir la informacin de modo til e informativo. Analizar la informacin disponible. Sacar las conclusiones y realizar las inferencias necesarias, al tiempo que se evala el riesgo de llegar a una conclusin incorrecta

  • Censo de la Republica Mexicana 112,337,000 habitantes

  • Distribucin de frecuencia

    Distribucin de frecuencia: Agrupamiento de datos en categoras mutuamente excluyentes, que indican el nmero de observaciones en cada categora

    Para que los datos sean tiles deben organizarse para distinguir patrones y tendencias y as llegar a conclusiones lgicas

    Una forma de organizar un conjunto de datos es clasificarlos en categoras o clases y luego contar cuntas observaciones quedan dentro de cada categora.

  • Cmo se elabora una distribucin de frecuencias?

    1.-Determinar el nmero de clases

    nk 2k nmero de clases n nmero de observaciones

    2.- Determine el intervalo o amplitud

    kLHi

    H es el valor mayor L es el valor menor k es el nmero de clases

    3.- Establezca los limites de las clases

    4.-Distribucin de los datos en las distintas clases.

    5.-Contar el nmero de elementos de cada clase.

    ( )nlog3.31 +

  • Componentes de la distribucin de frecuencia

    Frecuencia absoluta: nmero de elementos u observaciones pertenecientes a una misma clase.

    Frecuencia relativa: Se obtiene de dividir la frecuencia absoluta entre el nmero de observaciones

    Frecuencia acumulada: el nmero de observaciones que son menores que el lmite superior de la clase ( Se obtiene sumando en sentido descendente)

    Punto medio: valor central de la clase

  • Representacin grfica

    La representacin grafica contribuye a un mejor anlisis de los datos.

    Facilita la comprensin de fenmenos considerados.

    Pierde detalle de la informacin pero se obtiene otro tipo de informacin.

    Grficos utilizados: histogramas, polgonos de frecuencias y ojivas son tiles pues resaltan los patrones de los datos y atraen la atencin.

  • Histograma: Grfico de barras verticales que no guardan separacin entre s, la altura debe ser proporcional al nmero de elementos de la clase

  • Polgono de frecuencias: La altura de cada punto la determina el punto medio o marca de clase (abscisa) y la frecuencia simple (ordenada) de la clase.

  • Ojiva: Para representar la Frecuencia Acumulada, la ordenada se eleva sobre el limite superior (tiene forma de S)

  • Medidas de Centralizacin

    Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos:

    Media: (Muestral y poblacional): Se calcula de la misma manera, pero la simbologa utilizada es diferente.

    Media: (media aritmtica o simplemente media). Es el promedio aritmtico de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos.

  • MEDIANA (Me): es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.

  • MODA (M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica.

  • MEDIA ARITMETICA DE DATOS AGRUPADOS.

    Donde: Es la media aritmtica. Es el valor central o punto medio, de cada clase. Es la frecuencia en cada clase Es la frecuencia en cada clase multiplicada por el punto medio de la clase . Es la suma de esos productos. Es el numero total de frecuencias

    x

    ix

    if

    ii xf

    N

    N

    xfx

    N

    iii

    += 1

    +

    N

    ifixi

    1

  • MEDIANA DE DATOS AGRUPADOS:

    ( )C

    f

    fN

    LiMEmediana

    i

    +=

    2

    Donde: es el limite inferior de la clase que contiene la mediana. es el numero total de frecuencias. es la frecuencia de la clase que contiene la mediana. es el numero acumulado de frecuencias en todas las clases que preceden a la clase que contiene la mediana. es la amplitud (o anchura) de la clase en que se encuentra la mediana

    Li

    N

    medianaf

    ( )if

    C

  • Clase F Marca de clase

    fi xi

    45.5-52.5 8 49 392 52.5-59.5 7 56 392 59.5-66.5 9 63 567 66.5-73.5 13 70 910 73.5-80.5 6 77 462

    x

    )5.595.66(9

    15243

    5.59

    +=ME

    55.64=ME

    ( )C

    f

    ifN

    LMEmediana

    i

    +=

    2

    = 43

    EJEMPLO

  • MODA. Se relaciona con la frecuencia con que se presenta el dato o los datos con mayor incidencia, con lo que se considera la posibilidad de que exista ms de una moda para un conjunto de datos

    CLMo i

    +

    +=

    21

    1

    Donde: limite inferior o frontera inferior (N/2) exceso de la frecuencia modal sobre la clase modal inferior inmediata exceso de la frecuencia modal sobre la clase modal superior inmediata intervalo de la clase modal

    iL

    1

    2

    C

  • Clase F Marca de clase fi xi 45.5-52.5 8 49 392 52.5-59.5 7 56 392 59.5-66.5 9 63 567 66.5-73.5 13 70 910 73.5-80.5 6 77 462

    x

    EJEMPLO

    CLiMo

    +

    +=

    21

    1

    )5.595.66()613()913(

    9135.66

    +

    +=Mo

    05.69=Mo

  • Amplitud de Variacin= Valor ms grande Valor ms pequeo

    Desviacin Media: Es el promedio aritmtico de los valores absolutos de las desviaciones con respecto a la media

    Dispersin

    el valor de cada observacin.

    Es la media aritmtica de todos los valores

    El total de nmeros observados de la muestra

    Indican el valor absoluto

    NXX

    DM =

    NXX

  • MEDIDAS DE DISPERSIN

    VARIANZA ( S2 ) : La media aritmtica de las observaciones cuadrticas con respecto a la media.

    ( )N

    XXS i =

    22

    Es el smbolo de la Varianza

    El total de nmeros observados

    Es la media aritmtica de todos los valores

    Es el total de valores de la poblacin

    Es el total de valores de la muestra nNXXS 2

    ( )1

    22

    = n

    XXS i

  • DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza.

    ( )N

    XXS i =

    2 ( )1

    2

    = n

    XXS ii

  • Desviacin estndar para datos agrupados (S):

    ( )

    1

    22

    =

    n

    nXf

    XfS

    Es el smbolo de Desviacin estndar

    El punto medio de la clase

    Es el total de valores de muestra

    Es el valor de la frecuencia ifnXS

  • EJERCICIO

    Cierta empresa de la zona conurbada quiere conocer la eficiencia y eficacia de sus trabajadores en las lneas de produccin, para lo anterior hizo pruebas que le permitieran conocer los resultados y estos se sealan en la siguiente tabla:

    Clase o Intervalo

    f

    52-61 8 62-71 19 72-81 33 82-91 14

    92-101 6

    Obtenga: a) Media, mediana y moda (aproximado a dos decimales) b) Desviacin estndar y varianza. c) Histograma, polgono de frecuencia y ojiva.

  • COEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica.

    100*XSCV =

    CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica, expresado en porcentaje y cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.

  • El analista de investigacin para la empresa de corretaje de acciones Sidde Financial, desea comparar la dispersin de las razones (o cocientes) precio-rendimiento en un grupo de acciones comunes, con la dispersin de sus rendimientos sobre inversin. Para las razones precio-rendimiento la media es 10.9 y la desviacin estndar 1.8. el rendimiento sobre inversin es 25% y la desviacin estndar 5.2%. a) Por que debe utilizarse el coeficiente de variacin para comparar la dispersin.

    Precio - rendimiento Xmedia = 10.9 S = 1.8

    51.16)100(9.108.1

    )100(

    ==

    =

    CV

    xsCV

    8.20)100(25.0

    052.0

    )100(

    ==

    =

    CV

    xsCV

    b) Compare la dispersin relativa de las razones precio-rendimiento, y el rendimiento sobre inversin. Existe menor dispersin en el precio-rendimiento cuyo valor es 16.51% en relacin al rendimiento-inversin con su valor de 20.8%

    EJEMPLO

    Rendimiento - inversin Xmedia = 25% 0.25 S = 5.2% 0.052

  • EJEMPLO Se va comparar la dispersin en los precios anuales de las acciones que se venden a menos de $10 (dlares) y la dispersin en los precios de aquellas que se venden por arriba de $60. el precio medio de las acciones que se venden a menos de $10 es 5.25 y la desviacin estndar es $1.52. el precio medio de las acciones que se negocian a mas de $60 es $92.50 y su desviacin estndar es $5.28. a) Por que debe utilizarse el coeficiente de variacin para comparar la dispersin

    de los precios? b) Calcule los coeficientes de variacin. Cual es su conclusin?

    a) Por que se puede comparar la dispersin relativa en trminos de porcentajes.

    b) Se observa que las acciones a menos de $10 tienen una dispersin mayor relativa, en comparacin con las que se venden por arriba de los $60. Acciones menores a 10 dlares

    Arriba de 60 dlares

    %95.28)100(25.552.1

    )100(

    ==

    =

    CV

    xsCV

    %70.5)100(50.9228.5

    )100(

    ==

    =

    CV

    xsCV

  • La tabla a continuacin indica los salarios bsicos por hora (en unidades monetarias) en abril 2010 para ciertas categoras ocupacionales de obreros sindicalizados en cierto sector de la construccin. Determine cul es la ocupacin en la que existe la mayor variacin en los salarios bsicos y cul es la que muestra la menor variacin. Para hacer estas comparaciones deber utilizar el coeficiente de variacin.

    Salarios bsicos por hora, segn tipo de trabajo y lugares encuestados

    Ocupacin A B C D Albailes 6.290 7.375 5.750 7.500 Carpinteros 5.900 7.020 5.370 6.660 Electricistas 7.500 7.600 6.700 7.335 Pintores 7.170 6.735 4.750 6.110 Enyesadores 5.920 7.045 5.940 6.825 Plomeros 8.000 4.450 6.250 7.080 Ayudantes 4.020 4.780 3.180 4.700

    EJERCICIO

  • Teorema de Chebyshev

    Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o poblacin), la proporcin mnima de los valores que se encuentran dentro de k desvariaciones desde la media es por lo menos 1-1/k2 , donde k es una constante mayor que 1

    Regla emprica.

    Regla emprica: En una distribucin de frecuencias simtrica, con forma de campana, aproximadamente 68% de las observaciones estarn entre ms una y menos una desviacin estndar desde la media; aproximadamente 95% de las observaciones se encontaran entre ms dos y menos dos desviaciones estndar desde la media; prcticamente todas las observaciones (99.7%) se hallaran entre ms tres y menos tres desviaciones estndar, a partir del valor medio

  • 70 80 90 100 110 120 130

    68%

    95%

    99.7%

  • Simtrica

    Frec

    uenc

    ia

    Frec

    uenc

    ia

    Med

    iana

    Med

    ia

    Positivamente Asimtrica

    Frec

    uenc

    ia

    Med

    iana

    Med

    ia

    Negativamente Asimtrica

    Coeficiente de asimetra De Pearson

    3(Media-Mediana)

    s =

  • Medidas de Posicin

    Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo nmero de valores. Los ms usados son los cuartiles, los deciles y los percentiles.

    CUARTILES: Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles:

    -El primer cuartil Q1 es el menor valor que es mayor que una cuarta parte de los datos.

    - El segundo cuartil Q2 (la mediana), es el menor valor que es mayor que la mitad de los datos.

    - El tercer cuartil Q3 es el menor valor que es mayor que tres cuartas partes de los datos.

  • PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%

    ( )100

    1 CnLc +=

    DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles.

    Diferencia Intercuartilica I=Q3-Q1

    Donde: Q3= Tercer cuartil Q1= Primer cuartil

  • 11

    111

    41

    Cf

    FNLQ

    +=

    Donde:

    L1=Limite real donde se encuentra el primer cuartil. N= Total de datos. F1=Frecuencia acumulada antes de la clase que contiene el primer cuartil. f1=Frecuencia de la clase que contiene al primer cuartil. C1=Tamao real de la clase que contiene al primer cuartil

    Para datos agrupados

  • Clase F Marca de clase 51.5-61.5 8 56.5 61.5-71.5 19 66.5 71.5-81.5 33 76.5 81.5-91.5 14 86.5 91.5-101.5 6 96.5

    = 80

    11

    111

    41

    Cf

    FNLQ

    +=

    81.67)10(19

    8)80(41

    5.611 =

    +=Q

    33

    333

    43

    Cf

    FNLQ

    +=

    5.81)10(33

    27)80(43

    5.713 =

    +=Q

    13 QQIQ = 69.1381.675.81 ==QI

  • Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos resumen la informacin contenida en ella.

    Medidas descriptivas.

    Posicin: Divide un conjunto ordenado de datos en grupos con la misma cantidad de individuos Cuantiles , percentiles, cuartiles, deciles,

    Centralizacin: Indica valores con respecto a los datos parecen agruparse Media , mediana, moda Dispersin: Indica la mayor o menor concentracin de datos con respecto a las medidas de centralizacin. Varianza, desviacin tpica, coeficiente de variacin, rango. Forma: Asimetra

  • La Facultad de Ingeniera aplic un examen de fsica a 300 alumnos y se obtienen los siguientes resultados, con ellos se desea encontrar los siguientes resultados: a).- Obtener la tabla de frecuencias. b).-Representar el histograma de frecuencias. c).- Representar el Polgono de frecuencias. d).- Obtener la media, mediana y moda de los datos agrupados. e).- Obtener la desviacin estndar para datos agrupados. f).- Encontrar la diferencia intercuartil. g).- Comentar los resultados. La tabla de resultados de presenta a continuacin.

  • 61 100 91 37 25 76 36 41 70 48 60 38 73 42 26 54 63 76 54 94 30 90 90 58 21 82 85 55 25 14 78 59 80 19 58 1 12 48 39 66 38 84 45 2 84 75 17 27 24 19 98 48 24 66 85 10 95 14 58 63 21 6 7 46 64 5 98 8 5 62 78 46 28 20 99 19 25 85 60 44 85 32 43 20 98 47 28 34 4 66 46 91 46 69 68 1 84 67 86 45 68 90 98 75 79 86 80 10 34 85 80 65 93 54 35 47 37 59 11 71 24 25 60 53 78 15 36 11 59 43 75 23 58 41 5 25 27 25 63 62 92 55 11 56 35 6 26 41 78 64 99 39 40 73 36 21 99 72 74 89 88 75 94 29 13 47 5 87 79 99 50 39 21 78 98 46 68 82 65 73 1 27 17 19 42 35 50 23 91 51 2 35 35 47 41 44 11 35 61 5

    10 93 62 40 78 33 46 96 74 11 79 37 44 91 43 57 72 30 71 86 55 48 42 43 58 99 96 15 69 92 72 24 29 95 65 72 53 74 92 67 23 53 91 40 3 36 94 28 97 46 1 21 68 24 40 57 99 33 33 96 12 30 10 87 96 38 47 0 9 8 63 53 8 49 60 37 36 56 81 39 2 51 1 42 93 42 9 44 68 2 94 50 92 55 94 74 84 16 17 59

  • Captulo INmero de diapositiva 2Nmero de diapositiva 3Nmero de diapositiva 4Nmero de diapositiva 5Nmero de diapositiva 6Nmero de diapositiva 7Nmero de diapositiva 8Nmero de diapositiva 9Nmero de diapositiva 10Nmero de diapositiva 11Nmero de diapositiva 12Nmero de diapositiva 13Nmero de diapositiva 14Nmero de diapositiva 15Nmero de diapositiva 16Nmero de diapositiva 17Nmero de diapositiva 18Nmero de diapositiva 19Nmero de diapositiva 20Nmero de diapositiva 21Nmero de diapositiva 22Nmero de diapositiva 23Nmero de diapositiva 24Nmero de diapositiva 25Nmero de diapositiva 26Nmero de diapositiva 27Nmero de diapositiva 28Nmero de diapositiva 29Nmero de diapositiva 30Nmero de diapositiva 31Nmero de diapositiva 32Nmero de diapositiva 33Nmero de diapositiva 34Nmero de diapositiva 35Nmero de diapositiva 36Nmero de diapositiva 37Nmero de diapositiva 38Nmero de diapositiva 39Nmero de diapositiva 40Nmero de diapositiva 41Nmero de diapositiva 42Nmero de diapositiva 43Nmero de diapositiva 44