APUNTES+DE+ESTADISTICA

74
Universidad Autónoma “Gabriel René Moreno”. Facultad de Auditoría Financiera Septiembre, 2009 Apuntes sobre Métodos Estadísticos Por: Ing. M.Sc. Francisco Martínez Solaris Mgs. En Educación Superior

description

estadistica

Transcript of APUNTES+DE+ESTADISTICA

  • Universidad Autnoma Gabriel

    Ren Moreno. Facultad de

    Auditora Financiera

    Septiembre, 2009

    Apuntes sobre Mtodos

    Estadsticos Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    APUNTES SOBRE MTODOS ESTADISTICOS

    Generalmente cuando se escucha la palabra Estadstica inmediatamente se piensa en datos,

    cuadros, grficos, etc. En verdad no es una idea equivocada, sino ms bien, una idea popular de

    sta, pero no es lo nico y en la concepcin de la Estadstica Moderna tampoco el ms importante.

    Las primeras tcnicas estadsticas consistan principalmente en la organizacin, presentacin

    grfica y el clculo de ciertas cantidades "sobresalientes de un grupo de datos. Esta parte de la

    disciplina es lo que, en la terminologa moderna, se conoce como Estadstica Descriptiva.

    La Estadstica Descriptiva es la rama ms antigua de la Estadstica y tiene por objetivo,

    presentar informacin de una manera sencilla y esttica y que al mismo tiempo, sea aprehensible

    al ojo humano, es decir, fcil de entender. Aunque su campo de accin se ha visto reducido, es

    indudable su utilidad. Para que la Estadstica Descriptiva cumpla su cometido utiliza tres mtodos,

    Mtodos Tabulares, Mtodos Grficos y Mtodos Numricos.

    Supngase ahora, que se est interesado en saber cul es el ingreso promedio de las personas que

    tienen pensin en el mercado los Pozos, de Santa de la Sierra, Bolivia. Supngase adems, que

    este sector ha crecido de tal forma que se hace imposible estudiarlas en su totalidad. Por tal

    razn se deduce una muestra de esta poblacin por cualquier mecanismo aleatorio y se realiza la

    toma de la informacin deseada y se obtiene un dato promedio cualquiera, por ejemplo, Bs 550. A

    travs del mtodo de razonamiento que conduce a una extensin de este resultado a la poblacin

    de inters, se podra concluir que las personas que tiene pensiones en dicho mercado, tiene un

    ingreso promedio de Bs 550.

    El mismo hecho de que se est estudiando una fraccin de la poblacin, indica que se tiene una

    informacin incompleta y que es, lo comnmente que pasa en la realidad; pero, qu pasa si el azar

    proporcion las personas con pensiones que venden ms o bien que venden menos?. Si se da el

    primer caso se estara sobreestimando y en el caso contrario subestimando el ingreso promedio

    de estas personas. En este momento surge una duda sobre la informacin que en Estadstica

    Moderna se la conoce generalmente como Incertidumbre y que siempre estar presente en

    conclusiones que se deriven por medio del mtodo inductivo.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Ahora la pregunta que surge es la siguiente, qu papel juega la Estadstica en esto?. El papel de

    la Estadstica en este proceso es cuantificar la incertidumbre y la rama de la estadstica que se

    encarga de ello se le llama Estadstica Inferencial que utiliza el mtodo Probabilstico.

    En conclusin ya sea porque la se dispone de informacin incompleta, o debido a la propia

    variabilidad de la informacin (naturaleza), es muy comn que se arribe a conclusiones a travs

    del mtodo inductivo, en el cual las mismas son inciertas. El conjunto de tcnicas que permite

    realizar inducciones en las que el grado de incertidumbre es cuantificable, integran la rama de la

    Estadstica conocida como Inferencia Estadstica o Estadstica Inductiva o Inferencial.

    POBLACIN, ATRIBUTOS Y VARIABLES

    Se dice que los estadsticos extraen datos de las muestras y que esta informacin les sirve para

    hacer inferencia sobre la poblacin que la muestra representa. Es as que, los trminos, muestra

    y poblacin se consideran relativos.

    El concepto de poblacin va a variar de acuerdo al campo de la ciencia donde se aplique. Desde un

    punto de vista estadstico, poblacin; es el conjunto de resultados potenciales de un experimento

    aleatorio, es decir, todos los valores que puede tomar una caracterstica (variable).

    En palabras ms sencillas se puede decir que poblacin, es un conjunto de entes con

    caractersticas propias que los diferencian de otras. Con este concepto se puede tener una

    poblacin de rboles, de sillas, de tizas, etc. Un aspecto importante a retomar es que desde el

    punto de vista estadstico una poblacin es importante cuando se requiere verificar (medir) una

    caracterstica (variable) en ella.

    Atributos

    Supngase el siguiente ejemplo. Se tiene en un aula de clase un grupo de 20 estudiantes y suponga

    adems, que el estudiante de la primera fila es alto, color de piel blanca, cabello castao, ojos

    claros, etc. Si a los 20 estudiantes se les considera como una poblacin, se puede decir que los

    detalles antes mencionados corresponden a caractersticas propias de un miembro de esa

    poblacin, o sea, son atribuciones propias del estudiante en particular.

    Con el ejemplo antes citado, se puede tratar de deducir un concepto de Atributo, diciendo que es

    una caracterstica propia de cada elemento de una poblacin.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Variable

    Retomando el ejemplo anterior, supngase ahora, que se les pregunta a los cinco primeros

    estudiante su estatura los cuales responden de la siguiente manera:

    1.76, 1.69, 1.83, 1.72, 1.77

    De hecho estas alturas corresponde a atributos de los cinco primeros estudiante. Si se observan

    los datos anteriores, se puede constatar que el atributo estatura cambia de un estudiante a otro.

    Con esta idea se puede plantear un concepto de variable.

    Variable es un atributo medible que cambia de un elemento a otro de la poblacin, es decir, es

    toda caracterstica que cambia y que est sujeta a medida o cuenta.

    Supngase ahora, que los cincos primeros estudiantes poseen la misma altura, ejemplo, 1.73. Dado

    que el atributo altura en este caso no cambia, no se puede considerar como una variable, pero s,

    es un atributo. De lo anterior se puede concluir, que una variable siempre ser un atributo, pero

    un atributo no siempre es una variable.

    Las variables siempre se denotan por la letras maysculas del alfabeto y los valores que toman

    (observaciones) con letras minsculas.

    ELEMENTOS DE LAS VARIABLES

    Siempre que se desee constatar una variable en un elemento de la poblacin de inters, sta debe

    de poseer cuatro elementos:

    a.- Nombre

    b.- Definicin

    c.- Conjunto de categoras o valores que puede tomar la variable

    d.- Procedimiento que permita clasificarla

    Nombre

    Cuando un investigador toma los datos correspondiente a una variable, ste tiene que saber el

    nombre de la variable, de lo contrario cmo va a tomar informacin de una variable si no sabe el

    nombre de sta.

    Definicin

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Todo investigador tiene que definir la (s) variable (s) que va a estudiar. Este nombre es cmo se

    concibe la variable en el campo de la ciencia correspondiente, es decir, cmo se define. Si el

    concepto no existe, se debe construir el constructo por parte de investigador.

    Por ejemplo, supngase que un investigador est tomando el peso a un grupo de nios, El toma los

    datos cuando los nios no han desayunado y sin ropa alguna. Este investigador tiene que reportar

    al momento de dar a conocer la informacin cmo lo hizo porque quizs otro investigador lo puede

    haber tomado con ropa y despus de desayunar. Inclusive debe de especificar el equipo con el

    cual verific el valor de la variable en los elementos de la poblacin estudiados dado que pueden

    variar en precisin.

    Conjunto de categoras o valores que puede tomar la variable

    Esta se refiere a las categoras convencionalmente admitida por la sociedad. Por ejemplo; si en

    un grupo de personas se mide la variable sexo, de hecho se refiere al sexo anatmico y no al

    comportamiento sexual, por lo tanto las categoras que puede tomar son masculino femenino o

    bien macho hembra.

    Si la variable es edad, entonces segn el estado donde se mida puede ser das, semanas, meses,

    aos.

    Procedimiento que permita clasificarla

    Este elemento de las variables en muchos casos es muy complejo, pero se soluciona en parte si

    existe una adecuada definicin de la variable que el investigador desee medir. Si se retoma el

    ejemplo anterior donde se quiere medir la variable sexo en un grupo de personas. En este caso la

    variable se define como sexo anatmico de cada persona que componen al grupo. Ahora bien, el

    hecho de que una persona diga que es de sexo masculino no implica que no sea homosexual, pero no

    es la conducta sexual la que se est midiendo, sino el sexo anatmico. Por tal razn, aunque este

    elemento de la variable es complejo, con una definicin clara de lo que se desea medir se resuelve.

    De acuerdo a los valores que puede tomar una variable, sta se puede clasificar en:

    Variables cualitativas: no se pueden medir numricamente, representan caractersticas de las

    variables (categoras, por ejemplo: nacionalidad, color de la piel, sexo).

    Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales).

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Por su parte, las variables cuantitativas se pueden clasificar atendiendo a los valores que pueden

    tomar en discretas y continuas:

    Discretas: Son todas aquellas que toman valores que se pueden contar, es decir, que se pueden

    enumerar (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3...., etc, pero, por

    ejemplo, nunca podr ser 3,45).

    Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de

    un vehculo puede ser 80.3 km/h, 94.57 km/h..., etc.

    ESCALAS DE MEDICIN

    Medir una variable significa constatar la observacin en los elementos de la poblacin que es

    objeto de estudio, es decir, consiste en verificar que valor toma la variable en la unidad de

    anlisis. Lo anterior implica que para medir una variable, sta tiene que ser observable en el

    mundo real, manteniendo el principio fundamental de la construccin de una variable que consiste

    en que sus categoras deben de ser totalmente inclusivas y mutuamente excluyentes.

    En Estadstica se definen cuatro niveles o escalas de medicin las cuales son:

    a.- Escala Nominal: En esta escala lo nico que puede decirse de una observacin es a cul de un

    cierto nmero de categoras pertenece.

    En esta escala de medicin la nica relacin que puede establecerse entre observaciones es la de

    igualdad y por lo tanto de desigualdad. Dos observaciones son iguales si estn en la misma

    categora (llamadas tambin clases) y diferente si no lo estn. Como consecuencia de lo anterior,

    la nica estadstica vlida para este tipo de datos es la frecuencia de cada clase.

    Ejemplo, supngase que en grupo de personas se desea medir el estado de salud con respecto a

    una enfermedad en particular. En este caso la constatacin de la variable (medicin) en los

    miembros de la poblacin debe de concluir en que estn o no afectados por la enfermedad.

    b.- Escala Ordinal: Las observaciones medidas en esta escala pueden ordenarse de menor a

    mayor, y en consecuencia no slo se admiten las relacin de igualdad, sino adems la de mayor que

    y menor que. Muchos de los estudios realizados en las Ciencias Sociales producen observaciones

    que son medidas bajo esta escala, por lo difcil que es medir actitudes en los seres humanos.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    En esta escala adems de calcularse frecuencias como en la escala nominal, se puede calcular una

    medida de tendencia central llamada Mediana.

    Un ejemplo clsico de esta escala es la jerarquizacin que existe en la iglesia y el ejrcito.

    Coronel > Teniente > Subteniente > Sargento > Cabo > Soldado

    c.- Escala de Intervalo: Con observaciones en esta escala no slo se pueden ordenarse las

    observaciones, sino que adems puede definirse una unidad de distancia (puede ser arbitraria)

    entre ellas. La principal diferencia de esta escala con la de Proporciones es que en la escala de

    Intervalo el cero y la unidad de distancia son arbitrarios y, en particular, el cero no corresponde

    a una caracterstica fsica de las unidades de medidas. Un ejemplo clsico en esta escala es la

    medicin de la temperatura.

    Dado que los requisitos indispensables para efectuar sumas y productos son que existan ceros y

    una unidad de distancia, con las observaciones medidas bajo esta escala puede calcularse medidas

    de tendencia central como la media y de dispersin como la varianza. Por tal razn esta escala es

    ms fuerte que la Nominal.

    b.- Escala de Proporcin o Razn: En esta escala las observaciones pueden ordenarse y existen

    un cero y una unidad de distancia que son inherentes al sistema, es decir, que no son arbitrarios.

    Ejemplos tpicos de caractersticas medidas en esta escala el peso de un individuo, el rendimiento

    por hectrea de una planta, etc. Esta es la escala de medicin ms fuerte que existe y por lo

    tanto permite el clculo de cualquier estadstica.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    ORGANIZACIN DE LA INFORMACIN

    Resulta de mucha importancia en el campo de la investigacin, utilizar tcnicas que permitan

    apreciar de una forma rpida y fcilmente aprehensible un tipo de informacin donde se resalten

    los aspectos ms importantes. Estas tcnicas o mtodos debern poseer caractersticas o

    propiedades que faciliten lo antes mencionado. Entre estas propiedades se pueden mencionar las

    siguientes:

    1. Que proporcionen la mxima cantidad de informacin contenida en los datos en forma

    rpida y fcil de visualizar.

    2. Que posean sencillez operativa

    3. Que permitan presentar los datos de una manera esttica.

    La Estadstica Descriptiva, como se ha mencionado antes, tiene como propsito mostrar la

    informacin de forma sencilla, es decir, entendible. Para ello hace uso de tres mtodos los cuales

    son: Mtodos Tabulares y Grficos y Mtodos Numricos. Entre los mtodos tabulares estn las

    Tablas de Frecuencias o Tablas de Distribucin de Frecuencias.

    NOTACIN DE SUMATORIA. PROPIEDADES

    Supngase que la variable X, toma los valores de x1, x2, x3, ..., xn. Entonces, la suma de los

    valores xi de la variable X sera: x1 + x2+ x3 +... xn.

    Con el objeto de expresar esta suma de una manera ms resumida, se hace uso de la letra griega

    Sigma mayscula ( ), la cual es el smbolo utilizado en matemticas para indicar la suma, de tal

    manera que:

    =1 ; donde:

    i=1 se lee como la suma de i=1 a i=n de x, lo cual indica que la variable x toma valores para i=1, 2, 3,

    ..., n, o sea:

    =1

    = 1 + 2 +

    i se llama ndice de suma y es una variable que toma los valores 1, 2, 3, ..., n.

    La expresin i=1 indica en este caso que 1 es el valor inicial de i (no siempre el valor inicial

    comienza de 1).

    La n arriba del signo, indica el ltimo valor de i.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    A xi se le llama sumando

    Propiedades de la sumatoria

    Sean x1, x2,..., xn y y1, y2,..., yn dos conjuntos de datos, y a y b dos constantes arbitrarias.

    Entonces:

    1. = =1=1

    2. + = + =1=1

    =1

    3. = =1

    4. = + 1 ; =

    5. + = + =1=1

    La demostracin de cada una de estas propiedades se deja como prctica para el estudiante.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    METODOS TABULARES

    Tablas de Frecuencias Relativas y Absolutas

    Como una antesala de lo que son tablas de frecuencias relativas y absolutas se menciona a

    continuacin las formas iniciales de presentacin de informacin, sus ventajas y desventajas de

    tal manera que el estudiante comprenda la lgica de cada uno y por qu se usa una en vez de otra.

    Una de las primeras formas de presentacin de informacin es el arreglo de los datos el cual es

    una de las formas ms sencillas de presentar datos. Pone los valores en orden ascendente o

    descendente. Por ejemplo, a continuacin se muestran las concentraciones de cloro en partes por

    milln (ppm) de 30 galones de agua tratada.

    Concentraciones de cloro en ppm de 30 galones de agua tratada

    15.6 16.2 15.8 15.8 15.8 16.3

    16.0 15.7 16.0 16.2 16.1 16.8

    16.8 16.4 15.2 15.9 15.9 15.9

    16.0 15.4 15.7 15.9 16.0 16.3

    16.3 16.4 16.6 15.6 15.6 16.9

    Una forma sencilla de arreglar estos datos es presentarlos en orden ascendente o descendente.

    Si se arreglan de manera ascendente quedaran de la siguiente forma:

    15.2 15.7 15.9 16.0 16.2 16.4

    15.4 15.7 15.9 16.0 16.3 16.6

    15.6 15.8 15.9 16.0 16.3 16.8

    15.6 15.8 15.9 16.1 16.3 16.8

    15.6 15.8 16.0 16.2 16.4 16.9

    Este arreglo de datos ofrece varias ventajas sobre los datos originales o sin arreglar:

    Se pueden localizar rpidamente los valores mnimos y mximos en los datos. En el

    ejemplo, el valor mnimo es 15.2 y 16.9 el mximo.

    Los datos se pueden dividir en secciones (clases)

    Fcilmente se puede apreciar que valores se repiten ms de una vez.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Un inconveniente de esta forma de presentacin de informacin es que siempre se sigue

    manejando toda la masa de informacin y por lo tanto es muy tedioso emplearla en bases datos

    muy grandes. Esto quiere decir, que esta forma de presentacin de informacin no tiene

    capacidad de sntesis, de aqu que es preferible presentarlos en Cuadro de distribucin de

    frecuencias.

    Al nmero de veces que se repite una observacin dentro de una coleccin de datos se le llama

    Frecuencia Absoluta (fi). La suma de stas tiene que ser igual al tamao de la coleccin de datos

    (fi = n), en este caso 18 + 12 = 30 (total de las observaciones). A la relacin de cada frecuencia

    absoluta con respecto al total, se le llama Frecuencia Relativa (fr = fi/fi), la suma de esta

    tiene que ser igual a 1 o bien a 100 si se le expresa en porcentaje. Este tipo de arreglo es

    importante cuando la coleccin de datos es pequea.

    Los datos anteriores arreglados en un cuadro de distribucin de frecuencia se muestran a

    continuacin:

    xi fi fr xi fi fr

    15.2 1 3.33 16.1 1 3.33

    15.4 1 3.33 16.2 2 6.67

    15.6 3 10.00 16.3 3 10.00

    15.7 2 6.67 16.4 2 6.67

    15.8 3 10.00 16.6 1 3.33

    15.9 4 13.33 16.8 2 6.67

    16.0 4 13.33 16.9 1 3.33

    Total 18 60.00 Total 12 40.00

    Hay autores que consideran la siguiente forma de presentacin de cuadros de frecuencia donde

    incluyen elementos que son propios de las Tablas de Frecuencias Absolutas y Relativas. Esto se

    muestra a continuacin:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Variable Frecuencias absolutas Frecuencias relativas

    xi Simple(fi) Acumulada (fia) Simple (fr) Acumulada (fra)

    X1 f1 f1 fr1 = f1 / fi Fr1

    X2 f2 f1 + f2 fr2 = f2 / fi fr1 + fr2

    ... ... ... ... ...

    Xn-1 fn-1 f1 + f2 ++ fn-1 fr-1 = fn-1 / fi fr1 + fr2 ++ fr-1

    Xn fn fi= n frn = fn / fi 1 100

    Veamos un ejemplo:

    Medimos la altura de los nios de una clase con instrumental de precisin y en condiciones

    adecuadas, escogiendo a todos sus componentes, 30 sujetos, y obtenemos los siguientes

    resultados (m):

    Alumno Estatura Alumno Estatura Alumno Estatura

    1 1.25 11 1.23 21 1.21

    2 1.28 12 1.26 22 1.29

    3 1.27 13 1.30 23 1.26

    4 1.21 14 1.21 24 1.22

    5 1.22 15 1.28 25 1.28

    6 1.29 16 1.30 26 1.27

    7 1.30 17 1.22 27 1.26

    8 1.24 18 1.25 28 1.23

    9 1.27 19 1.20 29 1.22

    10 1.29 20 1.28 30 1.21

    Puesto que todas las tallas estn comprendidas entre 1.20 y 1.30 m., podemos agruparlas por

    centmetros formando 11 grupos indicando cuntos nios presentan cada uno de los valores. Si

    presentamos esta informacin estructurada (agrupada) en un cuadro de frecuencias obtendramos

    la siguiente:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Cuadro de frecuencia

    Observacin Frecuencias

    fi fia fr (%) fra

    1.20 1 1 3.33 3.33

    1.21 4 5 13.33 16.66

    1.22 4 9 13.33 30.00

    1.23 2 11 6.67 36.66

    1.24 1 12 3.33 40.00

    1.25 2 14 6.67 46.66

    1.26 3 17 10.00 56.66

    1.27 3 20 10.00 66.66

    1.28 4 24 13.33 80.00

    1.29 3 27 10.00 90.00

    1.30 3 30 10.00 100.00

    Total 30 100

    Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces,

    entonces conviene agruparlos por intervalos mayores. ya que de otra manera obtendramos una

    tabla de frecuencia muy extensa que aportara muy poco valor a efectos de sntesis.

    Supongamos que ahora medimos la estatura de los habitantes de una vivienda (tambin 30

    personas) y obtenemos los siguientes resultados (m):

    Habitante Estatura Habitante Estatura Habitante Estatura

    1 1.15 11 1.53 21 1.21

    2 1.48 12 1.16 22 1.59

    3 1.57 13 1.60 23 1.86

    4 1.71 14 1.81 24 1.52

    5 1.92 15 1.98 25 1.48

    6 1.39 16 1.20 26 1.37

    7 1.40 17 1.42 27 1.16

    8 1.64 18 1.45 28 1.73

    9 1.77 19 1.20 29 1.62

    10 1.49 20 1.98 30 1.01

    Los datos son menos homogneos (ms dispersos) que en el caso de los nios de un grupo escolar

    (todos de la misma edad) y si presentramos esta informacin en un cuadro de frecuencia

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    obtendramos 30 lneas (una para cada valor), cada uno de ellos con una frecuencia absoluta de 1 y

    con una frecuencia relativa del 3.3%. Esta tabla nos aportara toda la informacin inicial, pero

    sera muy difcil de manejar si en vez de 30 personas fueran 300. 3000 o ms: en definitiva, de

    escaso valor prctico. Lo que quiere decir lo anterior, es que si bien es cierto que los cuadros de

    frecuencias tienen ms capacidad de resumir la informacin, esto no siempre se logra ya que

    depende de las caractersticas propias de la informacin.

    En lugar de ello, podramos agrupar los datos por intervalos llamados tambin Tablas de

    Frecuencias Absolutas y Relativas, con lo que la informacin queda ms resumida (se pierde por

    tanto algo de informacin), pero es ms manejable e informativa.

    Una tabla de frecuencia absoluta y relativa no es ms que la agrupacin de una base de datos en

    subgrupos llamados clases o intervalos de clases.

    Cada intervalo de clase o clase posee dos elementos, Lmite inferior y Lmite superior. La

    semisuma de ambos origina un elemento ms en una tabla de frecuencia absoluta y relativa

    denominado Punto medio de clase (PMC) o bien Marca de clase.

    El primer tropiezo que se afronta es decidir cuntas grupos o clases debern establecerse y si

    stas tendrn la misma anchura. Es recomendable en la prctica utilizar entre 5 y 20 clases

    inclusive hay autores que recomiendan hasta 25 clase, y normalmente conviene construirla de

    modo que todas las clases tengan la misma anchura. La anchura de clase recibe tambin el nombre

    de Intervalo de Clase o bien Amplitud de clase.

    Una manera de resolver este problema es utilizar la frmula de Stirling (Sturge) K = 1 + 3.33*

    log(n), donde k es el nmero de clases o intervalos que se deben construir. Para el caso en

    cuestin sera:

    k = 1 + 3.3*log(30) = 5.87. Como se puede recordar que nmero de intervalos viene a ser una

    variable cuantitativa discreta, entonces tiene que tomar valores cerrados. De acuerdo a lo

    anterior y basado en leyes matemticas se redondea al inmediato superior, es decir, 6. Hay

    autores que sugieren siempre esto.

    Un segundo problema que se afronta se refiere a la determinacin del Ancho del Intervalo de

    Clase. Este problema se resuelve calculando primeramente la diferencia entre el mayor y el menor

    valor numrico de los datos, llamado tambin Rango, Recorrido o Amplitud (A). En el caso del

    ejemplo es: A = 1.98 - 1.01 = 0.97. Esto indica que la suma de las amplitudes de clase de los

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    intervalos de clase deber cubrir al menos esta diferencia. Si 0.97 se divide entre 6, se obtiene

    un resultado de 0.16. Si se multiplica la anchura de clase (Ac) determinada por el nmero de

    intervalos K = 6, (al resultado se le llama Rango Ideal) se tiene el siguiente resultado: 0.16*6 =

    0.96. Si se recuerda la amplitud de los datos es de 0.97, por lo tanto esta anchura de clase (Ac)

    no es suficiente para cubrirla por tal razn, algunos autores recomiendan redondearlo al

    inmediato superior que en este caso sera de 0.17. Repitiendo el proceso, se tiene que 0.17*6 =

    1.02. Un aspecto importante de sealar es que si bien es cierto que se pasa de 1.98 con 3

    centsimas, cubre la amplitud de los datos. Por esto se dice que Ac*k = al menos debe ser igual a

    la amplitud de los datos, es decir, no importa si se pasa del valor mximo.

    Un tercer aspecto que hay que resolver es por donde iniciar la construccin de los intervalos de

    clases. Para el caso de variables cuantitativas continuas, se habla de una medida de

    desplazamiento (MD) que es igual al Rango ideal (RI) menos la Amplitud de los datos (A), donde RI

    es igual Ac * k, esto es:

    MD = RI A, entonces: MD = [(0.17*6) 0.97]/2 =0.025, o aproximadamente 0.03.

    Este es el desplazamiento que debe tener el valor mnimo para iniciar la construccin de los

    intervalos. Al construir el primer intervalo, al valor mnimo le restamos el desplazamiento es

    decir, 1.01 0.03 = 0.98, ste es el lmite inferior del primer intervalo de clase y su lmite

    superior ser 0.98 + Ac, es decir, 0.98 + 0.17 = 115, Para el caso del segundo intervalo de clase, su

    lmite inferior es el lmite superior del primer intervalo de clase o sea 115 y el lmite superior

    ser 1.15 + 0.17 = 1.32 y as sucesivamente hasta llegar al nmero de intervalos definidos. Esto es

    continuidad, ya que no existe ruptura entre intervalos.

    Entonces, para este tipo de variable (cuantitativa continua), los intervalos de clases son abiertos

    por la izquierda y cerrados por la derecha.

    Luego se determina los Puntos Medios de Clase o Marcas de Clase en la segunda columna de la

    tabla, esto es: PMC = (Li + LS)/2.

    Posteriormente en una tercera columna se determinan las frecuencias absolutas, que en este caso

    se define como el nmero de observaciones que caben dentro del intervalo de clase. Para que

    quepa una observacin dentro de un intervalo de clase en este tipo de variable, ste tiene que ser

    mayor que el lmite inferior o menor igual que el lmite superior.

    La tabla antes mencionada quedara de la siguiente forma:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Intervalos de Clase PMC fi fr fia fra

    0.98 a 1.15 1.065 2 6.67 2 6.67

    1.15 a 1.32 1.235 5 16.67 7 23.33

    1.32 a 1.49 1.405 8 26.67 15 50.00

    1.49 a 1.66 1.575 7 23.33 22 73.33

    1.66 a 1.83 1.745 4 13.33 26 86.67

    1.83 a 2.00 1.915 4 13.33 30 100

    30 100

    Para el caso de variables cuantitativas discretas, los intervalos de clases son cerrados por ambos

    lados.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    METODOS GRAFICOS

    Dentro de las representaciones grficas se pueden mencionar las siguientes:

    Diagrama de puntos

    Pictogramas

    Diagrama de barras sencillas, dobles, mltiples

    Diagrama de sectores torta o pastel (pie)

    Histogramas de frecuencias

    Polgono de frecuencias absolutas relativas

    Polgono de frecuencia acumulada por la izquierda (menor que) u ojiva

    Grficos de lnea, etc.

    Para efecto de este texto se desarrollarn los principales como son el Diagrama de Puntos

    por su relacin con el Diagrama de dispersin, Histograma de frecuencia, Polgono de

    frecuencia, Ojiva y Diagrama de sectores.

    Diagrama de Puntos

    Sirve para representar grficamente cuadros de frecuencias en las cuales se consideran

    nicamente una variable y una cantidad asociada a cada valor de la misma (frecuencias). Existen

    dos tipos de diagramas de puntos cuya construccin se detalla enseguida.

    La construccin de los diagramas de puntos se realiza de la siguiente manera:

    El primer tipo de diagrama de puntos se construye colocando en el eje horizontal los

    valores de la variable y en el eje vertical las cantidades asociadas a stos (frecuencias).

    Finalmente, para cada valor de la variable y cada cantidad asociada se dibuja puntos cuyas

    alturas corresponde a la magnitud de dicha cantidad.

    Para construir el segundo tipo de diagrama de puntos se colocan en el eje horizontal los

    valores de la variable y sobre cada valor se dibuja tantos puntos como veces aparecen

    stos.

    Para ejemplificar el primer caso se retomar las alturas de los 30 habitantes que han sido

    mencionados anteriormente.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    En este caso se puede observar que los valores de la variable altura se encuentran en el eje

    horizontal y en el vertical, el nmero de habitantes, y el punto est compuesto por las

    coordenadas (altura, Nmero de habitantes con esa altura).

    Histograma

    Se llama Histograma a la grfica de barras verticales sin espaciamiento entre ellas, construida

    colocando en el eje vertical a las frecuencias absolutas relativas y el eje horizontal a los lmites

    de clase de una tabla de frecuencias. Lo anterior implica que si los intervalos de clases son

    iguales, sobre cada clase se erigen rectngulos cuyas reas son proporcionales a las frecuencias

    de clase. Las etapas que se deben de cubrir en la construccin de un histograma son:

    Colocar en el eje horizontal los lmites de clases

    Colocar en el eje vertical las frecuencias relativas o absolutas.

    Erigir rectngulos cuya base son las clases y su altura las frecuencias que corresponde a

    cada clase

    Para ejemplificar este mtodo grfico se tomar a la tabla de frecuencia absoluta y relativa

    y las frecuencias absolutas asociada a cada clase.

    0 0.5 1 1.5 2 2.5

    Estatura (mt)

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    En este caso, dado que se utiliz la frecuencia absoluta para construir el histograma entonces el

    histograma toma el nombre de Histograma de Frecuencias Absolutas.

    Polgono de Frecuencia

    Un polgono de frecuencia es una grfica de lneas rectas que unen los puntos obtenidos al colocar

    en el eje horizontal a los valores medios (puntos medios) de clases y en el eje vertical a las

    frecuencias absolutas o relativas. Esto equivale a unir los puntos medios de la cara superior de los

    rectngulos de un histograma por medio de lneas rectas.

    Para cerrar el polgono se adiciona una clase tanto inferior como superior para que el polgono

    cierre.

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    Fre

    cuenc

    ias

    abso

    luta

    s

    Intervalos de clases

    0123456789

    Fre

    cuenc

    ias

    abso

    luta

    s

    Puntos Medios de Clases

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    En este caso al igual que el histograma, el polgono retoma el nombre de la frecuencia que se ha

    utilizado para construir.

    Polgono de Frecuencia Acumulada por la Izquierda o Ojiva

    Una Ojiva o Polgono de Frecuencia Acumulada es una grfica construida con segmentos de lneas

    rectas que unen los puntos obtenidos al colocar en el eje horizontal a los lmites superiores de

    clase y en el vertical a las frecuencias acumuladas absolutas o relativas.

    Al inicio en el eje horizontal se coloca el lmite inferior de la primera clase y se le asigna una

    frecuencia acumulada de cero. Asimismo, por su naturaleza una ojiva es no decreciente.

    Retomando como ejemplo la misma tabla de frecuencia absoluta y relativa, se tomarn las

    frecuencias absolutas acumuladas por la izquierda o menor que de sta.

    Diagrama de Sectores (Torta o pastel)

    Este tipo de grfico se utiliza para representar datos cualitativos y cuantitativos discretos. Su

    uso ms frecuente es con el propsito de comparar ya sea las categoras que toma una variable

    cualitativa o los valores discretos de una variable cuantitativa respecto al total.

    Para construir este grfico se utiliza una circunferencia, la cual se divide en sectores de tal

    manera que sus medidas angulares centrales y, por ende la superficie del sector circular sean

    proporcionales a las magnitudes de los valores de la variable que se trata de representar.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Al total de las frecuencias (fi = n) le corresponde el crculo completo, es decir, los 3600 de la

    circunferencia y por regla de tres simple se determina el nmero de grados que le corresponde a

    cada categora o valor discreto en particular.

    Ejemplo:

    Los datos que se muestran a continuacin corresponden a la distribucin de los docentes de una

    universidad en particular, respecto al lugar de realizacin de estudios de diplomados.

    Lugar de realizacin del Diplomado n %

    Extranjero 19 13.87

    Universidad de Inters 87 63.5

    Otras universidades bolivianas 31 22.63

    Total 137 100

    Tratando de representar estos datos en diagrama de sectores se tiene lo siguiente:

    Nmero de grados para la categora Extranjero.

    = (19 x 3600)

    = 49.9 = 50 137

    De la manera que quedara de la siguiente forma una vez que se hayan realizado las operaciones

    correspondientes:

    Lugar de realizacin del Diplomado n Grados

    Extranjero 19 50

    Universidad de Inters 87 229

    Otras universidades bolivianas 31 81

    Total 137 360

    De forma grfica se vera de la siguiente forma:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    MEDIDAS DE TENDENCIA CENTRAL O POSICIN

    Como se pudo observar en la unidad anterior los histogramas o distribuciones de frecuencias

    presentan formas muy variadas, por lo que no es fcil de comparar dos conjuntos de datos

    mediante una inspeccin somera de los histogramas. Por otra parte, una tabla de frecuencia con

    15 a 20 clases puede no ser una representacin suficientemente concisa de los datos. Por estas

    razones y por su importancia en posteriores usos es necesario contar con cantidades que

    describan sucintamente (rpidamente) el conjunto de datos que se estudia. Son de inters

    cantidades que localicen el "centro" de las observaciones (o ms bien de su distribucin de

    frecuencias) y la dispersin o variabilidad de las mismas.

    A las medidas que localizan el "centro" de los datos se les llama "Medidas de Tendencia Central" y

    las que miden la variabilidad de las observaciones se les llama "Medidas de Dispersin".

    Dentro de las medidas de Tendencia Central se pueden mencionar las siguientes:

    Media o promedio

    Media ponderada

    Media Geomtrica

    Media Armnica

    Media Cuadrtica

    Extranjero

    14%

    Universidad

    de Inters

    63%

    Otras

    universidades

    bolivianas

    23%

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Mediana

    Moda

    Por el grado de aplicabilidad sern desarrollada la siguientes medidas de tendencia central: media

    aritmtica, mediana y moda y, como un caso especial de la media aritmtica, la media ponderada.

    Media Aritmtica

    Tambin llamada media. Def: La media aritmtica de n observaciones de la variable X se denotar

    por , y se define como la suma de ellas dividida por "n". Esto es:

    = =

    Ejemplo:

    Sean los siguientes datos x1=2, x2=12, x3=9, x4=10, x5=7. La media aritmtica de estos datos es:

    = 2 + 12+9+10+7

    5= 8

    Desde un punto de vista geomtrico, la media aritmtica corresponde al punto de equilibrio de los

    datos.

    La media aritmtica es la medida descriptiva de tendencia central ms usada. Tiene la ventaja de

    ser fcil de calcular, adems de poseer propiedades tericas excelente desde el punto de vista de

    la estadstica inferencia. Su principal desventaja es que, por ser el punto de equilibrio de los

    datos es muy sensible a la presencia de observaciones extremas. Por otro lado su clculo se vuelve

    tedioso cuando la base de datos es muy grande. Otra desventaja es que no se puede calcular en

    datos que tienen intervalos de clases abiertos.

    Clculo de la Media Aritmtica en Tablas de Frecuencias

    En muchas ocasiones se nos presenta el problema de estimar la media a partir de una tabla de

    frecuencias. Esto se da por dos razones:

    Ya se han presentado los datos en forma resumida y no se dispone de las observaciones

    originales.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Cuando se dispone de las observaciones originales, pero su nmero es tan grande que las

    operaciones aritmticas necesarias para el clculo de la media requieren de mucho

    trabajo. Entonces el uso de una tabla de frecuencias simplifica considerablemente el

    trabajo.

    Se debe de recordar que cuando se tiene una tabla de frecuencias con k clases se da lo

    siguiente:

    =

    =1

    En una clase se tienen fi observaciones (frecuencia absoluta), las cuales pueden tener cualquier

    valor entre el lmite superior e inferior de esa clase. Para calcular de una manera aproximada la

    media, se supone que las observaciones se encuentran uniformemente distribuidas en el intervalo

    y, por lo tanto, el valor medio de clase (Punto medio de clase o Marca de Clase) es un valor

    representativo de esa clase.

    Con esta suposicin el clculo de la suma de las observaciones se simplifica de la siguiente manera:

    =1

    Esta expresin representara la suma aproximada de las observaciones; por lo tanto, la media

    aritmtica se estimara de la siguiente manera:

    = =

    Todo lo anterior es posible siempre y cuando no se tengan clases abierta en la tabla.

    Ejemplo:

    Para ejemplificar la media aritmtica para datos tabulados se retomar la tabla de frecuencias

    absolutas y relativas que se ha expuesto anteriormente, la cual corresponde a la estatura de 30

    personas. Se pide estimar la estatura promedio de estas personas.

    Es importante ver que lo que se ha solicitado es una estimacin de la estatura y no una

    determinacin ya que en datos lo nico que se puede hacer es una estimacin ya que la

    determinacin se la realiza en los datos originales.

    Retomando la ecuacin de estimacin de la media aritmtica se tiene lo siguiente:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Intervalos de Clase PMC fi PMC*fi

    0.98 a 1.15 1.065 2 2.13

    1.15 a 1.32 1.235 5 6.175

    1.32 a 1.49 1.405 8 11.24

    1.49 a 1.66 1.575 7 11.025

    1.66 a 1.83 1.745 4 6.98

    1.83 a 2.00 1.915 4 7.66

    Total 45.21

    Promedio 45.21/30 = 1.507

    = 45.21

    30= 1.507/

    La estimacin proporcion un valor de 1.507 m/persona. La determinacin del promedio en la base

    de datos original, es de 1.513 m/persona. Siempre se observar una diferencia que es producida

    por el hecho de que en una tabla de frecuencia lo que se realiza es una estimacin y no una

    determinacin. Esta diferencia ser cada vez menor si la medida de desplazamiento para

    construir la tabla sea pequea.

    Propiedades de la Media Aritmtica

    La media aritmtica tiene muchas propiedades sin embargo, solo se expondr una por la relevancia

    que tiene a nivel de inferencia y es la siguiente:

    La suma algebraica de las desviaciones de un conjunto de nmeros respecto a su media

    aritmtica es cero, es decir: = = . Esta es la razn por la cual le media se la

    interpreta como el punto de equilibrio de una coleccin de datos numrica y adems, es

    por ello que en Estadstica se le conoce como el primer momento.

    Mediana

    Es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50% de

    valores son inferiores y otro 50% son superiores).

    No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en

    su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces

    que se ha repetido).

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    La mediana (Me) de un conjunto de n nmeros, ordenados de menor a mayor, es el nmero

    central en el arreglo. Si n es un nmero non, slo hay un valor central. Si n es un nmero par, hay

    dos valores centrales, y la mediana debe tomarse como la media de estos dos valores. Ejemplo...

    1.- Sean la siguiente coleccin de datos: 27, 3.4, 3.2, 3.3, 3.1

    El primer paso para determinar la Mediana en datos sin tabular es ordenar los datos en orden

    ascendente o descendente de tal forma que:

    3.1, 3.2, 3.3, 3.4, 27. Dado que n es un nmero non o impar (n=5), entonces slo hay un valor

    central (3.3) y ste es el valor de la mediana.

    Me = 3.3

    2.- Calcular la mediana para los siguientes datos y ordenados:

    151, 152, 153, 158, 162, 167, 167, 167, 168, 173

    En este caso n es par (n=10), por lo que hay dos valores centrales, que son 162 y 167. Entonces

    partiendo del concepto de Mediana, la Me es la media aritmtica de estos dos valores ya que

    antes y despus de ella, no existe ms del 50% de los datos.

    Me = (162 + 167)/2 = 164.5. Entonces cuando este sea el caso la Me, se puede determinar de la

    siguiente forma:

    =

    +

    +

    Cuando los datos son simtricos entre la mediana y la media aritmtica no hay mucha diferencia;

    sin embargo, para datos no simtricos es mejor medida de tendencia central la mediana que la

    media.

    Clculo de la Mediana en datos tabulados

    Cuando los datos estn agrupados en clases, es decir, cuando existe una tabla de distribucin de

    frecuencias, para estimar la mediana se utiliza la siguiente ecuacin:

    = + (. )

    Donde:

    Me = Mediana

    a = Lmite inferior de la clase de la Mediana

    b = Lmite superior de la clase de la Mediana

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    c = Frecuencia relativa acumulada una clase antes de la clase de la Mediana

    d = Frecuencia relativa de la clase de la Mediana

    Como se puede observar todos los insumos requeridos para la determinacin de la Me, estn en la

    misma tabla.

    Como se ha verificado anteriormente, la mediana es aquella medida de tendencia central que antes

    y despus de ella no existe ms del 50% de la informacin, es decir, parte en dos la base de

    datos. A partir de esto es que se propuso partir la base de datos en cuatro partes y se le llam

    cuartiles, luego en 10 parte y se les llam deciles y luego en 100 partes y se les llam percentiles.

    A todo esto se llaman Fractiles o Cuantiles, los cuales no se desarrollan en el presente documento

    pero si se recomienda revisar cualquiera de la obras citadas al final de este documento para

    verificar esta informacin.

    Moda

    La Moda (Mo) de un conjunto de datos es la observacin o valor (si existe) que ocurre con mayor

    frecuencia. Si es un valor nico se dice que la distribucin de frecuencias es unimodal. Si se

    tienen dos o ms valores con la misma frecuencia mxima se dice que la distribucin es bimodal,

    trimodal, etc. Ejemplo: sean los siguientes datos las calificaciones de un examen:

    10, 7, 8, 7, 9, 8, 7, 9.

    En este caso la calificacin que ms se repite es 7 ya tiene una frecuencia fi =3, por lo tanto la

    Mo es 7.

    Sean los siguientes datos:

    10, 6, 7, 4, 13, 16, 18

    Como se puede observar en estos datos todos tienen una frecuencia absoluta igual a 1, por lo

    tanto no tiene moda este conjunto de datos. Las distribuciones de este tipo se les llaman

    uniformes.

    Sean los datos: 4, 3, 4, 7, 2, 7, 5, 4, 7, 5, 9, 7, 4

    Aqu se puede observar que los valores numricos con mayor e igual frecuencia son los valores 4 y

    7 por lo tanto la moda de estos datos es 4 y 7, o sea que una distribucin bimodal.

    Cuando los datos se encuentran organizados en Cuadros de frecuencia, la Mo es el valor que tiene

    la mayor frecuencia absoluta. Ejemplo:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Los datos que se muestran a continuacin, corresponden a la estatura de 30 personas que

    conformaron una muestra. Segn el cuadro de frecuencia donde se presenta esta informacin,

    existen 3 valores que tienen la mayor frecuencia absoluta. Estos son 1.21, 1.22 y 1.28 con fi = 4;

    por lo tanto existen 3 Modas. stas son: 1.21, 122 y 1.28 m, por lo tanto la distribucin es

    trimodal.

    Observacin Frecuencias

    fi fia fr (%) Fra

    1.20 1 1 3.33 3.33

    1.21 4 5 13.33 16.66

    1.22 4 9 13.33 30.00

    1.23 2 11 6.67 36.66

    1.24 1 12 3.33 40.00

    1.25 2 14 6.67 46.66

    1.26 3 17 10.00 56.66

    1.27 3 20 10.00 66.66

    1.28 4 24 13.33 80.00

    1.29 3 27 10.00 90.00

    1.30 3 30 10.00 100.00

    Total 30 100

    Cuando la informacin se encuentra organizada en una tabla de frecuencias absoluta y relativa, la

    Mo se puede estimar a travs de la siguiente ecuacin:

    = + [

    + ( )]

    Donde:

    Mo = Moda

    Licm = Lmite inferior de la clase modal

    Acm = Amplitud de clase de la clase modal

    ficm =Frecuencia absoluta de la clase modal

    ficprem = Frecuencia absoluta de la clase postmodal

    ficpostm = Frecuencia absoluta de la clase postmodal

    Ejemplo:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Sea la siguiente tabla de frecuencia absoluta y relativa correspondiente a la variable estatura de

    30 personas.

    De hecho la variable estatura es una variable cuantitativa continua, adems la tabla lo demuestra

    ya que entre los intervalos no existe ruptura, es decir, que el lmite superior de la primera clase

    es el inferior de la siguiente clase. Es por ello que se dicen que son abiertos por la izquierda y

    cerrados por la derecha.

    Intervalos de Clase PMC fi

    (0.98 a 1.15] 1.065 2

    (1.15 a 1.32] 1.235 5

    (1.32 a 1.49] 1.405 8

    (1.49 a 1.66] 1.575 7

    (1.66 a 1.83] 1.745 4

    (1.83 a 2.00] 1.915 4

    En este caso la clase modal sera aquella que tiene mayor frecuencia absoluta, esta es:

    (1.32 a 1.49] =8, entonces partiendo de la ecuacin proporcionada anteriormente:

    = + [

    + ( )]

    Mo = 1.32 + 0.17 [(8 - 5)/((8 - 5) + (8 7)) = 1.4475

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    MEDIDAS DE DISPERSION

    Estas son las medidas que miden como se dispersan los datos, generalmente alrededor de una

    medida de tendencia central. Entre stas se pueden mencionar las siguientes:

    Rango o Amplitud

    Desviacin Media y Mediana

    Varianza y Desviacin Tpica

    Dispersin Relativa

    Generalmente las ms utilizadas son: Varianza, Desviacin tpica y Dispersin relativa o

    Coeficiente de Variacin y una que en los mtodos tabulares ya se ha utilizado como es el Rango.

    Rango

    La Amplitud, Rango o Recorrido de un conjunto de datos es la diferencia entre las observaciones

    de mayor y menor valor numrico en el mismo.

    R = Valor mximo - Valor mnimo

    Tiene la ventaja de ser fcil su determinacin, pero no es una buena medida de dispersin ya que

    solo toma en cuenta dos valores de toda la coleccin y no idea de cmo es la variabilidad dentro

    de los datos.

    Varianza

    La varianza retoma un nombre de acuerdo a dnde se determina. Si la determinacin es en una

    poblacin se la llama Varianza Poblacional () y si es en una muestra se le llama Varianza

    Muestral (s).

    La Varianza Poblacin o Variancia de una poblacin finita de N elementos x1, x2, x3, ...xn; se

    define como la media aritmtica del cuadrado de las desviaciones de las observaciones respecto a

    su media ; y se determina a travs de la siguiente ecuacin para varianza poblacional:

    = ( ) =

    En caso de que sea muestral y para datos no organizados en una tabla de frecuencia absoluta y

    relativa, se determina de la siguiente forma:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    = ( ) =

    Para datos tabulados, la varianza se determina de la siguiente manera:

    = =

    ( = )

    Existe una frmula de trabajo mucho ms rpido para determinar la varianza muestral para datos

    no tabulados que resulta de desarrollar en trinomio cuadrado perfecto de la ecuacin. Esta

    frmula es:

    = =

    ( = )

    Ejemplo:

    Sean los siguientes datos las estaturas de 30 estudiantes de un saln de clases

    Alumno Estatura Alumno Estatura Alumno Estatura

    1 1.25 11 1.23 21 1.21

    2 1.28 12 1.26 22 1.29

    3 1.27 13 1.30 23 1.26

    4 1.21 14 1.21 24 1.22

    5 1.22 15 1.28 25 1.28

    6 1.29 16 1.30 26 1.27

    7 1.30 17 1.22 27 1.26

    8 1.24 18 1.25 28 1.23

    9 1.27 19 1.20 29 1.22

    10 1.29 20 1.28 30 1.21

    = =

    ( = )

    xi = (1.25 + 1.28 + 1.27 + 1.21) = 47.1558

    xi = (1.25 + 1.28 + 1.27 + 1.21) = 37.6

    n = 30

    S = 47.1558 -

    (37.6)

    30

    30-1

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    S = 0.00105 m

    Dado que se determina o se estima la varianza se eleva al cuadrado las unidades originales de

    medicin razn por la cual no se debe comparar con la media aritmtica ya que sta es medida en

    unidades lineales. Por esta razn, es que se propone una nueva medida de dispersin llamada

    Desviacin Tpica.

    Desviacin Tpica

    No es ms que la raz cuadrada positiva de la varianza. En este sentido se puede hablar entonces

    desviacin tpica poblacional y muestral, entonces:

    =

    S = S

    Para el caso del ejemplo anterior, S = 0.00105 = 0.0324 m

    Este dato indica que los datos se dispersan en promedio 0.0324 m del promedio de la variable

    Estatura.

    Coeficiente de Variacin

    Todas las medidas de dispersin antes descritas son medidas de variacin absoluta. Una medida

    de la dispersin relativa de los datos, que toma en cuenta su magnitud, est dada por el

    Coeficiente de Variacin.

    Coeficiente de Variacin (C.V): Es una medida de dispersin relativa de un conjunto de datos,

    que se obtiene dividiendo la desviacin estndar del conjunto datos entre su media aritmtica.

    . =

    Cuando se multiplica por 100 se expresa en porcentaje indicando tanto por uno que se alejan los

    datos de su media aritmtica.

    . =

    Ejemplificando con los datos anteriores se tendra:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    C.V = (0.0324/1.253)*100 = 2.586%, indicando con ello que por cada valor de la media los datos se

    dispersan en un 2.586% alrededor de ella.

    Ejemplo.

    Sean la siguiente tabla de frecuencia absoluta y relativa, las estaturas correspondientes a 30

    estudiantes. La tabla es la siguiente

    Intervalos de Clase PMC fi

    (0.98 a 1.15] 1.065 2

    (1.15 a 1.32] 1.235 5

    (1.32 a 1.49] 1.405 8

    (1.49 a 1.66] 1.575 7

    (1.66 a 1.83] 1.745 4

    (1.83 a 2.00] 1.915 4

    Determine el Coeficiente de Variacin de los datos.

    Ntese que solo piden CV, entonces necesitamos dos insumos, la desviacin tpica y la media

    aritmtica de los mismos. Como se necesita S, entonces se necesita de S. Entonces realizando

    los clculos necesarios en la misma tabla se obtienen todos los insumos para la estimacin del

    Coeficiente de variacin como se muestra a continuacin. Note que lo que se hizo fue generar los

    componentes de las ecuaciones a determinar:

    Intervalos de Clase PMC fi PMCfi PMCfi

    (0.98 a 1.15] 1.065 2 2.2685 2.13

    (1.15 a 1.32] 1.235 5 7.6261 6.175

    (1.32 a 1.49] 1.405 8 15.792 11.24

    (1.49 a 1.66] 1.575 7 17.364 11.03

    (1.66 a 1.83] 1.745 4 12.18 6.98

    (1.83 a 2.00] 1.915 4 14.669 7.66

    Totales 30 69.9 45.21

    = =

    ( = )

    S = 69.9 -

    (45.21)

    30

    30-1

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    S = 0.0609

    S = 0.0780

    = =

    = 45.21/30 = 1.507

    . =

    C.V = (0.0078/1.507)*100 = 0.5176

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    DEFORMACION DE CURVAS UNIMODALES

    Una curva unimodal se puede deformar de dos maneras, respecto a un eje horizontal o bien

    respecto a un eje vertical.

    Cuando se trata de una deformacin horizontal se habla de Asimetra y cuando se habla de

    deformacin vertical se habla de Curtosis.

    Asimetra

    Asimetra es el grado de deformacin horizontal que presente una curva unimodal respecto al eje

    horizontal. De acuerdo a ello se puede tener lo siguiente:

    Asimetra Positiva: Se dice que una distribucin de frecuencia unimodal presenta asimetra

    positiva o a la derecha, si tiene una ramificacin ms extendida hacia la derecha o hacia los

    valores grandes de una variable. Esto indica que la variable tiende a tomar valores mayores que su

    promedio y la relacin que se establece entre las principales medidas de tendencia central es la

    siguiente: > >

    Asimetra Negativa: Una distribucin unimodal tiene asimetra negativa o hacia la izquierda, si

    tiene una ramificacin ms extendida hacia la izquierda indicando con ello que la variable tiende a

    tomar valores inferiores a su promedio. En este caso, la relacin que se establece entre las

    principales medidas de tendencia central es la siguiente: < <

    La siguiente grfica resume la asimetra negativa y positiva

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Curva Simtrica: En este caso la variable se deforma proporcionalmente con respecto al eje

    horizontal y la relacin que se establece entre las principales medidas de tendencia central es la

    siguiente: = =

    = =

    Coeficiente de Asimetra

    La medida ms usada para cuantificar la asimetra de la distribucin de frecuencias de una

    variable X, recibe el nombre de coeficiente de asimetra y que desde el punto de vista de

    momento (tercer momento) tiene por ecuacin:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    =

    ( )3=1

    3

    La ecuacin antes expuesta es para datos sin organizar o datos no tabulados. Aqu se puede

    observar que si existen observaciones muy grandes en relacin a la media, el coeficiente de

    asimetra tendr un valor positivo. Si existen observaciones muy pequeas (menor que la media),

    el coeficiente de asimetra ser negativo y, finalmente, si las observaciones estn simtricamente

    distribuidas alrededor de la media, el coeficiente de asimetra tendr el valor de cero.

    Ejemplo.

    Sea los siguientes datos:

    6.2, 7.9, 8.1, 8.5, 8.5, 8.9, 9.1, 10.8

    Determine el CAs.

    = 8.5

    s = 1.29

    3= 2.1388

    xi (xi -x) (xi - x)

    6.2 -2.3 -12.167

    7.9 -0.6 -0.216

    8.1 -0.4 -0.064

    8.5 0.0 0.0

    8.5 0.0 0.0

    8.9 0.4 0.064

    9.1 0.6 0.216

    10.8 2.3 12.167

    =0

    8

    1.293 = 0

    Por lo tanto se puede decir que la distribucin es simtrica, en este caso el promedio, la mediana

    y la moda coinciden en el mismo valor, lo cual puede ser verificado.

    Para datos organizados en una tabla de frecuencia absoluta y relativa el coeficiente de asimetra

    se estimar siempre y cuando la tabla no presente clases abierta, por la siguiente ecuacin:

    =

    ( )3 =13

    Ejemplo:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Intervalos PMC fi PMC*fi 2*fi ( )3fi Fia

    (20.5 a 25.5] 23 3 69 1587 -2736.99887 3

    (25.5 a 30.5] 28 42 1176 32928 -4357.21344 45

    (30.5 a 35.5] 33 21 693 22869 0.5738588 66

    (35.5 a 40.5] 38 7 266 10108 1042.84987 73

    (40.5 a 45.5] 43 3 129 5547 3279.33151 76

    (45.5 a 50.5] 48 2 96 4608 7164.84635 78

    (50.5 a 55.5] 53 2 106 5618 16733.8331 80

    (55.5 a 60.5] 58 2 116 6728 32393.1814 82

    (60.5 a 65.5] 63 1 63 3969 27821.4455 83

    83 2714 93962 81341.8493

    Obteniendo la informacin necesaria de la tabla:

    =2714

    83= 32.698795

    2 =93962

    27142

    8383 1

    = 63.627681

    = 63.6276812

    = 7.976696

    =81341 .8493

    83

    7.976696 3 = 1.9309312; por lo tanto, la asimetra resultante es Positiva, esto quiere decir

    que la > > , lo cual puede demostrarse con la informacin que proporciona la misma tabla.

    Medidas de Curtosis

    Medidas de Curtosis o apuntamiento. Se entiende por Curtosis, la medida de deformacin vertical

    de una distribucin de frecuencias, es decir, la medida de apuntamiento o achatamiento de una

    distribucin.

    La Curtosis mide cuan puntiaguda es una distribucin en general por referencia a la normal.

    La forma de medir la Curtosis o apuntamiento puede ser en funcin de momentos o cuartiles.

    Curtosis en funcin de Momentos:

    En este caso el grado de apuntamiento esta dado por:

    =

    ( )4=1

    4; para datos sin organizar

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    En caso que los datos estn tabulados (organizados) y si la tabla no presente clases abiertas se

    puede estimar Curtosis desde el punto de vista de momento a travs de la siguiente ecuacin:

    =

    ( )4 =14

    El coeficiente de Curtosis puede tomar uno de los siguientes valores, indicando con el tipo de

    deformacin vertical de la curva unimodal. Estos son:

    Kur > 3: Este valor indica que la distribucin es ms apuntada que la normal y recibe el nombre de

    Leptocrtica

    Kur = 3: En este caso la distribucin es moderadamente apuntada y se llama Mesocrtica (o

    apuntamiento normal)

    Kur < 3: Este indica que la distribucin es menos apuntada que la normal, o sea achatada y se llama

    Platicrtica

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    TEORIA DE PROBABILIDADES

    Experimento Aleatorio

    En Estadstica, los conjuntos de inters son colecciones de observaciones obtenidas estudiando el

    comportamiento de un fenmeno, ya sea en estado natural o bien bajo control. Al proceso

    mediante el cual se obtiene observaciones se llama experimento. Los experimentos u operaciones

    reales o hipotticas pueden dividirse en dos clases:

    Experimento Determinstico

    Experimento no Determinstico

    Un experimento es determinstico si su resultados estn completamente determinados y puede

    describirse por una frmula matemtica llamada tambin modelo determinstico (no son de

    inters desde el punto de vista estadstico)

    Ejemplo...

    Supngase que el experimento consiste en lanzar un objeto (piedra) al aire. De hecho sta va a

    caer porque posee un peso y por la fuerza de gravedad que ejerce la tierra. De hecho se puede

    saber cul es el tiempo que tardar en hacerlo. Este experimento se puede modelar por la

    ecuacin de cada libre de los cuerpos. En este caso de hecho se sabe cul ser el resultado que

    se obtendr.

    Otro ejemplo sera si se lanza una pelota al agua, sta de hecho flotar, en caso de ser de hierro

    pues no flotar.

    Un experimento es no determinstico si los resultados del experimento no se pueden predecir con

    exactitud antes de realizar el experimento.

    Ejemplo...

    Supngase que un experimento consiste en la aplicacin de un sedante a una persona que tiene

    dolor de cabeza. Aqu los posibles resultados pueden ser {sanos, enfermos}. En este caso no se

    sabe a ciencia cierta cul de estos dos resultados suceder.

    Otro ejemplo sera el lanzamiento de un dado legal. Aqu los resultados posibles son: {1, 2, 3, 4,

    5,6}. Se sabe cules son los posibles resultados, pero no se sabe cual precisamente.

    En estos ejemplos se puede identificar lo siguiente:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    .- Cada experimento se puede repetir indefinidamente sin cambiar esencialmente las condiciones.

    .- Cada experimento es no determinstico.

    .- Cada experimento tiene varios resultados posibles que pueden describirse con anterioridad con

    precisin (resultados a priori). Entonces a un experimento que presentas las tres caractersticas

    mencionadas anteriormente se llama experimentos aleatorio. En otras palabras, un Experimento

    Aleatorio es aqul cuyos resultados no pueden predecirse antes de su realizacin, y por lo

    tanto, estn sujetos al azar.

    Espacio Muestral y Sucesos Elementales

    Como se ha observado anteriormente, un experimento aleatorio tiene varios resultados posibles y

    que pueden ser escritos con precisin. Entonces: A todo los resultados posibles asociados a un

    experimento aleatorio , se le llama Espacio Muestral y se denotar por M y a cada resultado de

    un espacio muestral M se llamar suceso.

    Ejemplo...

    Extraer un artculo defectuoso de un lote que contiene artculos defectuosos "D" y no defectuosos

    "N"

    M = {D, N}

    .- Lanzamiento de un dado legal

    M = {1, 2, 3, 4, 5,6}

    .- Lanzamiento de una moneda.... M = {C, S}

    .- Designacin de un delegado de un grupo de 50 personas

    M = {A1,A2,....,A50} ... Ai = i-sima persona

    Los experimentos aleatorios pueden ser simples o compuestos. Experimentos aleatorios simples son

    los que se han ejemplificado anteriormente.

    Un experimento aleatorio compuesto consiste en dos o ms experimentos simples que puede ocurrir

    de forma sucesiva o bien de forma simultnea.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Considrese el caso de experimento aleatorio compuesto: aquellos en que los experimentos simples

    estn unidos por la partcula gramatical "o" en el sentido excluyente y aquellos donde los

    experimentos simples estn unidos por la partcula gramatical "y".

    Experimentos compuestos unidos por la partcula "o" excluyente

    Un experimento compuesto , se dice que es una o-combinacin de los experimentos 1 y 2

    s, slo s, el experimento ocurre, cuando el experimento 1 2 ocurren (pero no ambos).

    Esto quiere decir que ocurren de forma sucesiva pero no al mismo tiempo.

    Ejemplo...

    Considrese el experimento consistente en lanzar un dado o una moneda. Determine el espacio

    muestral del experimento.

    M1 = {1,2,3,4,5,6} ... lanzamiento del dado 1

    M2 = {C,S} ... lanzamiento de la moneda 2. Por lo tanto, el espacio muestral asociado a , es la unin

    de M1 y M2. Es decir:

    M = M1 M2 = {1, 2, 3, 4, 5, 6, C, S}

    Experimentos compuestos unido por la partcula "y"

    Un experimento compuesto , se dice que es un y-combinacin de los experimentos simples 1 y

    2, s y slo s, el experimento ocurre, cuando el experimento 1 y 2 ocurre. Lo anterior

    trae como consecuencia que si el experimento compuesto es una y-combinacin de los experimentos

    1 y 2, el espacio muestral M asociado a , es el producto cartesiano de los espacios muestrales

    M1 y M2 correspondiente a 1 y 2, es decir: M = M1 x M2. Ejemplo...

    Se lanza una moneda tres veces. Determine el espacio muestral.

    Aqu se puede observar que el experimento ocurre, si los tres experimentos simples ocurren... i

    = 1,2,3; i= i-simo lanzamiento de la moneda. Esto es:

    M1 = {C,S}

    M2 = {C,S}

    M3 = {C,S}

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    consiste en realizar el experimento 1, luego 2 y luego 3. Por lo tanto: M = M1 x M2 x M3

    M = {CCC, CCS, CSC, SCC, CSS, CSC, SSC, SSS} que resulta del producto cartesiano de los espacio

    muestrales simples que conforman al experimento compuesto como se muestra a continuacin:

    M1*M2

    M3

    M2

    C S

    M1 C S

    CC CCC CCS

    C CC CS

    CS CSC CSS

    S SC SS

    SC SCC SCS

    SS SSC SSS

    Otro ejemplo podra ser el experimento aleatorio compuesto consistente en el lanzamiento de una

    moneda y un dado al mismo tiempo.

    M2

    M1 1 2 3 4 5 6

    C (C,1) (C,2) (C,3) (C,4) (C,5) (C,6)

    S (S,1) (S,2) (S,3) (S,4) (S,5) (S,6)

    En muchos casos un diagrama, conocido con el nombre de Diagrama del rbol, es ms sugerente para

    la determinar el espacio muestral de un experimento aleatorio compuesto.

    Ejemplo... Determine el espacio muestra M del experimento aleatorio compuesto consistente en el

    lanzamiento de tres monedas al mismo tiempo

    (2n) = 24 = 16

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    En este caso el espacio muestral se obtiene con los resultados que tiene cada rama del rbol, es

    decir, M= {CCC, CCS, CSC, SCC, CSS, CSC, SSC, SSS}

    Sucesos y Algebra de sucesos (-Algebra de Borel)

    Como se ha mencionado anteriormente, un suceso es un resultado de un experimento aleatorio. Si se

    ha definido al espacio muestral como todos los posibles resultados de un experimento aleatorio, es

    decir, se puede concebir al espacio muestral como un conjunto universo. Si se ve desde este punto

    de vista, se puede hablar entonces de subconjunto y elementos de este conjunto universo llamado

    espacio muestral. Se llama Evento a cualquier subconjunto del espacio muestral y se le denota por

    A, B, C, D, E, F, etc. As, si A es un evento, entonces A M, y se le llamar suceso a cada elemento

    de un espacio muestral y se le designa por w, x, y, etc. Esto es si x es un suceso, entonces x M. Un

    evento con un slo elemento es un evento elemental.

    Ejemplo: considrese como experimento aleatorio al lanzamiento de un dado y al evento A como la

    ocurrencia de un nmero par. Determine el espacio muestral.

    M = {1, 2, 3, 4, 5, 6}

    A = {2, 4, 6}; entonces se dice que A M

    Dado que ya se ha identificado el espacio muestral como conjunto universal, los eventos como

    subconjunto del espacio muestral, se identificar tambin el conjunto vaco () de la teora de

    conjunto como el evento imposible, esto es, un evento que no se da o sea que no ocurre. Por ejemplo,

    lanzar dos dados simultneamente, y sea el evento A: "obtener suma de 14". De hecho esto nunca va

    a suceder A = {}.

    Sub-evento: Dados dos eventos, A y B se dice que A est contenido en B o que a es sub-evento de

    B, si todo suceso favorable a A, es favorable a B. En otras palabras, si ocurre el evento A, ocurre

    el evento B. Esto es: A B, si wi A w B

    A B

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Igualdad de Eventos: Se dice que dos eventos A y B son iguales si, AB y BA. Esto es: A = B =

    AB y BA.

    Unin de Eventos: Dados dos eventos A y B, se llama unin de A con B y se denota por AB al

    evento formado por los sucesos que pertenecen a A a B , a ambos, es decir:

    AB = {wiM /wiA v wiB}.

    ABAB

    Interseccin: Dados los eventos A y B, se llama interseccin de A con B, al evento formado por

    todos los sucesos favorables a A y a B. Es decir, ambos eventos A y B ocurren. Esto es:

    AB = {w M / w A w B}.

    AB

    Complemento: Si A es un evento del espacio muestral M, se llama complemento de A, al evento

    formado por todos los sucesos que no pertenecen a A. Es decir, no ocurre el evento A. Esto es:

    Ac = M - A = {wi M / wi A}

    Ac

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Eventos Mutuamente Excluyente y colectivamente exhaustivos (complementarios)

    Dos eventos A y B definidos en el mismo espacio muestral, se dice que son mutuamente excluyentes

    si no pueden ocurrir juntos. Es decir la ocurrencia de uno excluye la ocurrencia del otro. Es decir,

    que AB =

    Enfoques de Probabilidades

    Definir probabilidad estrictamente es un poco inadecuado. La formulacin axiomtica de la teora de

    probabilidades requiere niveles de abstraccin y competencia matemtica fuertes. Sin embargo, hay

    autores que plantean enfoques a travs de los cuales se puede abordar las probabilidades. Estos

    enfoques son:

    1. Enfoque o Probabilidad Clsica (llamada tambin de Laplace o Apriori)

    2. Enfoque desde el punto de vista de frecuencia relativa (llamada tambin A posteriori).

    3. Probabilidad subjetiva

    Enfoque Clsico o A priori: Llamado tambin Este definicin se basa en el supuesto de que todos

    los resultados posibles de un experimento aleatorio son igualmente probable, es decir, cada suceso

    de un espacio muestral M, tienen la misma posibilidad de ocurrir.

    Segn Laplace (1812) la probabilidad de un evento es la razn entre el nmero de casos

    (sucesos) favorables y el nmero total de casos (sucesos) posibles, siempre que nada obligue a

    creer que alguno de estos sucesos deban de tener preferencia a los dems, lo que hace que

    todos sean iguales. Esto es:

    =

    Observaciones:

    1.- La probabilidad de un evento cualquiera A est comprendido entre 0 y 1. En efecto nA y n

    son enteros positivos y 0 nA 1. Esto es:

    0/n nA/n n/n 0 P[A] 1

    2.- P [A] = 0, si A es un evento imposible A = ; nA = 0, luego P[A] = 0/n = 0

    3.- P [A] = 1, si A es el evento seguro (A = M), es decir A = M nA = n P[A] = n/n = 1

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    4.- Puesto que todos los elementos de M = (w1, w2, ..., wn} son igualmente probables P[{wi}] = 1/n; i

    = 1, 2,3,..., n P [M] = P[wi] = 1

    Si A es un evento de M P [A] = P [{wi}] wiA

    Ejemplo..... Si se lanza una moneda tres veces. Calcular la probabilidad que ocurran:

    a.- Dos caras

    b.- Al menos dos caras

    c.- A lo ms dos caras

    El espacio muestral de este experimento lo puede obtener a travs de producto cartesiano o bien a

    travs del diagrama del rbol. Determinando el espacio muestral:

    M = {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}

    a.- A = {CCS, CSC, SCC} P[A] = 3/8

    b.- B = {CCC, CCS, CSC, SCC} P[B] = 4/8 = 1/2

    c.- C = {CCS, CSC, CSS, SCC, SCS, SSC, SSS} P[C] = 7/8

    Ejemplo

    Considrese el lanzamiento de dos dados. Calcular la probabilidad de:

    a.- Obtener suma 7

    b.- Obtener suma 6

    c.- Obtener suma mayor que 5

    d.- Que el resultado del primer dado sea mayor que el resultado del segundo dado.

    A = {(w1,w2) M / w1 + w2 = 7}

    B = {(wi,w2) M / w1 + w2 = 6}

    C = {(w1,w2) M / w1 + w2 > 5}

    D = {w1,w2) M / w1 > w2}]

    Determinando el espacio muestral a travs del producto cartesiano de los dos espacios muestrales

    simples de los experimentos que conforman este experimento compuesto se tendra lo siguiente:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    M2

    M1 1 2 3 4 5 6

    1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

    2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

    3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

    4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

    5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

    6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

    P[A] = 6/36 = 1/6 (nA) = 6

    P[B] = 5/36 (nA) = 5

    P[C] = 26/36 (nA) = 26

    P[D] = 15/36 (nA) = 15

    Probabilidad desde el punto de vista de Frecuencia Relativa (o A posteriori).

    Supngase la siguiente pregunta: Cul es la probabilidad de que la mitad o ms de los estudiantes de

    Esta2 obtengan notas aprobatorias?. En este caso y en muchos ms, no sirve de nada enumerar todos

    los resultados posibles. Como se puede observar esta pregunta no se puede responder utilizando la

    definicin clsica de probabilidades, dado que se necesita mayor informacin. Esto conlleva a la

    interpretacin de probabilidades en trminos de vista de frecuencia relativa.

    Si un experimento bien definido se repite n veces (n grande): sean nA < n el nmero de veces

    que el evento A ocurren los n ensayos, entonces la frecuencia relativa de veces que ocurre el

    evento A "nA/n", es la estimacin de la probabilidad que el evento A ocurra, esto es:

    P[A] = nA/n

    Observacin:

    1.- La frecuencia relativa de un evento, est comprendida entre 0 y 1 0 P[A] 1

    2. nA/n = 1, s y slo s, el evento A ocurre en las n repeticiones de experimento. En particular

    nM/n = 1

    Ejemplo.

    Sexo Partido Poltico

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    A B C D E F Total

    Masculino 90 80 65 35 37 13 320

    Femenino 15 20 5 10 3 2 55

    Total 105 100 70 45 40 15 375

    Determine las siguientes probabilidades:

    a. Cul es la probabilidad que un miembro seleccionado aleatoriamente

    b.- Sea una mujer?

    c.- Pertenezca al partido B?

    d.- Sea hombre miembro del partido C?

    Solucin.....

    a.- P[Mujer] = 55/375

    b.- P[B] = 100/375

    c.- P[C] = (70)/375

    Definicin Subjetiva de Probabilidad

    Probabilidad desde el punto de vista subjetivo est relacionada con una presuncin,

    creencia o como algunos autores le llaman corazonada, por lo tanto, puede variar de una

    persona a otra.

    Dado un experimento determinado, la probabilidad de un evento A es el grado de creencia

    asignado a la ocurrencia de este evento por un individuo particular, basado en toda la

    evidencia a su disposicin con las siguientes exigencias:

    1.- P[A] = 0, representa la certeza que el evento A, no ocurrir

    2.- P[A] = 1, representa la certeza que el evento A, s ocurrir

    Principales Teoremas de Probabilidad:

    1. O P[A] 1, para cada evento A en M.

    2. P[M] = 1

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    3. P[AUB] = P[A] + P[B]; siempre y cuando los eventos A y B ocurran por separado o de

    forma independiente.

    4. P [AUB] = P[A] + P[B] P[AB]; en este caso A y B no son eventos independientes,

    es decir, que ocurren al mismo tiempo.

    5. Si A = , entonces P[A] = 0

    6. Eventos mutuamente excluyentes y colectivamente exhaustivos o complementarios.

    Sea A y B, dos eventos en el espacio muestral, se dice que son mutuamente

    excluyente si la ocurrencia de uno de ellos elimina la ocurrencia del otro y viceversa

    y son complementarios si la suma de sus probabilidades, es decir la unin de ambos,

    da como resultado la probabilidad del espacio muestral. Si dos eventos cumplen

    estos dos requisitos se dicen que forman una particin del espacio muestral M.

    7. Sea A es un evento en M, entonces P[A] = 1 P[A]

    Probabilidad Condicional (Dependencia de Eventos)

    A menudo sucede que la ocurrencia de un evento depende de la ocurrencia de otro y es de

    frecuente inters obtener la probabilidad de un evento, donde dicho evento est

    condicionado a la ocurrencia de un subconjunto del espacio muestral (otro evento). Es decir,

    que se dice que el evento B ha ocurrido y se quiere saber la probabilidad que ocurra el

    evento A.

    Sea A y B dos eventos en el espacio muestral M si P [B] 0, se define la probabilidad

    condicional del evento A dado el evento B como:

    / =

    ; P 0

    Es decir, la probabilidad condicional es una probabilidad calculada en un espacio muestral

    reducido, B; pues a partir de la informacin se sabe con probabilidad 1 que el evento B ya

    ocurri. En la prctica se puede resolver este problema usando la definicin, esto es

    calculando la P [AB] y P [B] con respecto al espacio muestral original, o bien considerando

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    la probabilidad del evento A con respecto al espacio muestral reducido B, es decir, del

    evento que condiciona.

    Ejemplo...

    Una empresa tiene 300 trabajadores de los cuales 100 son casados y 30 son divorciados. En

    dicha empresa trabajan 200 hombres, 85 de los cuales son casados y 95 son solteros. Se

    toma un trabajador al azar:

    a. Si el trabajador seleccionado es soltero, cul es la probabilidad que sea mujer?

    b. Si el trabajador seleccionado es mujer, cul es la probabilidad que sea soltera?

    c. Cul es la probabilidad que sea mujer o est casada?

    Solucin

    Lo primero que se tiene que hacer es extraer la informacin que proporciona el problema y

    ver como se puede completar la siguiente. Por otro lado se debe de partir del hecho que la

    informacin proporcionada se puede clasificar de acuerdo a dos criterios los cuales son: el

    sexo de los trabajadores y el estado civil de los mismos. En el caso del ejemplo se dispone

    de la siguiente informacin que se encuentra en el siguiente cuadro en forma cursiva. La

    restante se puede completar utilizando el concepto de complemento de evento.

    Sexo

    Estado Civil

    Total Casado (C) Soltero (D) Divorciado (E)

    Femenino (A) 15 75 10 100

    Masculino (B) 85 95 20 200

    Total 100 170 30 300

    Como se puede observar se est totalizando tanto por filas como por columnas, es decir, de

    acuerdo a los dos criterios de clasificacin de la informacin. A esto se le llama

    probabilidades marginales y a la informacin del interior del cuadro se le llama probabilidad

    conjunta de los dos eventos (criterios de clasificacin). Resolviendo el problema se tiene:

    a. Si el trabajador seleccionado es soltero, cul es la probabilidad que sea mujer?.

    En este caso el evento condicionante es que el trabajador sea soltero y el evento

    dependiente es que sea mujer.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Los problemas de probabilidad de eventos dependientes se pueden resolver de dos manera:

    respecto al espacio muestral original y respecto al espacio muestral restringido del evento

    que condiciona. Para el primer caso:

    =[]

    []=

    75/300

    170/300=

    75

    170

    = 75

    300

    = 170

    300

    Para el segundo caso, es decir, respecto al espacio muestral restringido del evento

    condicinate se tendra que ver cuntas veces se repite el evento trabajador de sexo

    femenino y cuntas veces se repite el evento trabajador soltero. De acuerdo a esto se

    tiene que:

    =[]

    [] =

    75

    170

    Como se puede observar ambos resultados coinciden en el mismo resultado.

    b. Si el trabajador seleccionado es mujer, cul es la probabilidad que sea soltera?

    Esto tiende a confundir pensando que es el mismo del inciso a., sin embargo el evento

    condicionante es ahora que el trabajador sea Mujer. De acuerdo a esto se tiene:

    =[]

    [] =

    75

    100

    c. Cul es la probabilidad que sea mujer o est casada?

    = + [ ]

    = 100

    300 +

    170

    300

    75

    300 =

    95

    300

    Independencia de Sucesos

    En probabilidad condicional la ocurrencia de un evento condiciona la probabilidad de un

    segundo evento. Sin embargo, hay muchos casos donde los eventos estn totalmente sin

    conexin, y la ocurrencia de uno de ellos no cambia la probabilidad de ocurrencia del otro,

    en este caso se dice que son independientes.

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Sean A y B dos eventos y sea P [B] 0., A y B son eventos independientes si:

    a.- P[A/B] = P[A]

    Como consecuencia, si A y B son independientes y

    P [A/B] = P[AB]/P[B] = P[A] P[AB] = P[A]P[B] y viceversa

    Dos eventos A y B son independientes si se cumple cualquiera de las siguientes

    condiciones:

    .- P[A/B] = P[A] .- P[B/A] = P[B] .- P[AB] = P[A].P[B]

    Ejemplo...

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Un impulso elctrico debe de pasar del punto I al II para producir una seal. Para llegar al

    punto II debe de pasar por dos componentes electrnicos (E1 y E2). La trayectoria del

    impulso se interrumpe si falla cualquiera de los dos componentes. La probabilidad de que el

    componente E1 no falle es 0.7 y la probabilidad que el componente E2 no falle es 0.8.

    Adems, la probabilidad de que al menos uno no falle es 0.94. Cul es la probabilidad de

    que la seal se produzca?

    A = Componente E1 no falle = P[A] = 0.7

    B = Componente E2 no falle = P[B] = 0.8

    P [AUB] = 0.94

    Para que se produzca el impulso elctrico, ninguno de los componentes (E1 y E2) deben de

    fallar la probabilidad solicitada es P[AB].

    P[AUB] = P[A] + P[B] - P[AB]

    P [AB] = P[A] + P[B] - P[AUB]

    = 0.7 + 0.8 - 0.94 = 0.56

    P[AB] = P[A]P[B] = 0.7*0.8 = 0.56

    Probabilidad Total

    Sean A1, A2,..., Ak, eventos que forman una particin del espacio muestral y Sea B un

    evento en el espacio muestral. Si P[A1], P[A2],..., P[Ak], P[B/A1], P[B/A2],..., P[B/Ak] son

    probabilidades conocidas y se est interesado en la ocurrencia del evento B. Para obtener

    esta probabilidad se hace uso del Teorema de Probabilidad Total que partiendo de las

    premisas anteriores se enuncia de la siguiente manera:

    =

    =1

    = 1 1 + 2

    2 +

    Ejemplo:

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    Un profesor tiene tres secretarias con diferentes niveles de competencia. Las secretarias

    son S1, S2, S3. La secretaria S1 ha escrito el 20% de un trabajo, la secretaria S2 el 40%

    y la secretaria S3 el 40%. Hay un error ortogrfico que irrita en especial al profesor, y

    ste ha calculado que S1 lo comete el 90% de las veces que tiene que escribir la palabra en

    cuestin, que S2 lo comete el 40% de las veces, y S3 nunca.

    Cul es la probabilidad de que el profesor encuentre el error mencionado?

    Obteniendo la informacin que proporciona el problema se tiene:

    P [S1] = 0.20; P [S2] = 0.40; P [S3] = 0.40; P [ 1 ] = 0.90; P [

    2 ] = 0.40; P [

    3 ] = 0;

    entonces la probabilidad del error es:

    P [E] = P [S1]* P [ 1 ] + P [S2]* P [

    2 ] + P [S3]* P [

    3 ]

    P [E] = ((0.20*0.90) + (0.40*0.40) + (0.40*0)) = 0.34

    Lo anterior se puede facilitar si se usa un rbol de probabilidades como se muestra a

    continuacin

    Supngase ahora que el evento B ya ha ocurrido y se est interesado en saber a cules de

    los eventos que forman la particin del espacio muestra se ha debido su ocurrencia. En este

    caso se hace uso del Teorema de Bayes que partiendo tambin de las premisas anteriores

    se enuncia de la siguiente forma:

    P [S1] = 0.20

    P [S2] = 0.40

    P [S3] = 0.40

    P [E/S1] = 0.90

    P [E/S1] = 0.10

    P [E/S2] = 0.40

    P [E/S2] = 0.60

    P [E/S2] = 1

    P [E/S3] = 0

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    =

    =1

    Como se puede observar, el denominador no es ms que la probabilidad B, es decir, la

    probabilidad total.

    Ejemplo>

    Si el profesor encuentra el error mencionado en una pgina del trabajo. Cul es la

    probabilidad de que esa pgina la haya escrito secretaria S1?, la secretaria S2?, la

    secretaria S3?

    1 = 1 1

    []=

    (0.20 0.9)

    0.34= 0.53

    2 = 2 2

    []=

    (0.40 0.40)

    0.34= 0.47

    3 = 3 3

    []=

    (0.40 0.0)

    0.34= 0

  • Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

    REGRESION Y CORRELACION LINEAL SIMPLE

    Regresin Lineal Simple

    En muchas reas de la investigacin cientfica, la variacin en las mediciones de una variable

    en estudio es causada preponderantemente por otras variables relacionadas cuyas

    magnitudes cambian en el curso del experimento. La incorporacin explcita de los datos de

    estas variables que influyen en el anlisis estadstico, permite conocer la naturaleza de las

    relaciones y utilizar esta informacin para mejorar la descripcin y las inferencias de las

    variables de inters primario.

    Al probar las relaciones entre variables es importante que el valor de la variable pueda ser

    predicha de las observaciones de otra variable o an controladas y optimizadas manipulando

    los factores de influencia.

    El anlisis de regresin es un conjunto de mtodos estadsticos, que tratan con la

    formulacin de modelos matemticos que describen las relaciones entre variables y el uso

    de estas relaciones modeladas con el propsito de predecir e inferir.

    Supuestos del modelo de Regresin Lineal Simple

    Al igual que en otros tipos de anlisis estadsticos, el modelo de Regresin Lineal Simple se

    basa en ciertos supuestos que a continuacin se detallan.

    Supuesto 1. "Y" es una variable aleatoria cuya distribucin probabilstica depende de

    "X"

    Este supuesto quiere decir que para cualquier valor de "X", "Y" es una variable aleatoria con

    cierta distribucin probabilstica con media y/x y y/x. Note que esta suposicin solamente

    implica que "Y" es una variable aleatoria que depende de "X", y no toma en cuenta la forma

    lineal. Por otra parte, significa que la variable X se mide sin error y fijada por el

    investigador.

    Supuesto 2. Modelo de la lnea recta

  • Por: Ing. M.Sc. Francisco Martnez S