[UNED]McGraw Hill - Introduccion a La Teoria de La Estadistica - Mood OCR

548

Click here to load reader

Transcript of [UNED]McGraw Hill - Introduccion a La Teoria de La Estadistica - Mood OCR

  • INTRODUCCION A LA

    TEORIA DE LA ESTADISTICA

  • ALEXANDER M. MOOD y

    FRANKLIN A. GRA YBILL

    INTRODUCCION A LA

    TEORIA DE LA

    EST ADISTICA Adaptacin a la :z.& edicin norteamericana por

    RAFAEL PRO BERMEJO Profesor de la Escuela de Estadistica de la Universidad de Madrid

    AGUILAR

  • coleccin ciencia y tcnica seccin matemticas y estadstica obra incorporada con el asesoramiento de luis bravo gala

    la cuarta edicin espaola se ha preparado sobre la traduccin de la primera edicin original realizada por francisco azorn poch

    edicin espaola aguilar s a de ediciones 1955 1969 juan bravo 38 madrid deposito legal m 2053/1978 cuarta edicin-cuarta reimpresin-1978 ISBN 84-03-20102-8 printed in spain impreso en espaa por grficas ema miguel yuste 31 madrid

    edicin original rncgraw-hill book company 1952 1963 introduction to the theory of statistics (second edition) mcgraw-hill book company inc new york

  • PROLOGOS

  • PROLOGO DEL TRADUCTOR A LA PRIMERA EDICION ESPAOLA

    Aunque todava no es muy grande el nmero de obras de Estads-tica, originales o traducidas al espaol, parece oportuno subrayar los relevantes mritos de este libro, que hicieron preferir su tra-duccin a la de tantos textos publicados hasta la fecha en Inglaterra y en los Estados Unidos. Creemos que esta obra es, entre las de nivel medio, la que mejor tiene en cuenta las necesidades prcti-cas del estadstico de hoy, lo que ya se pone de manifiesto en la definicin que de la Estadstica da el autor al comienzo del captulo primero, como CI tecnologa de la experimentacin cien-tficaD

    En cuanto al ingrato problema de la traduccin de trminos y conceptos, que la ausencia de un medio universal de. expresin im-pone al cientfico moderno, hemos procurado seguir en lo posible la nomenclatura utilizada en obras anteriormente publicadas por esta Editorial, en particular las ms recientes de Introduccin a la Estadstica matemtica, traducida por J. Ros Jimeno, y Mtodos matemticos de Estadstica, cuyo traductor es E. Cansado. Quiz la ms discutida haya sido la de traducir las palabras inglesas test y testing por las espaolas de dcima .y docimasia. En la Nota del traductor de la ltima obra citada se justifica extensamente su empleo, as como el inconveniente de otras traducciones propuestas. En muchos casos, se ha traducido test y to test por contraste y contrastar, lo que en general no ofrece inconvenientes, pero en la teora del diseo de experimentos se usa en ingls el tm;zino con-trast para indicar una combinacin de efectos, que permite el con-traste (en el sentido de oposicin, contraposicin o diferencia entre Set'f!S o COSasD) entre los resultados de diferentes tratamientos o variedades, por lo que aqu parece ms conveniente reservar la palabra espaola contraste para la traduccin del trmino ingls contrast.

    Confiamos en que esta obra podr desempear un papel til entre los textos estadsticos directamente accesibles a los lectores de habla espaola, y recordamos que gran parte de estos textos

    IX

  • x PROLOGOS

    han sido publicados por Aguilar, S. A. de Ediciones, que por ello merece nuestro reconocimiento. Deseamos que esta traduccin ocupe un puesto honroso entre Introduccin a la Estadstica matemtica, de Yule-Kendall, y Mtodos matemticos de Estadstica, de H. Cra-mr, contribuyendo as a la ya iniciada formacin de tcnicos esta-dsticos en Espaa y en Hispanoamrica.

    FRANCISCO AZORN.

  • PREFACIO DEL AUTOR A LA PRIMERA EDICION

    Este libro se ha desarrollado a partir de un conjunto de notas preparadas por m en 1945. En aquella fecha no exista texto mo-derno especialmente dirigido a quienes empezaran a estudiar esta-dstica matemtica. Desde entonces la situacin ha mejorado consi-derablemente, y si yo hubiera sabido por anticipado los libros que haba en preparacin, es probable que no me hubiera decidido a es-cribir esta obra. No obstante, como el libro parece ser suficientemente distinto a los dem,s en el modo de presentar las cosas, espero pueda proporcionar a profesores y estudiantes una til posibilidad de eleccin.

    Las notas antes mencionadas se emplearon durante tres aos como texto en un curso para estudiantes ya graduados, de dos nive-les diferentes, en el Iowa State College. Solo se exiga para este curso un ao de clculo, requerimiento que prejuzga el nivel del libro (la clase de clculo en Iowa constaba de cuatro horas sema-nales e inclua un estudio detallado de desarrollos de Taylor, deri-vadas parciales e integrain mltiple). No se suponan conocimien-tos previos de estadstica.

    Es este un libro de estadstica, no de matemticas, como cual-quier matemtico podr ver fcilmente; no hay gran rigor mate-mtico en sus desarrollos, por la sencilla razn de que resultara pesado y supondra una prdida de tiempo injustificada en este nivel de enseanza; claro es que el rigor en los razonamientos resulta totalmente es~ncial en buena estadstica y he procurado ponerlo as de manifiesto, haciendo que el lector se d cuenta de su necesidad y subrayando varios fallos en argumentos rigurosos.

    Aunque este texto se refiere primordialmente a la teora de la estadstica, se ha tenido plenamente en cuenta a aquellos estudian-

    t~ que temen perder un solo momento en frivolidades matemticas. Toda cuestin nueva viene acompaada de un pequeo cortejo de cuestiones prcticas y, lo que es ms importante, se ha llevado a efecto un serio esfuerzo para ilustrar por medio de problemas las diversas formas en que puede aplicarse la teora.

    Los problemas constituyen parte esencial del libro: se extienden desde simples ejemplos numricos a teoremas que se necesitan en

    XI

  • XII PROLOGOS

    captulos posteriores, e incluyen materias tal vez ms importantes que algunas de las estudiadas en el texto; el que una materia se haya tratado o no en los problemas se ha basado ms en la con-veniencia de hacerlo as que en su importancia; por ejemplo, casi todas las cuestiones de correlacin se tratan en los problemas. Me pareci poco eficaz ocuparme dos veces de las cuestiones multiva-riantes: una desde el punto de v.ista de la regresin, y otra desde el de la correlacin. En el texto se ha expuesto con mayor insisten-cia la regresin por su carcter ms general.

    El autor de un libro de texto ha de sentirse en deuda, prctica-mente, con todos los que han tratado la materia correspondiente, y desde aqu me reconozco obligado a todos los estadsticos. No obstante, al reconocer explcitamente su contribucin hl de fijar un lmite, y yo he simplificado la situacin trazando este muy alto; solo mencionar, pues, a los ms destacados.

    Mi mayor deuda personal es con S. S. Wilks, quien despert mi inters por la estadstica y fue mi mentor durante mi poca de estudiante. Cualquier mrito que pueda tener este libro deber atribuirse en gran parte a sus meditadas explicaciones y a la com-prensiva direccin de mis estudios.

    Todos mis colegas en el Iowa Sta te College han contribuido a mi comprensin y visin general de la estadstica. Reconozco en par-ticular lo mucho que debo a G. W. Brown, W. G. Cochran y G. W. Snedecor.

    Entre los numerosos estudiantes que revisaron por completo las notas originales debo mencionar, por sus excelentes comentarios y sugerencias, a H. D. Block, quien, al final del manuscrito, hizo de este una cuidadosa y competente revisin. Margaret Kirwin y Ruth Burns tradujeron con esmero mis garabatos en una perfecta copia mecanogrfica. Bernice Brown y miss Burns leyeron cuidadosamente todas las pcuebas de imprenta.

    Estoy en deuda tambin con Catherine Thompson y Maxime Merrington, y con E. S. Pearson, director de Biometrika, por haberme permitido incluir las tablas 111 y V, que son versiones abreviadas de tablas publicadas en Biometrika. Lo mismo digo respecto a los profesores R. A. Fishet:. y Frank Yates, y a la firma Oliver and Boyd, Ltd., de Edimburgo, por su 'autorizacin para reproducir la tabla IV de su libro Tablas estadsticas para investigadores cient-ficos 1.

    1 Hay edicin espafiola de Aguilar, S. A. de Ediciones, 1954.

  • PREFACIO DEL AUTOR A LA PRIMERA EDICION XIII

    En el ltimo captulo hay algunas dcimas a libre distribucin, que fueron desarrolladas conjuntamente por G. W. Brown y por m en el Iowa State College, en \.m proyecto del Office of Naval Research. El profesor Brown me ha permitido generosa y amable-mente incluir este material, que debiera haber aparecido impreso por primera vez con su nombre y el mo. Estas dcimas aparecen en las secciones 16-5 a 16-9.

    ALEXANDER McFARLANE MOOD.

  • PREFACIO DE LOS AUTORES A LA SEGUNDA EDICION

    Dado que la primera edicin de esta obra se public en 1950, muchas nuevas tcnicas estadsticas se han creado desde entonces, y muchas otras, que eran solo del dominio de los estadsticos ma-temticos, se conocen y utilizan ahora por los estadsticos aplicados. Para incluir parte de este material hemos tenido que eliminar otro, con el fin de no aumentar excesivamente el volumen del libro. El propsito general de exponer la teora en conexin con problemas prcticos concretos contribuy, aparentemente en gran medida, al xito de la primera edicin, y hemos procurado mantenerlo en la presente.

    Para estudiar este libro no es preciso haber seguido un curso previo de estadstica. La preparacin matemtica necesaria es la usual en un primer curso de clculo. Aunque no esencial, es deseable poseer algn conocimiento de la aritmtica de matrices; por otra parte, en el captulo 9 se hace una breve introduccin de las opera-ciones necesarias. Se han sealado con asterisco algunas de las seccio-nes que utilizan recursos de lgebra matricial y que pueden omitirse sin interrumpir la continuidad del libro.

    Los autores se sienten en deuda con el profesor Herman Chernoff, que dedic mucho tiempo a revisar a fondo gran parte del manuscrito, incluso redactando de nuevo varias secciones.

    Tambin expresamos nuestra gratitud al Dr. David Weeks, que ley la totalidad del manuscrito; a Terrence Connell, William Owen y Scott U rquhart, que nos ayudaron en la correccin de pruebas; as como a los doctores James Pachares y Leon Harter y a los directores de Biometrika por su amable autorizacin para reproducir determinado material en las tablas VI, VII y VIII.

    ALEXANDER M. MOOD. FRANKLIN A. GRA YBILL.

  • IN DICE GENERAL

  • IN DICE GENERAL

    PRLOGO DEL TRADUCTOR A LA PRIMERA EDICIN ESPAOLA .. .. Pg. IX

    PRBFACIO DEL AUTOR A LA PRIMERA EDICIN ... .. XI

    PRBFACIO DE LOS AUTORES A LA SEGUNDA EDICIN XIV

    CAP. l.-INTRODUCCIN ... 1-1. Estadstica, pg. 3.-1-2. Objeto y amplitud de este libro, 6.-1-3. Sis-tema de referencia, 7.-Bibliografa, 7.

    CAP. 2.-PROBABILIDAD .. .. . .. .. . . . . ... 2-1. Introduccin, pg. 9.-2-2. Probabilidad clsica o a priori, 9.-2-3. Probabilidad a posteriori o frecuencial, 12.-2-4. Modelos de proba-bilidad, 15.-2-5. Conjuntos de puntos, t~.-2-6. Desarrollo axiomtico de la probabilidad, 21.-2-7. Espacio muestral discreto con un nmero finito de puntos, 22.-2-8. Permutaciones y combinaciones, 23.-2-9. Frmula de Stirling, 29.-2-10. Notaciones de sumas y productos. 30.-2-H. Los teoremas binomial y polinomial, 30.-2-12. Funciones generatrices combi-natorias, 33.-2-13. Probabilidad marginal, 37.-2-14. Probabilidad con-dicional. 40.-2-15. Dos leyes bsicas de la probabilidad, 42.-2-16.. Su-cesos i:ompuestos, 45.-2-17. Independencia, 51.-2-18. Variables aleato-rias, 52.-Prbblemas, 54.-Bibliografa, 60.

    CAP. 3.-VARIABLES ALEATORIAS DISCRETAS ... 3-1. Introduccin, pg. 61.-3-2. Funciones de cuanta, 65.-3-3. Distri-buciones multivariantes, 66.-3-4. Distribucin binomial, 75.-3-5. D.istri-bucin polinomial, 80.-3-6. Distribucin de Poisson, 81.-3-7. Otras distribuciones discretas, 83.-Problemas, 84.-Bibliografa, 87.

    3

    9

    61

    CAP. 4.-VARIABLES ALEATORIAS CONTINUAS ... '" ...... '" . . 88 4-1. Introduccin, pg. 88.--4-2. Variables aleatorias continuas, 88.--4-3. Dis-tribuciones multivariantes, 96.--4-4. Distribuciones acumulativas, 99.-4-5. Distribuciones marginales, 104.--4-6. Distribuciones condicionales, 106. 4-7. Independencia, 107.--4-8. Muestra aleatoria, 108.--4-9. Distribuciones deducidas de otras, HO.-Problemas, 1I3.-Bibliografa, 117.

    CAP. 5.-VALORES ESPERADOS y MOMENTOS ........... . 5-1. Valores esperados, pg. 118.-5-2. Momentos, 122.-5-3. Funciones generatrices de momentos, 130.-5-4. Momentos para distribuciones mul-tivariantes, 133.-5-5. El. prOblema de los momentos, 134.-5-6. Esperan-zas condicionales, 134.-Problemas, 136.-Bibliografa, 139.

    CAP. 6.-DISTRIBUCIONES CONTINUAS ESPECIALES 6-1. Distribucin uniforme, pg. 140.-6-2. La distribucin normal, 141.-6-3. La distribucin gamma, 145.--6-4. La distribucin beta, 148.-6-5. Otras distribuciones, 151.-6-6. Funciones de densidad completas, 151.-Proble-mas, 155.-Bibliografia, 159.

    CAP. 7.-MUESTREO .............. . 7-1. Inferencia inductiva, pg. 160.-7-2. Poblaciones y muestras, 162.-7-3. Distribuciones muestrales, 164.-7-4. Momentos muestrales, 166.-'7-5. Ley de los grandes nmeros, 169.-7-6. El teorema central del lmi-te, 172.-7-7. A9I:oximacin normal a la distribucin binomial, 176.-7-8. Papel de la distrIbucin normal en estadstica, 119.-Problemas, 180. Bibliografa, 183.

    118

    140

    160

    XVII

  • XVIII INDlCE GENERAL

    CAP. 8.-EsTIMACIN PUNTUAL ....... ... ... . .. 8-1. Teora de la decisin, pg. 185.-8-2. Estimacin puntual, 190.-8-3. Estadsticos suficientes; caso de un solo parmetro, 193.-8-4. Estads-ticOS suficientes; ms de un parmetro, 196.-8-5. Estimador insesga-do, 198.-8-6. Estimador consistente, 199.-8-7. Estimadores asinttica-mente eficientes, 200.-8-8. Estimadores insesgados de varianza mnima, 202. 8-9. Principio de mxima verosimilitud, 206.-8-10. Algunos estimadores mximo-verosmiles, 210.-8-11. Propiedades de los estimadores mximo-verosmiles, 213.-8-12. Estimacin por el mtodo de los momentos, 214.-8-13. Estimadores de Bayes, 215.-Problemas, 221.-Bibliografa, 226.

    185

    CAP. 9.-DISTRIBUCIN NORMAL MULTIVARIANTE '" .... , ... '" ...... 228 9-1. La distribucin normal bivariante, pg. 228.-9-2. Matrices y deter-minantes, 234.-9-3. Distribucin normal multivariante, 238.-Problemas, 248. Bibliografa, 252.

    CAP. lO.-DISTRIBUCIONES EN EL MUESTREO 10-1. Distribuciones de funciones de variables aleatorias, pg. 253.-10-2. Distribucin de la media muestral para densidades normales, 259.-10-3. Distribucin ji cuadrado, 259.-10-4. Independencia de la media y varianza muestrales en densidades normales, 261.-10-5. La distribucin eF, 265.-lO-6. Distribucin eh de Student, 267.-10-7. Distribucin de las' medias muestrales en densidades binomiales y de Poisson, 268.-10-8. Distribucin, en muestras grandes, de estimadores mximo-veros-miles, 270.-10-9. Distribucin de estadsticos ordinales, 276.-10-10. Reco-rrido studentizado, 279.-Problemas, 280.-Bibliografa, 284.

    253

    CAP. H.-ESTIMACIN POR INTERVALOS ...... '" ... ... ... ... ... ... ~85 11-1. Intervalos confidenciales, pg. 285.-11-2. Intervalos confidenciales para la media de una distribucin normal, 289.-11-3. Intervalos confiden-ciales para la varianza de una dilltribucin normal, 291.-11-4. Regin con-fidencial para la media y la varIanza de una distribucin normal, 293.-11-5. Mtodo general para la obtencin de intervalos confidenciales, 295.-11-6. Intervalos confidenciales para el parmetro de una distribucin bino-mial, 299.-11-7. Intervalos confidenciales para muestras grandes, 301.-11-8. Regiones confidenciales para muestras grandes, 303.-11~9. Intervalos confidenciales mltiples, 307.-Problemas, 312.-Bibliografa, 315.

    CAP. l2.-DoCIMASIA DE HIPTESIS ... ... ... ... ... ... ... ... 12-1. Introduccin, pg. 317.-12-2. Dcima de una hiptesis simple contra una alternativa simple, 324.-12-3. Hiptesis compuestas, 335.-12-4. Docimasia de (J ~ (JI contra 8> 81 para densidades con un parmetro nico 8, 339.-12-5. Docima&ia de la hiptesis HI: (JI ~ (J ~ 8. contra la hip-tesis alternativa H.: 8> 8., (J i= (JI, 341.-12-6. Dcima de la razn de vero-similitud generalizada, 343.-12-7. Dcimas relativas a la media de una poblacin normal, 347.-12-8. Diferencias entre las medias de dos poblacio-ciones normales, 350.-12-9. Dcimas de la varianza de una distribucin normal, 354.-12-10.-Dcima de la bondad del ajuste, 356.-12-11. Dci-mas de independencia en tablas de contingencia, 359.-Problemas, 368. Bibliografa, 376.

    317

    CAP. l3.-REGRESIN E HIPTESIS LINEALES ... ... ... ... ... ... ... ... 378 13-1. Introduccin, pg. 378.-13-2. Modelos lineales simples 379.-13-3. Prediccin, 386.-13-4. Discriminacin, 389.-13-5. Estimacln pun-tual. Caso B, 391.-13-6. El modelo lineal general, 394.-Problemas, 410. Bibliografa, 413.

    CAP. l4.-MoDELOS DE DISEO EXPERIMENTAL .. ... ... ... ... ...... 415 14-1. Introduccin, pg. 415.-14-2. Modelo de disefto experimental, 417. 14-3. Modelo de clasificacin simple, 431.-14-4. Modelo de clasificacin doble, 433.-14-5. Otros modelos, 438.-Problemas, 438.-Bibliografa, 442.

    CAP. 15.-DCIMAS SUCESIONALES DE HIPTESIS 15-1. Anlisis sucesionales, pg. 444.-15-2. Construccin de dcimas su-cesionales, 445.-15-3. Funciones de potencia, 449.-15-4. Tamafto mues-tral medio, 453.-15-5. Inspeccin por muestreo, 456.-15-6. Inspeccin por muestreo sucesional, 459.-15-7; Dcima sucesional para la media de una poblacin normal, 461.-Problemas, 463.-Bibliografa, 466.

    444

  • INDICE GENERAL

    CAP. 16.-MTODOS NO PARAMTRICOS 16-1. Introduccin, ppg. 467.-16-2. Una distribucin bsica, 468.-16-3. Po-sicin y dispersin, 470.-16-4. Comparacin de dos poblaciones, 474.-16-5. Lmites de tolerancia, 482.-16-6. Dcima de rangos para dos mues-tras, 483.-16-7. Eficiencias asintticas y dcima de aleatorizacin, 486. Problemas, 489.-Bibliografa, 492.

    TABLAS .............. '" ..... '" ........ , ... Descripcin de las tablas, pg. 495.-Tabla 1: Ordenadas de la funcin de densidad normal, 498.-Tabla II: Distribucin normal acumulati-va, 499.-Tabla III: Distribucin ji cuadrado acumulativa, 500.-Tabla IV: Distribucin a~umulativa de cStudent, 50 l.-Tabla V: Distribucin F acumulativa, 502.-Tabla VI: Puntos porcentuales superiores del 1% del recorrido studentizado, 504.-Tabla VII: Puntos porcentuales superiores del 5% del recorrido studentizado, 505.-Tabla VIII: Puntos porcentuales su-periores del 10 % del recorrido studentizado, 506.

    XIX

    467

    493

    SOLUCIONES DE LOS PROBLEMAS PROPUESTOS AL FINAL DE LOS CAPTULOS. 509

    INDICE ALFABTICO ...... '" .............. , ............... '" ... ... 531

  • INTRODUCCION A LA

    TEORIA DE LA ESTADISTICA

  • CAPITULO 1 INTRODUCCION

    1-1. Estadstica.-Para situar este libro en la perspectiva ade-cuada es necesario que empecemos por considerar qu es la esta-dstica. La concepcin profana de estadstica suele incluir la reco-gida de grandes masas de datos y la presentacin de estos en tablas o grficos; puede incluir tambin el clculo de totales, promedios, porcentajes, etc. En todo caso, estas operaciones, ms o menos ru-tinarias, son una parte, pero solo una parte incidental de la esta-dstica. Estadstica es tambin el diseo de experimentos, el diseo de sobrevisiones muestrales, la reduccin y el proceso de datos, y otras muchas cuestiones.

    Describiremos la estadstica como la tecnologa del mtodo cien-tfico. La estadstica proporciona instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre. Estos instrumentos pueden. ser de aplicacin y utilidad completamente general en cualquier campo de la ciencia: fsico, biolgico, social, etctera. Son aplicables no solo en el mundo cientfico, sino tam-bin en el de la ~mpresa y en el de los asuntos cotidianos. Por otra parte, ciertos instrumentos pueden estar especialmente diseados para campos especiales de la investigacin.

    La estadstica puede dividirse en dos amplias ramas: 1) estads-tica descriptiva, que est relacionada con el resumen de datos y la ~escripci6Q de -estos; 2) estadstica inferencial, relacionada con el proceso de utilizar datos para tomar decisiones en el caso ms ge-neral del que forman parte estos datos. El proceso de tomar deci-siones en situaciones generales, sobre la base de una informacin incompleta contenida en datos muestrales, es arriesgado y no puede rea.lizarse con certeza; la probabilidad es una medida de esta in-certidumbre. Hay dos tipos de incertidumbre con los que tenemos que enfrentarnos: 1) la incertidumbre debida a la aleatoriedad, y 2) la incertidumbre debida a nuestra ignorancia del ve~dadero estado del sistema. Lo aclararemos con un ejemplo.

    La compaa A cultiva cierta clase de plantas, recolecciona las semillas y las envasa en paquetes de 25 semillas cada uno. Un al-macn de venta al por menor adquiere algunos de los paquetes y garantiza a sus compradores que 22 al menos de las 25 semillas de cada paquete crecern; _ en caso contrario, les dar otrc? paquete libre de todo gasto. El almacenista tiene dos tipos de incertidumbre

    3

  • 4 INTRODUCCION [CAP. 1

    con que luchar: 1) no est seguro de qu proporcin PA de los pa-quetes que la compaa tiene en venta ser aceptable (contienen al menos 22 semillas que crecern), y 2) puesto que la compaa tiene del orden de un milln de paquetes de semillas en venta y el al-macenista adquiere solo unos 200 paquetes, se enfrenta con otra incertidumbre; es decir, aun conociendo que la proporcin PA del milln de paquetes es aceptable, cmo puede estar seguro o ra-zonablemente seguro de que la proporcin PA de los 200 paquetes que l adquiere sea aceptable? Aunque PA sea 0,99, es decir, aunque 990000 paquetes del milln que la compaa tiene en venta sean aceptables, los 200 paquetes del almacenista podran haberse selec-cionado accidentalmente entre los 10000 inaceptables y perdera mucho dinero.

    El primer tipo de incertidumbre, no conocer PA, proporcin de paquetes aceptables que la compaa produce, tiene su origen en la ignorancia del estado del sistema (llamado, a veces, verdadero estado de la naturaleza). El segundo se debe a lo que se designa frecuentemente como aleatoriedad.

    Al almacenista se le ofrece la posibilidad de mejorar su situa-cin por experimentacin (o exigir a la compaa que realice prue-bas de germinacin), por la que puede tomar (cdecisiones basadas en lo que l cree que es el estado de la naturaleza (dado por PA). Aun as, nunca ser capaz de determinar PA exactamente y con certeza. Si conoce la prdida en que incurrir si determina que la propor-cin de paquetes aceptables es P'A cuando realmente es PA' necesi-tar experimentar y tomar decisiones de tal forma que de alguna manera haga mnima su prdida.

    Para complicar ms las cosas, otra compaa (la compaa B) vende tambin la misma clase de semillas a idntico precio por paquete, por lo que el almacenista debe decidir qu compaa ser su proveedora. Si PA es mayor que PB, comprar a la compaa A; en caso contrario, adquirir las semillas de la compaa B.

    El almacenista puede realizar un experimento (o exigir a cada compaa que efecte pruebas de germinacin) y elegir una de dos acciones: (al) comprar a la compaa A; o (a2) comprar a la com-paa B, segn los resultados del experimento y su evaluacin de la prdida que puede sufrir si toma una decisin errnea.

    El diseo del experimento, determinar el nmero y clase de observaciones a realizar, y decidir cmo deben utilizarse los resul-tados para tomar buenas decisiones, son problemas estadsticos.

    Otra divisin del campo de la estadstica que merece una breve consideracin es la que existe entre teora y metodologa. La teora estadstica es una rama de la matemtica aplicada; tiene sus races en la rama de la matemtica pura conocida con el nombre de teora de la probabilidad, y en realidad la estructura completa

  • SECo 1-1] ESTADISTICA 5

    de la teO'ra estadstica en sentidO' ampliO' puede cO'nsiderarse que incluye la teO'da de la prO'babilidad. Incluye tambin O'tras cues-tiO'nes que nO' fO'rman parte de la teO'ra de la prO'babilidad prO'pia-mente dicha, cO'mO' las cO'nsecuencias del principiO' de aleatO'rizacin, diversO's principiO's de estimacin y O'trO's relativO's a la dO'cimasia de hiptesis, y, en general, un principiO' de tO'ma de decisiO'nes. Cabe considerar estO's principiO's cO'mO' axiO'mas que se integran en la axiO'mtica de la teO'ra de la prO'babilidad.

    El estadsticO' se O'cupa, pO'r supuestO', de la prO'duccin de ins-trumentO's para uso' de lO's investigadO'res. Al encO'ntrarse cO'n un prO'blema experimental determinadO', cO'nstruye un mO'delO' matem-ticO' que se. ajuste, lO' mejO'r pO'sible, a la situacin experimental; analiza el mO'delO' pO'r mtO'dO's matemticO's, y, finalmente, esta-blece prO'cedimientos para el estudiO' del prO'blema. En sus trabajO's se gua por lO's principiO's de la teO'ra estadstica.

    El estadsticO' se O'cupa as mismO' del desarrO'llO' y extensin de la teO'ra estadstica. Existen muchO's prO'blemas impO'rtantes del diseO' experimental y de la inferencia estadstica que permanecen tO'dava sin tO'car, pO'rque la teO'ra estadstica nO' ha sidO' an capaz de resO'lverlO's. El gran avance de la aplicacin de lO's mtO'dO's esta-dsticO's durante las tres dcadas pasadas fue pO'sible gracias a lO's desarrO'llO's tericO's de largO' alcance que haban tenidO' lugar en la pO'ca que precedi inmediatamente a la citada.

    Pueden ser de inters unas O'bservaciO'nes sO'bre lO's O'rgenes de la teO'ra estadstica. Ciertas zO'nas de la experimentacin biO'lgica alcanzarO'n un puntO' en que, para su prO'gresO', se haca imperativO' el uso' de lO's' ahO'ra denO'minadO's mtO'dO's estadsticO's. FuerO'n en-tO'nces lO's mismO's bilO'gO's lO's que desarrO'llarO'n lO' esencial de esta teO'ra. Aunque este desarrO'llO' ha sidO' paralelO' al de casi tO'das las ramas del cO'nO'cimientO' abstractO', resulta curiO'sO', sin embargO', en el casO' de la estadstica; la teO'ra estadstica parece una evO'lucin muy natural de la teO'ra de la prO'babilidad, que cuenta variO's cen-tenares de aO's de antigedad; perO' la verdad es que lO's investiga-dO'res prO'babilistas prescinden tO'talmente de la estadstica. CO'nviene advertir, de pasO', que la situacin que diO' lugar al nacimientO' de la teO'ra estadstica cO'ntina existiendO'; hay muchas zO'nas de la

    experimen~acin cientfica en espera de mtO'dO's an nO' creadO's. Adems de la teO'ra, hay que cO'nsiderar la prctica de la esta-

    dstica. Hay un gran bagaje de instrumentO's y tcnicas para inves-tigadO'res que crece apreciablemente en el transcursO' de cada aO'. Hasta hace pO'cO' tiempO' el estadsticO' tena pO'cO' que ver cO'n estO's instr:umentO's, y se cO'ntentaba cO'n pO'nerlO's a dispO'sicin de quien quisiera hacer uso' de lO's mismO's. PerO' al aumentar la cO'mplejidad de lO's experimentO's pO'r el prO'gresO' de la investigacin cientfica, el

  • 6 INTRODUCCION [CAP. 1

    instrumental estadstico alcanz anloga complejidad y especializa-cin. Actualmente, al investigador en determinadas zonas le es im-posible familiarizarse con todas las tcnicas que pueden serIe tiles. Adems, a mayor especializacin de un instrumento, menor flexi-bilidad de este; muchas veces hay que modificarlo para adaptarlo a un experimento determinado, y esto requiere conocimientos muy profundos de la teora estadstica.

    El empleo del instrumental estadstico no es una simple cues-tin de escoger la llave que .mjor se adapte a un perno; ms bien se trata de elegir entre varias, todas las cuales parecen adaptarse igual de bien, sin que ninguna de ellas se ajuste exactamente al mismo. Hay mucha diferencia entre una frmula algebraica y, diga-mos, un experimento de nutricin con cerdos. No hay en la frmula nada de tipo mgico; se trata simplemente de un instrumento, obte-nido adems a partir de un simple modelo matemtico que, pro-bablemente, no representar con gran precisin la situacin verda-dera. Para emplear dicho instrumento hay que hacer toda una serie de juicios relativos a la naturaleza y magnitud de los diversos erro-res engendrados por discrepancia entre el modelo y el experimento efectivo. Estos' juicios no pueden hacerse por el estadstico o el ex-perimentador, pues dependen a la vez de la naturaleza de la teora estadstica y de la del material experimentado.

    Para resolvt;r esta dificultad sale a escena el estadstico aplicado. Tiene su campo de accin en diversos centros de investigacin aca-dmica e industrial, y su funcin es, desde luego, colaborar con los investigadores en sus 'experimentaciones y estudios. Debe estar muy familiarizado, tanto con la teora como con la metodologa de la estadstica, aunque su trabajo no pertenezca al campo de esta cien-cia, sino al de la aplicacin de que se trate. Lo que nos interesa subrayar es que la estadstica aplicada se ha desarrollado hasta tal punto que puede considerarse que constituye ya un campo de inte-rs especial.

    1-2. Objeto y amplitud de este lihro.-Se ocupa este libro de la teora, ms que de las aplicaciones de la estadstica. En su desarrollo se deducirn y analizarn diversos instrumentos. Un se-gundo propsito de esta obra es poner en claro las condiciones en que deben emplearse determinadas tcnicas estadsticas importan-tes; pero nuestro propsito principal es la exposicin de la teora estadstica.

    El libro es una introduccin en el sentido de que no supone conocimientos previos de estadstica en el lector. Y es elemental por no presuponer ms conocimientos matemticos que los del clcu-lo elemental. Sin embargo, es deseable, aunque no esencial, alguna familiaridad con la aritmtica de matrices.

  • BIBLIOGRAFIA 7 ... __ .. _._._------------------------

    Tal restriccin del nivel matemtico es necesariamente costosa. Habremos de omitir, p. ej., muchas cuestiones interesantes, pero de carcter ms tcnico; habr que reducir la generalidad de los teoremas; ser necesario de cuando en cuando prescindir de demos-traciones; a veces se sacrifica~ el rigor matemtico, y tendremos que usar en ocasiones razonamientos tediosos, prescindiendo de otros ms directos, pero que requieren un nivel matemtico ms elevado. Sin embargo, estos sacrificios afectarn a nuestra obra menos de lo que pudiera suponerse. Los aspectos esenciales de la teora son del todo comprensibles sin necesidad de matemticas superiores.

    Puesto que la teora estadstica se funda en la teora de la pro-babilidad, empezaremos este estudio dando algunos conceptos y teo-remas del clculo de probabilidades que necesitaremos ms adelante. A continuacin, consideraremos algunos modelos matemticos cuya aproximacin a muchas situaciones experimentales corrientes ha sido puesta de manifiesto por la experiencia. Despus ser posible el estudio matemtico de problemas de inferencia estadstica, y de diseo y anlisis de experimentos e investigaciones.

    }3. Sistema de referencia.~Los captulos van divididos en secciones numeradas; la numeracin empieza de nuevo en cada ca-ptulo. Los teoremas, definiciones, ejemplos, etc., se numeran tam-bin por captulos. As, Seco 5-3 indica la seccin 3 del captulo 5; teorema 5-1 indica el teorema 1 del captulo 5, etc.

    Las ecuaciones se numeran de nuevo en cada seccin y los n-meros de las ecuaciones se encierran siempre entre parntesis. Al referirse a una ecuacin de la misma seccin se da solo el nmero de la ecuacin; en caso contrario, se expresan primero los nmeros del captulo y seccin. As, ecuacin (6) indica la sexta ecuacin de la misma seccin, y ecuacin (9-1-12) la duodcima ecuacin de la primera seccin del captulo 9.

    Los nmeros entre corchetes indican las referencias numeradas en la bibliografa dada al final de cada captulo.

    BIBLIOGRAFIA

    l. ARRow, Kenneth J.: Alternative approaches to the theory of choice in risktaking situations, Econometrica, vol. 19 (1951), pgs. 404-437.-

    2. CHURCHMAN, C. West.: Theory of Experimental lnference, The Mac-millan Company, Nueva York, 1948.

    3. FISHER, R. A.: Statistical Methods and Scientific Inference, Hafner Publishing Company, Nueva York, 1956.

    4. GOOD, l. J.: Probability and the Weighing of Evidence, Charles Grif-firi & Co., Ltd., Londres, y Hafner Publishing Company, Nueva York, 1950.

  • 8 INTRODUCCION [CAP. 1

    5. JEFFREYS, Harold: Scienti(ic In(erence, Cambridge University Press. Londres, 1957.

    6. KOLMOGOROFF, A. N.: Foundations o( the Theory o( Probability, Chel-sea Publishing Company, Nueva York. 1950.

    7. LINDLEY, D. V.: .Statistical inferenee), Journal o( the Royal Statistical Society, Serie B, vol. 15 (1953), pgs. 30-76.

    8. NEYMAN, Jerzy: .Outline of a theory of statistical estimation based on the classical theory of probability, Philosophical Transactions o( the Royal Society o( London, Serie A, vol. 236 (1937), pgs. 333-380.

    9. SAVAGE, Leonard J.: The Foundations o( Statistics, John Wiley & Sonso Ine., Nueva York, 1954.

  • CAPITULO 2 PROBABILIDAD

    2-1. Introduccin.-Uno de los instrumentos fundamentales de la estadstica es la probabilidad, que tuvo sus orgenes en los juegos de azar, en el siglo XVII.

    Los juegos de azar, como implica su nombre, incluyen acciones tales como girar la rueda de una ruleta, lanzar dados, tirar al aire una moneda, extraer una carta, etc., en las cuales el resultado de una prueba es incierto. Sin embargo, es sabido que, aun cuando el resultado de una prueba en particular sea incierto, existe un resultado que se puede predecir a largo plazo. Se sabe, p. ej., que en muchas tiradas de una moneda ideal (equilibrada, simtrica),. aproximadamen-te en la mitad de las pruebas se obtiene cara. Es una regularidad que puede predecirse a largo plazo y que permite hacer negocio a las casas de juego.

    En la ciencia experimental se presenta tambin un tipo similar de incertidumbre y regularidad a largo plazo. As, p. ej., en gen-tica es incierto saber si un descendiente ser macho o hembra, pero en un plazo largo se conoce aproximadamente el porcentaje de des-cendientes que sern machos y el de aquellos que sern hembras. Una compaa de seguros de vida no puede predecir qu personas de un pas morirn a la edad de cincuenta aos, pero s puede pre-decir bastante satisfactoriamente cuntas personas de ese pas mo-rirn a esta edad.

    Examinaremos en primer lugar la teora clsica de la probabi-lidad, o sea de la probabilidad a priori; luego se expondr la teora frecuencial y, finalmente, desarrollaremos un modelo axiomtico; este es el orden del desarrollo histrico de la teora.

    2-2. Probabilidad clsica o a priori.-Como se ha dicho en la seccin anterior, en sus principios la teora de la probabilidad estuvo ntimamente relacionada con .los juegos de azar. Esta re-lacin sugiri la definicin clsica. As, p. ej., supongamos que queremos hallar la probabilidad del suceso obtener cara al lanzar una moneda ideal. Razonamos de esta forma: Puesto que solo existen dos resultados, cara o cruz, y dado que la moneda est bien equilibrada, cabe esperar obtener cara y cruz con la misma fre-cuencia, aproximadamente; por tanto, en un gran nmero de prue-bas, es de esperar que se obtendr cara alrededor de la mitad de

    9

  • 10 PROBABILIDAD [CAP. 2

    las veces, y aS, la probabilidad del suceso obtener cara estar dada por el valor 1/2. Esta clase de razonamiento origin la siguiente de-finicin clsica de probabilidad:

    Definicin 2-1.-Definicin clsica de probabilidad. Si un su-ceso puede ocurrir de n maneras mutuamente excluyentes e igual-mente verosmiles y si nA de estas poseen un atributo A, la proba-bilidad de A es la fraccin nA/no

    Aplicaremos esta definicin a algunos ejemplos sencillos, como ilustracin de su significado.

    Si se lanza un dado ordinario, hay seis resultados posibles: pue-de caer hacia arriba cualquiera de las seis caras numeradas. Estos seis resultados son mutuamente excluyentes, ya que no pueden apa-recer dos o ms caras simultneamente. Si adems suponemos que el dado est bien construido, los seis resultados son igualmente ve-rosmiles; no hay por qu esperar una cara con preferencia a cual-quier otra. Supongamos ahora que deseamos conocer la probabilidad de que el resultado de una tirada sea un nmero par. Tres de los seis resultados posibles tienen tal atributo. La probabilidad de que aparezca un nmero par al lanzar el dado es, por tanto, 3/6 1/2 Anlogamente, la probabilidad de que el resultado sea mayor que 2 es 2/3.

    Para dar otro ejemplo, supongamos que se saca una carta al azar de una baraja ordinaria 1. Se ve en seguida que la probabilidad de sacar espadas es 13/52 1/4. La probabilidad de sacar un nmero entre 5 y 10, ambos inclusive, es 24/52 6/13

    La aplicacin de la anterior definicin no siempre resulta tan inmediata como en estos casos sencillos. Examinemos cuidadosa-mente el sentido de mutuamente excluyentes y de igualmente ve-rosmiles. Supongamos que alguien deseara calcular la probabilidad de obtener dos caras lanzando una moneda dos veces. Podra razo-narse que los resultados posibles en las

  • SECo 2-2] PROBABILIDAD CLASICA O A PRIORI 11

    neamente. Supongamos ahora que alguien quisiera calcular la pro-babilidad de que una carta extrada de una baraja ordinaria sea un as o una espada. Al enumerar los resultados favorables podra contar 4 ases y 13 espadas, y razonar que hay 17 resultados posibles con el atributo deseado. Claro que esto es incorrecto, porque los

    suce~os no son mutuamente excluyentes; el hecho de que una carta sea un as no impide que sea tambin una espada.

    Observemos que la probabilidad es siempre un nmero com-prendido entre O y 1. La razn nA/n debe ser una fraccin propia, ya que el total de resultados posihles no puede ser menor que el nmero de resultados con un determinado atributo. Si un suceso ha de ocurrir ron seguridad, su probabilidad es 1. Si es seguro que Jlll ha de ocurrir, su probabilidad es O. As, la probabilidad de ob-tener 8 al lanzar un dado es O. La probabilidad de que el resultado sea menor que lOes 1.

    Las probabilidades determinadas mediante la definicin clsica se denominan probabilidades a priori. Cuando se dice que la proba-bilidad de obtener una cara lanzando una moneda es l/b se llega a este resultado por puro razonamiento deductivo. El resultado no requiere el lanzamiento de moneda alguna, ni siquiera disponer de ella. Decimos que si la moneda est bien construida, la probabilidad de obtener cara es 1/2; pero esto es poco ms que decjr una misma cosa de dos maneras distintas. Nada se dice de cmo puede deter-minarse si una moneda en particular est bien construida.

    No debe preocuparnos el hecho de que al desarrollar la teora de la probabilidad hayamos de tratar de objetos ideales, porque esta condicin es comn a todos los sistemas matemticos. La geome-tra, p. ej., trata c'onceptualmente de crculos perfectos, lneas de anchura cero, etc., y es, sin embargo, una rama til del conocimien-to que puede aplicarse a diversos problemas prcticos.

    Existen varios inconvenientes en esta manera clsica, a priori, de abordar el problema. Es obvio que la definicin de probabilidad deber modificarse de algn modo cuando el total de resultados po-sibles sea infinito.

    Podra buscarse, p. ej., la probabilidad de que un nmero na-tural extrado al azar sea par. La respuesta intuitiva a esta cuestin es 1/2, Si hubiera de justificarse este resultado basndose en la defi-nicin, podra rzonarse del siguiente modo: supongamos que solo se consideran los 20 primeros nmeros naturales; como 10 de estos son pares, la razn de sucesos favorables al total de posibles es 1/20 1/2, Si consideramos los 200 primeros, 100 de estos son pares y la razn es tambin 11z. En general, los 2N primeros nmeros natura-les contienen N nmeros pares; si formamos la razn N/2N y hace-mos tender N a infinito, de modo que comprenda todo el conjunto de los nmeros naturales, la razn sigue siendo 1/2,

  • 12 PROBABILIDAD [CAP. 2

    El argumento anterior es plausible y tambin la respuesta, pero su justificacin rigurosa no es cosa sencilla. Observemos que el razonamiento depende de la ordenacin natural de los nmeros enteros y positivos, y una ordenacin distinta podra dar lugar a un resultado diferente; p. ej., podran ordenarse los nmeros na-turales de este modo: 1, 3, 2; 5, 7, 4; 9, 11, 6; ... , tomando la primera pareja de nmeros impares, seguida del primer nmero par; la segunda pareja de nmeros impares, seguida del segundo nmero par, y as sucesivamente. Con esta ordenacin podra decirse que la probabilidad de obtener un nmero par es 1/3' Tambin pueden ordenarse los nmeros naturales de modo que la razn n/N aumen-te y disminuya, oscilando sin tender a valor alguno, cuando N crezca.

    La definicin clsica de probabilidad suscita otra dificultad ms grave an que la que se presenta en el caso de un nmero infinito de resultados posibles. Supongamos una moneda de la que sabe-mos que tiene un sesgo a favor de las caras (esto es, una distri-bucin tal de masa que hace ms probable que aparezca cara que cruz). Los dos resultados posibles al lanzar la moneda no son igual-men te probables: Cul es la probabilidad de obtener cara? La definicin clsica nos deja sin posible respuesta.

    Nos encontramos an con otra dificultad de la definicin cl-sica cuando queremos responder a preguntas tales como la siguien-te: cul es la probabilidad de que un nino nacido en Chicago sea varn?, o cul es la probabilidad de que un varn muera antes de los cincuenta aos?, o cul es la probabilidad de que una torta para t comprada en cierta pastelera contenga al me-nos tres cacahuetes?,o cul es la probabilidad de que una lm-para luzca al menos durante cien horas? Deseamos que todos es-tos problemas tengan respuesta dentro del marco de la teora de la probabilidad. Sin embargo, las cuestiones de simetra)), igual-mente verosmilesB, etc., no pueden considerarse como lo seran en un juego de azar. Por tanto, tendremos que alterar o extender nuestra definicin para incluir problemas anlogos a los anterio-res en la estructura de la teora. Esta probabilidad, aplicable ms extensamente, se llama probabilidad a posteriori o probabilidad fre-cuencial y ser analizada en la seccin siguien te.

    2-3. Probabilidad a posteriori o frecuencial.--Una moneda, que suponemos bien equilibrada y simtrica, fue lanzada 100 ve-ces; los resultados se recogen en la tabla 2-1. Un hecho impor-tante que debe observarse es que la frecuencia relativa de caras tiende a estabilizarse en tomo al valor 1/2, Esto no es sorprendente, ya que la moneda es simtrica y de antemano sabamos que, en una larga serie de tiradas, se obtendran aproximadamente tantas

  • SECo 2-3] PROBABILIDAD II.A. POSTERIORI:D O FRECUENCIAL 13

    caras como cruces. En oh o ejemplo, un nico dado fue lanzado 300 veces, recogindose los resultados en la tabla 2-2. Obsrvese cmo la frecuencia relativa de obtener un uno se aproxima a 1/6; anlogamente para un dos, un tres, un cuatro, un cinco y un seis. Estos resultados no son inesperados puesto que el dado que se emple era suficientemente simtrico y equilibrado; se esperaba que, en una larga serie de pruebas, cada cara del dado apareciera con, aproximadamente, la misma frecuencia. Esto sugiere que la frecuencia relativa de la tabla 2-1 podra utilizarse como una apro-ximacin de la probabilidad de obtener cara, con la moneda em-pleada, o cabra utilizar las frecuencias relativas de la tabla 2-2 como aproximaciones de las probabilidades de que aparezcan los diferentes nmeros con ese dado.

    En el experimento de la moneda es razonable suponer que existe un nmero, que designaremos con p, que es la probabilidad de obtener c.ara. Si la moneda parece verdaderamente bien equilibra-da y simtrica, podemos emplear la definicin 2-1 y establecer que p es aproximadamente igualOa l/Z' Decir que p es igual a 1/2 es solo una aproximacin, puesto que para esta moneda particular no po-demos estar seguros de que los dos resultados, cara y cruz, sean con exactitud igualmente verosmiles. Pero comprobados el equi-librio y la simetra de la moneda, parece bastante razonable supo-ner que lo son. Alternativamente, podra lanzarse la moneda un gran nmero de veces, anotando los resultados como en la ta-bla 2-1 y utilizar la frecuencia relativa de una cara como una apro-

    TABLA 2-1.-RESULTADOS DEL LANZAMIENTO DE UNA MONEDA 100 VECES

    Frecuencia Frecuencia relativa es-Resultado Frecuencia relativa perada en una larga se-

    observada rie de pruebas con una moneda equilibrada

    e 56 0,56 0,50 X 44 0,44 0,50

    Total 100 1,00 1,00

    ximci6n de p. En el experimento del dado, podra aproximarse la probabilidad P2 de obtener un dos utilizando la definici6n 2-1 o la frecuencia relativa de la tabla 2-2. Lo importante es que postula-mos la existencia de un nmero P que se define como la probabi-lidad de obtener cara con la moneda, o un nmero P2 que es la probabilidad de obtener un dos al lanzar el dado. En los ejemplos

  • 14 PROBABILIDAD [CAP. 2

    TABLA 2-2.-RESULTADOS DEL LANZAMIENTO DE UN DADO 300 VECES

    Frecuencia relativa es-Resultado Frecuencia Frecuencia pera da en una larga

    relativa serie de pruebas con un dado equilibrado

    1 51 0,170 0,1667 2 54 0,180 0,1661 3 48 0,160 0,1667 4 51 0,170 0,1667 5 49 0,163 0,1661 6 47 0,157 0,1661

    Total 300 1,000 1,0000

    citados parece poco importante el que utilicemos la definicin 2-1 o la frecuencia relativa para hallar la probabilidad p.

    Supongamos, como se dijo anteriormente, que la moneda est desequilibrada, de tal forma que despus de un examen estamos completamente seguros de que los dos sucesos, cara y cruz, no son igualmente verosmiles. Aun en estos casos puede postularse la existencia de un nmero p como probabilidad de obtener cara, pero para hallar el valor de p no podremos aplicar la definicin clsica. Tendremos que utilizar la teora frecuencial.

    En muchas investigaciones cientficas se realizan observacio-nes que tienen un elemento de incertidumbre o que no pueden predecirse. Como ejemplo muy simple, supongamos que se desea predecir si el prximo nio que nazca en cierta localidad ser va-rn o hembra. Este suceso individual es incierto, pero los resul-tados de grupos de nacimientos pueden ser tratados satisfactoria-mente. Observamos que existe cierta regularidad en una gran serie de observaciones, semejante a la regularidad de la razn frecuen-cial de una cara cuando lanzbamos una moneda. Si, p. ej., al exa-minar los registros observamos que un 51 por 100 de los nacidos son varones, es razonable postular que la probabilidad de que naz-ca un varn en esa localidad es igual a un nmero p, y tomar, como aproximacin de l, 0,51. Este mtodo de definicin se de-nomina a veces probabilidad estadstica.

    Para hacer ms concreta esta idea, supongamos que pueden hacerse observaciones (o experimentos) bajo condiciones comple-tamente uniformes. Es decir, hecha la observacin, se repite el suceso en condiciones anlogas y se hace otra observacin; esto se repite muchas veces y, aunque las condiciones sean siempre si

  • SECo 2-4] MODELOS DE PROBABILIDAD 15

    milares, existe una variacin incontrolable que es casual o alea-toria, de tal forma que no es posible predecir el resultado de las observaciones individualmente. En muchos de estos casos, las ob-servaciones caen dentro de ciertas clases, en las que las frecuen-cias relativas son bastante estables. Esto sugiere que postulemos un nmero p, llamado probabilidad del suceso, y aproximar p por la frecuencia relativa con que aparece dicho suceso en las repe-tidas observaciones. AS, p. ej., supongamos que el experimento consiste en muestrear la poblacin de una gran ciudad para ver cuntos votantes se pronunciarn a favor de cierto candidato. Los resultados son a favor o uno a favor y no es predecible la res-puesta de cada votante, pero es razonable postular un nmero p como probabilidad de que una respuesta dada sea a favor. La frecuencia relativa de respuestas a favor puede utilizarse como valor aproximado de p.

    Como otro ejemplo, imaginemos que el experimento u obser-vacin consiste en el muestreo de transistores en una gran colec-cin de estos. Postularemos que la probabilidad de que un tran-sistor dado sea defectuoso es p. Podemos aproximar p seleccionan-do al azar varios transistores del conjunto dado y calculando la frecuencia relativa del nmero de defectuosos.

    Lo importante es la posibilidad de imaginar una serie de ob-servaciones o experimentos realizados en condiciones bastante uni-formes. Puede postularse entonces un nmero p como probabili-dad de que ocurra el suceso A, y P puede ser aproximado por la frecuencia relativa del suceso A en una serie de experimentos.

    2-4. Modelos de prohabilidad.-Uno de los objetivos de la ciencia consiste en predecir y describir sucesos del mundo en que vivimos. Una manera de hacerlo es construir modelos matemti-cos que describan adecuadamente el mundo real. AS, p. ej., la ecuacin s= 1/22,t2 expresa cierta relacin entre los smbolos s, g y t. Con el fin de utilizar la ecuacin S=1/~t2 en una experiencia del mundo real para predecir s, distancia recorrida por un cuerpo que cae, como funcin del tiempo t,. tiene que conocerse la constante gravitatoria g. Esta es una constante fsica que debe ser medida por experimentacin si se desea que la ecuacin S=1/22,t2 sea til. La razn de haber mencionado esta ecuacin es que en la teora de la probabilidad hacemos algo muy parecido: construimos un modelo probabilstico que pueda utilizarse para describir sucesos del mundo real. As, p. ej., puede desearse hallar una ecuacin a

  • 16 PROBABILIDAD [CAP. 2

    perfectamente para ocuparse de grupos de sucesos. Cabe postular la existencia de un nmero p que represente la probabilidad de que un nacido sea varn. A partir de esta probabilidad fundamen-tal, podemos responder a preguntas tales como: Cul es la pro-babilidad de que de diez nacidos, al menos tres sean varones?, o cul es la probabilidad de que haya tres varones consecutivos en los prximos cinco nacimientos? Para contestar a preguntas tales como estas y a muchas otras anlogas, desarrollaremos un modelo idealizado de probabilidad.

    Consideraremos una teora de la probabilidad adecuada solo para aquellas situaciones que pueden ser descritas por los resultados de experimentos conceptuales. Es decir, consideraremos nicamen-te aquellos sucesos cuya repeticin sea concebible bajo condiciones semejantes. As pueden tratarse los nacimientos de varones, el lan-zamiento de una moneda, el nmero de automviles, etc.; pero no se incluyen problemas tales como cul es la probabilidad de que mi esposa me ame?, o cul es la probabilidad de que no hubiera ocurrido la segunda guerra mundial?

    Tambin necesitamos que pueda enumerarse cada posible re-sultado de 'un experimento. As, p. ej., al lanzar una moneda exis-ten dos resultados posibles: cara y cruz. Asociaremos probabili-dades solamente con estos resultados. Aadiremos, sin embargo, que aun cuando un resultado sea imposible puede ser incluido (su probabilidad es O). Lo fundamental es recordar que ha de incluirse cada resultado que puede ocurrir.

    Cada resultado imaginable de un experimento conceptual, que puede repetirse bajo condiciones similares, ser denominado un punto muestral, y la totalidad de los resultados imaginables (o pun-' tos muestrales) se llamar el espacio muestral.

    Antes de proceder al desarrollo de la teorta, daremos algunos ejemplos.

    Ejemplo 2-1.-Si un experimento aleatorio consiste en lanzar una moneda dos veces, existen cuatro resultados imaginables: (C, C), (e, X), (X, C), (X, X). Por tanto, hay cuatro puntos mues-trales que forman el espacio muestra!.

    Ejemplo 2-2.-Si un experimento aleatorio consiste en observar el sexo de los nacidos en cierta poblacin, existen dos resultados imaginables: varn y hembra; por tanto, hay dos puntos muestra-les en el espacio muestral.

    Ejemplo 2-3.-Supongamos que se selecciona una muestra de 50 semillas de un saco, para ver cuntas germinan. El experimento aleatorio consiste en extraer 50 semillas del saco. Los resultados posibles son las cantidades que germinan de las 50. Puede haber O, 1, 2, ... , 50 que germinen, por lo que existen 51 puntos mues-trales que forman el espacio muestra!.

  • SECo 2-5) CONJUNTOS DE PUNTOS 17

    Ejemplo 2-4.-Imaginemos que en una gran ciudad se seleccio-nan 500 personas al azar para ver cuntas consumen cierta marca de leche. El nmero imaginable de las que consumen tal marca de leche entre las 500 personas es 0, 1, 2, ... , 500. Cada uno de estos 501 nmeros es un punto muestral del espacio muestraI.

    Ejemplo 2-5.-Supongamos que un experimento aleatorio con-siste en preguntar a los espectadores de la televisin de cierta Ciu-dad si presencian regularmente tres programas especificados. Hay ocho resultados imaginables: (S, S, S), (S, S, N), (S, N, S), (N, S, S). (S, .N, N), (N, S, N), (N, N, S), (N, N, N), donde (S, N, S) significa s presencia el primer programa, nOD el segundo programa y s el tercer programa, etc. El espacio muestral est formado por ocho puntos.

    Ejemplo 2-6.-En los ejemplos anteriores el espacio muestral est formado por un nmero finito de puntos. Daremos ahora un ejemplo de espacio muestral que contiene un nmero infinito de puntos. Supongamos que se desea determinar el nmero de tiradas de una moneda que deber hacerse hasta que aparezca la pri-mera cara. Esta puede aparecer en la tirada 1.a., 2.a, , n-sima, ... Aqu el espacio muestral est formado por una infinidad numerable de puntos (tantos como nmeros enteros positivos).

    Ejemplo 2-7.-En este ejemplo, el espacio muestral estar for-mado por tantos puntos (llamado un continuo de puntos) como n-meros reales positivos. Sea el experimento aleatorio consistente en seleccionar una muestra aleatoria de estudiantes de sexto curso en determinada ciudad y registrar su peso. El resultado puede ser cualquier nmero positivo. Cabe objetar que no habr estudiantes que pesen menos de un kilogramo o ms de 1000. Es cierto, pero no es objecin si se incluyen los resultados imposibles al enumerar cada resultado imaginable. Por tanto, este espacio muestral estar formado por todos los nmeros positivos.

    2-5. Conjuntos de puntos.-Definiremos ciertas operaciones sobre el conjunto de puntos que forman el espacio muestral y que son necesarias para posteriores desarrollos de la teora. Un conjunto de puntos, llamado a veces simplemente un conjunto, es una colec-cin de elementos que tienen ciertas propiedades. especficas. Un conjunto podra ser el de los 10 primeros nmeros naturales o una coleccin de automviles o de cualesquiera otros objetos. Si s es un punto o un elemento que pertenece al conjunto S, escribire-mos sE S.

    Definicin 2.2.-Dos conjuntos SI y S2 se dice que son iguales si cada elemento o punto de SI es tambin un punto de S2I y cada punto de S2 es as mismo un punto de SI; es decir. si SI y S2 con-

  • 18 PROBABILIDAD [CAP. 2

    tienen exactamente los mismos puntos. Indicaremos la igualdad escribiendo S1 = S2'

    Definicin 23.-Si cada elemento (o punto) de un conjunto S1 es tambin un elemento de S, llamaremos a S1 un subconjunto de S y escribiremos S1 e S.

    Ejemplo 2-8.-Sea S el conjunto de los enteros x tales que x=l, 2, 3, 4, 5, 6, 7. Escribiremos S={x:x=l, 2, 3, 4, 5, 6, 7}. Sea S1={y:y=l, 2, 3}. Entonces SI es un subconjunto de S. Si S2={z:z=l, 3, 5, 7}, S2 no es un subconjunto de Sb pero s un sub-conjunto de S.

    Definicin 24.-En cada aplicacin de la teora, existir un con-junto universal, el espacio muestral S, tal que todos los otros con-juntos que intervengan en el anlisis son subconjuntos de S.

    Algunas veces puede que no se indique explcitamente el espa-cio muestral, pero generalmente estar implcito en el contexto de la discusin.

    Definicin 25.-EI complemento de un conjunto Sil respecto al espacio muestral S, ser el conjunto de puntos que estn en S pero no en SI' Se indicar por S - ~1 o a veces por S1'

    En el ejemplo 2-8, el conjunto SI est dado por S1={x:x=4, 5, 6, 7} Y Sz={z:z=2,4, 6}.

    Definicin 2-6.-Si un conjunto SI no contiene puntos, se deno-mina el conjunto nulo, y ser indicado por 0.

    Adoptaremos' los convenios de que el conjunto nulo es un sub-conjunto de todo conjunto, y de que cada conjunto es un subconjunto de s mismo.

    Despus de haber enumerado los resultados de un experimento aleatorio y definido un espacio muestral S, necesitaremos conside-rar ciertos subconjuntos del espacio muestral. As, p. ej., en el ejem plo 2-3, cabe preguntarse, cul es la probabilidad de que germinen ms de 30 semillas? Estamos haciendo una pregunta relacionada con un subconjunto de S; el subconjunto contiene los elementos 31, 32, ... , 50. Con nuestra terminologa diremos, cul es la pro-babilidad '~e que ocurra el suceso A, donde A es el subconjunto 31, 32, ... , 50? Esto nos lleva a la siguiente definicin:

    Definicin 2-7.-Un suceso A est definido en el espacio mues-tral S como un subconjunto A de puntos de S, y cuando decimos probabilidad de que ocurra el suceso A queremos decir proba-bilidad de que aparezca cualquier punto de A.

    As, p. ej., cuando preguntamos cul es la probabilidad de que germinen ms de 30 semillas? estamos preguntando, en esencia, cul es la probabilidad de que se presente cualquier punto del su-

  • SECo 2-5] CONJUNTOS DE PUNTOS 19

    ceso A, donde A={x:x=31, 32, ... , 50}; si ocurre cualquier punto de A, diremos que se ha producido el suceso A (germinar ms de 30 semillas).

    Si el espacio muestral contiene un continuo de puntos, como en el ejem~lo 2-7, no definiremos todo subconjunto como un suce-so, sino solo subconjuntos medibles. El trmino medible est to-mado de las matemticas superiores y el lector no necesita preocu-parse de l en este libro, ya que los subconjuntos que consideremos sern medible s y, por tanto, sern llamados sucesos.

    En el ejemplo 2-7 podemos preguntar cul es la probabilidad de que el estudiante pese entre 75 Kg y 85 Kg? Con nuestra termi-nologa preguntaramos cul es la probabilidad del suceso A, don-de A={x: 75 < x < 85}?

    En relacin con el espacio muestral S, supongamos que SI y S2 son dos sucesos, es decir, dos subconjuntos de S. Pueden definirse otros dos sucesos: 1) el conjunto de puntos que estn en ambos, SI y S2' Y 2) el conjunto de puntos que estn en SI o en S2 o en ambos, SI y S2. Estos conjuntos se precisan en las dos definiciones siguientes.

    Definicin 2-8.-Sean SI y S2 dos sucesos cualesquiera del espa-cio muestral S, el suceso formado por todos los puntos que estn en SI o en So o en ambos, se llama unin de SI y S2 y se denota por SI US2. .

    Ejemplo 2-9.-Consideremos de nuevo el ejemplo 2-5. Sea SI el suceso definido por la condicin de que la respuesta para el pri-mer programa sea s; es decir, SI contiene los cuatro puntos (S, S, S), (S, S, N), (S, N, S), (S, N, N). Sea S2 el suceso definido por la condicin de que la respuesta para el tercer programa sea nOD; esto es, S2 contiene los cuatro puntos (S, S,N), (S, N, N), (N, S, N)~ (N, N, N). Entonces, el conjunto SI U S2 contiene los seis puntos (S, S, S), (S, S, N), (S, N, S), (S, N, N), (N, S, N), (N, N, N).

    Definicin 2-9.-Sean SI y S2 dos sucesos cualesquiera del espa-cio muestral S, el suceso formado por todos los puntos que estn en ambos, SI y So se llama interseccin de SI y S2 y se denota por SI n So o a veces por SlS2.

    Ejemplo 2-10.-Si se definen SI y S2 como en el ejemplo 2-9, el suceso SI n S2 contiene los dos puntos (S, S, N), (S, N, N).

    De las definiciones anteriores se desprenden los resultados si-guientes, donde S es el espacio muestral, y SI Y S2, sucesos de S.

    1. 5=0. 2. Si SI y S2 no tienen puntos comunes (conjuntos mutua-

    mente excluyentes), SI n S2 = 0. 3. SI n S=SI. 4. SI US=S.

  • 20 PROBABILIDAD [CAP. 2

    5. S n SI =S - SI =SI. 6. SI U SI =SI. 7. SI n SI =51

    Existe la posibilidad de establecer otras muchas relaciones en-tre sucesos, _pero estas bastarn para nuestros propsitos inme-diatos.

    Clasificaremos el espacio muestral en dos tipos, discreto y con-tinuo. Lo hacemos con el propsito de aligerar las explicaciones de posteriores desarrollos de la teora. En realidad, con instrumentos de las matemticas superiores que estn fuera de los objetivos de este libro, pueden tratarse ambos tipos en una teora unificada.

    Definicin 2-10.-Vn espacio muestral S se dice" que es discreto si contiene: 1) un nmero finito de puntos, o 2) un nmero infinito de puntos (infinito numerable) que pueden ponerse en correspon-dencia uno a uno con los nmeros naturales.

    En los ejemplos 2-1 a 2-5, el espacio muestral contiene un n-mero finito de puntos y, por tanto, es discreto. En el ejemplo 2-6 hay un nm.ero infinito de puntos, pero pueden ordenarse en una sucesin (en correspondencia uno a uno con los nmeros natura-les); por tanto, ese espacio muestral es tambin discreto. Sin em-bargo, en el ejemplo 2-7 el espacio muestral est formado por to-dos los nmeros reales x, donde x> O, Y no es posible poner estos nmeros en correspondencia uno a uno con los naturales. Por tan-to, existen espacios muestrales que no son discretos, sino que con-tienen lo que se llama un continuo de puntos.

    Definicin 2-11.-Un espacio muestral S se llama espacio mues-tral continuo, si contiene un continuo de puntos.

    Concluiremos esta seccin con algunos ejemplos adicionales, y daremos luego un desarrollo axiomtico de la probabilidad.

    Ejemplo 2-11.-Consideremos un experimento aleatorio con-sistente en observar la duraci6n de la vida de tubos electrnicos. El resultado puede ser cualquier nmero positivo y, por tanto, el espacio muestral es continuo.

    Ejemplo 2-12.-Sea un experimento aleatorio que consiste en seleccionar al azar tres personas de entre los empleados de cierta compaa y registrar la renta anual de cada persna. El espacio muestral est formado por las ternas (Xh x2, X3), donde x., X2 Y X3 son las rentas respectivas de las tres personas, y cada una de ellas puede tomar cualquier valor mayor que cero. Definamos el suceso A por la condicin de que la renta anual total de las tres personas que se muestrean exceda de 15000 dlares. Esto puede escribirse de la forma siguiente:

    A={(X.,X2,X3):Xl>0, X2>0, X3>0; xl+x2+x3>15000}

  • SECo 2-6] DESARROLLO AXIOMATICO DE LA PROBABILIDAD II

    Ejemplo 2-13.-Un experimento aleatorio consiste en lanzar dos dados y observar los nmeros que salen. El espacio muestral consta de 36 puntos, que son (1, 1), (1,2), ... , (6, 6), donde los pares ordena-dos de nmeros representan los resultados respectivos del primero y del segundo dado. Definimos el suceso A por la condicin de que la suma de las dos puntuaciones sea igual a siete; tal suceso est formado por seis puntos, que son (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1).

    Ejemplo 2-14.-En un experimento agrcola, se examina el ren-dimiento de cinco variedades de trigo. Las cinco variedades se des-arrollan bajo condiciones uniformes. El resultado es una coleccin de cinco nmeros (y, Y2' Y3' Y4, Ys), donde Yi representa el rendimien-to de la i-sima variedad, en quintales por hectrea. El espacio muestral es continuo, ya que cada Yi puede ser cualquier nmero real mayor o igual que O. Definamos el suceso A en este ejemplo por las condiciones de que Y2, Y3, Y4 e Ys sean cada una 10 o ms quintales por hectrea mayores que Y, variedad estndar.

    Con nuestra notacin, escribiremos

    A ={(Yh Y2' Y3' Y4' Ys): Y"~Yl + 10; j =2,3,4,5; O~Yd 2-6. Desarrollo axiomtico de la probabilidad.-En las sec-

    ciones anteriores hemos dado los conceptos de probabilidad clsica y frecuencial que pueden ayudarnos a resolver importantes proble-mas de la ciencia experimental. Para coadyuvar a la solucin de es-tos problemas, desarrollaremos una teora matemtica de la proba-bilidad y mostraremos luego cmo puede utilizarse este modelo idea-lizado en los problemas del mundo real.

    En primer lugar enunciaremos los axiomas que se emplearn para desarrollar la teora.

    Sea S un espacio muestral, y A, cualquier suceso de S; es decir, A es cualquier subconjunto de S. Diremos que P es una funcin de probabilidad en el espacio muestral S si se satisfacen los tres axio-mas siguientes.

    Axioma l. P(A) es un nmero real tal que P(A) ~ O para todo suceso A de S.

    Axioma 2. P(S) = 1. Axioma 3. Si SI1 Sb ... es U1la sucesin de sucesos mutuamen-

    te excluyentes de S, es decir, si Si n Sj=0 para i:l= j = 1, 2, 0'0' P(Sl U S2 U ".)=P(Sl) + P(SJ + ...

    Estos axiomas, que se utilizarn para desarrollar un modelo idealizado, estn motivados por las definiciones de probabilidad cl-sica y frecuencial. Demostraremos ahora algunos teoremas que son resultados directos de los axiomas.

  • 22 PROBABILIDAD [CAP. 2 -------

    Teorema 2-1o-Sea S un espacio muestral y P una funcin de probabilidad en S; la probabilidad de que no ocurra el suceso A es 1 - peA). Con la no!...acin de los conjuntos' de puntos, esto se escribe en la forma P(A)=l-P(A).

    Demostracin.-En virtud de la definicin 2-6, A n A=0; tam-bin A UA=S, y, por el axioma 2, se tiene l=P(S)=P(A U A). Por el axioma 3, 1 =P(S)=P(A U A) =P(A) +P(A), con 10 que queda de-mostrado.

    Teorema 2-2.-Sea S un espacio muestral con funcin de pro-babilidad P; en tal caso, O~P(A) ~ 1 para cualquier suceso A de S.

    Demostracin.-Por el axioma 1, peA) ~ O, con lo que solo ser necesario demostrar que P(A) ~ 1. Por el teorema 2-1, peA) + peA) = 1; pero peA) ~ O por el axioma 1, luego peA) = 1 - peA) ~ 1.

    Teorema 2-3o-Sea S un espacio muestral con una funcin de probabilidad P. Si So es el conjunto nulo, peSo) = o.

    Demostracin.-De los resultados de la seccin 2-5, se deduce que S = So = 0. Por el axioma 3, peS U S) = peS) + P{S) = peS) + peSo). Pero S U S=S y P(S)= 1, luego P(So) =0.

    Si estos axiomas y los teoremas de ellos resultantes han de ayu-damos a desarrollar un modelo til, debemos tener una regla o fun-cin que nos permita calcular la probabilidad de cada suceso A (subconjunto) del espacio muestral S. Explicaremos cmo se cons-truye tal funcin en las prximas secciones. Lo haremos para tres espacios muestrales diferentes: 1) un espacio muestral discreto con un nmero finito de puntos, donde cada uno de ellos tiene la misma probabilidad; 2) un espacio muestral discreto general, que ser es-tudiado en el captulo 3; 3) un espacio muestral continuo, que ex-pondremos en el captulo 4.

    2-7 o Espacio muestral discrcto con un nmero finito de puntoso-En ciertos tipos de problemas, entre los cuales los juegos de azar constituyen ejemplos notables, el espacio muestral contiene un nmero finito n de puntos, y la probabilidad asignada a cada punto es lln.

    En otras palabras, en ciertos problemas existe un nmero finito de ordenaciones (n) y es totalmente realista suponer que la proba-bilidad de cada ordenacin es lln. En general, es suficiente para estos problemas la definicin clsica, y pueden emplearse los m-todos combinatorios para la enumeracin de las ordenaciones. Ve-remos cmo este espacio muestral especial (nmero finito de puntos con igual probabilidad para cada uno de ellos) encaja en la teora general y a continuacin indicaremos varios mtodos que pueden utilizarse para resolver estos problemas.

  • SECo 2-8] PERMUTAC~ONES y COMBINACIONES 23

    Definicin 2-12.-Sean Sl1 So ... , Sn los n punt0s muestrales de un espacio muestral discreto S,' se dice que la funcin P es una funcin de probabilidad de sucesos igualmente verosmiles si satis-face las condiciones siguientes:

    a) P(SI) =P(S2) = ... = P(Sn) = lIno b) Si es A un suceso que contiene nA cualesquiera de los puntos

    muestrales Si, entonces P(A) = nA/no La condicin a) afirma que cada uno de los n puntos es igual-

    mente verosmil y, por tanto, que su probabilidad es l/n. La condi-cin b) establece que la probabilidad de un suceso que contenga nA de los n puntos muestrales es nJn. Es fcil comprobar que esta funcin satisface los axiomas 1, 2 y 3 y es, por tanto, una funcin de probabilidad. La funcin de probabilidad de sucesos igualmente verosmiles es exactamente lo mismo que el concepto dado en la definicin 2-1.

    Ejemplo 2-15.-Supongamos que un experimento aleatorio con-siste en lanzar una moneda simtrica equilibrada dos veces. El es-pacio muestral S (resultados) est formado por cuatro puntos: (e, C)=s., (e, X)=S2' (X, C)=S3' (X, X)=S4' donde (e, X) significa cara en la primera tirada y cruz en la segunda, etc. Parece totalmen-te razonable asignar a cada punt muestral la probabilidad 1/4' Ima-ginemos que A es el suceso el resultado de la primera tirada es caraD; entonces A =Sl U S2' Este suceso (subconjunto) contiene dos puntos, de donde P(A)=2/4=1/2.- Definamos el suceso B por la con-dicin de que aparezca al menos una cara; entonces B=Sl U S2 U S3' B contiene tres puntos, luego P(B) =3/4, Supongamos ahora que se desea hallar la probabilidad de que no ocurra B, es decir, P(B). Por la definicin 2-5, s4=B, Y por el teorema 2-1, l-P(B)=P(B)= =P(S4)=1/4 ; luego P(B) = 1/4'

    2-8. Permutaciones y combinaciones.-Para calcular la pro-babilidad de un suceso A cuando es aplicable la definicin 2-1 o su equivalente 2-12 (supondremos aplicables estas definiciones en las Secs. 2-8 a 2-13), necesitamos calcular el nmero total n de orde: naciones mutuamente excluyentes e igualmente verosmiles, y el n-mero nA con el atributo A. Esta ~numeracin se facilita a menudo mediante ciertas frmulas combinatorias que desarrollaremos a con-tinuacin y que se basan en los dos principios fundamentales si-guientes:

    --\ a) Si un suceso A puede ocurrir de m maneras, y un suceso di-ferente 13 puede ocurrir de n maneras, el suceso A o B puede ocu-rrir de m + n maneras, siempre que A y B no puedan ocurrir simul-tneamente.

  • 24 PROBABILIDAD [CAP. 2

    b) Si un suceso A puede ocurrir de m maneras, y un suceso diferente B puede ocurrir de n maneras, el suceso A y B puede ocurrir de mn maneras.

    Estas dos ideas pueden ilustrarse haciendo corresponder A a la extraccin de una espada de una baraja y B a la extraccin de un corazn. Cada uno de estos sucesos puede realizarse de 13" maneras. El nmero de maneras en que puede sacarse un corazn o una es-pada es, evidentemente,

    13+ 13=26

    Para aclarar el segundo principio supongamos dos cartas extradas de la baraja, de modo que una sea una espada y la otra un corazn. Hay 13 x 13 =169 maneras de hacer esto, ya que con el as de espa-das podemos poner cualquiera de los 13 corazones; con el rey de espadas, tambin cualquiera de los 13 corazones, y as sucesiva-mente para las dems espadas, hasta 13.

    Estos dos principios pueden, evidentemente, generalizarse te-niendo en cuenta ms de dos sucesos. As, si tres sucesos A, B Y e, mutuamente excluyentes, pueden ocurrir de m, n y p maneras, res-pectivamente, el suceso A o B o e puede ocurrir de m + n + p ma-neras, y el suceso A y B Y e puede ocurrir de mnp maneras.

    Usaremos ahora el segundo de estos principios para contar el nmero de disposiciones de un conjunto de objetos. Consideremos el nmero de disposiciones posibles con las letras a, b y c. Podemos tomar cualquiera de las tres y colocarla la primera; cualquiera de las otras dos podr colocarse la segunda, y la tercera posicin la ocupar la letra restante. La ocupacin de la primera posicin es un suceso que puede ocurrir de tres maneras; la de la segunda, de dos, y la de la tercera, de una. Luego los tres sucesos juntos pueden presentarse de 3 x 2 x 1 = 6 maneras. Las seis disposiciones, denomi-nadas permutaciones, son

    abc, acb, bac, bca, cab, cba

    En este ejemplo apenas mereca emplear el mtodo del recuento, ya que es suficientemente sencillo escribir las seis permutaciones. Pero si quisiramos buscar el nmero de permutaciones de seis letras, habramos tenido que escribir .

    6 x 5 x 4 x 3 x 2 x 1 = 720 permutaciones.

    Es evidente que, en general, el nmero de permutaciones de n objetos diferentes es

    n(n -1) (n - 2.)(~ - 3) ... (2) (1)

  • SECo 2-81 PERMUTACIONES Y COMBINACIONES 25

    Este producto de un nmero natural por todos los nmeros na-turales menores que l, se denota corrientemente con el smbolo n! (lase .factorial de n). As, 2! =2, 3! =6,41 =24,51 =120, etc. Pues-to que

    n! (n-l)! =-n

    es corriente definir O! como 1, de modo que la relacin sigue apli-cndose cuando n = 1.

    Vamos a contar ahora el nJ..I1ero de permutaciones que pueden hacerse con n objetos cuando solo se emplean r objetos en una per-mutacin dada. Por el razonamiento anterior, la primera posicin puede ocuparse de n maneras; la segunda, d,e n - 1 maneras, y as sucesivamente; al llegar a la r-sima posicin, habremos usado r - 1 de los objetos, de modo que nos quedarn n - (r -1), entre los cua-les podremos elegir. El nmero de permutaciones de n objetos to-mando r cada vez es, por tanto, n(n -1) (n - 2) ... (n - r + 1). Este nmero se designa con el smbolo Pn r :

    Pn.r=n(n -1) (n - 2) ... (n -r+ 1) n! (1) (n - r)! As, el nmero de permutaciones de las letras a, b, c, d, tomando dos cada vez, es P4,2=4 x 3 = 12. Haciendo r=n en la ecuacin O), obtenemos el resultado enunciado anteriormente: el nmero de per-mutaciones de n objetos tomados de n en n es n!.

    Con ayuda de la ecuacin (1) podemos resolver ahora el siguien-te problema: De cuntas maneras distintas pueden elegirse r ob-jetos de entre n objetos? Pn r representa el nmero de selecciones po-sibles, as como todas las disposiciones de cada seleccin o combi-nacin., Dos combinaciones son distintas si no estn formadas por el mismo conjunto' de objetos. As, abc y abd son combinaciones di-ferentes de tres letras, mientras que abc y bca son permutaciones diferentes de la misma combinacin. Representemos por el smbolo

    (~) el nmero de combinaciones diferentes. Es evidente que Pn., es igual a (~) veces r!, ya que cada combinacin de r objetos tie-ne r! disposiciones. Por tanto,

    (n) = Pnr r rI

    n(n -1) (n - 2) ... (n - r + 1) r!

    n! (2) r!(n-r)!

    Otro smbolo corriente para este nmero es Cn,rl pero no 10 usa-remos en este texto. El nmero de combinaciones de cinco objetos

  • 26

    tomados tres a tres es

    (~)

    PROBABILIDAD

    5x4x3 31

    60 6

    10

    [CAP. 2

    Puede darse a (:) una interpretacin diferente. Es el nmero de maneras en que pueden dividirse n objetos en dos grupos, uno de ellos de r objetos, y el otro grupo, de n - r objetos. Supongamos ahora que queremos dividir n objetos en tres grupos que conten-gan n, n2, n3 objetos, respectivamente, siendo

    Empezaremos por dividirlos en dos grupos que contengan nI Y n2 + n3 objetos. Esto puede hacerse de (:1) maneras. Entonces po-demos dividir el segundo grupo en otros dos grupos que contengan nz y n3 objetos, lo que puede hacerse de (n2 ~ n3) maneras. Median-te el segundo principio de enumeracin, el nmero total de maneras de hacer a la vez ambas divisiones es

    n! (n2 +n3)! ni nI ! (n2 + n3) 1 n21 n3! nI ! n2! n3 1

    Este tipo de razonamiento puede extenderse para hallar el n-mero de maneras de dividir n objetos en k grupos que contengan n, n2, ... , nk objetos, siendo nI + n2+ '" + nk=n. Se halla en seguida que este nmero es

    n! (3) ni! n2! ... nk 1

    Por tanto, el nmero de maneras de dividir cuatro objetos en tres grupos que contengan 1, 1 Y 2 objetos es

    4! 12

    111 !2! La expresin (3) tiene una segunda interpretacin. Es el nmero

    de permutaciones diferentes de n objetos cuando ni de los objetos son iguales entre s y de una clase, n2 iguales y de otra clase, y as sucesivamente. Si nos referimos al ejemplo numrico anterior,hay 12 permutaciones de las letras a, b, c, c. Para ver que la expre-

  • SECo 2-8] PERMUTACIONES Y COMBINACIONES 27

    sin (3) da el nmero correcto, consideremos n objetos diferentes (p. ej., las letras a, b, e, oo., p) dispuestos en un orden dado. Consi-deremos ahora una divisin de este conjunto de objetos en k gru-pos, de los cuales el primero contiene nI objetos; el segundo, n2, y as sucesivamente. Sustituyamos ahora en la disposicin original de los objetos todos los elegidos para el primer grupo por unos, todos los elegidos para el segundo grupo por doses, y as sucesiva-mente. El resultado ser una permutacin de nI unos, n2 doses, 000' nk smbolos k. Reflexionando un poco, nos convenceremos de que cada divisin de las letras en los k grupos corresponde a una per-mutacin diferente de los nmeros considerados y que este es el conjunto total de permutaciones, pues si hubiera otro habra otra divisin de las letras en k grupos.

    Hemos obtenido tres frmulas en esta seccin, no solo por su utilidad, sino porque su obtencin sirve para ilustrar la aplica-cin de los dos principios de recuento que dimos al principio de la seccin. Lo ms importante es considerar los mtodos; las frmu-las servirn para resolver muchos problemas, pero resultan intiles en muchos otros, y entonces hay que recurrir a los principios ele-mentales.

    Ejemplo 2-16.-Si se extraen dos cartas de una baraja ordinaria, cul es la probabilidad de que una sea espada y otrci corazn?

    Puesto que nada se dice sobre el orden de presentacin de la espada y el corazn, se trata de un problema de combinaciones. Para calcular la probabilidad, hemos de hallar el total de resultados po-sibles en una extraccin de dos cartas, y despus, el nmero de es-tos resultados que tienen el atributo en cuestin. El total de com-binaciones de dos cartas que pueden hacerse con 52 cartas es (522) =1326=n. Ya hemos visto antes que hay "13 x13=169=nA combinaciones distintas con el atributo requerido. Por tanto,

    P(A)=~= 169 =~ n 1326 102

    Este problema puede resolverse tambin considerando el n-mero de permutaciones posibles; el denominador de la fraccin se-ra entonces PS2,2=2652. Para obtener el numerador basta considerar que cada una de las 169 combinaciones de dos cartas tiene dos per-mutaciones, lo que da 2 x 169 = 338 para el nmero de permuta-ciones que tienen el atrib.uto requerido. O tambin podemos em-pezar del siguiente modo: El nmero de permutaciones donde aparece primero una espada y despus un corazn es 13 x 13 = 169, segn el principio bY, y el nmero de aquellas en las que se presenta el corazn primero y la espada despus es el mismo. Cualquiera

  • 28 PROBABILIDAD [CAP. 2

    de estos grupos de permutaciones satisface nuestro requerimiento, y segn el principio a), el nmero requerido ser 169 + 169 = 338; por tanto, volvemos a obtener para la probabilidad el valor 13/102.

    Ejemplo 2-17.-Cul es la probabilidad de obtener 3 o ms espadas en una extraccin de 4 cartas de una baraja ordinaria?

    Se trata tambin, en este caso, de combinaciones. El total de combinaciones posibles con cuatro cartas es (5:) =270725. En consecuencia, el espacio muestral S est formado por 270 725 = n puntos, y la probabilidad asignada a cada punto es l/n = 1/270725. Para hallar el numerador nA! consideremos lo siguiente: La condi-cin, al menos tres espadas, significa tres o cuatro espadas. El nmero de grupos de 4 cartas que contienen exactamente 3 espa-das es (1:) x 39 = 11154; el primer factor es el nmero de com-binaciones de las 13 espadas de 3 en 3, y el segundo, el nmero de maneras en que puede elegirse una carta de los otros tres palos; se toma el producto, de acuerdo con el principio b). El nmero de combinaciones que pueden obtenerse con las 13 espadas de 4 en 4 es (~) :=0715. Por el principio a), el nmero de grupos que poseen el atributo en cuestin es 11154+715=11869=nA. La probabili-dad pedida es

    P(A) = nA/n = 11 869/270725, Tambin cabe hallar el numerador por el siguiente mtodo: El

    nmero de combinaciones con las 13 espadas de 3 en 3 es ( 1: ) = 286. La cuarta carta puede ocurrir que sea o no espada, y si las 3 prime-ras son espadas, habr que elegir esa cuarta carta a partir del grupo de las 49 restantes. Por consiguiente, el nmero de grupos requerido ser 49 x 286= 14014. Este razonamiento no es vlido, porque cuenta ms de una vez los grupos de 4 espadas. Una combinacin espec-fica de espadas es as-rey-reina, y extrayendo la sota de espadas de entre las restantes 49, tenemos la combinacin as-rey-reina-sota. Pero contamos a la vez la combinacin que considera as-reina-sota, extra-yendo el rey de las 49 cartas restantes. Es evidente que se han con-tado 4 veces los grupos de 4 espadas. Puede obtenerse el resultado cOrrecto restando 3 veces el nmero de grupos con 4 espadas. El resultado es

    14 014 - 3 ( ~ ) = 11 869 igual que anteriormente.

  • SECo 2_-.-..:9)=-----__ FORMULA DE STIRLING 29

    Ejemplo 2-18.-Se echan 7 bolas en 4 cajas numeradas, de modo que cada bola tenga que caer en una caja y todas tengan igual pro-babilidad de caer en cualquiera de las 4 cajas. Cul es la probabili-dad de que en la primera caja caigan precisamente 2 bolas?

    Puesto que la primera bola puede caer en cualquiera de las 4 ca-jas, la segunda lo mismo, etc., el total de resultados posibles es, por el principio b), 47 Para enumerar cuntos resultados habr con el atributo deseado, empezamos por dividir las 7 bolas en dos grupos, uno de los cuales contenga 2 bolas, y el otro, 5 bolas. Esto puede hacerse de (~) maneras. Ahora pondremos el .grupo de dos en la primera caja y distribuiremos las otras cinco entre las 3 cajas res-tantes. Esto puede hacerse, por el mismo razonamiento anterior, de 35 maneras. El nmero de resultados favorables es, por tanto, (~) 35, Y la probabilidad deseada es

    (7) 35 P(A)=~=_2_=~==O 3115 n 47 47 '

    (El smbolo == se emplea para denotar igualdad aproximada.) 29. Frmula de Stirling.-Al hallar valores numricos de las

    probabilidades nos encontramos con la necesidad de evaluar largas expresiones factoriales que son de clculo laborioso por multiplica-cin directa. Si se dispone de una mquina de sumar y no hay un gran nmero de factores en la expresin, suele resultar conveniente emplear logaritmos. No obstante, si los factores son numerosos, hasta este mtodo resulta pesado, y puede ahorrarse mucho trabajo utili-zando la frmula de Stirling, que da un valor aproximado de n!. Este es

    (1)

    en donde e es la base de los logaritmos neperianos 2,71828 ... Una aproximacin mucho ~ejor puede obtenerse sustituyendo el factor e-n por e-[n-(1/Un)], pero este refinamiento se emplea solo en raras ocasiones. Para indicar la aproximacin obtenida por medio de esta frmula, podemos calcular lO!, cuyo valor exacto es 3 628 800. La frmula (1), utilizando logaritmos con cinco cifras decimales, da

    lO! == 3 599000

    mientras que la frmula ms refinada da lO! == 3 629 ()()()

  • 30 PROBABILIDAD [CAP. 2

    El error en (1) para n = 10 es algo menor del 1 %; el porcentaje de error disminuye al aumentar n.

    2-10. Notaciones de sumas y productos.-Una suma de tr-minos tales como n3 + n4 + ns + n6 + n7 suele designarse con el smbolo

    7

    : ni' es la letra griega mayscula sigma, que en estas ocasiones i=3 suele denominarse signo sumatorio, y la letra i recibe el nombre de ndice sumatorio. El trmino que sigue al smbolo se denomina sumando. La i = 3 debajo de la indica que el primer trmino de la suma se obtiene haciendo i = 3 en el sumando. El 7 encima de in-di ca que el trmino final de la suma se obtiene haciendo i = 7. Los otros trminos de la suma se obtienen dando a i los valores enteros comprendidos entre los lmites 3 y 7. As tenemos

    5 ( - l)i -2jx2i = 2x" - 3x6 + 4x8 - 5x10 j=2

    Anloga notacin se obtiene para un producto utilizando la letra griega mayscula ll. En este caso los trminos que resultan de sustituir valores enteros en lugar del ndice se multiplican en vez de sumarse. As tenemos

    Utilizando esta notacin, la expresin (2-8-3) antes deducida pue-de escribirse

    2-11. Los teoremas binomial y polinomial l.-El desarrollo de la expresin binomial (x+ y)n puede verse en los libros de lgebra elemental, y suele obtenerse por induccin la demostracin de su desarrollo. Utilizaremos aqu para obtener el desarrollo binomial un mtodo combinatorio que se generaliza fcilmente al caso polinomial. Si escribimos la expresin binomial en la forma (x + y){x + y) ... (x + y), con n factores, el problema de hallar el coeficiente de uno de los trminos, p. ej., xn-aya, se reduce al de hallar el nmero de mane-ras de dividir n factores en dos grupos. El primer trmino del des-

    1 Est muy generalizado el uso improcedente de la palabra multinomial por polinomial. (N. del T.)

  • SECo 2-11] LOS TEOREMAS BINOMIAL Y POLINOMIAL 31

    arrollo es X"', que se obtiene eligiendo la x en cada uno de los fac-tores. El trmino siguiente es un cierto coeficiente multiplicado por rz-ly. Este trmino se obtiene eligiendo la x en n - 1 de los factores y la y en el restan te. El factor del cual se toma y puede elegirse entre n, y, por tanto, el coeficiente de xn-ly es n. En ge-neral, para obtener el coeficiente de xn-aya tenemos que contar el nmero de maneras de dividir los n factores en dos grupos, de modo que uno de ellos contenga a factores y el otro n-a; y se elige de cada uno de los factores del primer grupo y x de cada uno de los factore~ del segundo grupo. El nmero de maneras de dividir los n factores en dichos dos grupos es (:), que es el coeficiente deseado. El desarrollo binomial es, por tanto,

    (x+y)n=xn+nxn- 1y+ (~)xn-2y2+ ... +y" (1)

    El teorema polinomial se deduce inmediatamente; desarrollan-do la expresin

    se obtienen trminos de la forma

    en donde e representa un cierto coeficiente y los exponentes sa-tisfacen la relacin

    Se trata ahora de determinar e: los trminos de la forma dada se presentan cuando se elige Xl en nl de los n factores, X2 en n2 de los restantes factores, y as sucesivamente. El nmero de maneras de obtener dicho trmino es- igual al de formas de di-vidir los n factores en k grupos que .contengan n, n2, ... , nk facto-res. Esta es la expresin (2-8-3). Por tanto, el trmino general del desarrollo polinomial es

    ni ----- X~l X~2 ... ~I: o nl! n2! ... nk!

  • 32 l' ltOBABILlDAD [CAP. 2

    y podemos escribir

    (2)

    Hemos indicado solamente que la suma se extiende a los ndi-ces nh nz, ... , nk. Cada ndice toma valores desde O hasta n, pero no pueden ser sumados independientemente con estos valores, por-

    k

    que debe verificarse ~ ni=n. La suma se extiende a todos los i=1

    conjuntos de valores de nh n2, ... , nk tales que su suma sea n y ta-les que ni sea un entero que puede tomar cualquier valor desde O hasta n, ambos inclusive. La suma es de desarrollo muy laborioso cuando n es grande. Como aclaracin, consideraremos un caso sencillo:

    (XI + Xz+ XJ)4= ;'1' n2 , n3

    El conjunto de valores (n., n21 nJ) que satisfacen a nI + n2 + n3 = =4 es

    (4, 0, O), (3, 1, O), (3, 0, 1), (2, 2, O), (2, 1, 1), (2, O, 2), (1, 3, O), (l, 2, 1), (1, 1, 2), (1, O, 3), (0, 4, O), (O, 3, 1), (0, 2, 2), (O, 1, 3), (0, O, 4);

    por tanto, la suma tiene 15 trminos, los primeros de los cuales son

    4' 4' 4' 4' 4' (XI + Xz + XJ4 = -'- x4 + -'- xJxz + -'-' X3X3 + --'- X21X2 + ... + -'- x4 4! l 3! l 3! 1 2!2! 2 41 3

    =x1+4x~X2+4~X3+ 6xfxi+ ... +~ Un conjunto de nmeros como (3, 1, O) se denomina particin de

    4 en 3 partes; (2, 6) es una particin de 8 en 2 partes. Los 15 tros de nmeros antes enunciados forman el conjunto completo de parti-ciones ordenadas de cuatro en tres partes. Estas particiones se lla-man ordenadas porque se consideran distintas dos particiones que consten de las mismas partes si difieren en el orden.

    Si no se especifica que las particiones deben ordenarse, se supone que son sin ordenar; as, las particiones de cuatro en tres partes son simplemente (4, O, O) (3, 1, O), (2, 2, O), (2, 1, 1). La suma poli-nomial (2) puede describirse del siguiente modo en funcin de parti-ciones: se extiende la suma a todas las particiones ordenadas de n en k partes, siendo las partes (n}, n2, ... , n,,).

  • SECo 2-12] FUNCIONES GENERATRICES COMBINATORIAS 33

    2-12. Funciones generatrices combinatorias.-Las enumera-ciones de resultados posibles y de resultados que presentan un cier-to atributo pueden llegar a constituir un problema de gran compli-cacin. En realidad, es sencillo enunciar problemas en los cuales la enumeracin resulta prcticamente imposible. Un recurso muy efi-caz en la resolucin de problemas de enumeracin consiste en el uso de las llamadas funciones generatrices. Las funciones generatri-ces combinatorias constituyen en s mismas una seccin especial de las matemticas, y nos limitaremos a considerar un pequeo nmero de casos sencillos. Se trata simplemente de indicar la naturaleza de este mtodo de anlisis.

    Estudiemos de nuevo el ejemplo 2-18, en el que se echaban 7 bolas en 4 cajas, y consideremos la funcin

    El coeficiente de un trmino como el xix1x3 en el desarrollo de este polinomio viene dado por 7! /2! 4! 1 ! O! [frmula (2-8-3)}, que es precisamente el nmero de maneras de dividir 7 objetos en 4 gru-pos, de modo que el primero contenga 2 objetos; el segundo, 4, y as sucesivamente. De este modo, cualquier trmino del desarrollo pol