ESTADISTICA INFERENCIAL

download ESTADISTICA INFERENCIAL

of 273

Transcript of ESTADISTICA INFERENCIAL

E S T A D S T I C A HUGO GMEZ GIRALDO Mayo/2009 i TABLA DE CONTENIDO CAPTULO 1: CONCEPTOS GENERALES ........................................................................................... 1 1.1 Breve resea histrica .................................................................................................................. 1 1.2 Significado de la estadstica ......................................................................................................... 2 1.3 Pasos que sigue una investigacin estadstica. ........................................................................... 4 1.3.1 Planeacin de la investigacin. ............................................................................................. 4 1.3.2 Recoleccion o recopilacin de datos. .................................................................................... 6 1.3.3 Organizacin de los datos. .................................................................................................... 6 1.3.5 Anlisis .................................................................................................................................. 7 1.3.6 Interpretaciones y conclusiones ............................................................................................ 7 1.4Cuadros estadsticos ................................................................................................................... 7 1.4.1 Normas para cuadros estadsticos........................................................................................ 8 1.5Grficos estadsticos.................................................................................................................. 10 1.5.1 Normas sobre grficos estadsticos .................................................................................... 10 1.5.2 Tipos de grficos estadsticos ............................................................................................. 11 1.5.3 Ejemplos de grficos estadsticos ....................................................................................... 12 Ejercicios resueltos ........................................................................................................................... 18 Ejercicios propuestos........................................................................................................................ 18 CAPTULO 2: ANLISIS ESTADSTICO.............................................................................................. 20 2.1 Tablas de frecuencia................................................................................................................... 20 2.2 Anlisis estadstico para datos cualitativos ................................................................................ 21 2.2.1 Razn .................................................................................................................................. 21 2.2.3 Proporcin ........................................................................................................................... 22 2.2.4 Tasa..................................................................................................................................... 22 Ejercicios resueltos para datos cualitativos...................................................................................... 24 Ejercicios propuestos para datos cualitativos................................................................................... 26 2.3 Anlisis estadstico para datos cuantitativos .............................................................................. 26 2.3.1 Construccin de una tabla de frecuencias cuantitativa....................................................... 28 2.3.2 Grficos estadsticos para una distribucin de frecuencias cuantitativa............................. 31 2.3.3 Promedios o medidas de tendencia central ........................................................................ 33 2.3.4 Medidas de dispersin......................................................................................................... 46 2.3.5 Medidas de asimetra .......................................................................................................... 55 2.3.6 Medidas de curtosis o apuntamiento................................................................................... 57 Ejercicios resueltos para datos cuantitativos.................................................................................... 59 Ejercicios propuestos para datos cuantitativos................................................................................. 64 CAPTULO 3: TCNICAS DE CONTEO............................................................................................... 70 3.1 Principio de la multiplicacin en el conteo.................................................................................. 70 3.2 Diagrama de rbol ...................................................................................................................... 71 3.3 Principio de la adicin en el conteo ............................................................................................ 72 3.4 Notacin factorial ........................................................................................................................ 72 3.5 Permutaciones ............................................................................................................................ 73 3.5.1 Permutaciones de n objetos tomados r a la vez............................................................. 74 3.5.2 Permutaciones de n objetos tomados todos a la vez.......................................................... 75 3.6 Combinaciones ........................................................................................................................... 75 3.6.1 Combinaciones de n objetos tomados parte a la vez.......................................................... 75 3.6.2 Combinaciones de n objetos tomados todos a la vez......................................................... 77 3.7 Permutaciones con repeticin..................................................................................................... 77 3.8 Pruebas ordenadas..................................................................................................................... 79 3.8.1 Pruebas ordenadas con sustitucin .................................................................................... 79 3.8.2 Pruebas ordenadas sin sustitucin...................................................................................... 79 3.9 Particiones ordenadas ................................................................................................................ 80 Ejercicios resueltos de anlisis combinatorio ................................................................................... 81 Ejercicios propuestos de anlisis combinatorio................................................................................ 86 ii CAPTULO 4: PROBABILIDAD............................................................................................................. 88 4.1 Diversos orgenes del concepto de probabilidad........................................................................ 89 4.1.1 Concepto clsico ................................................................................................................. 89 4.1.2 Concepto de la frecuencia relativa ...................................................................................... 89 4.1.3 Concepto subjetivo.............................................................................................................. 90 4.2 Algunas definiciones bsicas...................................................................................................... 90 4.3 Axiomas de probabilidad............................................................................................................. 94 4.4 Teoremas de probabilidad .......................................................................................................... 95 4.5 Espacios finitos de probabilidad ................................................................................................. 96 4.6 Espacios finitos equiprobables ................................................................................................... 97 4.7 Espacios infinitos no contables................................................................................................... 98 4.8 Eventos independientes.............................................................................................................. 99 4.9 Eventos condicionales o dependientes .................................................................................... 100 4.10 Principio de la multiplicacin en la probabilidad condicional .................................................. 101 4.11 Procesos estocsticos finitos.................................................................................................. 102 4.12 Ley de probabilidad total ......................................................................................................... 103 4.13 Ley de probabilidad de bayes................................................................................................. 103 Ejercicios resueltos de probabilidad ............................................................................................... 104 Ejercicios propuestos de probabilidad ............................................................................................ 110 CAPTULO 5: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD..................... 114 5.1 Variable aleatoria...................................................................................................................... 114 5.1.1 Espacio muestral discreto. ................................................................................................ 115 5.1.2 Espacio muestral continuo ................................................................................................ 115 5.1.3 Variable aleatoria discreta................................................................................................. 116 5.1.4 Variable aleatoria continua................................................................................................ 116 5.2 Distribuciones de probabilidad.................................................................................................. 116 5.2.1 Distribucin discreta de probabilidad................................................................................. 116 5.2.2 Distribucin continua de probabilidad................................................................................ 117 5.2.3 Media o valor esperado de una variable aleatoria discreta............................................... 118 5.2.4 Varianza para una variable aleatoria discreta................................................................... 119 5.2.5 Media o valor esperado para una variable aleatoria continua .......................................... 120 5.2.6 Varianza para una variable aleatoria continua.................................................................. 121 5.3 Algunas distribuciones discretas de probabilidad..................................................................... 121 5.3.1 Distribucin binomial ......................................................................................................... 121 5.3.2 Distribucin de poisson ..................................................................................................... 125 5.3.3 Aproximacin de probabilidades binomiales a travs de la frmula de poisson............... 127 5.3.4 Distribucin de probabilidad hipergeomtrica ................................................................... 128 5.3.5 Aproximacin de la distribucin hipergeomtrica a travs de la distribucin binomial ..... 129 5.3.6 Distribucin de probabilidad multinomial ........................................................................... 130 5.4 Algunas distribuciones continuas de probabilidad.................................................................... 131 5.4.1 Distribucin exponencial negativa..................................................................................... 131 5.4.2 Distribucin de probabilidad normal .................................................................................. 133 Ejercicios resueltos de distribuciones de probabilidad ................................................................... 140 Ejercicios propuestos de distribucin de probabilidad.................................................................... 150 CAPTULO 6: DISTRIBUCIONESMUESTRALES............................................................................ 155 6.1 Algunos conceptos bsicos ...................................................................................................... 156 6.2 Propiedades de un estimador ................................................................................................... 157 6.3 Distribucin en el muestreo ...................................................................................................... 158 6.3.1 Distribucin en el muestreo de la media ........................................................................... 158 6.3.2 Distribucin en el muestreo de la diferencia de medias en poblaciones normales independientes. .......................................................................................................................... 166 6.3.3 Ley t-student y distribucin en el muestreo de la diferencia de medias............................ 169 6.3.4 Distribucin enel muestreo de la proporcin................................................................... 170 6.3.5 Distribucin en el muestreo de la diferencia de proporciones .......................................... 172 6.3.6 Distribucin ji-cuadrada(2_ ) .......................................................................................... 175 6.3.7 Distribucin del cociente entre dos varianzas. .................................................................. 177 iii Ejercicios resueltos de distribuciones muestrales .......................................................................... 178 Ejercicios propuestosdedistribuciones muestrales..................................................................... 188 CAPTULO 7: INTERVALOS DE CONFIANZA................................................................................... 191 7.1 Estimacinde punto eintervalos de confianza ...................................................................... 191 7.1.1 Intervalode confianza para la media, oconocida ........................................................ 192 7.1.2 Intervalode confianza para la media, odesconocida y tamao de muestra pequea 195 7.1.3 Determinacin del tamao de la muestra para estimar la media...................................... 196 7.1.4 Intervalos de confianza para la diferencia entre las medias de dos distribuciones normales con desviaciones estndar conocidas........................................................................................ 198 7.1.5 Intervalos de confianza para la diferencia entre las medias de dos distribuciones normales con desviaciones estndar desconocidas y tamaos de muestras pequeas .......................... 199 7.1.6 Intervalo de confianza para la proporcin ......................................................................... 200 7.1.7 Determinacin del tamao de la muestra para estimar la proporcin............................... 201 7.1.8 Intervalo de confianza para la diferencia entre las proporciones de dos poblaciones...... 202 7.1.9 Intervalo de confianza para varianza................................................................................. 203 Ejercicios resueltos de intervalos de confianza.............................................................................. 205 Ejercicios propuestos de intervalos de confianza........................................................................... 212 CAPTULO 8: PRUEBAS DE HIPTESIS.......................................................................................... 214 8.1 Conceptos bsicos sobre hiptesis estadsticas ...................................................................... 214 8.1.1 Contrastes de hiptesis y significacin ............................................................................. 214 8.1.2 Hiptesisalternativaehiptesis nula ............................................................................. 214 8.1.3 Errores tipo iyerrores tipo ii............................................................................................ 215 8.1.4 Nivel de significacin......................................................................................................... 216 8.1.5 Pruebas bilaterales y unilaterales...................................................................................... 216 8.2 Pasos que sigue una prueba de hiptesis estadstica ............................................................. 218 8.3 Pruebas de hiptesis para la media ......................................................................................... 219 8.4 Pruebas de hiptesis para la diferencia de medias.................................................................. 222 8.5 Pruebas de hiptesis para la proporcin .................................................................................. 226 8.6 Pruebas de hiptesis para la diferencia de proporciones......................................................... 227 8.7 Prueba de hiptesis para una varianza .................................................................................... 228 8.8 Prueba de hiptesis para la razn de dos varianzas................................................................ 229 Ejercicios resueltos sobre hiptesis estadsticas............................................................................ 232 Ejercicios propuestos sobre pruebas de hiptesis ......................................................................... 239 TABLAS..................................................................................................................................... 241 BIBLIOGRAFIA.................................................................................................................................... 267 PREFACIO Estapublicacineselfrutodemilargaexperienciacomoprofesordeestadsticaenlas aulasuniversitariasyrecogeporunaparte,unaseriedeapuntesanterioresque constituyeron herramienta de trabajo en el ejercicio de la ctedra y por otra parte, incluye un buen nmero de ocurrencias originadas como consecuencia de la diaria discusin en clase y que en una u en otra forma contribuyen a una mayor claridad en los diferentes temas aqu tratados. Laintencindestapublicacinesmejorarrespectoalasanteriores,enaspectostales como:msprofundizacin,mayorclaridad,msordenymejorpresentacindelos diferentes temas, ampliacin del nmero de ejemplos ilustrativos y de ejercicios resueltos y propuestos,ascomomayorcoberturaenlaasignatura,incluyendotemasdegran importancia como los intervalos de confianza y las pruebas de hiptesis. Otropropsitodelapresentepublicacin,esservirdetextoguaparaelestudiantey coherentes con sta intencin a lo largo de los ocho captulos desarrollados, se busca en la mayoradeloscasosaclararaquellasreflexionesmatemticademayorintersperode menorcomplejidad,complementandoentodomomentolasexplicacionesdelosdiferentes conceptosconejemplosilustrativosyunabuenacantidaddeejerciciosresueltosyde ejercicios propuestos con sus respectivas respuestas. A lo largo de la presente publicacin continuamenteseremitealestudiantearepasaryrevisarlostemastratadosenpginas anteriores,buscandoconestoquelaconceptualizacinseaunapremisaparaelexitoso aprendizaje de una importante asignatura como la estadstica. A lo largo de mi ejercicio docente, pude percibir la tendenciams o menos generalizada de los estudiantes de estadstica a pasar por alto la conceptualizacin inherente a cada uno de lostemasdesarrollados.Esporello,queentodoslostemasincluidos eneltexto, sepuso especialnfasisenloquetienequeverconelanlisisylainterpretacin,puesenfinde cuentas stos son sin lugar a dudas los pasos ms importantes de toda investigacin y si lo anterior se cumple cabalmente, la solucin de cualquier problema ser menos compleja y elniveldeocurrenciaenlaaplicabilidaddelasdiferentestcnicasenlavidaprofesional, ser consecuentemente muy alto. Por ltimo, espero que con sta publicacin sea cada vez mayor el nmero de estudiantes quecomprendanlosimportantestemasaqutratados,conlocualmesentir suficientemente recompensado. HUGO GMEZ GIRALDO Manizales, mayo/2009 1 CAPTULO 1: CONCEPTOS GENERALES 1.1 BREVE RESEA HISTRICA Lo que seguramente impuls al hombre en un momento de su desarrollo a tomar en cuenta los datos con sentido y propsitos estadsticos, quizs lo comprendamos, si pensamos lo difcil que es imaginarnos un organismosocialcualquieraqueseasupoca,sinregistrarenundocumentoescritoaquelloshechos queaparecencomoactosesencialesdelavida.Enestascondiciones,alsituarnosenunapoca cualquieradeldesarrollodelaestadstica,podemospensarquestaseconvirtienunaaritmtica estatal,paraauxiliaralestadoensuempeodeconocerlariqueza,elnmerodesusgobernadosy cualquier otra informacin relativa a su regin y su poblacin. A medida que se va definiendo el estado, lanecesidaddelaestadsticaseacentamsyms,comoalgoorgnico,yesprecisamentedela palabra estado, de dondeparece derivarse el nombre de sta disciplina. Existen evidencias del uso de la estadstica a un nivel rudimentario por organizaciones sociales antiguas y se volvera muy extenso relacionar la gran cantidad de hechos y testimonios que desde la ms remota antigedadsehanregistradocomoinformacinestadstica.Asporejemplo,podramosdestacar,queen los monumentos Egipcios hay testimonios de que los movimientos de poblaciones eran seguidos por medio de censos y en este sentido la Biblia cita que Moiss hizo un censo de los Israelitas en el desierto. EnChina,ConfucionarracmounreyllamadoYao,unos3000aosantesdeCristo,hizolevantarun recuento agrcola, industrial y comercial del pas. TambinentrelosmsantiguospobladoresdeAmrica,losChichimecas,quellegaronalvallede Mxico, practicaronuncensomediantelaspiedras quetodoslospobladoresfueron depositando enun lugarllamadoNepohualcooContadero.LosAztecasqueformaronunestadoguerreroycomercial, hacanpermanentementeminuciosasestadsticasqueservandebaseasuorganizacinyasus tributos, segn lo demuestra el libro de los tributos de Moctezuma. En la otra gran civilizacin del nuevo mundo,ladelantiguoPerqueeraunestadocolectivistaconeconomadirigida,trabajoobligatorioy equilibrio entre los habitantes y la produccin, la razn de ser de ese orden social era los nmeros,es decir la estadstica. CuandoenEuropaflorecilaculturaGriega,debehaberseproducidoungranprogresoestadsticoen relacinconelrepartodelosterrenos,elserviciomilitar,laenseanzaytodoloreferente,ensumaa complejas actividades sociales. En Roma la organizacin del estado se perfecciona en todos los rdenes yelloinfluyeenlaestadstica,cuyabasequedaestablecidaenelCENSUS,queeraunadoble investigacin practicada regularmente sobre los ciudadanos y sus bienes.La declaracin de los nacimientos se establece como obligacin legal en tiempo de los Antoninos y haba quehacerlaeneltemplodeSaturnoenunlapsonomayorde30das.Lasoperacionescensalesse practicaban en todos los dominios de Roma, entre ellos Siria. La civilizacin Arabe fue la heredera de las prcticasestadsticas,queposteriormenteprosperaronbajoCarlomagno,utilizadasconfines administrativos y financieros. Un nuevo concepto sobre la estadstica empieza a precisarse a mediados del siglo XVII, segn el cual le corresponde una funcin descriptiva del estado. Surgen comoinnovadores el Alemn Horman Conring, conocidocomoelmaestro,elaboradordeunsistemadelcualarrancalaorientacinqueseconoci comoestadsticauniversitaria,haciendoevolucionarlaestadsticamediantesusctedrasdefilosofa, medicina y poltica, relacionadas con la investigacin de los hechos sociales. EnInglaterra,losaritmticospolticosorientabanlaestadstica,nohacialadescripcinsinohaciala investigacin.Grauntsientalasbasesdelaestadsticainvestigadora,realizandointeresantes 2 observacionesquedioaconoceralaSociedadRealdeLondres,sobrelamortalidadenstaciudad, segn las estaciones, las profesiones, etc. as como muchos otros fenmenos sociales. El clculo de las probabilidades, nace con Blas Pascal y Pedro de Fermat al tratar de dar soluciones a problemas relacionados con los juegos de azar. La estadstica moderna se debe al sabioAdolfo Quetelet (1796 1874), quien le dioa la estadstica un doblesentidotericoyprctico.Fueelorganizadordelaestadsticadesupasyeliniciadordelos congresos internacionales de la estadstica. Quetelet y Cournot fueron los grandes representantes de la tendencia enciclopdica- matemtica y la despojaron de los defectos que presentaba. Quetelet por una parte bas la investigacin numrica en el clculo de las probabilidades, mientras que Agustin Cournot, matemtico y filsofo, se vali de la estadstica en el campo de la economa, auxiliado por la matemtica. Entre los contemporneos de Quetelet y Gauss, se destacan Florence Nightingale y Francis Galton. Este ltimoy Darwin se dedicaron al estudio de la herencia, aplicando mtodos estadsticos. Quizs el aporte msimportantedeGaltonserelacionaconeldesarrollodemtodosbsicossobreregresiny correlacin. Los investigadores y los tratadistas en el rea de la estadstica siguen siendo ms y ms numerosos y ha habidoabundanteproduccindeobrassobremetodologaestadstica,ascomomonografas metodolgicas y en cuanto a las aplicaciones, se siguen produciendo otras en creciente nmero. Porltimo,comoresultadodetalevolucin,sellegaaunacompletaseparacinentrelaestadstica metodolgicaylaaplicadaysobrestaltimasedesarrollanimportantesdisciplinascomola antropologa, la biometra, la econometra y la psicometra entre otras. Hoy en da podemos decir que la estadstica, hace presencia en la mayora de las reas del conocimiento, constituyndose en herramienta vital para la comprensin y desarrollo de cada una de las mismas. 1.2 SIGNIFICADO DE LA ESTADSTICA Eltrminoestadsticaesampliamenteescuchadoypronunciadodiariamentedesdediversossectores activosdelasociedad;sinembargoexisteunagrandiferenciaentreelsentidodeltrmino,cuandose utiliza en el lenguaje corriente y lo que realmente significa la estadstica como ciencia. Laestadsticaesgeneralmenteconsideradacomounacoleccindehechosnumricosexpresadosen trminos de una relacin resumida y que han sido recopilados a travs de varias observaciones o a partir de otros datos numricos. Es decir, que la estadstica es considerada como un conjunto de mtodos para tratardatosnumricos,locualimplicaquelaestadsticaesuninstrumentoparalarecoleccin, organizacin, y anlisis de datos numricos. No se debe confundir a la informacin estadstica con la estadstica. Aspues que debemos llamar a la informacindatosestadsticosyalosmtodoslosdebemosllamarmtodosestadsticos.Cuandouna persona tiene pocos hechos numricos puede utilizar la informacin numrica sin perder mucho tiempo en analizar el hecho. Ejemplo: Juan compra 2 novillospara elsacrificio cuyos pesos fueron 456 y 478 kilosrespectivamente,estehechoimplicaraunmnimoanlisis.Noobstante,siunapersonatieneun granvolumendehechosnumricos,puedeencontrarquelainformacinindividualesdepocovalor, puesto que no puede interpretarla al mismo tiempo. Este gran volumen de hechos numricos, origina la necesidad de utilizar mtodos estadsticos, que le permitan organizar, presentar, analizar e interpretar la informacin efectivamente. Este sera el caso de Juan, si procede a la compra de un lote de 200 novillos para su correspondiente comercializacin. Es difcil proponer una definicin precisa del concepto de estadstica, debido a lo extenso y variado del campocubierto por sta. Sin embargo, podramos simplificar diciendo que la estadstica es la ciencia queutilizaunconjuntodemtodos,paraelestudionumricodelascolectividades,siemprey cuando,estaspuedansercontadas,clasificadas,ordenadasyanalizadasdeacuerdoaciertas caractersticascomunes.Todoslosestadsticosestndeacuerdoenclasificarlaestadsticaendos materiasquecumplenfuncionesdiferentesperocomplementarias.EllassonlaESTADSTICA DESCRIPTIVA y la ESTADSTICA INFERENCIAL. 3 Laestadsticadescriptiva,tratadelresumenyladescripcindelosdatosenformatabular,grficao numrica.Elanlisisquesehaceatravsdetasas,proporciones,coeficientes,promedios,etc.se limitaalosdatoscoleccionadosorecolectadosydeningunamaneraserealizaninferenciaso conclusionesrespectoalatotalidaddelosdatosdedondeprovienedicharecoleccin.Porotraparte, aunqueladescripcindelosdatosrecolectadosatravsdelaestadsticadescriptivaesavecesens misma elfinque seproponelaestadstica;enlamayoradelos anlisisestadsticos,soloestamosal comienzodelatareaunavezquehemosterminadolosaspectosdescriptivos,puestoqueelobjetivo ltimo de la estadstica, es sacar conclusiones y generalizacionessobre la totalidad de la poblacin y no solo parte de ella. Asporejemplo,siquieroconocerelnmerodepiezasdefectuosasqueresultarondeungranlotede produccin, podra resultar poco prctico observar todo el grupo, en especial si ste es muy grande o si dichaobservacinimplicaladestruccindelapiezacuyocostoesrelativamentealto.Puedeserms prcticoentrminosdeeconomadetiempoydinerorecurriraunasgeneralizacionesatravsdeuna muestra.Dichasgeneralizacionescorrespondenalaestadsticainferencial,queesaquellaqueen trminosdeprobabilidadesyeldiseodeexperimentosapartirdeunamuestraosubconjuntodela poblacin,logrageneralizacionesyconclusionesacerca deunacaractersticadelapoblacinala cual pertenece esa muestra. Cuandosehaceinferenciaestadstica,debedecidirsecuidadosamente,hastaqupuntopueden hacerse generalizaciones a partir de un subconjunto de datos disponibles. Es decir, debe considerarse si talesgeneralizacionessoncompletamenterazonablesojustificables.Enrealidad,algunosdelosms importantesproblemasdelainferenciaestadstica,serefierenalaevaluacindelosriesgosylas consecuencias que puede tener el hecho de hacer generalizaciones a travs de una muestra de datos. Estoincluye,laasignacindeunvalordelaprobabilidadalaconfiabilidadquemerecentales estimaciones o generalizaciones. Una medida estadstica obtenida mediante el estudio de una muestra, se denomina estadstico o estimador, mientras que si dicho clculo es obtenido a travs del estudio delatotalidaddelapoblacin,lamedidasedenominaparmetro.Laestimacindelparmetroa travs del estimador puede ser de tres tipos a saber: Estimacin de punto. El valor del estimador, es aquel que se asume como la medida representativa de la poblacin.Ejemplo:Juandeseaconocerelpesomediodelacompradeunlotede200novillos (poblacin), para lo cual toma aleatoriamente 15 novillos (muestra). Encuentra que el peso medio de la muestra es de 451 kilos (estimador). Generaliza oinfiere, que el peso medio de los 200 novillos es de exactamente 451 kilos (estimacin del parmetro). En ste caso se asume que el valor del parmetro es exactamente igual al valor del estimador (451). Esta es una estimacin de punto.Estimacin de intervalo. Se asume un margen de error por encima y por debajo del estimador como una medidaadecuadaparaestimarelparmetropoblacional.Conrelacinalejemploanterior,Juan generaliza que el valor del estimador incluido un margen de error de 10 kilos por encima o por debajo de ste, es el verdadero peso promedio de los 200 novillos. En consecuencia se generaliza o infiere que el peso promedio(parmetro estimado) de los 200 novillos flucta entre 441 y 461 kilos. Intervalodeconfianza.Esunaestimacindeintervalo,asociadaaunaprobabilidadquerepresentael gradodeconfiabilidadenlageneralizacin.Conrelacinalejemploanterior,Juangeneralizaoinfiere conunaconfianzadel95%dequeelpesopromediodelos200novillosfluctaentre441y461kilos. Probabilidad(441 ) 461 s s promedio peso = 0.95. Con relacin al ejemplo anterior vale la pena destacar, que el valor del margen de error, o sea 10 kilos, as como el valor de probabilidad o confiabilidad en la estimacin o sea 95%, son valores subjetivos de acuerdoalasnecesidadesdelinteresado.Enelcasodequeelinteresadoenlaestimacinest dispuesto a aceptar un mayor margen de error, se requiere un tamao de muestra menor. Igualmente, si el interesado est dispuesto a aceptar un menor grado de confiabilidad en la estimacin, se requiere un tamao de muestra menor. Lo anterior quiere decir que entre mayor precisin y confiabilidad se requiera en la estimacin, mayor debe ser el tamao de la muestra, lo cual se evidencia al utilizar la frmula para el clculo del tamao de la muestra necesaria, que se ver en el captulo relacionado con distribuciones muestrales.

4 1.3 PASOS QUE SIGUE UNA INVESTIGACIN ESTADSTICA. Comoyasedijoenlapgina2,laestadsticaeslacienciaqueusaunconjuntodemtodosparael estudionumricodelascolectividades,siempreycuandostaspuedansercontadas,ordenadas, clasificadas y analizadas de acuerdo a ciertas caractersticas comunes. Coherentes con sta definicin, se puede decir que los pasos que sigue una investigacin estadstica son los siguientes:

- Planeacin de la investigacin. - Recoleccin o recopilacin de los datos. - Organizacin de los datos. - Presentacin de los datos. - Anlisis de los datos presentados - Conclusiones e interpretaciones. 1.3.1 PLANEACIN DE LA INVESTIGACIN. Es este el primer paso que sigue una investigacin estadstica. El xito de una investigacin estadstica dependeengranpartedelaplaneacinquedeellasehaga.Algunasveces,solamenteseprevuna etapa determinada y por falta de recursos econmicos o humanos es necesario archivarla. Otras veces se cometen errores en el transcurso de la investigacin, los cuales pudieron evitarse con con una buena planeacinmedianteunbuendiseodelproyecto,unametodologabiendefinida,utilizacinadecuada de trminos,y formularios bien ajustados a las necesidades de la investigacin. Ennuestromedio,seobservaentreotrasfallasdeplaneacin:lafaltadedefinicindelosobjetivoso demasiadogenerales,metodologaequivocada,iniciacindeestudiossinelpresupuestoadecuado, ausenciadeinstruccionesclarasparalosprocesosderecoleccin,crticadelainformacin,etc.Toda recoleccin de datos estadsticos requiere de un plan que detalle los aspectos que la investigacin quiere abarcar, que fije el procedimiento que se va a seguir y que resuelva las posibles dificultades que puedan presentarse a lo largo de la investigacin. Laplaneacindeunainvestigacinestadsticaparaqueseaexitosasedebebasarfundamentalmente en los siguientes aspectos: a)Planteamiento del problema. Esto implica: i.Definirlanaturalezadelproblema.Estoes,explicarclaramenteQUESloquesevaaestudiar, cuales son los aspectos generales y especficos que se quieren conocer. Resolviendo ste interrogante, nos llevar a pensar: en el tipo de preguntas que deben formularse, dificultades o ventajas que ofrece la investigacin,dineronecesarioparadesarrollarlamisma,tiemporequeridoyeltipoderecursos humanos necesario, as como la capacitacin previa que stos necesitan. ii) Justificar la investigacin. Es decir, POR QUE se considera necesario efectuar el estudio. Reflexionar sobrestehechoprobablementenospermitirdecidirenasuntostalescomo:fechaenlaquedebe arrancar la investigacin y fecha de terminacin de la misma, qu aspectosson necesarios investigar y cuales aspectos aparentemente importantes pueden ser omitidos, etc. iii)Determinar los objetivos generales y especficos. Es decir, determinar cuales son las posibilidades de aplicacinprcticadelainvestigacin,oseaPARAQUSEVAAESTUDIARELFENMENO.La claridadenstecampo,probablementeledarmsfuerzaaladecisindeemprenderelestudioo posiblemente nos lleve a archivar el mismo. iv)Definirlostrminosquesedebenutilizar.Estoesfundamental,nosoloparaquelosresultados quedencomparablesconotrosdelamismanaturaleza,sinotambinparaevitarinterpretaciones diferentesentrelaspersonasqueinvolucralainvestigacincomo:informantes,recolectores, codificadores, crticos, etc. 5 b)Estudio bibliogrfico. Consiste en averiguar quienes han elaborado estudios sobre el mismo tema, a fin de utilizar sus resultados si la investigacin fue lo suficientemente buena y se adapta a la poca y a nuestros objetivos, ahorrando en stas condiciones tiempo y dinero. Son importantes las entrevistas con quienestienenexperienciaenlainvestigacin,afindecapitalizarsusxitosyevitarsusfracasos.A travsdeentrevistasdestanaturalezaconpersonasprcticasydeexperienciapodraconseguirse adems documentacin valiosa como cartografa, marco muestral, etc. Noobstanteloanterior,lainformacinobtenidasobreeltemaainvestigar,debeevaluarse,afinde decidirsiseutilizaono,respondiendolassiguientespreguntas:quienhizoelestudio,porqulohizo (objetivosgeneralesyespecficos),cualfueelmaterialestudiado,dondesehizoelestudio,enqu poca se efectu, cuantos individuos se estudiaron, qu conclusiones se obtuvieron, etc. c)Metodologa. Consiste en definir claramente los siguientes aspectos: i.Definirlapoblacin.Tantoenelperododereferenciacomoelcontornogeogrfico.Deltamaode dichapoblacin,dependersiseinvestigatodalapoblacinosisoloseutilizaunamuestraparala investigacin a fin de minimizar tiempo y dinero. ii. Seleccin de la muestra.O sea definir: tamao de la muestra, tipo de muestreo que se utilizar, etc. iii Instructivos de crtica y codificacin. Se refiere a las instrucciones que deben recibir aquellas personas queseresponsabilizarndecodificartantolaspreguntascomolasrepuestas,afindehacerlas comprensiblesaunprogramadecomputadoraqueprobablementetabularlainformacin.Porotra parte,lasinstruccionesdecrticairnorientadasaaquellaspersonasqueseocuparndedetectarlas omisiones e inconsistencias en las respuestas que contienen los formularios. iv. Diseo de formularios e instructivos. Es ste, uno de los aspectos que merece especial cuidado en la planeacin.Losformulariosconstandedospartesasaber:DatosdeidentificacinyDatos especficos del problema que se estudia. Con el fin de definir las preguntas que se relacionarn en el formulario, es muytilprepararunosCUADROSDESALIDA,esdecirdisearloscuadrosquesernfinalmente publicados como resultado de la investigacin, conteniendo aquellos conceptos considerados necesarios enlamisma.Lainformacinque deseamos que contengandichos cuadros,nosdarclaraideasobre aquelloqueesynoesnecesariopreguntarafinsimplificarelformularioyporconsiguientela investigacin.Frecuentementelosformulariossondiseadossintenerencuentanormasgenerales como las siguientes: -Esimportantetenerencuentaelpropsitoparaelcualserutilizadoelformularioquecontienelas preguntas ylas posibles circunstancias como se recoger la informacin: modo, tiempo y lugar. -Elformulariodebeserlomscortoposible,locualselograsitenemosencuentaquedebemos seleccionarentrelaspreguntasdeseables,soloaquellasfactiblesderecolectarydetabular,ascomo aquellas que sern verdaderamente tiles en la investigacin. -Ordenarlaspreguntasenelformulario.Primerodebenirlosdatosdeidentificacin,luegolosdatos sociales, luego datos econmicos, etc. - Formular las preguntas de manera simple y sin sugerir las respuestas. Es decir, las respuestas deben ser espontneas. -Tratardeprecodificarlasrespuestas,estoes,relacionartodaslasposiblesrespuestasparaqueel encuestadoseleccioneunadeellas.Dichoenotraforma,sedebenevitarlaspreguntasabiertas,que son aquellas en las cuales el encuestado puede responder lo que se le ocurra y de la manera que desee, pudiendo de sta manera dar respuestas incomprensibles, de difcil o imposible tabulacin

- Determinar las caractersticas del formulario, como forma, tamao, tipo de material, tipo de impresin, etc.Estosaspectossonimportantespuestoquedebepensarseenlascomodidadesquedebetenerel recolectorparadiligenciarelformulario,eltiempoquedurarnarchivadoslosformularios,lashorasen 6 quevaatomarselainformacin,etc.Cualquierinconvenienciaenlascaractersticasdelformulario, puedeafectarostensiblementelosresultadosdelainformacin.Supngaseporejemploqueun recolectorincmodoporundiseotipogrficoinadecuadodelformulario,puedeoptarportelevisarlas respuestas desde su propia casa, falseando la informacin. -Esconveniente,cualquieraquesealainvestigacin,dejarespacioparalasobservacionesalfinaldel formulario, como por ejemplo explicacin sobre omisiones o imprecisiones en algunas respuestas, etc. - Es muy importante, efectuar una prueba de operabilidad del formulario en una pequea muestra, a fin de detectar los errores, as como lasinconsistencias e inconveniencias del mismo, antes de proceder a la costosa impresin de la totalidad de los formularios. d)Diseo de los planes de recoleccin. Es decir, nmero de recolectores que se necesitarn, manual deinstrucciones,sisonnecesariossupervisoresdecampoono,tratardepreverlassolucionesalas posibles dificultades que se les pueden presentar durante su trabajo, etc. e)Evaluacindelainvestigacin.Setratadecompararloplaneadoconloejecutadoduranteel proceso de la investigacin y establecer las razones de las diferencias para capitalizar las experiencias en otrasfuturas investigaciones. Es importante preparar al final de la investigacin, una MEMORIA de la misma,siguiendopreferiblementeelordenquesesiguidurantelaetapadeplaneacinyregistrando todos los detallespresentados en el transcurso de la investigacin. 1.3.2RECOLECCION O RECOPILACIN DE DATOS. Esesteel segundopaso deunainvestigacinestadstica.Lainformacinque requierelainvestigacin essuministradaporelamadecasa,elhombredenegocios,ocualquierotroinformante;yaseapor intermedio de una persona que visita al informante y le hace las preguntas necesarias para anotarlas en un formulario, o enviando al informante una lista de preguntas que puede contestar en el momento que desee, o que debe contestar con carcter obligatorio como sucede en la encuesta anual manufacturera que anualmente realiza el DANE, organismo rector de las estadsticas en Colombia.Tambinpuedenobtenerselosdatosatravsdeencuestastelefnicasoentrevistaspersonales. Algunasveceslainformacinseobtienemedianteregistro,locualsignifica,quelainformacinse proporcionaalaautoridadcompetenteenelmomentoqueocurreelhecho,odespusdequeste suceda.Sonejemplosderecoleccinporregistro:losnacimientos,lasdefunciones,losaccidentes automovilsticos, las ventas de propiedad raz ante una notara, el consumo de energa. , etc. Para fines estadsticos, los datos se clasifican como INTERNOS y EXTERNOS. Los datos obtenidosde lospropiosarchivossondatosinternos.Sinembargo,enmuchasocasionesesnecesarioestablecer comparacionescondatosdelamismandoleperoreferidosaunaescalademayormagnitudo simplementeesnecesarioobtenerlainformacindeunafuentediferentealospropiosarchivos.Estos datos exgenos se denominan datos externos. Ahora bien, desde el punto de vista de la frecuencia con que se realiza la investigacin, la recoleccin puede hacerse de manera: OCASIONAL si la informacin setomaen circunstanciasextraordinarias comoalgunas encuestasde opinin,PERIDICAcuandola investigacin se realiza en lapsos de tiempos regulares como por ejemplo la recoleccin sobre precios al consumidor de carcter mensual, los censos de poblacin que normalmente se efectan cada diez aos, etc., y CONTINUA cuando los datos se registran automticamente en el momento que se presenten los hechos, sin interrupcin, como los datos sobre criminalidad, natalidad, etc. 1.3.3 ORGANIZACIN DE LOS DATOS. Esesteeltercerpasodeunainvestigacinestadstica.Alrecolectarselainformacin,estadebeser organizada,estoes,quelosdatosantesdesertotalizadosyutilizadosparaunanlisis,debenser sometidos a un proceso de CRTICA, es decir a un examen crtico y severo con el fin de detectar si los datosson:exactos,completos,precisosyrepresentativos.Lacrtica,buscaclasificarelmaterialen: bueno,incorrectoperocorregible,yenincorregibleyporlotantodesechable.Porotraparte,losdatos 7 debenserCODIFICADOS,estoes,cadapreguntadebeseridentificadaconunnmeroocdigo,que ser reconocido posiblemente por la computadora para efectos de la totalizacin. 1.3.4PRESENTACIN DE LOS DATOS. Es este el cuarto paso de una investigacin estadstica. Los datos pueden presentarse para los lectores potenciales,medianteenunciadostextuales,cuadros,tablas,grficos.Estasalternativasde presentacinayudanallectoracomprenderdeunamaneragil,amena,resumidaycomprensiblela informacinresultante de la investigacin.

1.3.5ANLISIS Esesteelquintopasodeunainvestigacinestadstica.Despusdequelosdatossonrecolectados, organizadosypresentadosdeformacomprensibleatravsdeloscuadros,grficosyenunciados;la informacin debe ser analizada, proceso ste, que involucra una serie de operaciones matemticas. Este procesode anlisis ser estudiado detenidamente en el siguiente captulo. 1.3.6 INTERPRETACIONES Y CONCLUSIONES Es este el ltimo paso que sigue una investigacin estadstica. La interpretacin de la informacin, es un campo que compete a personas especializadas en el tema que es materia de investigacin, como es el caso de estadsticas como las: demogrficas, culturales, manufactureras, etc. 1.4CUADROS ESTADSTICOS Aligualquelosgrficosylosenunciados,esunadelasformasdepresentarlosdatosestadsticos, despus de que stos han sido recolectados y organizados. Los cuadros estadsticos son una forma de prepararlosdatosestadsticosparaqueelanlisisdelainformacinresultemsfcil,orgnicay funcionalyporotraparteparaquelalecturadelainformacinporpartedellectorresultemsgil, comprensible,funcionalymotivadora.Uncuadroestadsticoconsisteenunconjuntodedatos metdicamente expuestos en forma de filas y columnas. Un cuadro se consideracompleto, cuando constadelassiguientespartes:ttulo,columnaprincipalomatriz,casillas,filas,columnas,fuentes,y observaciones o notas al pie. Al menos, un cuadro debe tener las cinco primeras partes que se acaban deenunciar.Acontinuacin,sepodrnobservaralgunasdelaspartesconstitutivasdeuncuadro estadstico. 23 1 5 6 7 8 9 4 -Todo el rectngulo exterior se denomina cabezote y contiene el conjunto de los conceptos 1 al 9, es decir la columna matriz, casillas y columnas secundarias. En el conjunto de los conceptos 1 al 9, se escribirn los encabezamientoso textos de las columnas y casillas. Fuera del cabezote y por debajo del mismo se anotarn todos los datos numricos y alfanumricos correspondientes. -El rectngulo distinguido con el nmero 1, corresponde a la columna principal o matriz o primera del cuadro. -Los rectngulos distinguidos con los nmeros 2 y 3 se denominan casillas. Una casilla abarca dos o mscolumnassecundarias.Asporejemplo,lacasilla2abarcalascolumnassecundarias5y6, mientrasquelacasilla3abarcalascolumnassecundarias7,8y9.Elrectngulo4corresponde tambin a una columna secundaria. 8 -El conjunto de columnas secundarias y de casillas se denomina cuerpo del cuadro(columnas 2 a 9). Es decir el cuerpo del cuadro es el mismo cabezote excluyendola columna matriz. 1.4.1 NORMAS PARA CUADROS ESTADSTICOS Un cuadro estadstico debe cumplir con las siguientes normas generales: a) SIMPLICIDAD, Esto es,que sea lo ms fcil de leer posible. b)UNIDADDETEMA.Estoes,quetodoslostpicosquesemencionenenelcuadro,debenestar relacionados para que no haya confusin. c) ORDEN. Esto es, un desarrollo lgico de los diferentes temas de tal manera que se puedan establecer fciles interrelaciones entre ellos. Desde el punto de vista del diseo, es conveniente seguir algunas normas prcticas, que de una u otra maneracontribuirnadarlemejorpresentacinalainformacinyporotraparte,permitirnmayor funcionalidad a la lectura e interpretacin. Las principales normas sobre diseo son las siguientes: a)El ttulo del cuadro va en la parte superior.Puede ir centrado, y si existe una referencia de aos, es preferible anotar sta en el centro y debajo del ttulo. b)Lafuente,oseaelorigendelainformacin,puedeiralfinaldelcuadro,lomismoquelas observaciones acerca de la cobertura y tipo de frmulas empleadas, si ello fuere necesario, etc. c) Debajo del cabezote irn todas las celdas en las cuales se registrarn todos los datos numricos y alfanumricos. d)Elttulodebeserlomscortoposible.Debeenunciarenprimerlugar,lanaturalezaocarcter general del cuadro, enseguida si el ttulo no se alarga mucho mencionar los encabezados del cuerpo del cuadro en forma sinttica, y por ltimo debe mencionarse la especificacin o encabezado de la columna matriz. e) El encabezamiento de las columnas debe ser simplificado, pero sin abreviaturas. f) Debe elegirse como columna principal o matriz, aquel concepto que se extienda mucho en el sentido vertical.Espreferiblequeelcuadroseextiendaverticalmente,porquelosproblemasdeimpresin resultan menores. g)Para facilitar el contenido substantivo del cuadro, el columnaje debe disponerse en progresin lgica, de modo que la lectura del cuadro resulte orgnica. h)Es preciso el buen empleo de los totales, asignando una columna especial, para los mismos. i)Silossumandosestndispuestoshorizontalmente,lapalabratotaldebeaparecerantesdelas columnas de sumandos. Si la suma es vertical, la palabra total, debe ir arriba de la columna respectiva y no abajo. j)Cuandoelcuadroresultaverticalmentemuyextenso,esnecesarioempezarporunCUADRO RESUMEN.Luegosepresentancuadrosparcialesquedetallanlainformacincontenidaenelcuadro resumen.Siporejemplo,sedeseapresentaruncuadroquecontengalainformacinrelativaalos resultadosdelaseleccioneseneldepartamentodeAntioquia,esclaroquedeboelegircomocolumna principal o matriz, aquella que relaciona todos los municipios del departamento, ocupando en sta forma variashojas. As,elcuadroseextendermuchoverticalmente,porlo cuales recomendablepresentar inicialmente un cuadro resumen de las diferentes zonas o subconjuntos que componen el departamento y luego presentar un cuadro por zona. Esta alternativa, no slo dar mayor claridad y funcionalidad a la lectura, sino que permitir una mejor presentacin del cuadro.9 k)En los cuadros en que existen reas o agrupaciones que ocupen varias lneas en la columna matriz bien delimitadas; cada rea o agrupacin debe ir separada de la siguiente por un espacio adicional. l)Lasnotasyreferenciassecolocanalfinal,fueradelcuadroypuedenser:fuentes,definiciones, alusiones a la cobertura de la investigacin, mtodos usados, frmulas utilizadas, etc. m) Si se presentan dos o ms columnas contiguas con una caracterstica igual, debe abrirse una casilla o superficie en el cuadro que las cubra, en lugar de repetir en cada columna sta caracterstica. n) El espacio o ancho de las columnas, debe adaptarse al anchoque ocupan los valores numricos en lasmismas.Estoselograyaseapartiendoeltextoenelencabezamientodelascolumnasousando tipos de letras de diferentes tamaos. EJEMPLO:Sepidedisearuncuadroestadsticoquecontengalainformacinrelativaalaventade muebles de madera de la firma DECORANDO S.A de la ciudad de Pereira, durante el ao 2003. -Sequierequeaparezcanlasventasdiscriminando:tipodeartculos,segnunidadesvendidasy valor de las mismas. -Se quiere que aparezcan las ventas segn regiones del pas.-Sequieretambinqueelcuadrototalicehorizontalyverticalmente,segntipodeartculoypor regiones del pas, discriminando los totales segn unidades vendidas y valor de dichas ventas. Solucin: VENTAS DE LA COMPAA DECORANDO S.A SEGN ARTCULOS Y ZONAS DEL PAIS 2003 CAMAS NOCHEROS TotalesSENSACIN ISABELINAS ZONAS DELPAIS Ventas totales (Millones de pesos) Unida-des Millones de pesos Unida-des MillonesDe pesos Unida-des Millones de pesos Unida-des Millones de pesos

TOTALES CALDAS ManizalesChinchin QUINDOArmenia Latebaida RISARALDA PereiraLa Virginia Santa rosa VALLE Cali B/ventura Buga Obsrvesequeenelejemploanterior,setuvieronencuentatodaslasnormasrelacionadasatrs, exceptoaquellassobrediseoreferidasenlosliterales:b,j,yl,porquelanaturalezadelcuadronolo exiga. El estudiante deber verificar el cumplimiento de las normas, confrontando el cuadro del ejemplo, con las normas relacionadas en las pginas 8 y 9. El estudiante adems, deber diligenciar elcuadro de 10 lareferencia,condatossupuestos,poniendoespecialcuidadoenelmanejoeinterpretacindelos totales. 1.5GRFICOS ESTADSTICOS Comoyasehabavistoanteriormente,losgrficossonunaopcinquetieneelinvestigadorpara presentar los datos estadsticos, complementaria de los cuadros y los enunciados. Ungrficoestadstico,eslarepresentacindeunosdatosestadsticos,mediantealgunasfiguras geomtricas,talescomo:rectngulos,crculos,pictogramas,cartogramas,lneasdetendencia,yotros quesondeusomenosfrecuente.ltimamente,existenmuchasvariacionesenlapresentacindelos grficos; por ejemplo un prisma rectangular se presenta como una forma alternativa del rectngulo, pero debe tenerse muy en cuenta, que lo que realmente se busca con un grfico es no solo una presentacin atractiva, sinoayudar a comprender al lector la informacin contenida en un cuadro estadstico. Ungrficoesdegraneficaciacomoartificiopararepresentarciertosdatos,siendoademsun instrumento estadstico de enorme utilidad. Sin embargo, tiene ciertas limitaciones a saber:

a)No puede representar tantosdatos como uncuadro. Si se intenta incluir mucha informacin en un grfico, podra perderse claridad, hecho ste que atenta contra el objetivo primordial de un grfico. b)Mientras en un cuadro pueden darse valores exactos, en un grfico pueden leerse los valorescon menos precisin por limitaciones visuales. c)En muchos casos, las ilusiones pticas de los grficos nos llevan a conclusiones errneas, debido a laarbitrariedadenlaconstruccindelasescalas.Asporejemplo,enungrficolinealcuyoejedelas abscisasserefiereaaosyelejedelasordenadasserefiereaventas,podrasucederqueseutiliceerrneamenteunaescalademasiadoampliaparalasventas.Enstascondicioneslatendencialineal sermuyempinada,locualmostraravisualmenteuncrecimientoaceleradoenlasventasatravsdel tiempo, cuando posiblemente se podra tratar de un crecimiento moderado en las mismas. Conungrficoestadstico,sebuscavisualizardeunamanerarpidayfcilelcomportamientodeun fenmenoylasrelacionesexistentes.Losgrficossonmuytilesparadarunaidearpidadela situacin general, pero no de los detalles, aunque son ms eficaces para llamar la atencin del lector que cualquier otro sistema, pues es ms fcil que un lector eluda un texto o un cuadro que un grfico. Un grfico bien concebido, sugiere conclusiones e interpretaciones, lo cual no es fcil lograr mediante un cuadro. Un buen grfico debe ser ante todo sencillo y fcil de entender, teniendo en cuenta hacia quien va dirigida la informacin esto es personas corrientes o especializadas. Un grfico para que se considere completo, debe contener los siguientes elementos: a) TITULO,cuyas normas siguen las ya analizadas para cuadros estadsticos.b) PARTE GRFICA, que corresponde al cuerpo del grfico es decir: lneas, barras o smbolos.c) ESCALAS, que se refieren al eje de la X que se usa para mostrar las clasificaciones de los datos y el eje Y que se usa para expresar la frecuencia o magnitud de cada dato expresado en el eje de la X. d) FUENTE, que se coloca en la parte inferior y se refiere por lo general al cuadro que contiene los datos numricos.e)CONVENCIONES,queserefierenaloscolores,rayadosespecialesparalasbarrasolneasque diferencian a cada concepto representado. 1.5.1 NORMAS SOBRE GRFICOS ESTADSTICOS a) Un grfico debe ser lo ms simple posible y debe entenderse por s mismo.b) En caso de utilizarse convenciones, stas deben explicarse claramente. Estas convenciones pueden referirse a coloreso diversos rayados para las diferentesespecificaciones que pueda tomar la variable. 11 Ejemplo: diferenciando los 5 artculos producidos por una compaa, o los diferentes aos de una serie de tiempo, por colores o rayados diferentes. c) La abscisa se destinar para las diferentes clases de la escala o variable independiente y la ordenada para las frecuencias. d) La ordenada debe siempre empezar por cero, pero si los valores son muy elevados se debe partiro acotar la escala. e)Laslongitudesdelasescalasdebenguardarproporcin,locualpuedeserentre1y11y2.Es decir, que si la ordenada vale 10, la abscisa debe ser entre 10 y 20 respectivamente. f) Si se desea tener bases de comparacin, es importante resaltar. Ejemplo: 100%, promedio, etc. g)Cuandoelgrficoeslineal,esbuenoresaltarlaslneas.Idnticamentesielgrficoeslineale incorpora varias lneas stas deben destacarse por trazos diferentes. 1.5.2 TIPOS DE GRFICOS ESTADSTICOS Losgrficos msimportantes sonlos que se detallana continuacinypuedenrepresentarseencifras absolutas o relativas: a)BARRAS SIMPLES. Estos pueden ser en valores absolutos o relativos. Igualmente las barras pueden ser verticales u horizontales. Para datos cualitativos se prefieren las barras horizontales.

b)BARRAS COMPONENTES. Estas implican que las barras son acumulativas, es decir la barra total se refiere a un todo y las barras parciales son las partes que conforman el todo. c)BARRASCOMPUESTAS.Estas,implicanqueeltodoestconformadoporunconjuntodebarras contiguas. d) LINEAL SIMPLE. Consiste en una lnea que representa una variable en un sistema de coordenadasy muestraunatendenciaatravsdeltiempo.Seusaparaseriesdetiempo.Elejedelasabscisasse destina para la variable tiempo. e) LINEAL COMPUESTO. Es un conjunto de lneas representadas en un sistema de coordenadas. Cada lnea marca la tendencia a travs deltiempo de una variable especfica. f)LINEALDESILUETAS.Esungrficolinealsimple,peroadicionalmenteexisteunalneahorizontalque representa el promedio de la variable durante el perodo representado. g) CIRCULAR. Consiste en un crculo que representa un todo y los sectores circulares que se refieren a las partes constitutivas del todo. Es importante aclarar la diferencia entre valores absolutos y valores relativos. Un valor absoluto es aquel queresultadelaobservacindirectaodelconteodirecto.Asporejemplosiunaclaseconstade30 alumnos,entonces30esundatoabsolutoporqueresultadelconteodirecto.Porotrapartesiunode esos alumnos pesa 52 kilos, ste valor es absoluto porqueresulta de la observacin directa. Unvalorrelativoesaquelqueresultadelacomparacinentredosomsdatosyseexpresa generalmente en porcentajes. Segn el ejemplo anterior, si de los 30 alumnos 12 de ellos son hombres y 18sonmujeres,entoncespodemosdecirqueel60%sonmujeres(18*100/30).Enstecasoelvalor 60% es un dato relativo. Losgrficosdebarras,hacenresaltarenmejorformalosdistintosvaloresdelavariablecuandostas sonpocasymuestranmsclaramentelasdiferenciasentrelasfrecuenciasindividuales.Losgrficos lineales muestran ms claramente la tendencia en el tiempo de la variable representada. Los grficos de barras sirven para cualquier clasificacin, mientras que los grficos lineales son ms apropiados cuando la variable es tiempo. 12 1.5.3 EJEMPLOS DE GRFICOS ESTADSTICOS CUADRO 1.1 PUNTAJES DE LOS ASPIRANTES AL CONCURSO A GERENTE DE LA COMPAATECNIREPUESTOS S.A PUNTALES DE LAS PRUEBAS ASPIRANTES EXAMENENTREVISTAHOJA DE VIDA A502010 B401815 C381520 CUADRO 1.2 RESULTADOS DE L CONCURSO A GERENTE DE LA COMPAA TECNIREPUESTOS S.A PORCENTAJESASPIRANTES EXAMEN ENTREVISTAHOJA DE VIDA A100100100 B8090150 C7675200 Base de comparacin: Puntajes de A=100 Fuente: Cuadro 1.1 CUADRO 1.3 EXPORTACIONES DE LA COMPAA ALIMENTOS S.A 2000-2003 ARTCULOS(MILES DE LATAS)AOS ABC 200023.117.23.8 200124.410.44.3 200228.321.55.6 200325.929.37.8 CUADRO 1.4 COMPORTAMIENTO PORCENTUAL DE LAS EXPORTACIONES DE LA COMPAAALIMENTOS S.A 2000-2003 ARTICULOS(PORCENTAJES)AOS ABC 2000100.0100.0100.0 2001105.660.5113.2 2002122.5125.0147.4 2003112.1170.3205.3 Base de comparacin: AO 2000=100 Fuente: cuadro 1.3 13 Grfico 1.1 BARRAS SIMPLES RESULTADOS EN EL EXAMEN DEL CONCURSO A GERENTE DE LA COMPAA TECNIREPUESTOS S.A5040380102030405060ASPIRANTESPUNTAJEB A C Fuente: Cuadro 1.1 Grfico 1.2 BARRAS SIMPLES (Valores relativos)) RESULTADOS DEL EXAMEN AL CONCURSO DE GERENTE DE LA COMPAA TECNIREPUESTOS S.A1008076020406080100120ASPIRANTESPORCENTAJESAB C Fuente: Cuadro 1.2 Base de comparacin: aspirante A=100 14 Grfico 1.3 BARRAS COMPUESTAS (Valores absolutos) RESULTADOS DEL CONCURSO A GERENTE DE LA COMPAA TECNIREPUESTOS S.A5020104018153815200102030405060ExamenEntrevista Hoja vidaPRUEBASPUNTAJESABC Fuente: Cuadro 1.1 Grfico 1.4 BARRAS COMPUESTAS (Valores relativos) RESULTADOS DE PRUEBAS AL CONCURSO DE GERENTEDE LA COMPAA TECNIREPUESTOS S.A100 100 100809015076 75200050100150200250EXAMENENTREVISTA HOJA DE VIDAPRUEBASPORCENTAJESABC Fuente: Cuadro 1.2 Base de comparacin: aspirante A=100 15 Grfico 1.5 BARRAS COMPONENTES (Valores absolutos) RESULTADOS DEL CONCURSO A GERENTE DE LA COMPAA TECNIREPUESTOS S.A5040 38201815101520020406080100ASPIRANTESPUNTAJE ACUMULADOHOJA DE VIDAENTREVISTAEXAMENA B C Fuente: Cuadro 1.1 Grfico 1.6 BARRAS COMPONENTES (Valores relativos) PARTICIPACIN PORCENTUAL DE LOS PUNTAJES DE LAS DIFERENTES PRUEBAS AL CONCURSO A LA GERENCIA DE LA COMPAA TECNIREPUESTOS S.A5040382018151015200%20%40%60%80%100%ASPIRANTESbase:total puntaje=100PARTICIPACIN PORCENTUALHoja vidaEntrevistaExamen A BCC Fuente: Cuadro 1.1 16 Grfico 1.7 LINEAL SIMPLE (Valores absolutos) EXPORTACIONES DEL ARTCULO A DE LA COMPAA ALIMENTOS S.A23,124,428,325,90510152025302000 2001 2002 2003AOSMILES DE UNIDADES Fuente: Cuadro 1.3 Grfico 1.8 LINEAL SIMPLE (Valores relativos) COMPORTAMIENTO PORCENTUAL DE LAS EXPORTACIONES DEL ARTCULO B DE LA COMPAA ALIMENTOS S.A .100,060,5125,0170,30,050,0100,0150,0200,02000 2001 2002 2003AOS base:ao 2000=100PORCENTAJE 17 Grfico 1.9 LINEAL COMPUESTO (Valores absolutos) EXPORTACIONES DE LA COMPAA ALIMENTOS S.A23,124,428,325,917,210,421,529,33,84,35,67,8051015202530352000 2001 2002 2003AOSMILES DE UNIDADESABC Fuente: Cuadro 1.3 Grfico 1.10 CIRCULAR (Valores relativos) EXPORTACIONES DE LA COMPAA ALIMENTOS S.A AO 2000 EN MILES DE UNIDADES 23,117,23,8ABC Fuente: Cuadro 1.3 18 EJERCICIOS RESUELTOS 1.1Unfabricanteafirmaconraznenvirtuddesuexperiencia,quelacargapromedioque soportan los cables de acero producidos por su compaa es de 4.006 libras. Un cliente pone en dudadichaafirmacinyparacomprobarlotoma10dedichoscablesyencuentraquelacarga mediasoportadaporstosesde4.003libras.Responder:a)Cualeslamuestra,b)Cualesla poblacin,c)Cualeselparmetro,d)Cualeselestimador.Respuestas:a)10,b)infinita,c) 4.006 libras, d) 4.003 libras. 1.2Conrelacinalejemploanterior,sielclienteestimaatravsdelamuestraquelacarga promedioquesoportanloscablesqueproduceelfabricantefluctaentre4.002y4.010libras conunaconfianzadel90%,sepideresponder:a)Qutipodeestimacinesthaciendoel cliente,b)Cualeselmargendeerrordedichaestimacin?,c)Eseprocesodeestimacin hacepartedelaestadsticadescriptivaodelaestadsticainferencial?Respuestas:a)intervalo de confianza, b) 5 libras, c) estadstica inferencial. 1.3 Con relacin al ejemplo anterior, qu caractersticas debe tener la muestra seleccionada por el cliente. Respuesta: aleatoria y untamao adecuado en concordancia con el margen de error que el analista est dispuesto a aceptar en la estimacin y a la confianza que quiere tener en la misma. 1.4 Los cuadros y los grficos como parte del cuarto paso de una investigacin estadstica, se consideran herramientas sustitutivas o complementarias? Respuesta: complementarias. 1.5Cualesladiferenciaentregrficosdebarrascompuestasydebarrascomponentes. Respuesta:Enlasbarras compuestas unsubconjuntodebarras contiguasrepresentaneltodo, mientrasqueenlasbarrascomponentes,cadabarracontienelasdiferentespartesque conforman el todo de forma apilada o acumulada. EJERCICIOS PROPUESTOS 1.1UnJefedeproduccindeunacompaarequiereconocerelvoltajepromediode2.500bateras tipo A correspondientes a un lote de produccin de la tercera semana del mes de marzo delao2.004,paralocualutilizadosmtodosasaber:Mtodo1.Someteaunapruebalas 2.500 bateras una tras otra y encuentra que el promedio es de 14.9 voltios. Mtodo 2. Somete a prueba un subconjunto de 80 de las 2.500 bateras y encuentra que el promedio de ste es de 14.8voltios.Conrelacinalmtodo2,eljefedecontroldecalidaddelacompaapresenta3 alternativasdeestimacindelpromediodelas2.500baterasas:a)elvoltajepromedioes de14.8voltios,b)elvoltajepromediofluctaentre14.65y14.95voltiosyc)laprobabilidadde que el voltaje promedio de las bateras flucte entre 14.65 y 14.95 voltios es de 0.95. Identifique cualessonlostrestiposdeestimacionessugeridasenelmtodo2yconfrontelasventajasy desventajas de cada uno de los mtodos.. 1.2 La estadstica se divide en estadstica descriptiva y estadstica inferencial, a cual de stas se ajusta cada uno de los dos mtodos descritos en el ejercicio 1.1. 1.3 Con relacin al ejercicio 1.1, identifique: a) la poblacin, b) la muestra, c) el parmetro, d) la estimacin en cada una de sus modalidades. 1.4Conrelacinalejercicio1.1,qucaractersticasdebereunirlamuestraparaquesea representativa. Explique cada una de ellas. 19 1.5 Con relacin al ejercicio 1.1, identifique el margen de error. 1.6 Cual de los 3 tipos de estimaciones es la mejor. Explique sus ventajas y desventajas. 1.7Conrelacinalejercicio1.1,cmodeberaserlamuestra,siseestuvieradispuestoen aceptar un menor margen de error en la estimacin del parmetro poblacional. Explique 1.8Conrelacinalejercicio1.1,cmodeberaserlamuestra,siseestuvieradispuestoen aceptar una menor confiabilidad en la estimacin del parmetro poblacional. 1.9Sielejercicio1.1noserefirieraaunaspilas,sinoa2.500lmparasalascualesseles quiereaplicarunacargadevoltajehastaquestasfallenconelfindeprobarsuresistencia promedio,cualdelosdosmtodosdeestimacinreferidosenelejercicio1.1considera adecuado?. Explique las ventajas y desventajas de cada uno.

1.10Desdeelpuntodevistadelafrecuenciacomoserecolectalainformacinenuna investigacinestadstica,existentresformasderecoleccin.Dtresejemplosdecadaunade dichas formas, basndose en investigaciones que actualmente realiza el DANE en Colombia. 1.11Supongaqueusteddebeefectuarunainvestigacinestadsticasobrelosaccidentesde trnsito en el departamento de Caldas durante el ao 2.003. Produzca al menos tres cuadros de salidaquecontenganlainformacinqueusteddeseaobtenermediantelainvestigacinycon baseenloscuadros,sugieralaspreguntasqueharaenelformulario,teniendoencuenta aquellasnormasrelacionadasconeldiseodeunbuenformulario.Diseeloscuadrosajustados a las normas contempladas en las pginas 7 a 9. 1.12Conrelacinalejercicio1.11elabore4grficosestadsticos,siguiendolasnormas contempladas en las pginas 10 y 11. 1.13 Con datos supuestos, produzca un cuadro estadstico que contenga valores absolutos. Con baseaestecuadro,produzcadoscuadrosadicionalesconvaloresrelativos,detalsuerteque tomandostoscomofuentes,sepuedanprepararrespectivamenteungrficodebarras componentes y otro de barras compuesto. 1.14Supongausted,queunaorganizacinnogubernamental,quierehacerunainvestigacin sobreeldesempleoyelsubempleoeneldepartamentodeCaldasyqueparatalefectoha reflexionadoydeliberadoampliamentesobrelosobjetivosquesepersiguenysobrela justificacindedichainvestigacin,encontrandoconellovalibreparainiciarlainvestigacin. Qu aspecto fundamental de la planeacin estadstica analizara usted antes de emprender la investigacin? 20 CAPTULO 2: ANLISIS ESTADSTICO Comovimos enel captulouno,el anlisis estadsticocorrespondealquintopaso de unainvestigacin estadstica. Despus de una juiciosa planeacin y luego deque los datos estadsticos, como vimos en el captuloanterior,hansidorecolectados,organizadosypresentadosdeformacomprensibleydefcil lectura a travs de tablas y grficos estadsticos, los datos deben ser analizados. Elanlisisestadstico,eselprocesodeprepararlosdatosestadsticosconelfindeinterpretarlos mediantesuadecuadaclasificacin,sucorrectaasociacinysuconvenientetransformacinencifras relativastalescomo:coeficientes,promedios,tasas,razones,etc.Duranteelprocesodeanlisisse emplean fundamentalmente operaciones matemticas que sern discutidas a lo largo de ste captulo. Laadecuadaclasificacin,selograusandolastcnicasdedistribucindefrecuencias,queseobtiene mediante una tabla de frecuencias. 2.1 TABLAS DE FRECUENCIA Una tabla de frecuencias constituye un mtodo til y eficiente para ORGANIZAR Y RESUMIR datos. Los diferentes valores que contiene la variable, son relacionados en una tabla que consta de dos columnas. En una primera columna se relacionan los diferentes valores que toma la variable objeto de estudio y en una segunda columna se relacionan las frecuencias, o sea el nmero de veces que se repite cada valor de la variable. Es decir, la primera columna se destina para las CLASES O CATEGORAS que toma la variable, mientras que la segunda columna se destina para lasFRECUENCIAS. Elconjunto de las dos columnas se denomina TABLA DE FRECUENCIAS. Existen dos tipos de tablas de frecuencia a saber: tablas de frecuencias para datos cuantitativos y tablas DEFRECUENCIASparadatoscualitativos,segnlavariableserefieraadatoscuantitativoso cualitativosrespectivamente.Unavariablecuantitativaesaquellaqueasumevaloresnumricos expresados en alguna unidad de medida. Ejemplos: a) la velocidad de un vehculo que circula por cierto tramo de carretera, expresado en kilmetros/hora, b) la duracin de un proceso productivo, expresado en minutos, c)laenergaelctrica detiporesidencial consumida por losdiferenteshogaresde una ciudad durante un perodo determinado, expresado en kilovatios / hora . Una variable cualitativa es aquella que se refiere a preferencias, cualidades, caractersticas, referencias, etc.Esdecir,lavariablenoseexpresaenvaloresnumricos.Ejemplos:a)lasdiferentesmarcasde champ que distribuye una comercializadora, b) las diferentes razas que conforman la poblacin de una regin,c)Laspreferenciasporuncandidatoalapresidenciadelarepblica,d)elvalorprotenicode unosartculosalimenticiossugeridosporunarevistacientfica.Acontinuacinsepresentanejemplos para las tablas de frecuencias cuantitativa y cualitativa, segn la variable sea cuantitativa o cualitativa. Es importante anotar que en el caso de la tabla de frecuencia cuantitativa, el anlisis se hace respecto a la variablequeseexpresaenlaprimeracolumnadelatabla,mientrasqueenelcasodelatablade frecuencia cualitativa, el anlisis se hace respecto a las frecuencias, expresadas en la segunda columna de la tabla. El cuadro 2.1, es una tabla o distribucin de frecuencias cuantitativa y se refiere al tiempo empleado por los299obrerosdeunacompaaparaproducirciertapiezamecnicayelanlisisestadsticosehace respectoalaprimeracolumna,enstecasoeltiempo.Elcuadro2.2,esunatablaodistribucinde frecuenciascualitativayserefierealosresultadosdelaseleccionesenunaregindelpaspara presidentedelarepblicayelanlisissehacerespectoalasegundacolumna,oseaelnmerode sufragantes.

21 . Cuadro 2.1Cuadro 2.2 Tiempo (minutos) Nmero de Obreros CandidatosSufra-gantes Total299Total92.91820-2323A4.67824-2734B34.87628-3159C12.02132-35132D23436-3931E28.76440-4320F12.345 2.2 ANLISIS ESTADSTICO PARA DATOS CUALITATIVOS Despus de que los datos han sido recolectados y resumidos en una tabla de frecuencias, procedemos con el quinto paso de una investigacin estadstica, que se refiere al anlisis estadstico. Para el caso de variablescualitativas,dichoanlisisseefectautilizandomedidascuyainterpretacinespuramente aritmtica,puestoquecadaunadeellasseexpresaenformaderaznoseaquesetratadela comparacin entre dos cantidades diferentes a saber: el numerador o ANTECEDENTE y el denominador oCONSECUENTE.Elantecedenteseexpresaenfuncindelconsecuentequeeslabasede comparacin y en ese sentido debe enfocarse la correspondiente interpretacin. Lasmedidasmsutilizadasparaelanlisisdedatoscualitativosson:RAZONES,PORCENTAJES, PROPORCIONES, TASAS. 2.2.1RAZN Es un valor que resulta de dividir una cierta cosa, por otra de la misma naturaleza y que es la base de comparacinyqueparatalefectodichabasedecomparacinsehaceigualalaunidad.Sideseo comparar un valor A con otro valor B, divido el primero por el segundo y el resultado es la razn A/B. EJEMPLO 2.1 Si un vehculo A recorre una determinadadistancia a una velocidad de 80 kilmetros por hora, mientras que otro vehculo Blo hace a 32 kilmetros por hora, entonces la razn de A respecto a B, es:A / B = 80 / 32 = 2.5; lo cual quiere decir que la velocidad de A fue 2.5 veces la de B. La cantidad B es la base de comparacin y para efectos de clculo se hizo igual a la unidad; por lo tanto tambin puedo afirmar que cuando B recorre 1 kilmetro, A ha recorrido 2.5 kilmetros. EJEMPLO 2.2 Respectoalcuadro2.2destapgina,sideseocompararlavotacindelcandidatoBrespectoal candidato E, entonces la base de comparacin o sea el denominador debe ser la votacin del candidato E y el valor del candidatoB ser el numerador as: B/E = 34.876/28.764 = 1.21, lo cual quiere decir que por cada voto obtenido por el candidato E, el candidato B obtuvo 1.21 votos. ObsrvesequelabasedecomparacinEesigualalaunidad,hechostequesehizoresaltarenla interpretacin pues de lo contrario carecera de sentido. 22 2.2.2 PORCENTAJE Tambinseconsideracomounarazn,conladiferenciadequeelconsecuenteosealabasede comparacin o sea el denominador se hace igual a 100. En stas condiciones la frmula estar dada por (A / B)* 100. EJEMPLO 2.3 Segnelejemplo2.1delapgina21lavelocidaddeArespectoaBser:(80/32)*100=250;locual significaquelavelocidaddeAfueel250%delavelocidaddeB.ComolacantidadBeslabasede comparacin y para efectos de clculo se hizo igual a 100, entonces puedo tambin afirmar que por cada 100 kilmetros de distancia recorridos por B, la distancia recorrida por A es de 250 kilmetros. EJEMPLO 2.4 Respectoalejemplo2.2delapgina21,sideseocompararlavotacindelcandidatoBrespectoala votacindelcandidatoE,entonceslavotacindelcandidatoEserlabasedecomparacinyparatal efecto toma el valor de 100, as: (B/E)*100 = (34.876/28.764)*100 = 121%, lo cual significa que por cada 100 votos obtenidos por E, los votos obtenidos por B fueron 121. Tambin puedo afirmar que la votacin del candidato B fue el 121% de la votacin de E.

Obsrvese que tanto en el ejemplo 2.4 como en el ejemplo 2.3, la base de comparacin fue 100, hecho ste que se hizo resaltar en la interpretacin, pues de lo contrario carecera de sentido. 2.2.3PROPORCIN Tambinseconsideracomounarazn,conladiferenciadequeeldenominadoroconsecuentese refiere a un todo (T), mientras que elnumerador o antecedente (A), hace parte de ese todo.Paralosclculoscorrespondientes,eldenominadorsehaceiguala1a100,parainterpretarlocomo raznoporcentajerespectivamente,segnlodeseemos.LafrmulaestdadaporA/T,sisequiere expresar como razn o (A/T)*100, si se quiere expresar como porcentaje. EJEMPLO 2.5 Si una compaa de la construccin contrata 114 obreros no calificados tipo A y 36 especialistas tipo B, entonceseltotaldepersonalcontratadoserde150(T=150.)Laproporcindelacontratacindelos obrerosfuede(114/150)=0.76.Sideseointerpretardichacifracomorazn,tengoquedecirquepor cadapersonacontratada,sevincularon0.76obrerosnocalificados.Sideseointerpretarelresultado comoporcentaje,entonces,deboafirmarqueporcada100personascontratadassevincularon76 obrerosnocalificados.Tambinpuedoafirmarqueel76%delasvinculacionesfuerondeobrerosno calificados. EJEMPLO 2.6 Conrelacinalcuadro2.2delapgina21,sideseoconocerlaproporcindevotosdelcandidatoB respectoaltotal,entoncesdiramosquestaesde34.876/92.918=0.376.Sideseointerpretarste valorcomorazn,debodecirqueporcadavotoefectuado,0.376correspondieronalcandidatoB.Si deseo interpretar ste valor como porcentaje, debo afirmar que el 37.6% de los votos fueron a favor del candidato B. 2.2.4 TASA Esunarazn,detalformaqueeldenominadoroconsecuenteserefiereaunconjuntopoblacional, mientrasqueelnumeradoroantecedenteserefiereaunsucesoquetienerelacindecausalidadcon dicha poblacin. Es decir que el consecuente o denominador es la poblacin expuesta al riesgo. Existen tasasimportantescomo:a)tasadefecundidadenmadresdeciertogrupodeedad,respectoala poblacindemujeresendichogrupodeedad,b)tasadedesempleo,querelacionaelnmerode 23 desempleados,respectoaldenominadorqueenstecasoeslapoblacineconmicamenteactiva,c) tasa de defectuosas, que relaciona el nmero de piezas defectuosas respecto a un lote de produccin en unacompaa,etc.Conmuchafrecuencia,enlasestadsticasdemogrficas,lastasasseexpresanen funcindeaos,peropuedenreferirseaperodosmscortosmslargos.Porotraparte,lastasas pueden referirse al nmero de sucesos por cada mil, pero puede expresarse como el nmero de sucesos porcada100,1000,10.000cada100.000,etc;loimportanteesqueelvalordelatasaevitelos nmeros decimales a fin de facilitar su interpretacin. Para la mayora de las estadsticas demogrficas, eldenominadorpoblacinserefierealpuntomediodelperodoestudiadoconelfindeevitarla sobrestimacin o subestimacin de la tasa. Tambinesimportantetenerencuentaquesiporalgunarazn,fueimposiblerecogeralguna informacin correspondiente a la poblacin denominador, es necesario excluir los respectivos sucesos enelnumerador,oviceversaafindenodistorsionarelvalordelatasa.Asporejemplo,sisequiere calcular la tasa de natalidad en una regin, y no fue posible obtener el nmero de nacimientos en una de laslocalidadesdedicharegin,sernecesarioexcluirlapoblacindedichalocalidadtambinenel denominador. EJEMPLO 2.7

En una encuesta de opinin, se le pregunt a la poblacin de una comunidad el concepto que le mereca un gran proyecto vial de inters para la regin. El nmero de personas encuestadas fue de 34.576 y no respondieron1.234.Latasadenorespuestaserentonces:1.234/34.576=0.035636porcada 1.000 356 por cada 10.000. Acontinuacinserelacionarnalgunosejemplosdetasas,conloscualesnosdaremoscuentaque estamos en condiciones de crear nuestras propias tasas, segn nuestras propias necesidades: Tasa de prevalecencia = riesgo al uesta poblacinenfermedad cierta de causa por enfermos de nmeroexp Tasa de analfabetismo = aos de mayor poblacinaos de mayores s analfabeta de Nmero1414 Tasa de desempleo =activa ente econmicam poblacinos desemplead de nmero Tasa bruta de participacin = total poblacinactiva ente economicam poblacin Tasa de letalidad = causa dicha por enferma poblacindada causa una por s defuncione Tasa de fecundidad en edad X = X edad en femenina poblacinX edad de madres en vivos s nacimiento 24 EJERCICIOS RESUELTOS PARA DATOS CUALITATIVOS 2.2.1EnunaencuestarealizadaporelDANEenunaregindelpas,seencontrquelapoblacin econmicamenteactivaerade34.576habitantes,deloscuales3.120respondieronquenoestaban trabajando y que estaban buscando empleo. Se pide calcular la tasa de desempleo.

Solucin: Segn la frmula para tasa de desempleo, vista en la pgina 23 tenemos: tasa de desempleo = % 0 . 9 0902 . 0576 . 34120 . 3= = 2.2.2Enunmunicipio,seencontrquedelas12.350personasexpuestasalriesgodecierta enfermedad,1482deellasseencontrabanenfermas.Sepidecalcularlatasadeprevalecencia correspondiente. Solucin: De acuerdo a la frmula de tasa de prevalecencia vista en la pgina 23, tenemos: tasa de prevalecencia =% 12 12 . 0350 . 12482 . 1= = 2.2.3 Una compaa vendi una mquina, perdiendo el 18% de su precio de compra. Cual fue el precio de compra si la mquina fue vendida en $2.000.000.00? Solucin: Obsrvese que la base de comparacin es el precio de compra y que el precio de venta es el 82% del precio de compra (100 -18). En estas condiciones el precio de compra ser el consecuente, mientras que elpreciodeventaserelantecedente.Siaplicamoslafrmuladeporcentajevistaenlapgina22y simbolizamos el precio de compra por pc, tenemos: 82 =100 *00 . 000 . 000 . 2pc;Por tanto: pc = $ 2.439.024.39 2.2.4 Un almacn de artculos para la construccin, vende un artculo de estricto contado en $60.543.00. Cunto le deber facturar a un cliente que quiere pagar con tarjeta de crdito, si el vendedor tiene como poltica trasladar al comprador, la comisin del 7% que Credibanco Visa, cobra sobre el precio de factura al vendedor? Es decir, que el vendedor quiere que el valor neto de su venta corresponda efectivamente el precio de contado. Solucin: Sitomamosapf(preciodefactura)comobasedecomparacin,esdecirquesehaceiguala100; entonces de ste total facturado le quedar el 7% a Credibanco Visa y el 93% le quedar al vendedor.Es decir, que el precio de contado que equivale al valor neto que quedar para el vendedor es el 93% del precio facturado, por lo cual aplicando la frmula de porcentaje de la pgina 22, tenemos: 25 100 *00 . 543 . 6093pf= ;Por tanto: pf = $ 65.100.00 2.2.5SupongaqueeljefedelServiciodeSaluddeunDepartamentodeColombia,quiereconocerla tasa de fecundidad para las mujeres de su departamento, ubicadas en el grupo de edad: 18 a 23 aos. Qu hecho importantedebetener encuentapara elclculo correspondiente,sipor razonesdeorden pblico fue imposible tomar la informacin sobre los nacimientos de dos corregimientos? Solucin: Si los nacimientos para ese grupo de edad en los dos corregimientos no son tenidos en cuenta para el clculo de la tasa de fecundidad, entonces, la poblacin de las mujeres de ese grupode edad en dichos corregimientos debe ser excluida, a fin de no subestimar la tasa. 2.2.6El precio de un artculo incluido el IVA del 16%, es de $168.200.00. Cual ser el precio antes del IVA? Solucin: Es claro que el precio antes del impuesto es la base de comparacin a la cual le ser aplicada la tarifa del16%, que quiere decir, que el precio que pagar el pblico es el 116% del precio antes de IVA que denominamosXyqueserelconsecuenteodenominador,mientrasqueelpreciodespusdedicho impuesto ser el antecedente o numerador. Segn la frmula de porcentajes, pgina 22: tenemos: 100 *00 . 200 . 168116X= ; Por tanto: X = $145.000.00 2.2.7Elsiguientecuadro,serefierealapoblacindeunpas,distribuidosegnreaurbanaorural discriminado segn alfabetos o analfabetos. Se pide transformar las cifras en proporciones porcentuales, tomando como base de comparacin la poblacin total. Se pide adems interpretar los resultados. POBLACIN TOTAL POBLACINTOTALURBANARURAL TOTAL1.000.000700.000300.000 ALFABETO800.000620.000180.000 ANALFABETO200.00080.000120.000 Solucin: COMPOSICIN PORCENTUAL DE LA POBLACIN POBLACINTOTALURBANARURAL TOTAL1007030 ALFABETO806218 ANALFABETO20 812 Interpretacin:

a)La poblacin urbana es el 70% de la poblacin total. b)El 62% de la poblacin total es urbana alfabeto. c)El 20% de la poblacin total son analfabetos.d) El 8% de la poblacin total es urbana analfabeta. etc. 26 EJERCICIOS PROPUESTOS PARA DATOS CUALITATIVOS 2.2.1 Un operario gast el 30% ms del tiempo normal para el ensamble de un artculo. Realmente gast 45 minutos. Cual es el tiempo normal de ensamble. Respuesta: 34.6 minutos. 2.2.2Qu porcentaje de 680 es 220? Respuesta: 32.4%. 2.2.3 El valor 20 es qu porciento menor que 70. Respuesta: 71.4% 2.2.4Uncompuestoqumicoesproducidoauncostode$1.020.00yvendidoen$1.430.00. Qu porcentaje del costo es la utilidad? Respuesta: 40.2% 2.2.5 Si el 25% de un nmero es 36; cual es ese nmero? Respuesta: 144. 2.2.6 Qu nmerodisminuido en 5% de si mismo es 133? Respuesta: 140 2.2.7Un fabricante vende un artculo ganando$1.200.00, lo cual representa el 22% de su costo. Cual es su costo? Respuesta: $ 5.454.55. 2.2.8Construyaunatabla,detalmaneraquepuedacalcularsobrelosdatoscontenidosenlamisma, tanto razones como proporciones, porcentajes y tasas. Haga las interpretaciones correspondientes. 2.2.9 El siguiente cuadro estadstico muestra las ventas de una compaa que distribuye tejas onduladas para techo de asbesto-cemento-celulosa (ACC) y tejas onduladas para techo de asbesto-cemento (AC).

VENTAS DE LA DISTRIBUIDORA DE TEJAS S.A (millones de pesos) 2.003 VENTASTOTAL4 PIES6 PIES TOTAL629.0270.8358.2 ACC400.4165.8234.4 AC228.6105.0123.6 a) Convierta la tabla de la referencia en un cuadro de porcentajes, de tal manera que los valores de la segunda fila (fila de total) sean todos 100. Interprete los resultados. b)Conviertalatabladelareferenciaenuncuadrodeporcentajes,detalmaneraquelosdatosdela segunda columna (columna de total) sean todos 100. Interprete los resultados. c)Conviertalatabladelareferenciaenuncuadrodeporcentajes,detalmaneraquelacelda correspondiente al valor 629.0, tome el valor 100. Interprete los resultados. 2.3 ANLISIS ESTADSTICO PARA DATOS CUANTITATIVOS Como vimos en la pgina 4, el anlisis es el quinto paso que sigue una investigacin estadstica y es el mediodelcualnosvalemosparainterpretarlosdatospreviaclasificacindestos.Laadecuada clasificacindelosdatoscuantitativos,selogramedianteunadistribucindefrecuenciasotablade frecuenciascuantitativa,queconsisteenunatabladedoscolumnasqueresumeelconjuntodedatos objetodeestudio,enunnmeroapropiadodeclasesocategoras(primeracolumna)yasociadasa 27 stas categoras en una segunda columna las frecuencias, o sea, el nmero de veces que se repite cada una de esas categoras. Cuando los datos cuantitativos recolectados son pocos, puede ser innecesario organizarlos y resumirlos enunatabladefrecuencias.Noobstante,sisetratademuchosdatos,esimportantetomarunaidea claradelconjunto,organizndolosenunordenascendenteyresumindolosenunadistribucinde frecuencias. Mediante la distribucin de frecuencias, se pierde el detalle de la informacin contenida en los datos. Es decir, a travs de la tabla, en lugar de conocer el valor exacto de cada uno de los datos, solo sabemos questospertenecenaunaclasecategoraointervalodeterminados.Ejemplo:Enladistribucinde frecuenciasparadatoscuantitativos,quecorrespondealcuadro2.1delapgina21,enlaprimera categoraclaseointervaloobservamosqueexisten23obrerosquetardanentre20y23minutosen producir la pieza mecnica. En estas condiciones, al producir la tabla, se pierde la informacin detallada, que nos muestra cunto tarda exactamente cada uno de esos 23 obreros. No obstante, el agrupamiento enunadistribucindefrecuencias,nospermiteobservardemanerarpidaysimple,aspectos importantes sobre la distribucin de los datos. Por lo tanto, lo que se pierde en precisin, se compensa ampliamente con la legibilidad. Con el fin de ver claramente la manera como se construye una tabla de frecuenciasparadatoscuantitativos,tomaremoslosdatosdelejemplo2.8quesepresentana continuacin, los cuales no solo sern resumidos en una tabla de frecuencias, sino que tambin, sern usados para calcular todas las medidas estadsticas que se estudiarn a lo largo de la presente seccin de ste captulo. EJEMPLO 2.8 Elsiguientecuadro,serefierealcontenidodegrasa(expresadoenlibras)de200frascosdeYoguren presentacinde2.5libras,referidosaunamuestraaleatoriaextradadeunlotede3.600frascos correspondientes a la produccin de un mes de la compaa LCTEOS S.A. Se pide construir una tabla defrecuenciasde6categorasycalcularloselementosauxiliaresrequeridosparalosclculos posteriores en el siguiente paso de anlisis estadstico. La muestra es representativa de la poblacin, lo cual garantiza un futuro proceso inferencial, como se observ claramente en las pginas 2 y 3. Cuadro 2.3 0.320.240.210.27 0.35 0.23 0.28 0.320.290.260.210.240.220.26 0.29 0.28 0.25 0.270.300.290.330.290.200.22 0.29 0.27 0.28 0.340.260.250.290.250.240.24 0.25 0.23 0.25 0.210.250.220.290.240.250.25 0.25 0.29 0.23 0.290.310.210.300.230.250.27 0.26 0.20 0.28 0.310.250.260.180.310.240.25 0.25 0.27 0.17 0.210.230.280.340.280.320.22 0.22 0.25 0.27 0.270.280.200.280.320.200.31 0.20 0.32 0.27 0.270.250.230.220.230.230.31 0.27 0.23 0.24 0.260.360.270.230.300.170.31 0.26 0.23 0.24 0.260.260.240.200.200.290.27 0.27 0.28 0.21 0.330.290.240.190.270.210.28 0.26 0.27 0.31 0.270.250.250.220.280.230.23 0.22 0.26 0.23 0.270.220.240.230.310.270.22 0.29 0.27 0.25 0.280.200.230.190.250.260.28 0.24 0.30 0.24 0.160.160.270.330.230.280.21 0.22 0.26 0.36 0.320.250.250.240.270.270.20 0.23 0.27 0.29 0.290.260.290.340.330.210.27 0.24 0.31 0.28 0.200.250.260.240.270.220.27 0.24 0.24 0.29 0.250.260.2528 2.3.1 CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS CUANTITATIVA Esimportantecumplirconalgunasnormasrelativasalaconstruccindeunatabladefrecuencias cuantitativa, pues la no aplicacin de las mismas puede conducir a graves errores de clculo durante la etapasiguientedeanlisisyposteriormenteenlaetapadeconclusioneseinterpretaciones.A continuacin nos referiremos a algunos conceptos relativos a las tablas y de paso aclararemos algunas delasreglasqueataenadichosconceptos.Simultneamenteconstruiremospasoapasolatablade frecuenciasquecorrespondealejemplodelcuadro2.3,relacionadoconelcontenidodegrasadelos frascos de yogur. Estospasos son los siguientes: 1) Calcular el Rango o recorrido, que simbolizamos por R y que equivale a la diferencia entre el mayoryelmenorvalordelconjunto.R=Xmximo -Xmnimo.Elrangoorecorridoparanuestro ejercicio de la compaa LCTEOS S.Asegn el cuadro 2.3 es: R = 0.36 - 0.16 = 0.20 libras. 2) Definimos el nmero de categoras, clases o intervalos y que simbolizamos por m.Algunos autores utilizan un nmero de categoras segn su criterio personal, pero de todas maneras, se sugierequeelvalordem,nodebesermenorde5,nimayorde20dependiendodequetan numerososeaelconjuntodedatos.Esimportantetambinaclarar,queentremenorseam, mayor probabilidad existir de incurrir en un mayor error de agrupamiento, concepto ste que se explicarmsadelante.Elnmerodecategoras,puedetambindeterminarse,aplicandola regladeSTURGESperostanoesdeobligatoriautilizacin.LafrmuladeSturgesesla siguiente:

m = 1+ 3.3 log n. Se entiende que n, es el nmero de datos de la muestra. Segn el cuadro 2.3: n = 200.Segn Sturges el nmero de clases o categoras para el cuadro 2.3 es: m = 1+ 3.3 log (200) = 8.59 = 9 Para nuestro ejemplo de la compaa LCTEOS S.A, utilizaremos6 clases o categoras, Es decir m=6. No utilizaremos la regla de Sturges por no ser esta de forzoso uso. 3)CalculamoseltamaodeclasequesimbolizamosporCyqueserefierealcampode fluctuacin de la variable en cada categora. La frmula para calcular el valor de C es:

mRC = Para el ejemplo de la compaa LACTEOS S.A:03 . 0620 . 0= = C 33 = 0.03libras. Esimportanteaclarar,queelvalordeltamaodeclase,debeconservarelmismonmerode decimalesquelosdatosoriginales.Observemosqueelvalorde0.0333seaproxima0.03, puesto que los datos originales segn el cuadro 2.3, contienen dos decimales. 4)Registramoslascategorasosealosdiferentesvaloresquetomarlavariableenestudio. Estas categoras se llaman tambin clases, casillas o intervalos y son la base para el conteodelosdatosyocupanparatalfinlaprimeracolumnadelatabla.Cadacategora contiene un lmite inferior y otro superior, comopuede verse en el cuadro 2.1pgina 21 as:Losvalores20,24,28,etc.sonlmitesinferiores,mientrasque23,27y31,etc,sonlmites superiores.Losanterioreslmites,sedenominanlmitestericos,loscualesdebenservalores enteros si los datos originales del conjunto son enteros, de lo contrario, los lmites tericos deben conservarel nmero de decimalesde dichosdatos originales.Para