Jesus de La Rosa - Estadistica Psicopedagogica
Click here to load reader
-
Upload
quinque-prado -
Category
Documents
-
view
215 -
download
74
Transcript of Jesus de La Rosa - Estadistica Psicopedagogica
Psicopedagógica
JESUS DE LA ROSA
JESUS DE LA ROSA
EstadísticaPsico- Educativa
Publicaciones de la Universidad Autónoma de Santo Domingo
Vol. CCCIX
COLECCION EDUCAr.ION y SOCIEDAD No. 19
ESTADISTICA PSICOPEDAGOGICA
Jesús de la Rosa
@ 1982Editora de la VASDApartado Postal No. 1355Santo Domingo. República Dominicana
Btdícatoría
A mi esposa Yolanda
Revisión Técnica,Corrección y Prólogo:
DRA. JOSEFINA PADILLACatedrático de Estadística
de la Universidad Autónomade Santo Domingo.
ESTADISTICAPSICO--EDUCATIV A
JESlJS DE LA ROSA
prtStlltadónEsta obra es un texto de suma utilidad para psicólogos, educado
res y estadísticos. como también para los estudiantes de esas carreras,en el campo de la Estadística.
En una admirable combinación, el texto ESTADIST/CA PSICOEDUCA TlVA, de Jesús de la Rosa. cubre la generalidad de los temasbásicos de los programas de Estadistica de las carreras de Pedagogtay Psicologia de la Universidad Autónoma de Santo Domingo.
Está elaborado teniendo en cuenta que los psicólogos.r los educadores no necesariamente son matemáticos, pero que sus tareas requierende la ayuda Estadistica, ciencia imprescindible tanto para el uso de lasmodernas técnicas de investigación como para la comprensián J' explicación de muchos textos.
Cada cap úulo está complementado COII ejercicios que facüüan elaprendizaje; al filial se ofrecen apéndices sobre re~'isión de los COIIC('lr
tos y tablas matemáticas que más se aplican a la Estadtstica.
Jesús de la Rosa presenta en forma sencilla .1' clara los principalesmétodos estadtsticos ." de mcdícion, circunstancia que hace a esta obra[ácihnente comprensiva Y bastante práctica,
Todas estas caractcrtsttcas, reunidas sorprendentemente ('/1 1/1/ (ex(o, hacen que el mismo sino o 1(L~ personas que S(' inictan ('/1 el estudio
12 JESUS DE LA ROSA
de Estadistica, como tU/II!Jh;1I a maestros r dircit- .ns lit cscucla-: detodos los niveles, psicúlogr», 01'1<'11tadorcs c incluso -tudisticos.
DI'. JACOBOlll(IQLFn
lntl RutorEste libro fue escrito para estudiantes de carreras pedagógicas y de
psicología que se inicien en el estudio de la Estadística, por lo que se haintentado presentar los principales cálculos o medidas estadísticas de lamanera más sencilla posible.
Hemos obviado la teoría y demostración de las medidas estadísticas por considerar que nuestros objetivos son lograr del lector el aprendizaje del calculo cst ad rstico. Creemos que el abordar temas con demostraciones y cálculos matemáticos de niveles superiores, limitaría el campo de lectores para qu icncs este' libro está destinado. como son los principiantes en esta disciplina y los profesionales de otras áreas del saberque han tenido poco contacto con la Estadística.
La Estadística no presenta gran dificultad ..le comprensión, sólorequiere para su aprendizaje estudiarla progresivamente, de tal maneraque para pasar a un sc'¡!undo tema se haya comprendido a satisfacción eltema que antecede. ls por ello que r..-comcndumos la realización de loscjcrcicio« que se presenten al final dL' cada tema y su aplicación a losmúltiples ejemplos o Situaciones que SL' presenten en seminarios y tra.iajos dI' invcst igación
El libro abarca, en 18 capítulos. los programas de Estadística paraPsicólogos I y Estad ist ica para Psicólogos 11. asi como el Programa deEstadtstic« (;C'nL'r;i1. Ilíe!,"s capítulos comprcudcn: nociones gcncrulcsde la tabulación lll' datos. representación gráfica de los mismos. medidas
de tendencia central y variabilidad. cálculo de probabilidades, regresióny correlación. predicción, escalas de pruebas. inferencia estadística.muestra y muestreo, pruebas de sjgnificación estadística. intrcducción
13
14 JESUS DE LA ROSA
al análisis de varianza, diseño experimental y el capítulo ]8 dedicadoa la computación, como una introducción a sus técnicas y procedimientos aplicados a la estadística descriptiva.
Hemos elaborado un apéndice para facilitar la comprensión teórica y práctica, con símbolos estadísticos; un glosario de los principalestérminos de estadística; un formulario básico, y las tablas estadísticasde mayor uso.
Este líbro, no es, por supuesto, un tratado exhaustivo de estadística: nos falta mucho por conocer de esta disciplina para tal pretengión,pero creemos que es básico y necesario para comenzar el estudio de lamisma.
Deseo expresar mi agradecimiento a Rosa González por haber empleado, sin interés alguno, su tiempo libre en mecanografiar el manuscrito. A su vez a mi compañera de lucha y colega Ora. Josefina Padillapor el constante estímulo que me proporcionó en la preparación delpresente volumen,
Por último, mi eterna gratitud a Don Antonio Guzmán por darmelas oportunidades de trabajo que ofrecen la tranquilidad y sosiego necesarios para escribir un libro.
Junio, ]980.
JESUS DE LA ROSACatednUíco
Departamento de EstadisticaUniversidad Autónoma de
Santo Domingo.
'AITIIESTADISTIClIESCIIPIIVA
¿QUE ES LA ESTADISTICA?
1.1 CONCEPTOS PREVIOS
1.1.1 POBLACION, ELEMENTOS y CARACTERES:
Conjunto de objetos (realmente existentes o posibles) que verifiquen una definición bien determinada. Por objeto entendemos cualquierpersona, animal, cosa, operación, familia, institución, etc. Asi por ejernplo, constituiría una población los universitarios dominicanos, las familias cibaeñas, las neveras fabricádas al año por cierta industria, los posibles lanzamientos de un dado.
Es obvio que toda investigación ha de estar necesariamente refería un conjunto o colección de personas o cosas. Ese conjunto o colec
ción es lo que se denomina población. En materia de Estadistica, eltérmino población tiene un significado mucho más amplio que el usual,ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo.
Las personas o cosas que integran la población se denominan elementos. En sentido estadístico, un elemento puede ser algo con existencia real, como un carro o una casa, o algo más abstracto como un voto,la temperatura, o un intervalo de tiempo. Los elementos pueden coincidir con unidades naturales, como obreros o turistas, o pueden ser creados artificialmente al sólo propósito de la investigación. Un ejemplo deelementos artificiales se tiene al estudiar un campo sembrado de trigo,en cuyo caso una práctica habitual es dividir el campo en cuadrados orectángulos; esos cuadrados o rectángulos constituyen los elementos dela población. Otro ejemplo lo proporciona el estudio de un fenómeno
17
1S JESUS DE LA ROSA
a lo largo del tiempo, tal como el número de turistas que vienen a laRepública Dominicana; los elementos de la población son en ese casolos intervalos de tiempo que se tienen como unidad (el día, la semana,el mes, el año).
Los elementos de la población, además, pueden ser lo que ordinariamente se conoce por una entidad simple-- un hombre __ o unacantidad compleja __ una familia __ .
El tamaño de la población es un factor de gran importancia en lainvestigación estadística. Ese tamaño viene dado por el número de elementos que integran la población. Así, ésta es finita cuando el númerode elementos es finito, e infinita cuando consta de infinitos elementos.
Los elementos de la población poseen ciertas propiedades, rasgoso cualidades,que denominaremos caracteres. Así, por ejemplo, el hombre tiene unos caracteres llamados estatura, peso, edad, estado civil, religión, profesión, ingresos, formación cultural, estado sanitario, etc.
La vivienda, otro ejemplo, tiene los siguientes caracteres.situación, número total de habitaciones, habitaciones interiores y exteriores, clases de servicios (cocina, energía eléctrica, agua corriente, baños,etc.),
La investigación estadística, relativa a unos elementos determinados no acostumbrafconsiderar exhaustivamente todos sus caracteres.Por una parte, porque corrientemente el numero de caracteres distintos pueden ser excesivamente grandes, y por otra, porque siempre lainvestigación va dirigida a una cierta dirección que es la que interesaal investigador. Por ejemplo, la población humana puede estudiarse desde los puntos de vista demográfico, biológico, económico, cultural, social, etc.; en cada caso se seleccionarán los caracteres más adecuados alo que se desea investigar. Por tanto, la selección de los caracteres quevan a someterse a investigación es de capital importancia para el éxitode dicha investigación.
Deberá observarse que la investigación estadística se centra en ungrupo de caracteres que necesariamente han de ser comunes a todos loselementos de la población. O dicho de otro modo, los elementos de lapoblación pueden incluso ser totalmente heterogéneos, con tal que posean en coman todos los caracteres sometidos a estudio. Un ejemplo
ESTADISTICA PSICO-EDUCATlVA 19
se tiene en la investigación estadística del número de libros que exportamos; el carácter común usualmente considerado en esta investigaciónes el valor de los libros que pasan por las Aduanas; los elementos (libros)gozan como bien es sabido, de gran heterogeneidad, ya que incluyenpor ejemplo, libros de textos, libros de consultas, libros de matemáticas, libros de Química, etc.
1.12 MUESTRA
Cualquier sub-conjunto de una población. La muestra-hace siempre referencia a una población de la cual es parte. Así por ejemplo, constituiría una muestra de las anteriores poblaciones; 200 universitarios dominicanos, 100 familias cibaeñas, 200 neveras, 80 lanzamientos de undado.
Supongamos que observamos una característica de los objetos deuna población. Por ejemplo, consideremos el peso de los universitariosdominicanos (población). Tendremos una población de dbservaciones yuna población de números. Paralelamente, observando la altura de unamuestra de universitarios dominicanos, tendremos una muestra de observaciones y una muestra de números.
Es claro que, dada una misma población de objetos, podemos tener diversas poblaciones de observaciones y, consiguientemente, diversaspoblaciones de números, segun que estudiemos una u otra característica. Así, con los mismos universitarios dominicanos, podíamos haberconsiderado su peso, su capacidad intelectual, su actitud frente a losconflictos sociales, etc.
1.1.3 PARAMETRO
Toda función definida sobre los valores numéricos de una población. Así por ejemplo, será parámetro la media aritmética de las entradas mensuales de todos los universitarios dominicanos que realizan labores, pues dicha media aritmética no es rp:ls que la suma de las entradas mensuales de la población de universitarios dominicanos divididapor el número de éstos, es decir, una función definida sobre los valoresnuméricos de la población.
20 JESUS OE LA ROSA
1.1.4 ESTADlSTICO
Toda función definida sobre los valores numéricos de una muestra.Así por ejemplo, será estadístico la media aritmética de las entradasmensuales de una muestra de 300 universitarios dominicanos.
1.2 DEFINICION DE ESTADISTICA
Ciencia que recoge, ordena y analiza los datos de una muestra, extraída de cierta población, y que, a partir de esa muestra, valiéndose delCálculo de Probabilidades, se encarga de hacer inferencias acerca de lapoblación.
Ordinariamente, las inferencias versarán sobre los parámetros dela población a partir de los estadísticos de la muestra. Pero, también, haremos inferencias acerca de la forma de la distribución de la población,a partir de la forma de la distribución de la muestra. En cualquier caso,las inferencias estarán basadas únicamente en la información objetiva,contenida en la muestra y no en otras fuentes extrañas a la misma. Estapostura es la llamada "Clásica", cuyo exponente máximo ha sido Ronald Ayrner Fisher (1890-1962 l. Nos limitamos a este punto de vistaclásico por una doble razón. En primer lugar, sólo con una base sólidaen estadística clásica es posible acceder a otros puntos de vista como elbayesiano o el de la teoría de la decisión. En segundo lugar, ni la estadística enfocada bayesíanarnenre. ni la teoría de la decisión puedenpresentar hoy un cuerpo de doctrina tan estructurado como el que presenta la estadística clásica. Además, el enfoque clásico, hoy por hoy. esmucho más útil en la aplicación a las prácticas psicológicas y pedagógicas que los otros dos enfoques.
Conviene distinguir desde ya, entre Estadística, estadísticas y estadístico.
a) Estadística es la ciencia acabada de definir.
b) Estadísticas son los resultados numéricos obtenidos mediante laEstadística: número de profesores que tienen títulos universitarios, número de accidentes registrados en transporte tic escolares,proeorción de personas no alfabetizadas. etc.
ESTADISTICA PSICO-EDUCATIVA 21
e) Estadístico es todo valor numérico obtenido a partir de los valorespresentados por una muestra, según lo dicho anteriormente.
Por supuesto, estadístico como sustantivo es, también, usado paradenominar a la persona dedicada a la Estadística. Como adjetivo es utilizado para calificar personas y cosas relacionadas con la Estadística.
1.3 DlVISION DE LA EST ADlSnCA
Según la definición acabada de dar en el párrafo anterior, la Estadística consta de dos partes fundamentales:
a) Recogida, ordenación y análisis de los datos de una muestra.
b) Verificación de inferencias acerca de la población (de sus parámetros, de la forma de su distribución), a partir de la muestra (de susestadísticos, de la forma de su distribución).
La probabilidad es la fuente que nos permite pasar válidamente dela muestra a la población, que legitima el salto desde las características(conocidas) de la muestra a las características (desconocidas) de la población.
La primera parte constituye la Estadística Descriptiva, cuyo cometido es describir una muestra. La segunda parte constituye la Estadística Inferencial, cuyo cometido es hacer inferencias sobre la población,a partir de la muestra.
1.4 BREVE RESEI'il"A HlSTORICA
El origen de la Estadística, en cuanto se refiere al concepto simplista de representación de los hechos mediante resultados numéricos,se remonta a los albores de la humanidad, al mismo instante en que concibiera el hombre la cantidad y el número.
El hombre primitivo que vivió en las cavernas y que se sostenía de
22 JESUS DE LA ROSA
la caza, la pesca y las frutas, debió comprender con ello la cantidad necesaria que debía de adquirir para atender a sus necesidades.
Cuando todavía el hombre no había constituido organización social, ni conocía los caracteres de la escritura, tenra ya un conocimientode la cuantía de las cosas que intervenían en su vida, tal como el número de los miembros de la familia, de la tribu, sus ganados, utensilios, frutas, etc.
Tan pronto se constituyen las sociedades humanas, todo aquelloque satisface una necesidad primaria fundamental, aparece inmediatamente, así en las páginas más antiguas de la historia encontramos ya,trabajos estadísticos.
Tanto los historiadores como los comentaristas, convienen en parte, en que China (23 siglos antes de Cristo), o sea, en el año 2238 antesde la Era Cristiana, el Emperador Yao mandó a levantar un censo general. Otros documentos encontrados han demostrado que se hacían investigaciones estadísticas bastante completas sobre la población y el territorio. Pero ya en esa fecha los egipcios acostumbraban a enumerar lapoblación, puesto que en el año 3,000 A.C. hubo que hacer un recuento de la población con motivo de la erección de las pirámides, y asítambién lo confirman los jeroglíficos, herramientas y otros utensiliosencontrados en las excavaciones practicadas en las tumbas de los faraones.
En la India, la Estadística llegó a alcanzar un alto nivel de organización dos siglos antes de la Era de Cristo, especialmente la EstadísticaAdministrativa.
En Babilonia y Asiria también se practicó la Estadística de un modo bastante preciso, ya que ellos tenían conocimiento de las riquezasdel país y controlaban rigurosamente los impuestos.
También la Biblia, el documento más antiguo que se conoce, menciona curiosas clasificaciones que comprueban la verificación de censosy recuentos.
Los griegos efectuaban enumeraciones periódicas de sus ciudadesy conocían la cuantía de sus bienes, as! como también los cartaginesesy fenicios; los unos tenían ejércitos organizados, los otros prosperaronenormemente con el comercio marítimo. Pero en realidad no existióuna regularidad que permitiera establecer los principios normativos.
ESTADISTICA PSICO-EDUCAT1VA 23
En el Imperio Romano fue Servía Tulio (578-534 A.C.) el primeremperador que estableció que el censo constituía la base constitucionaldel Estado, y esta misión tan delicada estaba a cargo de una de las dignidades oficiales. El censo se hacía con el recuento de los ciudadanos, esclavos, ejército, etc., y se llevó con regularidad hasta la caída del Imperio. Tenían los romanos un registro de nacimientos, matrimonios y óbitos, del cual se encargaban los sacerdotes.
En América, antes del descubrimiento, ya existe la Estadistica; losadelantos encontrados especialmente en los imperios de los incas y aztecas, no dejan lugar a dudas. Tanto los incas como los aztecas conocíanperfectamente la población de sus ciudades, el número de nacimientos,el número de defunciones, el número de guerreros, la cantidad de aprovisionamientos, etc. Apesar de que no conocían la escritura moderna, niel papel, se valían de curiosos sistemas de registro para conservar dichosdatos.
En la Edad Media, la Estadística fue nula casi por completo, conla caída del Imperio Romano y las continuas guerras entre los señoresfeudales, aesapareció casi totalmente la regularidad de los censos. Sinembargo, .en el Imperio de Carlomagno (742-814), volvieron a aparecer los censos cuando dicho emperador pretendió reconstruir y consolidar el poder central sobre el feudalismo, pero sólo se persiguió con elloun fin fiscal, También los árabes durante su dominación en España, hicieron varios censos de población y recopilaron datos estadísticos sobreel territorio las fábricas, número de trabajadores, número de libros quehabía en las, bibliotecas y muchos otros. Al final de la Edad Media secomenzaron a .hacer las primeras investigaciones estadísticas, con el resurgimiento de !o,s Estados fuertes y con el auge de las repúblicas italianas, especialmeate Venecia, Florencia y Génova, llegándose a considerar la Estad istica 00.1)10 una necesidad imprescindible para el Estado.
En la Edad Moderna eon .llj.. invención de la imprenta y el uso delpapel, se hicieron con más frecuencia investigaciones estadísticas, comotambién tuvo una mayor divulgaéión, y en el siglo XVI comenzaron apublicarse los primeros libros que contenían en pequeña cantidad datosnuméricos sobre los Estados, tomados en fuentes oficiales.
Los estudios estadísticos empiezan á hacerse frecuentes, con datossobre población, producción, potencia militar, artes, finanzas públicas,etc. Dando lugar a que se consideren tales estudios como la expresiónde una nueva técnica que se denominó Estadística, relacionándola mástarde con la Política y la Economía.
24 JESUS DE LA ROSA
La Estadística se estructuró como disciplina científica, en el siglopasado, aunque como vimos, ya se conocía y se aplicaba en forma rudimentaria desde la antigüedad.
La configuración actual de la Estadística significa la culminaciónde un proceso en el que pueden distinguirse, como primordiales, cuatroantecedentes que se desarrollan en forma independiente y luego confluyen mediante la obra de Laplace y sus continuadores, hacia un solocuerpo de doctrina y una metodología. A continuación nos referimosa estos cuatro antecedentes, presentándoles en el orden cronológico queles corresponden:
1) Ya en las civilizaciones antiguas se realizaban relevamientos estadísticos, por cierto de carácter rudimentario. En Egipto, debido alas innundaciones del Nilo, se efectuaban anualmente trabajos catastrales y censales, que permitían conocer el reparto de la propiedad y de los bienes para que fueran restituidas, después de lasinnundaciones. En la Biblia hay referencias de censos al pueblo hebreo. También se sabe que los griegos levantaban censos demográficos y de la propiedad. En la época del Imperio Romano, fue neocesario realizar, en forma periódica y sistemática, censos de bienesy personas de los pueblos sometidos al Imperio, con el objeto deaplicar el régimen de impuestos.
En la época moderna, la técnica censal adquirió un gran desarrollo,llegando a constituirse en eficaz auxiliar de las tareas de gobierno,particularmente en Alemania, en donde ya en el siglo XVIII se ensellaba en las universidades. Uno de los profesores de la Universidad de Goetingen, Achenwall (1719-1772), fue, al parecer, quienintrodujo la palabra "Estadística", atribuyendo a este vocablo elsiguiente significado "Ciencia de las cosas que pertenecen al Estado", llamando Estado a todo lo que es una sociedad civil y al paísen que ella habita, con todo lo que se encuentra de activo y deefectivo; "la Estadística se ocupa de los fenómenos que puedenfavorecer o defender la prosperidad del Estado", y agrega: "lapolítica enseña cómo deben ser los Estados, la Estadística explicacómo son realmente".
Esa defmición condensa el pensamiento de la corriente conocidacon el nombre de "Estadística Universitaria", caracterizada por considerar la Estadística como un método descriptivo que consiste enel recuento de datos, y está creada para servir las necesidades delos Estados.
ESTADISTICA PSICO-EDlJCATlVA 25
2) El segundo antecedente histórico lo encontramos a mediados delsiglo XVII. Los estudios estadísticos reciben un aporte de sumaimportancia que puede considerarse como el punto de partida dela estructuración actual de la Estadistica, como método de investigación de los fenómenos colectivos. Nos referimos a los trabajosrealizados por John Graunt (1620-1674), un vendedor de pañosen Londres; logró efectuar estudios que le permitieron descubrir,por inferencias, relaciones y leyes demográficas de validez permanente, llegando incluso a estimar en buena aproximación, porcamino indirecto la población de Londres y otras ciudades inglesas.La importancia de estos estudios radica en que se establece la posibilidad de obtener leyes que rijan el comportamiento de poblaciones numerosas, frente a atributos tales como son los demográficos, económicos y sociales. En los trabajos de Graunt, ya se insinua lo que habría de constituir el fundamento de los métodos inferenciales actuales, que han dado a la Estadística la posibilidad deestudiar los fenómenos colectivos, y que constituyen el capitulo másinteresante de esa disciplina y uno de los métodos de investigación más potentes con que cuenta el investigador moderno de lasciencias humanas y también de las ffsico-naturales. Graunt es, porlo tanto, el verdadero precursor de la Estadistica en nuestrostiempos.
Numerosos discípulos continuaron la obra de Graunt, debiendocitarse particularmente a William Petty (1627-1687) y a Süsmilh(1707-1767). El primero fue el continuador, en Inglaterra, de laobra de Graunt; en su obra principal Aritmética Política, dió numerosas aplicaciones del método de Graunt, contribuyendo a difundirlo en Inglaterra. Süsmilh, sacerdote alemán, fue tambiénadmirador y continuador de Graunt; escribió "la obra titulada Orden Divino, en la que trataba de dar una explicación mística delmétodo de Graunt, efectuando al mismo tiempo, interesantes contribuciones matemáticas ;;1 método y colaborando en forma muyeficaz al conocimiento y difusión del mismo en el continente europero.
Sintetizando diremos, que la obra de Graunt y sus continuadores,constituyen el verdadero punto de partida de la orientación de laEstadistica como método de investigación de los fenómenos demasa.
3) Paralelamente al desarrollo de la Estadística, como disciplina cien-
26 JESUS DE LA ROSA
tífica, pero en forma independiente, se desarrolló, a partir del sigloXVII, el Cálculo de Probabilidades. Sus iniciadores son los maternaticos italianos y franceses de ese siglo, particularmente Fennet yPascal, quienes iniciaron los estudios del Cálculo de Probabilidades,tratando de resolver problemas de juegos de azar propuestos por elCaballero de Méré,
Poco a poco, otros matemáticos y posteriormente los del sigloXVIII, fueron interesándose por esta clase de estudios y ampliando los resultados, hasta que Santiago Bernoulli (1654-1705),obtuvo el teorema que se conoce con su nombre y que permitióestructurar el Cálculo de Probabilidades como disciplina orgánica.A fines del siglo XVIII y 'principios del siglo XIX, los trabajos deLaplace permitieron dar su definitiva estructuración al Cálculode Probabilidades; en su obra "Ensayo Filosófico sobre Probabilidades" (1814) y "Teoría Analítica de la Probabilidad" (1818).completó la obra de Bernoulli y sus continuadores, proveyendo alCálculo de Probabilidades, de recursos matemáticos que habrían dellevarlo, mediante la obra del propio Laplace y de otros matemáticos como Poisson, Gauss, etc., a un grado de perfeccionamientoque lo ha hecho apto para las aplicaciones a diversos campos dela ciencia y muy especialmente de la Estadística.
A partir de Laplace, las dos disciplinas, Cálculo de Probabilidadesy Estadística, que hasta entonces habían permanecido separadas,se fusionan de manera tal que el Cálculo de Probabilidades se constituye en el andamiaj e matemático de la Estadística, mediante elcual ésta puede tomar el impulso teórico que habría de llevarla alextraordinario desarrollo y perfeccionamiento que alcanzó en elsiglo pasado y en el presente. El impulso que llevó al estado actualde desarrollo del Cálculo de Probabilidades, producido entre finesdel siglo pasado y principios del presente, se debe principalmentea la labor desarrollada por matemáticos franceses, soviéticos y norteamericanos, con la colaboración de matemáticos alemanes, ingleses e italianos.
4) Conjuntamente con el Cálculo de Probabilidades y ligado a él, sedesarrolló la teoría de los errores, especialmente por obra de Gauss,Bcsscl y el propio Laplacc. quienes llegaron a establecer el método de los números cuadrados, como procedimientos matemáticopara resolver el problema fundamental de la teoría de los errores.
ELdesarrolló de la teoría de los errores es un valioso antecedente
ESTADISTICA PSICD-EDUCATlVA 27
de la Estadística, ya que sus conclusiones y métodos sirvieron demodelo a los trabajos que posteriormente realizaron Quetelet yotros estad ísticos del siglo pasado.
Más propiamente, diremos que la teoría de los errores constituyela primera urna de la Estadística que pudo constituirse con unaestructuración teórica matemática.
A partir de la obra de Laplace y Gauss, la Estadística adquirió,al promediar el siglo pasado, un gran impulso, por obra de varioscreadores, entre los cuales merece especial atención Adolfo Quetelet, astrónomo belga que trabajó durante muchos años realizandonotables aplicaciones estadísticas y con ellas abrió, para esta disciplina, un campo muy vasto de probabilidades, tanto en cuestionessociales, demográficas y económicas, como en ciencias biológicascuestiones climáticas, antropológicas, etc. '
En todas ellas, Quetelet realizó notables aplicaciones, llevando laEstadística a constituirse en un método de investigación de los fenómenos colectivos y en un auxiliar valioso en problemas del gobierno, ya sean económicos, sanitarios, demográficos, etc. Entrelas numerosas obras de Quetelt, merece citarse: "Sur L'Hornrne"(1835).
En esta época la Estadística se circunscribía al capítulo que hoyconocemos como serie de frecuencias, y dentro de ese capítuloúnicamente se utilizaban las aproximaciones mediante la funciónnormal de Gauss.
Lexis, estad ístico alemán de fines del siglo pasado, amplió losestudios de Ouctelet, probando que no era solamente la curvanormal la que podía servir de modelo a una serie de frecuencias.
Esta corriente de ideas fue luego desarrollada y completada por lostrabajos de numerosos investigadores, entre los que cabe destacara Pearson y Charlier.
Iniciadas por la Escuela de Estadística Inglesa y luego continuadasen otros países. se desarrollaron entre los últimos años del siglo pasadoy lo que va del presente. los sectores modernos de la Estadística, y.conjuntamente con la teoría de las aplicaciones. dando como resultadoque esta disciplina llegara a constituirse en uno de los métodos más potentes de investigación. tanto en las ciencias sociales como en las físicas naturales.
28 JESUS DE LA ROSA
Los capítulos más importantes dé la Estadistica moderna son.además del ya citado de la serie dé frecuencia.s, la teoría de la correlacióny regresión, la teoría de las muestras y la tconu de las series de tiempo yde los procesos estocásticos. Estas teorías tuvieron iniciación en los trabajos de la Escuela Estadística Inglesa, debiendo citarse, especialmentedentro de ella los nombres de Galton, Pearson y R.A. Fishcr, cuyos trabajos marcan el punto de partida de las corrientes de investigación quellevaran a la Estadística al alto grado de desarrollo en que hoy Séencuentra. Los tres actuaron sucesivamente: Galton creó, entre otras tcorras, lade regresión, que con la de correlación. creada por Pearson, constituyeuno de los capítulos más fecundos en las aplicaciones dé la Estadística.En los últimos años del siglo pasado, y más intensamente en los primeros del p-resente, aparecieron los trabajos de Pcarson, que configuranuna obra variada y muy extensa dejando estampado el sello de la genialidad en todos los capítulos de la Estadística; perfeccionando teoríasexistentes y aportando numerosas creaciones, entré las que citaremos.por su importancia, el sistema de curvas que lleva su nombre, para el estudio de las series de frecuencias; el aporte capital que constituye suteoría sobre pruebas de significatividad y otras contribuciones que sirvieron para configurar la estructura de la teoría de las muestras, teoríaque se estructuró a partir de sus trabajos y los dc sus discípulos.
Discípulos de Galton, Pearson y Fishcr en Inglaterra y otros paíseshan aportado importantes colaboraciones, especialmente en los EstadosUnidos, Suecia, Francia, Unión Soviética y Alemania.
Se ha llegado así al estado actual en donde en todas las naciones,científicamente desarrolladas, se trabaja intensamente en el desarrolloteórico de la técnica Estadística y en ampliar los campos de aplicaciónde ésta.
1.5 HISTORIA DE LA ESTADlSnCA EN LA REPUBLICA DOMINICANA
La estadística apareció en la isla de Santo Domingo desde los primeros días del descubrimiento; existen pruebas de los diferentes censoso recuentos realizados en varias épocas por los conquistadores. Hay datos que confirman también, que desde los primeros días de la conquista, los españoles conocían el número aproximado de la población, así,el Padre Las Casas nos dice que en la Isla había tres millones de habitantes a la llegada de las naves colombinas, a pesar de que se ha disentidomucho sobre la exageración de esta cifra, porque ya en 1614 sólo que-
ESTADISTICA PSICO-EDUCATIVA 29
daban 14,000 indios, los historiadores se resisten a dar como buenas lascifras de Las Casas, pero no pueden demostrar lo contrarío, puestoque no hay documentos al respecto, pero s( los datos obtenidos nosconfírman que hubo censos y recuentos de la población, que es lo queinteresa hacer constar en este caso.
Hacía el año 1517 se estimó la población de la colonia en 60,000almas, pero en ese mísmo año quedó reducida a la cuarta parte debidoa una epidemia de viruelas, En el año 1533 no había más de 50,000habitantes. La población aumentó hacia 15::;5, según se desprende delos documentos de esa época, pero comenzó a decaer debido a las incursiones marítimas. En el año 1564 la colonia entera no tenía más de30,000 hahitantes. Su comercio y su agricultura se encontraban en estado ruinoso, motivo que dio lugar a que sus moradores emigraran enmasa a otros pa (ses. Así pasó el tiempo y la isla de Santo Domingo,ca,j olvidada de la Madre Patria. agonizaba en su perenne cstancarniento. podernos comprobarlo sí cxarninaramos el censo de 1606: a con tínuacion copiumo-, parte de él para su mejor ilustración:
"Testimonto de Cuantos Lugares lla, 1:'11 Esta Isla: Cuantos"ecillos: Cuantos Esclavos, Cuantos Ingenios, Cuantos Hatos: CuantasEstancias de Gcngibre; Cuantas de Comida l' Cuantos Puertos en estaCosta desde .,1://0 hasta Higucv ".
'TI/ la Ciudad de Santo Domingo, el dos c/c Octubre de Mil Seiscielitos l' Seis años el Sr, DOII Antonio Ossorio, t uballero de la OrdenMtlitar de Santiago, del Consejo del Rcv. Xucstro Señor, Sil Presidenteen la Real Cancilleria de esta Ciudad de Santo Domingo, Gobernadory Capitán General en esta Isla Española, etc. etc., dijo: que informar alRlT. ,\l/estro Señor, l' SIl Real Consejo de Indios mundabá v mandó que)"f'í el escribano de' por testimonio 1'11 manera qu« hago P, de cuantoslugares hay ('11 esta isla ,1' los vecinos qucliav ,'11 ellos, ,1' 1'1/ esta dichaCiudad, r 1",1 Ingenios. estancias r hatos de vacas (IU(' hav en dicha isla, ,1' cun tulud de csclavosv distancia de leguas IIUl ha)' desde Santiago alos 11lIl'fIOS muritimos r a dicha ciudad. ,1' de los puertos de mar que haydesde dicha villa de :1:lIa a esta Ciudadv purrt«¡ de lligucv. ,1 as¡' luproveyo ,1' mando a firmar DOII .Yntonu, Ossorio. ante /11(, t.uspar deAzpichuctu, escribano, En cumplimiento de 1" cual, lO el dicho Gasparde Azpichucta, escribano. dov ft; ,lO vcrdodero tcsttmonio 1'11 esta dichuisla)' las ciudades i villas v lugares siguientes"
I'CUJ[() DL 1..1 ISLl 1:.'>'1' lS0LI
"La Ciudad de Santo l unningo. la Ciudad de I.a J'ega, III Ciudad de
30 JESUS DE LA ROSA
620
San Antonio de Monte Plata; la Villa de Higuey, la Villa de Azua; laCiudad de Santiago, la Ciudad de San Juan Bautista de Vayaguana, laVilla de Cotuy , la Villa del Ceybo; la Villa de Boyá":
Vecinos de Santo DomingoPrevendador de la IglesiaCatedral y Clérigos ~
TOTAL , 648
Vecinos de Santiago de losCaballeros 150Clérigos _~
TOTAL 155
Vecinos de la Ciudad deLa Vega 38En esta Ciudad hay IglesiaCatedral y en ella dosPrevendados 2TOTAL o ••••••••••••••••• . . 40
Vecinos de San Juan BautistadeBan 115
Vecinos de San Antonio deMonte Plata 87
Vecinos de la Villa de Boyá 13
Vecinos de la Villa de Higuey 22
Vecinos de la Villa de Ceybo 7
Vecinos de la Villa de Azua 46
Vecinos de la Villa de Cotuy 24
Nota: Debe tenerse en cuenta que el término Vecino supone el Jefe de laFamilia, por tanto el número que señala la cantidad de vecinos no debenunca considerarse como el total de las almas o habitantes que poblaronesos lugares, los cuales, en este caso, pueden calcularse como términomedio a razón de cuatro almas por cada vecino. (Establézcase una
ESTADISTICA PSICD-EDUCATIVA 31
proporción de acuerdo con el número de almas que figuran en relación a los vecinos de 1812).
En el año 1812 se realizó otro censo para elegir diputados a las CortesEspañolas de acuerdo con los artículos 38, 39, 40, 41, 42, 43, 44 delCapítulo 3ro. Título 3ro. de la Constitución Política de la MonarquíaEspañola en Santo Domingo, Noviembre 26 de 1812. Arrojando lascifras siguientes:
60-012 Almas11-984 Vecinos
386 Compromiso60 Electos de la Parroquia
(Del archivo de San Juan Bautista de Bayaguana, Libro 8, Censode 1812). También existen varios censos regionales, efectuados por losCabildos de las Provincias respectivas, como por ejemplo: El de SanCristoba!, Santiago, y otros más, y sobre todo el de Monte Plata, delque he hecho mención.
En nuestro país no se instaló una oficina de Estadística Oficialsino mucho tiempo después de nuestra independencia. Sin embargo,aparece un Archivo de Monte Plata en el año 1821 un acta que nos diceque al Ayuntamiento de aquella común gastó la suma de sesenta pesospara instalar un servicio de estadística.
Copiamos textualmente el Acta:
"En la ciudad de Monte Plata y Villade Boyd en el dia 14 del mesde Junio de los años Mil Ochocientos Veinte i uno, los Sres. del Ayuntamiento Constitucional, Don Sebastidn Alcantard, Alcalde Primado,Don Manuel Felipe de los Reyes, Alconde Zdo., y los Sres. regidoresdon Cifrian Gonzdlez; Don Juan Contreras, Don Raymundo Mexias, noasistiendo Don Felipe Flores por hallarse fuera y el Síndico ProcuradorGeneral, juntaron en la Casa Consistorial y conferenciaron asuntos albien de esta república y habiendo deliberado, dijeron que se obligaban apagar el costo de la formación estadtstica que es de Sesenta Pesos,igualmente a la reformación de la casa del cabildo por estar muy deteriorada, con la que se concluyó este acuerdo y firmaron dichos señoresde que yo el regidor secretario, doy fé".
Firman: Sebastidn Alcántara, R. Mexia, S. Gonzdlez, José Alcantard.
32 JESUS DE LA ROSA
Sin embargo, nos dice Don Vicente Tolentino Rojas, en su conferencia "La Estadística en la República Dominicana", lo siguiente: "desde el establecimiento de la República el 27 de Febrero de 1844, hastacuarenta años después -uno de los más borrascosos períodos de nuestrahistoria política- no existió ninguna agencia oficial destinada a la ela-·boración y preparación de estadísticas nacionales, a pesar de figurar entodas las cartas constitucionales, como expresa atribución del Congreso,la de "determinar todo lo concerniente a la formación periódica de laestadística general de la República",
En consecuencia podemos deducir que dicho servicio no funcionó,ya que no hay ninguna elaboración estadística que nos ilustre al respecto o si tuvo algunas actividad, fue estrictamente municipal.
Desde 1845 por una ley votada el 2 de Mayo del mismo año, quedó a cargo de los ayuntamientos el organizar la estadística de la población, pero tal atribución fue suprimida, por un decreto del Poder Ejecutivo del 24 de Octubre de 1866, por haber sido desatendido dicho servicio. Siendo Presidente de la República el General Ulises Heureaux,dictó el Congreso Nacional el ¡.7 de Junio de 1884 un decreto por elcual se creaba, anexo a la Contaduría General de Hacienda "Un negociado de Estadística Mercantil" a cargo de un director y de los demás empleados' adscriptos a dicha oficina y cuyas atribuciones s610 correspondían a la recopilación de los datos sobre Comercio Exterior, ComercioCobatajc, Navegación Exterior, Costanera y Navegación Interior o Fluvial. En ese mismo año el Congreso Nacional. votó por un Decreto. lasuma de RDS4,500.00 para cubrir los gastos de la Estadística Mercantil del año anterior, que era de 1883.
Segun las estipulaciones establecidas por el Ministro de Hacienday Comercio, que lo era entonces Don Eugenio Generoso Marchcna. Nosdice el Agrimensor Vicente Tolcntino Rojas al respecto: "Son esas, modestas estipulaciones. las primeras disposiciones oficiales ejecutivas, dictadas por los Poderes Públicos para establecer el servicio de Estadística",
Si tomamos en consideración el rutinarismo administrativo deaquella época, resulta. apesar de todo, digno de interés ese primer intento hacia la organización de un sistema de estadística para la secciónde Comercio Exterior, único tal vez, que podía intentarse con probabilidades de éxito, dadas las condiciones reinantesen el país y carencia derecursos del (;obierno de entonces.
Ls cn el 1905 cuando el Congreso :\acional consignó por mediode la Ley de (;astos Públicos una suma para instalar y atcncionar una
ESTADISTICA PSICD-EDUCATlVA 33
oficina de Estadística y fue entonces cuando surgió la primera preocupación para obtener un servicio de esa índole; dicha oficina quedó establecida como una dependencia del Ministerio de Hacienda y Comercioy fue nombrado en calidad de Director el Sr. Xavier Amiama, de reconocida competencia.
El 15 de Agosto de 1906 el Sr. Amiama presentó renuncia de sucargo y fue nombrado el Sr. Leopoldo Navarro, también muy versado enasuntos estadísticos. Este hombre luchó incansablemente por establecerun servicio estadístico científico y logró, en parte, colmar sus aspiraciones. A la muerte del Sr. Navarro acaecida a mediados del año 1908 ocupó la Dirección General de Estadística el Geógrafo y Estadístico Sr.Casimiro M. de Moya, su labor al frente de dicha oficina fue bastantefructífera.
El 28 de Mayo de 1909, el gobierno del General Ramón Cáceresvotó una nueva Ley sobre Estadística en la cual establecía la obligaciónde rendir datos con regularidad.
De haberse organizado el servicio de Estadística de acuerdo con lasestipulaciones de esa ley votada por el General Cáceres, ce haber perdurado la paz en el país hubiera podido considerarse el año de 1909 comoel verdadero principio de la científica metodízación de la estadística nacional. Pero fatalmente en el año 1911 comenzó para la Repüblica Dominicana una larga serie de revoluciones armadas, de cruentas luchas intestinas durante cuyo período todos los conceptos de orden administrativo fueron obligatoriamente echados a un lado y todas las organizaciones en embrión entorpecidas.
Podemos decir que desde 1911, hasta la verdadera fundación deuna oficina gubernamental de Estadística en el año 1936 no hubo ninguna actividad digna de ser"tomada en cuenta a excepción de los informes de la Receptoría General de Aduanas y del Censo de 1920, efectuado por la ocupación yanqui.
En el año 1936, por medio de la ley No. 1023, promulgada por elCongreso Nacional en Noviembre del año 1935, quedó fundada real ypositivamente la Oficina Central de Estadística.
A partir de ese año, el quehacer estadístico penetra en todas lasactividades de la vida orgánica nacional, estudiando su constitución económica, política, jurídica y social, hasta constituir lo que es hoy, un valioso quehacer al servicio del conocimiento, del quehacer público y dela investigación.
II
MEDIDA EN PEDAGOGIA YEN PSICOLOGIA
2.1 INTRODUCCION
Es posible enfocar matemáticamente los problemas psicopedagégicoso Este enfoque implica atribuir números a las manifestaciones tantopedagógicas como psicológicas, someter esos números a ciertas técnicasmatemáticas de modo que lleguemos a un resultado. En realidad, el estadio estrictamente matemático es el segundo que comienza con datosnuméricos y concluye con resultados, también numéricos. Pero éste esinconcebible sin la previa atribución de números a las manifestacionespsicopedagógicas. Por ello, vamos a referimos a dicha atribución numérica o, lo que es equivalente, a la definición de medida.
2.2 CARACTERISTICAS y MODALIDADES
Los objetos manifiestan características según diversas modalidades.Así, por ejemplo, las personas manifiestan la característica sexo segúndos modalidades: varón y mujer; la característica religiónsegún muchasmodalidades: católico, protestante, mahometano, budista, ateo, etc.; lacaracterística peso según infinitas modalidades, pues entre dos modalidades, por. próximas que se encuentren, son siempre posibles modalidades intermedias.
2.3 DEFlNICION DE MEDIDA
Medida es la atribución de numerales a objetos o sucesos de acuerdo con reglaspre-establecidas.
Tenemos por una parte números y, por otra, objetos con suscorrespondientes modalidades. Entre los números existen ciertas rela-
3S
36 JESUS DE LA ROSA
ciones que son siempre válidas dentro del mundo aritmético, ideal. Entre las modalidades existen ciertas relaciones (en unos casos, pocos ysimples; en otros, bastantes y complejos), que son verificables en elmundo empírico real. Pues bien, la atribución de números a los objetosno va a ser arbitraria, sino de acuerdo con esta regla general: aceptarsólo como relaciones válidas entre los números aquellos que sean verificables empíricamente.
Exigimos, por tanto, un cierto paralelismo o isomorfismo entre lasrelaciones aceptadas como válidas entre los números y las relaciones verificables, entre las correspondientes modalidades (en nuestro caso, pedagógicas y psicológicas). Consiguientemente, en los números atribuidosa las modalidades, sólo podremos realizar aquellas operaciones que estén de acuerdo con las relaciones aceptadas como válidas entre las mismas. Por otra parte, esas relaciones son precisamente las verificables entre las modalidades ernpfricas psicopedagógicas. En consecuencia, parece que el resultado numérico final, obtenido operando de este modocon los números atribuidos a las modalidades psicopedagógicas, admitirá una interpretación lógica-psicopedagógica.
2.4 LA MEDIDA PEDAGOGICA: Su Posibilidad y Alcance
Toda medida expresa un valor relativo. Se hace posible por lacomparación de dos dimensiones. Ahora bien, cuando intentamosmedir fenómenos de tipo humano, nos encontramos con graves dificultades, porque los procesos sociales, mentales, psicológicos, pedagógicos, etc., son más que cantidad, calidad, y tienen, por consiguiente,matices que escapan y escaparán siempre a toda rnensuración.
Sin embargo, esto no quiere decir, que toda medida respecto aesos fenómenos, sea imposible.
Por la unión sustancial, el cuerpo participa, a su modo, de los fenómenos espirituales y cualitativos, por los que podemos medir losfenómenos internos, que se manifiestan al exterior. Medida ésta, queen primer lugar no es directa, porque tratamos de medir el fenómeno,valiéndonos de alguna reacción o consecuencia que se le sigue, pero nomedimos el fenómeno en si. Y en segundo lugar, esa medida no esexacta, sino más o menos aproximada, porque la reacción que exploramos no manifiesta el fenómeno en su totalidad.
Refiriéndonos, concretamente, a las medidas utilizadas en Pedago-
ESTADISTICA PSICO-EDUCATIVA 37
gía, repetimos, que esta medida, aunque indirecta y aproximada, es unaverdadera medida, en la que hemos relacionado con una dimensión determinada, conocida de antemano, otra cantidad objeto de rnensuración ,dando por resultado un número que expresa realmente esta relación deun modo aproximado, pero suficiente, para poder sacar conclusionescientíficas que incrementen provechosamente el acerbo pedagógico.
2.5 EL INSTRUMENTO DE MEDIDA EN PEDAGOGIA
De la naturaleza de las cantidades que han de recogerse y de los fenómenos que se quieran registrar, dependerá la clase de instrumentosque se precisan para la recopilación y estudio de los datos.
En Pedagogía, esos instrumentos de medida que han de servir paramedir los fenómenos educativos y de instrucción, son siempre de índoleestadística. Se toman de la valoración de un grupo de sujetos, representativos de todo conjunto, ya que no puede tener valor científico la experimentación basada en datos individuales.
Así vemos que los números -baremos- que representan años deinstrucción, en los tests didácticos, o edad mental, enlos tests psicológicos que aplicamos en Pedagogía, representan lo que, normalmente, seda en el grupo de sujetos que han sido sometidos a una experiencia bienplaneada, desarrollada sistemáticamente, cuyos datos se han tratado con.los procedimientos estadísticos y los resultados comprobados con todaescrupulosidad e interpretados inteligentemente y racionalmente, lo quepermite formar el juicio de que esa medida no sólo expresa la de esegrupo, sino de todo grupo que posea cualidades análogas.
De la comparación de esa medida tipo o standard en la dimensiónque examinamos en la clase o en el sujeto, surge la verdadera medida delgrupo o del individuo.
Por ejemplo, queremos medir la atención de un niño, Para ello leaplicamos el test de Bourdon". Se considera en segundos el tiempoempleado por el sujeto en la prueba y se añaden cinco segundos por cada letra omitida. Estadísticamente está demostrado que el términomedio es de doscientos segundos. Por consiguiente, cuanto más omenos tiempo invierta el sujeto en relación con los doscientos segundos,tendrá más o menos atención.
(1) El test de Bourdon consiste en tachar todo (a) que se encuentre en un impreso. Este debecontener 100 veces la letra (a) y 16 veces cada una de las otras 2S letras.
38
2.6 LA ESTADISTICA EN PEDAGOGIA
JESUS DE LA ROSA
El profesor argentino Victor Mercante fue el primero en aplicar elanálisis estadístico, de modo sistemático, a las cuestiones pedagógicas,sosteniendo que la "apreciación del valor de la enseñanza dada, no podría lograrse más que mediante la medición de la capacidad del grupode escolares". Y así, en 1853, la Estadística entra como instrumento valioso para la solución de los problemas didácticos.
En la actualidad, encontrándose la Pedagogía y gracias también alos procedimientos estadfsticos, en posesión de instrumentos de medidaescolares: tests, escalas y pruebas objetivas, la elaboración estadística alcanza un gran auge que hace avanzar la metodología de las ciencias y,sobre todo, alcanza la Estadística gran aplicación en la clasificacióncientífica de los alumnos, en las promociones, en el señalamiento de niveles por curso, en la valoración del trabajo escolar, en la orientaciónprofesional, etc. Puede decirse que hoy día no se concibe un trabajoverdaderamente serio en la Pedagogía experimental, sin la colaboraciónestadística.
Ahora bien, dentro del extenso campo pedagógico, los procedimientos estadísticos, no exclusivamente, pero si con preferencia y conmás positivos resultados, se utilizan en el terreno didáctico, Y sus objetivos son, sobre todo, problemas cuya solución lleven el mejoramiento,en todos los ordenes posibles, del trabajo escolar, ya desde el punto devista del maestro, y de la del discípulo.
Aun cuando utilicemos en Pedagogía experimental otros procedimientos de investigación, ha de completarse la experiencia por el procedimiento estadístico, si queremos obtener medidas que tengan valor general, ya que es el único que puede legítimamente emplearse cuando lascausas de los fenómenos que se analizan son muy complejas, como ocurre en los hechos pedagógicos.
2.7 LAS MEDIDAS ESTADISTICAS EN LA PEDAGOGIA EXPERIMENTAL.
Las medidas estadísticas que han de ser utilizadas para solucionarlos problemas pedagógicos y que en sucesivos capítulos iremos explicando, son:
lro. Medida del Grupo - Seriación ordenada, distribución de frecuencias, dístribucion de intervalos, distribución de rango.
ESTADISTICA PSICO-EDUCATlVA
2do. Medidas de tendencia central de valor representativo.
3ro. Medidas de variabilidad o dispersión.
4to. Medidas de individualización.
Sto. Medidas de relación.
6to. Medidas de garantía o precisión.
39
2.8 EXPRESION DE LAS MEDIDAS ESTADISTICAS EN PEDAGOGIA
Las medidas estadísticas en Pedagogía, siempre que se pueda, yaque no todas ellas son suscpetibles de ello, se expresarán:
1) Numéricamente,- Seriación de los resultados en tablas, expresadas en función de una unidad de la misma clase.
2) Analüicamente»- Una relación expresada por fórmulas indicadoras de la característica estudiada y cierto número de variables de distinta naturaleza.
3) Grdjicamente.- Expresión por medio de figuras bien precisadas. Gráficas que suponen un sistema de unidades y una escala. Es un procedimiento más intuitivo y claro y, por ello, unode los más usados. La representación gráfica más utilizada enPedagogía es la expresada por el sistema de coordernadas cartesianas, introducidas en Estadística por Francisco Galtón,
2.9 LA MEDIDA PSICOLOGlCA: Su Posibilidad y Alcance.
La 'Psicología moderna, casi desde sus comienzos, ha intentadoproponer leyes (o, al menos, algunas), bajo fórmulas matemáticas. Aeste respecto pueden ser consultados MiUer (1964). Thurstone (1959)quienes creen que la Psicología seguirá el camino recorrido por otrasciencias, haciéndose cada vez más y más matemática, a medida que vayaformulando más rigurosamente sus ideas fundamentales.
Horst (1966) piensa que la Psicología ha tardado tanto tiempo enocupar su lugar apropiado entre las ciencias aplicadas, quizás por nohaber reconocido la importancia de la medida en la investigación psicológica. Según Nunnally (1967), tocas las teorías psicológicas, con eltiempo irán siendo propuestas en forma matemática, Bailey (1967),admite que la bio-matemática ayudará a la biología y a la medicina,
40 JESUS DE LA ROSA
como la físico-matemática ha ayudado a la física. Existe pues, un convencimiento casi general de que el lenguaje cuantitativo ira asumiendocada vez mayor relieve en las ciencias de la conducta y, en la psicologíaen particular. De hecho, los modelos matemáticos juegan un papel importantísimo en muchas áreas psicológicas: psicología experimental ydiferencial, social, industrial, pedagógica ... y aún clinica. La lectura debastantes artículos y libros relacionados con estas disciplinas, exigeuna preparación matemática no ligera y, en ocasiones profunda. Sinel conocimiento de las matemáticas y de la Estadística, es imposibleleer revistas de especialización psico o biomatemáticas o entender libros,cada vez más numerosos, que abordan los problemas psicológicos demodo rigurosamente métrico. Igualmente es necesaria una sólida preparación matemática y estadística, para comprender diversas leyes oteorías psicofísicas y psicométricas, teorías sobre aprendizaje, teoría dela decisión y teoría de la información, aplicadas a la psicología, teoríade tests, etc. En conclusión, las matemáticas y la Estadística se van haciendo cada vez más indispensables dentro de las ciencias humanas y, enparticular, dentro de la pedagogía y la psicología.
Los múltiples libros de matemáticas y Estadística para pedagogos,psicólogos, biólogos, etc., que vienen apareciendo durante estos últimosaños son un índice claro de que estos investigadores necesitan y pidenuna fundamentación matemática cada vez más seria para poder abordaradecuadamente muchos problemas de sus correspondientes especialidades.
2.10 DEFINICION DE ESCALA DE MEDIDA
La palabra escalaes usada profusamente en la literatura psicomatemática,pero raramente definida. Ya Suffer y Zinnes se quejaban de que"es raro encontrar en la literatura sobre la medida una definición escrita de escalas".
Veamos qué entendemos aquí por escala de medida. Comenzamosdefiniéndola en algunos casos particulares para concluir ofreciendo unadefinición general.
Consideraremos la característica peso. Aceptemos como unidadempírica de medida la modalidad presentada por un cuerpo elegidoarbitrariamente. Mediante una balanza podemos elegir otro cuerpo quemanifieste la caracterrstica peso bzjo la misma modalidad que el prime.o, es decir, que pese kJ mismo. Mediante es.os dos cuerpos podemos
ESTADISTICA PSICO-E DUCATI V A 41
elegir otro nuevo cuya modalidad sea igual a la suma de las modalidadesde los dos cuerpos anteriores, es decir, que pese lo mismo que los dosprimeros juntos. Para ello, basta colocar estos dos cuerpos en un platillo de la balanza y en el otro un tercer cuerpo tal que la balanza permanezca en equilibrio. Esa operación la podemos ir repitiendo, poniendotres cuerpos en un platillo y en el otro un cuerpo tal que la balanza quede equilibrada. Así, llegaremos a obtener un conjunto de cuerpos materiales, uno en la modalidad unitaria, otro en una modalidad dos vecesmayor que la unitaria, etc. Podemos ahora atribuir números a esas modalidades. Una atribución obvia es asignar el l a la primera modalidad,el 2 a la modalidad empírica doble, el 3 a la triple, etc. Esa atribuciónes obvia, en cuanto que la primera modalidad ha sido elegida arbitrariamente como modalidad empírica unitaria. Pues bien, n~m~remos
escala ríe medida a "se conjunto de modalidades pJIW{ricas distintasy de numeros distintos, puestos en correspondencia biunívoca, es decir.puestos de manera tal que a cada modalidad le corresponda un solo número y a cada número una sola modalidad o, lo que es i!l"al, a ese conJunto de cuerpos materiales, con pesos, "distintos", y de los numerosdistintos atnbuinos a dichos cuerpos. Mediante esa escala podemosatribuir números de modo coherente a otro cuerpo cualquiera, comparando su modalidad peso con las modalidades de la escala tipo acabada de construir y atribuyéndole el número de la escala asociado a lamodalidad peso con las modalidades de la escala tipo acabada de construir y atribuyéndole el número de la escala asociado a la modalidadque coincide empíricamente con la modalidad del cuerpo en cuestión.
En conclusión, podemos ofrecer la siguiente definición genera! deescala: conjunto de modalidades distintas y conjuntos de números distintos relacionados biunívocamente. Es decir, a cada modalidad le corresponde un sólo número y a cada número una S91a modalidad.
La escala así definida, es un instrumento natural de medida. Conella podemos atribuir números a cualquier objeto. Para ello, basta conobservar qué modalidad de la escala coincide empíricamente con la modalidad del objeto en cuestión, atribuyendo a éste el número correspondiente en la escala.
La definición anterior de escala está de acuerdo con la idea que tenemos de uno de los instrumentos de medida más usuales, la regla.Una regla no es más que un conjunto de rayas equidistantes marcadassobre un listón de madera, o de otro material, y un conjunto de números, en correspondencia biunívoca.
42
2.11 TIPOS DE ESCALAS DE MEDIDA
JESUS DE LA ROSA
Al medir, o sea, al atribuir números a los objetos, decimos que sóloaceptábamos como válidas entre los números, aquellas relaciones quefueran verificables empíricamente entre las correspondientes modalidades. Ahora bien, estas relaciones son muy simples en algunos casos ycomplejas en otros. Por consiguiente, en unos casos sólo aceptaremoscomo válidas entre los números, relaciones muy sencillas; en cambio, enlas otras daremos validez a relaciones aritméticas más complejas.
Pues bien, diremos que nos encontramos a bajo o alto nivel de medida, según sea menor o mayor la complejidad de las relaciones que podemos verificar empíricamente entre las modalidades, en terminologíaparece ser la más oportuna. Sin embargo, en vez de niveles se suele hablar preferentemente de escalas de medida.
Distinguiremos cuatro tipos de escalas, siendo el esquema tradicional propuesto ya por Stevens, en su primera publicación sobre teoría dela medida.
2.11.1 ESCALA NOMINAL
Supongamos que, dadas dos o más modalidades, sólo podemoscomprobar empíricamente si ellas son iguales o distintas. Consiguientemente, entre los números atribuidos a los mismos, aceptaremos comoválida la relación igualdad - desigualdad. Si, por ejemplo, se trata dela característica "provincia de origen", y atribuimos 1 a la modalidadSantiago, el 2 a la modalidad Barahona y el 3 a la modalidad DistritoNacional,. entre los números 1, 2 Y 3 sólo aceptaremos como válida larelación igualdad - desigualdad. Es decir, el símbolo 1 será considerado como algo distinto de los símbolos 2 y 3, Y éstos, también, comodistintos entre sí, del mismo modo que son distintos entre sí las tresmodalidades correspondientes, pero, el 2 no será considerado como mayor que el 1, ni el 3 como mayor que el 2 y el 1, del mismo modo, yala modalidad Barahona no es una manifestación mayor de la característica Santiago sino, simplemente, una manifestación distinta. A este nivellos números atribuidos son simples nombres (de ahí el apelativo nominal), que podían ser sustituidos por cualesquiera símbolo no numérico: letras, colores, figuras geométricas, etc. Por consiguiente, los números no poseen en la escala nominal ninguna de las propiedades aritméticas.
ESTADISTICA PSICO-EDUCATIVA 43
No tiene ningún sentido aceptar a ese nivel que 3 = 2 + 1, puesello implicaría que la modalidad Distrito Nacional era el resultado deunir las modalidades Santiago y Barahona. En otras palabras, que el resultado de unir una persona en la modalidad Santiago y otra personaen la modalidad Barahona, daría como resultado una nueva personaen la modalidad Distrito Nacional.
Evidentemente, la escala nominal permanece invariante frente acualquier transformación que a números distintos haga correspondernúmeros distintos. Es decir, seguiremos teniendo una misma escalanominal, cuando, permaneciendo las mismas modalidades tipo, losnúmeros atribuidos a las mismas sean transformadas en otros con laúnica limitación de que a números distintos primitivos, corresponden,también números distintos nuevos. Si, por ejemplo, a tres modalidadesdistintas les hemos atribuido los números 5, 7, lO, podemos atribuirleen igual derecho cualesquiera otra terna compuesta de números distintos como 6, 9, 2, 7,3,1, etc.
2.11.2 ESCALA ORDINAL
Supongamos que, dadas dos o más modalidades, no s6lo podemoscomprobar si son iguales o distintas, sino, siendo distintas, cual de cadados es la mayor. Es decir, dados dos objetos, podemos .comprobar empíricamente si ambos manifiestan una característica según la misma odistinta modalidad y, supuesto que la manifiesten según distinta, podemos comprobar cuál de los dos la manifiesta según una modalidad mayor. Conjuntamente, entre los números atribuidos a las modalidades,admitiremos como válidas las relaciones igualdad-desigualdad y orden.
Si por ejemplo, se trata de la característica dureza, diremos queA es más duro que B, si A raya a B y no es rayado por éste, al frotarlosentre sí. Es una definición operativa de dureza, es decir, verificable empíricamente. Vamos a construir una escala de dureza, o sea, una escalapafa medir la característica dureza. Elijamos 10 cuerpos de naturalezafísica distintas y ordenémoslos empíricamente de acuerdo con la definición anterior. Pongamos en primer lugar aquel cuerpo que es rayadopor todos y no raya a ninguno. Pongamos en segundo lugar aquel queraya el primero (sin ser rayado por éste) y no raya a ninguno de los restantes (siendo rayado por ellos). Sigamos así hasta poner en último lugar aquel que raya a los nueve restantes y no es rayado por ninguno deellos.
44 JESUS DE LA ROSA
Tenemos, por tanto, 10 modalidades de la caracterrstica dureza ordenadas empíricamente desde la más blanda hasta la más dura. Atribuyamos a la primera modalidad el número 1, a la segunda el número 2...y a la última el número 10. Ahora aceptaremos no sólo que los núme-ros 1, 2 10, son srrnbolos distintos, sino que, además, el 2 esmayor que los nueve primeros números enteros y positivos. Pero, aeste nivel no tiene sentido admitir como válida entre los números unaigualdad 7 - 6 = 3 - 2, pues no podemos comprobar empfricamentesi la diferencia de dureza entre la modalidad a la que he atribuido el 7y la modalidad a la que he atribuido el 6 es igual que la diferencia dedureza entre la modalidad a la que he atribuido el 3 y la modalidad a laque he atribuido el 2.
Evidentemente, la escala ordinal permanece invariante frente acualquier transformación monótona creciente. En otras palabras, seguiremos teniendo una misma escala ordinal, cuando, permaneciendolas mismas modalidades tipo, los números atribuídos a las mismas, seansometidos a una transformación monótona creciente, es decir, que hagacorresponder a una sucesión ordenada de números otra sucesión de números ordenados del mismo modo que los primeros. Si, por ejemplo,a tres modalidades ordenadas de menor a mayor les atribuimos los números 3, 5 Y 8, podemos atribuules, con igual derecho, otras temas deltipo: 6,70,95,82,195,983, etc.
2.11.3 ESCALA DE INTERVALOS
Supongamos que, dadas dos o más modalidades, no sólo podemoscomprobar emprricamente la igualdad-desigualdad y el orden, sinoque, también, podemos establecer una unidad empirica de medida y
observar cuántas veces se encuentra contenida dentro de la diferenciaentre dos modalidades a, b, y e, podemos comprobar empíricamentecuántas veces la diferencia entre a y b, es mayor o menor que la diferencia entre b y e, suponiendo que las dos diferencias son distintas.Consiguientemente, entre los números atribuidos a las modalidades,admitiremos como válidas las relaciones igualdad-desigualdad y orden,y válidas la multiplicación y división entre las diferencias obtenidas apartir de dichos números (no entre los mismos números).
Supongamos que se trata de la característica temperatura. Elegimos tres cuerpos y los ponemos en contacto con un tubo de vidrio enuno de cuyos extremos lleva un pequeño depósito con mercurio. Obser-
ESTADISTICA PSICO-EDUCATIVA 45
vamos ahora el nivel alcanzado por el mercurio en cada uno de los trescasos. Tendremos tres niveles termométricos n! , n2 , n3. Elegimos arbitrariamente una unidad empírica de medida, es decir, una distancia arbitraria sobre el tubo de vidrio. Por sencíllez, supongamos que las diferencias entre ni, n2 y n3 contienen esa unidad un número entero deveces. Para ser más concreto, supongamos que la unidad empírica quedacomprendida dos veces entre ni y n2 , y ocho veces entre n2 y n3 , esdecir, que la diferencia entre n2 y n", es cuatro veces mayor que la diferencia entre n! y n2 •
Pues bien, una atribución obvia de números a las tres modalidadesanteriores puede ser: 4, 6, 14. Entre estos tres números aceptaremoscomo válidas las relaciones: 4 #6 # 14,4 < 6 < 14, 14 - 6 =4 (6 - 4).
Evidentemente, la escala de intervalos permanece invariante frente a cualquier transformación de la forma y = ax + b, donde a y b sonconstantes arbitrarias. En otras palabras, seguiremos teniendo una mismaescala de intervalos, cuando, permaneciendo las mismas modalidades tipo, los números atribuidos a ella son sometidas a una transformaciónde la forma y = ax + b. Esto es debido a que son arbitrarios tanto elorigen, como la unidad de medida. Por consiguiente, tan legítima es laterna 4, 6, 14, como la terna (4a + b), (6a + b), (l4a + b), donde a yb son constantes arbitrarias. Ase, por ejemplo, para a = 2 Y b = 5, tendremos la terna 3, 7, 23. Para esta nueva terna siguen siendo válidas lastres relaciones que fueron válidas para la terna primitiva, a saber, 3 1171123,3< 7 < 23, 27 ~ 7 =4 (7-2).
Nótese que la introducción de la unidad empírica de medida legítima, la suma y resta entre los números atribuidos a las modalidades yla multiplicación y la división entre las diferencias obtenidas a partir dedichos números. Pero no legítima la multiplicación y división entre losnúmeros mismos. La legitimidad de estas últimas operaciones sólo es posible cuando contemos con un origen empírico, absoluto y no con unorigen empírico arbitrario. Ahora bien, esta arbitrariedad en el origenes propia de la escala de intervalos.
Asr, por ejemplo, el origen empírico de temperaturas en la graduación centígrada, no corresponde a la temperatura nula, a la carencia total de calor, es decir, no en absoluto. Ese origen corresponde a la modalidad o grado- de temperatura a la cual el hielo se derrite, es decir. esarbitrario. Con el mismo derecho podríamos haber elegido como modalidad origen. cualquier otra temperatura inferior o superior a la que se
46 JESUS DE LA ROSA
derrite el hielo. Así se hace, por ejemplo, en las escalas Fahrenheit yReaumur.
2.11.4 ESCALA DE RAZON
Supongamos que, dadas dos o más probabilidades, no sólo podemos comprobar empíricamente la igualdad-i-desígualdad, el orden ycuántas veces la diferencia entre dos modalidades es mayor que la diferencia entre otras dos, sino, además, cuántas veces una modalidad esmayor que la otra. Por tanto, entre dos números atribuldos a las modalidades, admitiremos como válidas las relaciones igualdad-desigualdad yorden, y las operaciones suma, resta, multiplicación y división.
Supongamos que se trata de la característica longitud. Elegimos3 varillas metálicas que manifiestan la característica longitud según 3modalidades distintas. Para ello, basta con escoger tres varillas tales que,al compararlas simtl1táneamente coinciden las tres en uno de sus extremos y difieran en el otro. Determinamos arbitrariamente una unidadempírica de medida, es decir, un trocito de varilla arbitrario que llamaremos Vu- Aplicamos Vu a las tres varillas A, B Y C y contamos el número de veces que Vu cabe en A, en B y en C. Supongamos que Vu cabe 3 veces en A, 6 veces en By 24 en C. Tenemos pues, tres objetos manifestando la característica longitud según 3 modalidades distintas yequivalentes respectivamente a 3, 6 Y 24 veces la medida unitaria. Unaatribución obvia de números a las 3V u modalidades anteriores, puedeser: 3,6, 24. Entre estos números son válidas las relaciones 3 #6 #24,3 < 6 < 24.24 - 6 =6 (6 ~ 3), y, además, 6/3 = 2, 24/3 =8,24/6 =4,dado que empíricamente podemos comprobar que la modalidad longitud de B es doble dc la de A, la de e es ocho veces la de A y la de e escuatro veces la de B.
Resumiendo, tenemos que medida es una atribución de número alos objetos según ciertas reglas. Esas reglas se resumen en lo siguiente:iceptar sólo como válidas entre los números aquellas relaciones que
sean verificables ernptricamcntc entre las correspondientes modalidales.
Escala de Medida: Conjunto de modalidades (distintas) y de números (distintos), relacionados biunívocamente. Es decir, a cada modalidad le corresponde un sólo número y a cada número una sola modalidad. Tendremos uno u otro tipo de escala, según sean verificables empjricamente más o menos relaciones entre las modalidades que forman
ESTADISTICA PSICD-EDUCATlVA 47
parte de la escala. De acuerdo con este criterio, hemos distinguido cuatro tipos de escalas.
a) Nominal : Solo es verificable empíricamente la igualdad-desigualdad.
b) Ordinal : Son verificables empíricamente igualdad-desigualdad.
e) Intervalos: Son verificables empíricamente igualdad-desigualdady orden. Podemos, además, comprobar cuántas vecesqueda contenida una unidad empírica, elegida arbitrariamente, dentro de la diferencia entre las modalidades.
d) De razón : Son verificables empíricamente igualdad-desigualdady orden. Además de poder comprobar empíricamente cuántas veces queda contenida una unidad empírica, elegida arbitrariamente, dentro de la diferencia entre dos modalidades, podemos, también comprobarcuántas veces una modalidad cualquiera contiene dicha unidad empírica.
111
ORGANIZACION DE DATOS
3.1 DEFINICIONES PREVIAS
3.1.1 CONSTANTE
Característica que sólo puede manifestarse bajo una única modalidad. Por ejemplo, la longitud de todas las círcunsferencias con el mismoradio.
3.12 VARIABLE
Característica que puede manifestarse según dos o más modalidades. Por ejemplo, el peso, la inteligencia, la edad, la agudeza visual, etc.Cuando una característica, en sí mismo variable, sólo puede manifestarse bajo una modalidad, será considerada como constante. Por ejemplo,si estudiamos la extroversión en un grupo de varones, diremos que lacaracterística sexo se mantiene en dicho grupo.
VARIABLE CUALITATIVA
Característica que sólo puede ser considerada a nivel meramentenominal: sexo, profesión, lugar de origen, etc. Los números atribuidosa sus modalidades solamente gozan de la relación igualdad-desigualdad.
VARIABLE CUASI CUANTITATIVA
Característica que puede ser considerada, como máximo, a nivelordinal: dureza de los cuerpos, responsabilidad de un grupo de operarios estimada por su capataz, etc. Los números atribuidos a sus modalidades sólo gozan de las relaciones igualdad-desigualdad y orden.
49
50
VARIABLE CUANTITATIVA
JESUS DE LA ROSA
Característica que puede ser considerada, al menos, a nivel de intérvalos: peso, inteligencia, fuerza física, número de hijos, etc. Connúmeros atribuidos a los mismo podemos realizar operaciones aritméticas.
VARIABLE CUANTITATlVA DISCRETA
Característica que no admite siempre una modalidad intermediaentre dos cualesquiera de sus modalidades: número de hijos, númerode estudiantes matriculados a nivel primario, número de profesores cancelados del servicio, etc. Aquí pueden haber 800 mil niños matriculados a nivel primario, pero no 800 mil y dos tercios. Esa modalidad esimposible.
VARIABLE CUANTITATIVA CONTINUA
Característica que admite siempre una modalidad intermedia entre dos cualesquiera de sus modalidades: fuerza física, longitud, inteligencia, etc.
3.1.3 MODALIDADES Y CLASES
Como ya hemos indicado, frecuentemente es lUUY grande el número de modalidades bajo las cuales puede manifestarse una característica.Conviene reducir esas múltiples modalidades a un número menor declases. Esas clases deben estar bien definidas (es decir, debemos saberclaramente qué modalidades incluye cada una de ellas dentro de sf),deben ser mutuamente exclusivas (es decir ninguna modalidad puedepertenecer simultáneamente a dos o más clases distintas). deben ser exhaustivas (es decir, toda modalidad debe pertenecer necesariamentea alguna de las clases).
3.1.4 FRECUENCIA, PROPORCION, PORCENTAJE
Frecuencia (o, frecuencia absoluta) de una clase es el número deobservaciones contenidas dentro de ella.
Proporción (o, frecuencia relativa), de una clase es el cocienteentre la frecuencia absoluta de dicha clase y el numero total de observaciones (en todas las clases).
ESTADISTICA PSICO-EDUCATlVA 51
Porcentaje de una clase es igual a la proporción multiplicada por100
Distribución de Frecuencias: Conjunto de las clases y de las frecuencias (proporciones o porcentajes) correspondientes a cada una deaquellas. O, mejor aún, conjunto de los números atribuidos a las clasesy de las frecuencias (proporciones o porcentajes) correspondientes acada una de aquellas.
3.2 ORGANIZACION DE DATOS
3.2.1 VARIABLES CUALITATIVAS
Warren (1974) investigó la característica "tipo de color asociadoa la palabra paz" Para ello, la presentó a un grupo de cien personas,pidiendo a cada una escogiese entre 4 colores (rojo, azul, amarillo yverde) el que mejor se ajustase a dicha palabra.
La distribución de frecuencias fue la siguiente:
Distribución de Frecuencias
Tabla 3.1
Color Frecuencia Proporción Porcentaje
rojo 6 0.06 6
azul 58 0.58 58
amarillo 19 0.19 19
verde 17 0.17 17
Total 100 1.00 100
En el ejemplo anterior las modalidades eran s610 cuatro y no parecta razonable agruparlas en clases. Pero pueden darse otros casos enlos que el agrupamiento en clases sea muy conveniente. Así, por ejemplo. supongamos una pensión donde viven 80 universitarios. Estudiemosla caracterrstica "carrera universitaria" y supongamos que tenemos
52 JESUS DE LA ROSA
15 modalidades distintas: Profesorado en Ciencias, Profesorado en Matemáticas, Profesorado en Artes, Física, Ingeniería Eléctrica, Química,etc. Hagamos con esas 15 modalidades cuatro clases que las engloben atodas ellas, de acuerdo con el siguiente esquema:
Tabla 3.2
Carrera universitaria Frecuencia Proporción Porcentaje
Profesorado 24 0.30 30
Ciencias 28 0.35 35
Ingeniería 8 0.10 10
Derecho 20 0.25 25
Total 80 1.00 100
3.2.2 VARIABLES CUASI-CUANTITATIVAS
Con el objeto de investigar la eficacia diagnóstica y terapéutica dealgunas técnicas clínicas, Harrower (1965) recopiló los datos que exponemos a continuación sobre la mejoría de 622 pacientes.
Tabla 3.3
Mejoría Free. Propore. Porc, Frc.ae. Prop, A.C. Pore. A.C.
MáXima (4) 134 0.21543 21.543 622 1.0000 100.00
Moderada (3) 212 0.34084 34.084 488 0.7846 78.46
Leve) (2) 129 0.20740 20.740 276 0.4437 44.37
Nula (1) 147 0.23633 23.633 147 0.2363 23.63
Total 622 OOסס1.0 100.000
¡;STADIST1CA PSICO-EDUCATlVA 53
A nivel ordinal tiene sentido hablar de frecuencias, proporcionesy porcentajes acumulados (Fr. AC., Prop, AC). Ordinariamente, se suelecomenzar la acumulación a partir de la clase inferior. Así lo hemoshecho en el cuadro adjunto.
La primera frecuencia acumulada es la frecuencia de la clase inferior. La segunda frecuencia acumulada es la suma de las frecuencias delas dos clases inferiores. La tercera frecuencia acumulada es la suma delas frecuencias de las tres clases inferiores o, lo que es equivalente, lasuma de la segunda frecuencia acumulada más la de la tercera no acumulada. y así sucesivamente. Por supuesto, la última frecuencia acumulada será igual, siempre, a la frecuencia total. En nuestro ejemplo:
Primera Frecuencia Acumulada:Segunda Frecuencia Acumulada:Tercera Frecuencia Acumulada:Cuarta Frecuencia Acumulada:
147147 + 129=276147+ 129+212=276+212=488147 + 129 + 212 + 134 = 488 + 134=622
De modo análogo se obtienen las proporciones y los porcentajesacumulados a partir de las proporciones y porcentajes sin acumular.Naturalmcnte, las proporciones acumuladas pueden, también ser obtenidas dividiendo cada frecuencia acumulada por el total de las observaciones. Así, en nuestro caso, 147/622 = 0.2363, 276/622 = 0.4437.488/622 = 0.7846, 622/622 = 1.0000. Multiplicando por 100 estasproporciones acumuladas, obtendremos los correspondientes porcentajes acumulados.
.1.2.3 VARIABLES CUANTITATIVAS DISCRETAS
Consideremos cierta situación experimental en que una personadebe aprender una lista de pares de palabras, de manera que al presentarle una palabra de cada par sepa decir cuál es la otra que forma partedel mismo. Tomaremos como índice de dificultad de la tarea, el número de ensayos necesarios para asociar cada palabra con la correspondiente de su par. A continuación proponemos la distribución de frecuencias acerca del número de ensayos necesitados por un grupo de 59estudiantes de la Universidad Autónoma de Santo Domingo para aprender una lista de dificultad media formada por seis pares de palabras (De1;. ROSA, 1968).
54
Distribución de Frecuencias
Tabla 3.4
JESUS DE LA ROSA
Números de Ensayos Frecuencia Proporción Porcentaje
4 5 0.0847 8.47
5 10 0.1695 16.97
6 6 0.1017 10.17
7 7 0.1186 11.86
8 8 0.1356 13.56
9 10 0.1695 16.95
10 6 0.1017 10.17
11 3 0.0508 05.08
12 2 0.0339 03.39
13 2 0.0339 03.39
TOTAL 59 0.9999 99.99
3.2.4 VARIABLES CUANTITATIVAS CONTINUAS
3.2.4.1 INTERPRETACION CONTINUA DE LOS VALORESDISCRETOS
Consideramos, por ejemplo, la longitud. Entre dos modalidadescualesquiera existe un número infinito de modalidades posibles. Sin em-
\bargó, de hecho, sólo somos capaces de detectar un número finito deeUas, debido a la imperfección del instrumento de medida, en este casola regla. Cuanto más fina sea dicha regla, es decir, cuanto mayor número de subdivisiones contenga, tanto mayor será el número de modalidades que podemos detectar. Pero, en todo caso, ese número será finito,por culpa del instrumento de medida.
En conclusión, la variable que en sí es continua se manifiesta dehecho, como discreta. El número de modalidades discernibles es finito
ESTADISTICA PSICO-EDUCATIVA
y, por tanto, será finito el número de valores atribuibles a dichas modalidades. Contemplemos algo más despacio este número finito de valoresdiscretos.
Supongamos que nuestra regla no discierne más allá de los centímetros. Ello nos permitirá atribuir valores tales como 1.87, 1.88, 1.89,por ejemplo, pero no valores intermedios. Ahora bien, esta limitación,según lo visto, es debida a la imperfección del instrumento- de medida,no a que sean imposibles esos valores intermedios. Por ello, para salvarla continuidad, vamos a admitir que cada valor discreto se presenta atodos los infinitos valores que van desde 1.675 hasta 1.675 (incluido elnúmero 1.68), el valor 1.69 representa a todos los valores que van desde1.685 hasta 1.695, etc.
Es decir, 1.68 representa a una clase con infinitas modalidades.Llamaremos "intervalo elemental" a cada una de estas clases. Diremosque 1.675 es el límite exacto inferior del intervalo representado por1.68 y 1.685 su límite superior. Diremos que 1.685 es el límite exactoinferior del intervalo representado por 1.69, Y 1.695 es su límite exactosuperior. Admitiremos, por tanto, que 1.685 es, a la vez, límite exactosuperior de un intervalo y límite inferior del intervalo siguiente.
Habría que distinguir entre intervalos abiertos y cerrados, abiertospor la derecha (izquierda) y cerrados por la izquierda (derecha). En rigor, la amplitud de cada intervalo elemental valdrá la unidad de medidasutilizadas si nos valemos de intervalos semiabiertos. Sin embargo, estasdistinciones, aunque importantes a nivel matemático tienen poca importancia a nivel psicológico-estadístico. Por ello, las pasaremos por alto yaceptaremos un mismo valor como límite exacto común de dos intervalos consecutivos, admitiendo que la amplitud de cada intervalo elemental vale la unidad de medida.
3.2.4.2 INTERVALOS ELEMENTALES Y COMPUESTOS
Recordemos que cada valor discreto representa a todos los valoressituados media unidad a su izquierda y media unidad a su derecha. Esdecir, con cada valor discreto va asociado un intervalo de amplitud, unidad que hemos llamado elemental.
Llamaremos intervalo compuesto (o, simplemente intervalo) alconjunto de varios intervalos elementales consecutivos. Por regla general, todos los intervalos compuestos (para un conjunto de datos) contendrán cada uno de ellos el mismo número de intervalos elementales.
56 JESUS DE LA ROSA
3.3.4.3 LIMITES EXACTOS Y LIMITES APARENTES
Supongamos que en una investigación el valor discreto mínimo obtenido es 8 y el máximo es 19. Los valores discretos posibles (incluyendo el8 y e119) serán: 8,9, lO, 11, 12, 13, 14, 15, 16, 17, 18, 19. Cadauno de ellos representa un intervalo elemental unitario. Formemos unintervalo compuesto con los intervalos elementales representados por 8,9 Y 10. Dado que 7.5 es el lúnitc exacto inferior del intervalo elemental representado por 8 y es 10.5 el lrrnite superior del intervalo elemental representado por ellO, aceptaremos 7.5 como límite exacto inferiordel intervalo compuesto y 10.5 como límite exacto superior del mismo.Por consiguiente, tendremos 4 intervalos compuestos cuyos límitesexactos serán: cuatro intervalos a: 8-10,11-13,14-16,17-19. Nótese que estos valores aparentes son los únicos que, de hecho, pueden aparecer.
3.2.4.4 AMPLITUD Y PUNTO MEDIO DE LOS INTERVALOS.AMPLITUD TOTAL.
La amplitud de un intervalo es la diferencia entre su límite exactosuperior y su límite exacto inferior. En el ejemplo anterior la amplitudde los cuatro intervalos será: 10.5 - 7.5 = 13.5 - 10.5 = 16.5 - 13.5 =19.5 - 16.5 = 3. Aceptamos como punto medio de cada intervalo lasemi-suma de sus dos límites exactos. Ase los puntos medios de los intervalos anteriores serán: (7.5 + 10.5)/2 = 9. (\0.5 + 13.5)/2 = 12.(\3.5 + 16.5)/2 =15, (16.5 + 19.5)/2 = 18. A los mismos resultadoshabríamos llegado calculando la semi-suma de los dos límites aparentesde cada intervalo. En el ejemplo anterior: (8 + 10)/2 = 9, (11 + 13)/2 =12, (14 + 16)/2 = 15, (17 + 19)/2 = 18.
Llamaremos amplitud total de una serie de valores numéricos a ladiferencia entre el límite exacto superior del intervalo máximo y el límite exacto inferior del intervalo mínimo. En nuestro caso, 19.5 . 7.5 =2.
3.2.4.5 NUMERO Y AMPLITUD DE INTERVALOS
Para una misma amplitud total. si aumenta el número d... intcrvalos, tanto menor sed la amplitud de cada uno de ellos. Se recomiendaque, con 1000 o mis observaciones el número de intervalos no sea menorque 12, ni mayor que 18. Según otros. ni menor que 10 ni mayor que
ESTADISTICA P5ICO-EDUCATlVA 57
20. Sin embargo, ninguna de estas reglas son inflexibles. Eligiremos encada caso la regla que juzgamos más oportuna.
Según algunos autores, es preferible elegir amplitudes iguales a unode los valores siguientes: 1,2,3,5,10 ó 20. Estos números y sus múltiplos son fácilmente manejables. Sin embargo, ese criterio es arbitrario ypuede ser rechazado siempre que sea conveniente.
3.2.4.6 D1STRIBUCION DE FRECUENCIAS
El proceso de ordenar datos supone en Estadística una condensación de los mismos, mediante un tratamiento de clasificación y agrupamiento de los datos. Antes que los datos puedan ser entendidos e interpretados, es necesario resumirlos a agruparlos. Una forma de ordenarlas puntuaciones o datos, es hacerlo según su magnitud y colocar aliadoel número de veces que se repite caja uno de ellos o sea, su frecuencia.
La tabla 3.5, que aparece a continuación, expresa los resultadosobtenidos por un grupo de estudiantes. En dicha tabla, se observará queel estudiante Juan (JI) obtuvo la mayor puntuación, que es 34, y el estudiante Francisco (14) obtuvo la menor puntuación, que es 5.
Tabla 3.5
Alumno Puntuación Alumno Puntuación
I Jcsus 15 11 Juan 34, Manuel " 12 Carmen 28- --3 Argelia 17 17 Filomena 21
4 Yolanda 30 14 Francisco 5
5 Bertilia " 15 Ernesto 10--6 Patricia 27 16 Milagros 9
7 Lumumba IX 17 Hugo 12
jo¡ Rosa 20 18 Rosa Emilia 23-
9 Antonia 14 19 Ernesto José 16
10 (¡regorio 24 20 Pedro 31
En la tabla 3.6 hemos ordenado las puntuaciones en orden de 'crecicntc tde 34 a 5) Y hemos puesto a su Iudo el número de veces que se
58 JESU9 DE LA ROSA
repite la puntuación, o sea la frecuencia; pero cuando las puntuacionesson muchas, ese procedimiento no es práctico ni aconsejable. Un adecuado procedimiento sería reducirlas en grupos o intervalos de clase, cada uno contiene siempre igual número de puntuaciones diferentes. Elintervalo de clase se representa por la letra (i), Este tiene un límite inferior, un límite superior y un punto medio. El límite inferior es la puntuación menor de una clase, el límite superior es la puntuación mayorde una clase, y el punto medio entre el límite superior e inferior resultade dividir entre 2 la suma de los dos límites.
Tablo 3.6
X F X F X F X F X F X F
34 1 29 O 24 1 19 O 14 1 9 1
33 O 28 1 23 1 18 1 13 O 8 O
32 O 27 1 22 2 17 1 12 1 7 O
31 1 26 O 21 1 16 1 11 O 6 O
30 1 25 O 20 1 15 1 10 1 5 1
Podemos considerar cuatro etapas para la construcción de una distribución de frecuencias. Estas son:
l . Determinar la amplitud total o rango, que es 1 más la diferenciaentre la puntuación mayor y menor. De nuestras puntuacionesen 1" tabla 3.5, la puntuación más alta es 34 y la más baja es 5, loque indica un rango de (34 - 5) + 1 = 30. Estos son nuestros límites de clases (34 y 5). Los límites reales de esas mismas clasescon 34.5 y 4.5 con el fin de cubrir el intervalo de un punto (34.5- 33.5 Y 5.5 - 4.5).
2. Seleccionar el intervalo de clase que debe tener la misma amplitud en todas las clases de nuestra distribución. Para obtenerlo,procedemos a dividir el rango o amplitud de clase entre el nnmero de clase que estimamos más adecuado. En nuestro caso, si pensamos en 6 clases, dividiremos 30/6 = 5, si pensamos en 10 clasesel intervalo sería 3D/JO = 3; si pensamos en 7 clases el intervalosería 30/7 = 4.29. Sin embargo, entre esos tres, el menos recomendado sería el intervalo 4, pues en el momento de obtener el
ESTADISTICA PSICO-EDUCATIVA 59
punto medio de la clase, nos encontraríamos con que este es unnúmero fraccionado, lo que complicaría innecesariamente nuestros cálculos. Por ello es preferible buscar siempre un intervaloimpar pues de esta manera el punto medio será entero. Ahorabien, entre los intervalos de 3 y 5 unidades, es preferible escogerel último, debido a que la distribución no sería tan concentradacomo en el otro intervalo de clase.
3.· Determinar el límite de las clases. La distribución debe tener suficientes clases para que incluyan la puntuación mayor y la menor. Para facilitar la tabulación, comiéncese cada clase con un múltiplo del intervalo de clase. Si la clase más baja comienza a las 5,que es múltiplo de 5 (nuestro intervalo) queda acomodada nuestrapuntuación más baja, que es 5, y, a su vez, está la proporción conel número de clase en el paso anterior. En nuestro caso, por tanto,tendríamos como límite inferior de la clase más baja 5, y como límite superior de la misma clase, 9. Para obtener los siguientes límites de la clase que precede sumamos un punto al límite superior(9 + I = 10) Y comenzamos la segunda clase. La tercera clase comenzaría en 15, la cuarta en 20, y así sucesivamente hasta incluúnuestra puntuación más alta que es 34, y que estaría ubicada en laclase 30-34.
4. Elaborar la tabulación. Para elaborar la tabulación no es precisocolocar las puntuaciones en orden. Ese tipo de procedimiento llevaría más tiempo que la misma tabulación.
La tabla de frecuencia debe aparecer como se presenta a continuación:
. Tabla 3.7
X F
5-9 2
10 - 14 3
15 -19 4
20 - 24 6
2S - 29 2
30 - 34 3
60 JESUS DE LA ROSA
Tabla 3.8
ILUSTRACION DEL PROCESO DE ORDENAMIEN~O
EN UNA TABLA DE ,FRECUENCIAS
Puntuaciones originales(de la tabla 3.5)
15221730222718201424342821
5109
122316
31
Etapas en la Elaboración de la distribución
Primera Etapa:Determinar el rango o amplitud total.
Puntuación más alta 34Puntuación más baja 5Rango o amplitud total =1 + (34 - 5) =30
Segunda Etapa:Seleccionar el intervalo de claseRango/clase = intervalo30/6 =5
Tercera Etapa:Determinar los Iúni tes de las clasesComenzar cada clase con un múltiplo delintervalo para obtener el límite inferior.Límite inferior 5: límite superior 9Cuarta Etapa:Elaborar tabulación en tabla
X Cuenta F
5 - 9 11 2
10- 14 "' 3
15 - 19 - 1111 4
20 24 un 1 6
25 29 11 ,-
30 34 111 3
ESTADISTICA PSICO-EDUCATIVA
EJERCICIOS
3.1 ¿Cuáles son los ltmites exactos de los siguientes intervalos?
a) 15-24, b) 62.5 - 68.5, el 20 - 28.5 d) 10 - 15
61
3.2 ¿Cuál es la amplitud de cada uno de los intervalos anteriores?
3.3 ¿Cuál es su punto medio?
3.4 En un examen de Estadistica los alumnos han obtenido las si-guientes puntuaciones: 16, 18, 26, 15, 17, 21, 27,21,21,26,
14. 20, 23, 16, 19, 24, 22, 23, 20, 26,18,20, 14, 17, 21, 17, 24,27, 18,17,25, 19, 22, 21, 21, 15, 24,22, 15,18.
Prepare una distribución de frecuencias, sin acumular y acumulados introduciendo intervalos de amplitud 3. Calcular las proporciones y porcentajes sin acumular y acumulados.
3.5 Cincuenta estudiantes han obtenido en una prueba de inteligencialas siguientes puntuaciones:
8 11 11 8 9 10 16 6 12 19 13 14 9 13 159 12 ,16 8 7 14 11 15 6 14 14 17 11 6 910 19 12 11 3 6 15 16 16 12 13 12 12 8 17137 12 14 12
Ordene esas puntuaciones en una distribución de frecuencias.
IV
PRESENTACION DE DATOS
REPRESENTACIONES GRAFICAS
4.1 CONSIDERACIONES PRELIMINARES
Para representar sobre un eje los números racionales, se toma sobreél un punto origen O y un segmento OU que se considera como unidad.
A partir de O, y tanto a derecha como a izquierda, se lleva sucesivamente dicho segmento. obteniéndose puntos que representan los números enteros: 1, 2. 3, 4.... -1, -2, -3. Es fácil también representarlos números fraccionados. Por ejemplo, para hallar el punto que rcpresenta el quebrado 3/4. se divide el segmento unidad (OU) en 4 partesiguales. y a partir de O se llevan 3 de dichas partes hacia la derecha.
-3 -2 -1 o ..L 14
2 3
o u
Figura 4. J
64 JESUS DE LA ROSA
Los ejes de coordenadas cartesianas son dos rectas de un plano quese cortan: si forman ángulos rectos, se llaman rectangulares; si no, oblicuas.
Origen de coordenadas es el punto O en que se cortan los ejes decoordenadas. Uno de los ejes OX se supone horizontal, y se llama ejede las abscisas o de las X. El otro, OY, es el eje de las ordenadas o de lasY.
Son abscisas los números reales X, que miden segmentos del ejeOX, contados desde O; positivas, si caen a la derecha; negativas, si caena la izquierda de O. Son ordenadas los números reales y, que midensegmentos del eje OY, contadas desde el origen: positivas, si van haciaarriba; negativas si van hacia abajo.
Sea P un punto cualquiera del plano determinado por los ejes decoordenadas. Tracemos por P las paralelas a OX y OY.
Si OM = a y ON = b, los números a y b se llaman las coordenadasde P, a la abscisa y b la ordenada.
Las coordenadas a, b de P se escribe (a, b), y el símbolo P (a, b)"el punto P cuyas coordenadas son a y b".
y
x'a'
N-------1PIII
IlbIII
a I
M x
Ip'I N'
y'
Figura 4.2
ESTADISTICA PSICQ-EDUCATIVA 65
Cualquier punto P del plano determina dos nümeros reales, queson las coordenadas de P. Recíprocamente, dados dos números reales a'y b' queda determinado por ellos un punto P' delplano. Así, si a'= OM;b' == ON', trazaremos paralelas a los ejes por M' y N'.
Estas rectas se cortan en P' (a', b'). Luego:
Cada punto determina un par de números reales; y recíprocamente,un par de números dados en cierto orden, determina un punto.
Como casos especiales tenemos: los puntos del eje OY tienen suabscisa nula. Los del eje OX tienen nula su ordenada y el "origen"tiene nulas tanto la ordenada como la abscisa.
Los ejes rectangulares dividen el plano en cuatro regiones llamadascuadrantes; éstos se numeran según se indica en la figura 4.3, en el cualtambién se indican los signos de las coordenadas de sus puntos. En laabscisa X se acostumbra a inscribir los intervalos de la clase. En la ordenada Y las frecuencias de esos intervalos.
En la representación gráfica de frecuencias, sólamente se emplea elprimer cuadrante.
IV(-,+)
III(-, -)
Figura 4.3
l(+,+ )
II(+,-)
6
5
4
3
2
JESUS DE LA AOSA
En el trazado de polrgono de frecuencias, histograma y curvas defrecuencias acumuladas, se tienen en cuenta esas consideraciones y seprocura que la altura máxima de las representaciones o dibujos, corresponda a las partes de sus bases. La forma de representar las frecuenciasse manifiesta en el "polígono de frecuencias", "histograma", "curva defrecuencias acumuladas u ojibas" y "curva del porcentaje de las frecuencias acumuladas".
4.2 POLIGONO DE FRECUENCIAS
Una de las formas más comunes para representar una distribuciónde frecuencia simple, es el "polígono de frecuencias". Este se construyede la siguiente manera: en el eje de las X inscribimos los lúnites inferiores de cada intervalo de clase y en el eje de las Y las frecuencias por oroden ascendente, de menor a mayor (Fig. 4.4). Debemos recordar que launidad que tomemos en el eje de las X, deberá proporcionarse a 3/4partes en el eje de las Y. Comenzamos a elaborar el polígono desde elprimer límite inferior de clase y terminamos en el último límite. Seacostumbra hacer un corte entre el punto O y el primer límite inferior.
Figura 4.4
ESTADISTICA PSICO-E DUCATIV A
4.3 HISTOGRAMA
67
Generalmente el histograma se construye de igual manera que elpolígono de frecuencias. La diferencia radica en la forma y estructuradel dibujo. Mientras en el polígono de frecuencias unirnos los puntosde intersección con líneas rectas, partiendo de los limites inferiores; enel histograma los unirnos con ltneas rectas pero en forma cuadrada, formando cuadrados o rectángulos perpendiculares al eje de las X, desdelos puntos medios de los intervalos de clase.
El área comprendida dentro del perímetro de todos los rectángulos cuadrados (si los hay), representa la totalidad de los datos representados (Fig. 4.5).
4.4 CURVA DE LAS FRECUENCIAS ACUMULADAS
Para representar esa curva debernos, en primer lugar, buscar lasfrecuencias acumuladas. Estas son las resultantes de ir sumando lasfrecuencias entre sí, en orden ascendente o descendente.
7
6
5
4
3
2
5 10 15 20 25 30
Figura 4.5 Histograma correspondientetJ la tablo 4.1
68 JESUS DE LA ROSA
La última frecuencia acumulada debe ser, naturalmente, igual a lasuma de todas las frecuencias (véase tabla 4.1). La frecuencia acumulada se representa con las letras fa.
Tabla 4.1
5 W ~ ~ a ~. UFl8Urrl 4.6 Curvll de lasFrecuenciluAcumultuias correspondientesa
Tabla".J
X f fa
5-9 2 2
10 - 14 3 5
15 - 19 4 9
20 - 24 6 15
25 - 29 2 17~
30 - 34 3 20
N = 10
20
18
16
14
12
10
8
6
4
2
~
V
ESTADISTICA PSICO-EDUCATlVA 69
La construcción de la curva se hace de la siguiente forma: en el ejede las X se inscriben, como en el caso del polígono de frecuencias, loslímites de los intervalos de clase, y en el de las Y se colocan las frecuencias acumuladas (véase Fig. 4.6).
La curva que resulta en esta representación es una ojiva y puedeutilizarse en interpolaciones y cálculos. Por tanto, esta curva nos permite conocer cuántos datos están comprendirlos en cada uno de los intervalos.
4.5 CURVA DEL PORCENTAJE DE LAS FRECUENCIASACUMULADAS
La construcción de esta curva es muy semejante a la anterior. Colocamos una columna más (% fa) en la tabla 4.1 que corresponde alporcentaje de las frecuencias (véase tabla 4.2). Por ejemplo, para hallarel porcentaje de fa del intervalo 15 - 19, con su frecuencia acumuladade 9, tenemos que aplicar la sencilla regla de tres:
100 --------20X -------- 9 X
100 x 920 ;X=45
Explicado de otra forma, la suma de las frecuencias comprende el100 %; luego, si queremos conocer o averiguar el porcentaje que le corresponde a la frecuencia acumulada 11, aplicaremos la regla de tres.
Tabla 4.2
X f fa porcentaje de fa
5-9 2 2 10
10 - 14 3 5 25
15 -19 4 9 45
20 - 24 6 15 75
25 - 29 2 17 85
30- 34 3 20 100
N=20
70 JESUS DE LA ROSA
100
90
80
70
60
50
40
30
20
10
Figura 4. 7
Una vez que hemos averiguado el porcentaje de las frecuenciasacumuladas, colocamos en el eje de lax X los límites inferiores de losintervalos de clase, y en el eje de las y la numeración de O a 100 Ó. loque es lo mismo, el porcentaje de cada una de las frecuencias acumuladas.
PrOE IfVESTIOOS, SEGlJIl FACULTADES· U. A.S. D., PERIODO M:.A_DEMICO ENERO_OICEMBRE _1980.__--~
.....
.....
.....tiil-~' ..... iW.
i::l R" .... ~:'"...... ..."-
~~
l ....
~~ .fííIi.
u
~ ~ ~~....
~ ~ .-..: ~ ~
LEYENDA_
......_,. ,,_.•.c.-I 0'••0'."..c ,,_.......e " ..IU._'U. la " :..c...nc.••••IIU•....................,"n.
m!!l1>Oiii...ñ1>..CA
ñOImOe..,1>...<1>
...c. ...c.•.•. P. c ••......AC ....T•••••
'UENTE:: ••"AD .. liTA .IITICA •MIt"IIIA U"...UOlO•.... ., ITAII••• l.". &D.
72
4.6 OTRAS GRAFICAS
JESUS DE LA ROSA
Cuando necesitamos comparar cantidades o porcentajes, se suelenemplear gráficas de columnas, gráficas de pastel. pictogramas y combinaciones de todas ellas.
a) Gráficas de Columna
~
z.o
/iI;¡
o
;e~o
o.n~
or
•<lO
Figura 4.8
73
b) Gráfica de Pastel
ESTADISTICA PSICO_EDUCATIVA
DEUDAEXTERNA NETAGOBIERNO CENTRALAl 31 de Diciembre de 1980(Composición Porcentuall
• BIO 28.70/0AIO 21.00/0 oPL-480 8.70/0 BancO
Mllndial 8.0010
OtroS 33.6010
Figura 4.9
74
e) Grdfica de Columna
JESUS DE LA ROSA
••ZU
ZIO
ltIO
110
'10,
na
ISO
110
140
-'50•~~ IZO
i-110.. loa~
a• la
•.. lOe11
"lO
lO
!lO
<el
.0
20
10
OIlTRI8UCION DE LA MATlIICULA y SOBREEDADDE LA ESCUELA PRIMARIA RURAL
te15 -1'76
CJ "ALUMNO EN EDAD NORMAL.
~ ALUMNO EN SOBREEOAD
10
210
200
190
110
170
160
I !lO
140
130
120
110
100
90
80
70
60
40
.0
20
10
,. 2° 3·
'.AO 01
4° o· ,.
figura 4./0
ESTADISTICA PSICD-EDUCATIVA
EJERCICIOS
75
4.1 A partir de los datos correspondientes a un examen de estadtstica, que ofrecemos más bajo dibujar el correspondiente histogramay poltgono de frecuencias, ast como también la curva de frecuencias acumuladas.
16,18,26, 15, 17,21,27,21,21,26,14, 20, 23, 16,22,23,20,26, 18, 20, 14, 17, 21, 17,24, 27, 18,17,25,19,22,21,21,15,24,22,15,18.
4.2 A partir de la siguiente distribución de frecuencias dibuje el histograma y el poligono de frecuencias
x F
2-4 8
5-7 9
8 - 10 12
11 -13 !O
14 - 1fJ 7
17 - 19 4
4.3 Las puntuaciones en una prueba de int eligencia abstracta han sidolas stguientes.
91, 92,83,81, 88, 94, 91,87, 90, 94,85,93,90,89. 8fí, 87, 89,85,89.
al Organice esos datos en U/la distribucion de jrccuencias.
b l Represcntclos utilizando IIl1a gráfica conveniente.
4.4 ,.1 continuocián datos relativos a poblacián estudiantil por semestre en el pertodo 2e/O. 1974/75 a/ Ido. /978/79.r proveccion all ro, 198/-1982, en la Sede Centralv en los Centros Regionalesde la Universidad Autonoma de Santo {)o111 ineo.
76 JESUS DE LA ROSA
Período Académico Total Total Sede Total U.A.S.D.y semestre Centros Reg. Central (Sede Central y
( 1) (2) (3) Centros Reg.)
1974/7520 2,637 23,248 25,885
1975/7610 2,115 26,513 28,6282 0 2,131 29,210 31,341
1976/7710 2,253 30,918 33,1712 0 2,352 32,228 34,580
1977/7810 2,058 28,714 30,7722 0 2,062 31,971 34,033
1978/7910 3,110 32,427 35,53720 4,019 38,359 42,378
1979/8010 6,860 37,405 44,2652 0 7,617 43,085 50,702
1980/8110 8,695 45,385 54,0802 0 9,954 50,705 60,659
1981/8210 11,427 54,645 66,072
FUENTE: Unidad de Estadísticas ~ OPLAU. Julio de 1980.
Represente esa situación mediante una gráfica de columnas:
v
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
Las representaciones gráficas nos muestran, de una vez, toda laserie estadística o distribución de frecuencias. Pero en ocasiones, sedesea un valor numérico que represente todo el colectivo o muestra quese estudia; este número recibe el nombre de centro o media de la distribución, porque a su alrededor SCl agrupan los demás. La media aritmética, la moda, la mediana y otras que sólo señalaremos muy brevemente.reciben el nombre de números o medidas estadísticas de tendencia central o de concentración.
S.1 MEDIA ARITMETICA
Llamaremos media aritmética de n números, al cociente de dividirentre 11 la suma de esos números. La media aritmética es la medida deconcentración o de tendencia central más estable y que posee propiedades matemáticas, que no tienen ni el modo ni la mediana.
La media aritmética tiene un valor intermedio entre el menor ymayor de los números considerados.
En efecto, sean los números al, a2 , a J an
Entre los cuales supondremos que al es el menor y an el mayor.
De acuerdo con la hipótesis. se verificará:
7i
78
y de aquí
al + a2 + anal < <.a,
n
como queríamos demostrar
JESUS bE LA ROSA
Como los números, generalmente, son expresión de diferentes datos, diremos: Media Aritmética de un grupo o serie de datos, es su sumadividida entre el número de ellos.
Ejemplo: En los diferentes meses del año académico, un estudiante de una' escuela Secundaria obtuvo en algebra las calificaciones 65, 80,75,80,62,86,87,80,79. Su nota promedio del año será:
65 + 80 + 75 + 80 + 62 + 86 + 87 + 80 + 799
77.11
Por tanto, la fórmula de la media aritmética en datos no agrupadoses la fórmula 1:
(1) M=J1LN
x = Datos no agrupados:E = SumaciónN = Número de datos
En datos agrupados se utiliza la fórmula 2, como podemos apreciara continuación:
:E f. pmN
f = Frecuenciaspm = Punto Medio de Clase
N = Número de datos
Ahora bien, para sustituir correctamente la fórmula, necesitamosconocer el producto f. pm, por lo que construimos la tabla 5.1, de acuerdo con el ejemplo presentado en el capítulo 3; (véase la tabla 3.4):
ESTADISTICA PSICO-EDUCATlVA
Tabla 5.1
79
x f pm fpm
5-9 2 7 14
10 ~ 14 3 12 36
15 - 19 4 17 68
20 - 24 6 22 132
25 - 29 2 27 54
30 - 34 3 32 96
L f. pm = 400
L f. pmN
M=20
Interpretación de la tabla 5.1
~=2020
Primero: de las columnas X y f, ya conocemos como se elaboran.
Segundo: la columna (pm) se deduce mediante la columna X; pmes el "punto medio" de cada uno de los intervalos declase: por ejemplo, el pm del intervalo 30 - 34 es 32,ya que si ordenamos 30 - 31 - 32 - 33 - 34, el número 32 es el que ocupa el lugar medio entre esa serie numérica.
Tercero: la columna (f. pm) es el resultado de multiplicar cadafrecuencia por su respectivo punto medio; por ejemplof= 3 por prn = 3 x 32 es igual a 96.
Cuarto: se suman las frecuencias y el producto de las frecuenciaspor puntos medios.
80 JESUS DE LA ROSA
5.1.1 PROPIEDADES MATEMATICAS DE LA MEDIA ARITMETICA
Las principales propiedades matemáticas de la media aritméticason:
a) El promedio de las desviaciones de los valores de la serie con respecto a la media aritmética (M) es igual a cero.
En efecto:~ (pm - M) f =~ f.pm - M ~ f
Por definición de Media Aritmética
~ L pm
N
Pero como ~ f= N; ~ f.prn - M k f= k f.prn - MN
Al ser la diferencia de dos valores iguales a cero
k (pm - M) [= ~ f . pm - M k f = ~ f . pm -- MN = O
Vamos a ilustrar con un cicrnplo: Sea la siguiente distribución defrecuencias y el cálculo de su media aritmética correspondiente:
X f P. M. [P.M. (PM - M) [<PM - M)
5-9 2 7 14 - 13 - 26
10 - 14 3 12 36 - 8 - 24
1'5 - 19 4 17 68 - 3 -12 (-62)
20 - 24 6 " 132 2 12
25 .- 29 2 27 54 7 14
30 - 34 3 32 96 12 36 (62/
. \: = 20 ~ fP.M.=400 2.:x=~f<PM-M)=--O
~ fP. M. 400x= ;-..; =~=20
Observe que la suma de las desviaciones con respecto a la media
(M) es il,!ual a 2.: f (PM MI=O.
ESTADISTICA PSICO-EDUCATIVA 81
b) La Media Aritmética de una serie es igual a un número arbitrarioe más la Media Aritmética de los desvíos con respecto al número C.
En efecto:L (X ~ Of= L xr - C L f
Dividiendo ambos términos de la igualdad entre N, tenemos:
L (X - C)f
N
L (X - 0+ C =N
LX fN
LX f
N
CLfN
Luego:M L (X NC)f + C
Esta propiedad se denomina traslatividad.e) La Media Aritmética depende del conjunto de valores de la serie,
puesto que todos ellos entran en su cálculo, realizando así una delas condiciones para que sea valor representativo de los de la serie. En particular, si todos los valores de la serie son iguales, lamedia coincidirá con ese valor. Y,
d) Está unívocamente determinada en toda serie.
Se puede simplificar el cálculo de la Media Aritmética aplicando lapropiedad anunciada en (b). Vamos a ilustrar con un ejemplo:
Tabla 5.2
Salarios de Profesores por hora clase
Salarios 1 hora (X) No. de profesores [f) X-e F(X - e)
$ 1-3 1 -2 -2
4-6 4 -1 -4
7-9 9 O O
10 - 12 6 1 6
13 - 15 2 2 4..
916 -18 3 3
N = 25 ~f(x-c)= 13
82 JESUS DE LA ROSA
M = C +r- (X - C) f 1il N ]
(13)M=$8+ «2'5))3 =$8+$1.56=$9.56
Basta con hacer C = $8 = punto medio del intervalo $7 - $9.
Cualquier valor puede ser tomado como C. Sin embargo, a fin desimplificar los cálculos, el punto medio de una de las clases localizadascentralmente en los datos debería ser seleccionada como valor de C.
5.2 MEDIANA
Si por ejemplo, tomamos varias muestras de un mineral, obtenemos un porcentaje en peso y los ordenamos siguiendo el criterio máslógico, obtendremos una sucesión creciente como ésta:
14.9 - 17.8 - 17.9 - 18.6 - 18.8 - 19.6 - 20.2 - 21.2 - 21.3 - 21.621.9 - 22.9 - 23.2 - 23.5 - 23.8 - 24.3 - 25.3 - 25.3 - 26.0 - 26.1
Se define la Mediana como el elemento que ocupa el lugar centralen la sucesión. Así, en nuestro caso, la mediana sería:
Mdn= 21.3 + 21.62
=21.45
Dicho de otra manera, mediana es la puntuación por encima de lacual se encuentre la mitad de las demás puntuaciones y por debajo, laotra mitad. La fórmula, en datos no agrupados.
N + 12
(3) Lugar que ocupa el número que corresponde a la Mediana
La fórmula 4, en datos agrupados de la Mediana es:
~J'! - fa 1
(4) Mdn = Li + 2 Ji Li = Límite inferior de la clasefm modal
N = Total de frecuenciasfa = Frecuencia acumulada del in
tervalo que precede al de laclase modal
ESTADISTICA PSICO-EOUCATlVA 83
f = Frecuencia correspondiente ala clase que con tiene a la mediana.
i = Intervalo
5; Mdn =20 + 0.83
Para seguir con nuestro ejemplo de la tabla 5.1, la mediana sería:
[
20 ]2 :9Mdn =20 +
Mdn = 20.83
5.3 MODAO MODO.
Moda es el elemento al que corresponde mayor frecuencia. Es latendencia dominante. En general, suele emplearse para caracterizar ala serie el valor de la Media Aritmética; pero algunas veces se recurrea los de la Mediana o la Moda por su mayor rapidez de obtención.
Hay dos clases de moda: la Moda "directa o empírica" y la "corregida". La Moda directa es el punto medio del intervalo de clase quetenga más frecuencias. Por ejemplo, en nuestro ejemplo de la tabla 5. 1,la moda directa sería:
Clase Modal = 20 - 24Moda Directa =Mo =22
La Moda corregida se determina mediante la fórmula que exponemos a continuación:
L = Límite inferior de la clase modal.
6) =(Letra griega "delta") =diferencia, sin tener en cuenta lossignos, entre la frecuencia dela clase modal y la de la claseinmediatamente anterior.
61. Diferencia, sin tomar en cuenta los signos, entre la frecuen-
84 JESUS DE LA ROSA
cia de la clase modal y la de laclase inmediatamente posterior.
= Magnitud del intervalo de lacIase modal.
Ejemplo: En nuestro caso de la tabla 5.1, sustituiríamos la fórmula así:
rMo = 20 + I
L
6 - 4 1.(6 - 2)+ (6 - 4) J)
Mo =20 +(+)5 =20 + 1.67
Mo =21.67
S.4 MEDIA GEOMETRICA
Media Geométrica (MG) es la raíz enésima del producto de los valores dados. Su cálculo es muy parecido al aritmético. pero en vez desumarse los datos se multiplican. Para calcular la Medía Geométricacuando los datos no están agrupados se aplicar la fórmula 6 que aparecemás adelante:
n,,--------(6) MG =V al, a2 an
Ejemplo: Calcúlese la Media Geométrica de 10,25,4
MG =.j'-1-0-.2-S-A
MG= 10
3. _
= V 1000
La fórmula 7. corresponde a la Media Geométrica cuando los datosestán agrupados, es la siguiente:
(7) MG =\1 a' fi fll X al
ai = Punto Medio de Clase
~STAOISTICA PSICO-~OUCATIVA
f¡ = Exponente o potencia a que se eleva a
i = 1,2" n
85
Ahora bien, cuando los datos son muchos, es más fácil y rápido hacer el cálculo por logaritmos, las fórmulas (6) y (7), al aplicar los logaritmos se convertirán para datos no agrupados en (8) Y para datos agrupados en (9):
(8) Lag MG = -L k Lag ain
(9) Log MG =+~ F¡ Log ai
Ejemplo: Calcúlese la Media Geométrica de 10, :!5, 4 por medio de lafórmula g.
J _
MG =..; 10.25.4
MG
Log MG
Log M(;
(10.25.4)1/3
Lag (10.25.4)1/3
Log 10 + Log 25 + Lag 43
1.000000 + 1.39794 + 0.602063
3.000003
Me = I {J
Para finc\ dc ejercicio calcúlese la media geométrica del ejemplo dela tahla S.I aplicando la fórmula 9.
(,cncralml'ntL' la Media Geométrica sc emplea en series estadísticasCUY;I\ variaciones no \c expresan por diferencias absolutas, sino por grado-, y talllhil'n en '''guna, d ist rihucioncs aritméticas.
5,5 \IEDlA ARMONICA
Media Armónica es la recíproca de la Media Aritmética, calculada
86 JESUS DE LA ROSA
para los recíprocos de los números dados. Se usa, por lo general, parapromediar datos que son inversamente proporcionales a una magnituddada. Se expresa simbólicamcntc: MA.
Fórmula:
(10)N
MA=---.-----L...!...
x
Ejemplo: Calcúlese la Mcdia Armónica de 10,25,4
3
1 I I10+"""25+-4-
MA = 7.69
5.6 MEDIA CUADRATlCA
30.39
La Media Cuadrática es el resultado de extraer la raiz cuadrada a laMedia Aritmética de los Jatos elevados al cuadrado. Se representa conel símbolo M.e.
(11 )
Ejemplo: Calcúlese la Media Cuadrática de 10. 25. 4-
MC =..;
MC =..;
(IW + (2512 + (4)2
3
100+625+16.1
MC=";~3
Me = 15.71
ESTADISTICA PSICO-EDUCATIVA
I~ESUMEN DE LAS PRINCiPALES CARACTERISTICASDE LOS TRES PROMEDIOS COMUNES
87
MediaModa (M,,)Caructeristicus aritmética (M) Mediana (Mdn)
Cálculo: Cada valor Valor central Valor con la másbasado en alla frecuencia
Afectada por La más afectada No (afectada sólo Novalores extremos por elementos)
Manipulación Si:~X
No (promedio posi- No (promedio dealgebraica M=-- cional, valor ínter- concentración. cua-
N polado en muchos tro métodos paracasos) datos allrupados)
Propiedades ~(X-M)-O ~(X- Mdn) esmatemáticas k (X- M)2 es mínimo
mínimo (desdeñandolos sienas)
Aplicación para Indeterminada !?eterminada Determinadaclases abiertas
Comparación de Puede ser mayor o Puede ser mayorrespuestas para los menor que Entre M y Mdn o menor lIuemismos datos M. y M" Mdn Y-M:...___
Tipo de datos Mayoría de los El valor central es Datos con distintapreferidos tipos típico. excluyendo tendencia central
extremos
88
EJERCICIOS
JESUS OE LA ROSA
1. ¿Cuáles son tas fórmulas
a) De la M en una serie de valores agrupados en intervalos.
b} De la M en una serie de valores no agrupados.
e) Delia /ltdn en una serie de valores agrupados el! intervalos.
d) De la Moda de ulla serie de valores agrupados en intervalos.
2. Se nos dá la sigutente tabla:
x ¡:
54 -56 1
57-59 1
60-62 3
63-65 5
66-68 /5
69-71 9
72-74 3
75-77 :1
78-80 /
Calcule:
a) Los puntos medios de cada intervalo (P. M. X)
b) La Media Aritmética (lit)
e) La Mediana (lItdn)
d) La Moda (Mo)
3. ¿Qué nos dicen de esta el/n'a los valores centrales de la tabla defrecuencia de ejercicio 2.'
ESTADI5T1CA P5ICO-EDUCATIVA 89
4. La Media Aritmética de dos mímeros vale 8 r UlIO de el/os es tres.'eces mayor que el otro. <,OlálltO valen ambos números?
5. Deseamos transformar las puntuaciones 8, 13, 9, 15, 10 en otros,Sil filando/es a todos el/os una misma consta lite, de modo que Sil
media valga 26. ¿ClIál debe ser esa constante aditiva?
VI
MEDIDAS DE VARIABILIDADO DlSPERSION
MEDIDAS DE VARIABILIDAD O DlSPERSION
Hemos apreciado que por el cálculo de las diferentes medidas detendencia central, tenemos una idea del colectivo; pero también se observa fácilmente que la información que nos dan es insuficiente; porejemplo, dos alumnos han obtenido las siguientes calificaciones en susprimeros exámenes parciales. La escala de calificación en exámenes parciales va de O a 20.
Alumno A; 16 -- 4 - 18 - 0-:; -- 14 - 16 - 10Alumno H: 10 - 10- 8 - 10 - 10 - 12 -- 10 - 10
Los dos alumnos. A y H, obtienen 10 de promedio y. sin embargo,las calificaciones que han obtenido ambos son muy distintas, separándose mucho de 10 el alumno A, mientras que el alumno B ha conseguido
un •• mejor rcgularulad.
Otro ejemplo podría ser el siguiente: Si las edades de un grupo deamigos son. respectivamente. 38, 41. 40. 4 J. 39, 39, 4:; años es admisihlc decir que los amigos del grupo tienen 40 años (que es el promedio).mientras que si las edades lit' los miembros lit' una familia son 13. 15,IX. -tOo 45, (,7 Y X:; años. no tiene ningún sentido decir que la edad !!,"ncrul cs 40 años, aunque 40 sea el promedio lit- las edades.
Vcmo-; pues. la ncccsidacl lit' introducir un método de apreciar 1.1propiedad con que los números estatlíslicos ,kfinillos caracterizan laserie. Para ello utilizaremos las 1I'lIlladas "medidas de variabilidud odispersión" de los cuales ,'sllllliar,'mos la amplitud total o rango. la
'JI
92 JESUS DE LA ROSA
desviación semi intcrcuart il. la desviación media, la desviación típicay la varianza.
6.1 LAAMPLITUD TOTAL O RANGO
La medida de variabilidad más sencilla. pero menos exacta es laamplitud total o rango. Se obtiene calculando la diferencia entre lapuntuación mayor y la menor y agregando 1al resultado. Se representa por el símbolo AT. y su fórmula es la siguiente:
( 121 AT =(Xma ~ Xme ) + 1 ATXmaXme
Amplitud totalPuntuación MayorPuntuación Menor
ljcmplo: Calcúlese la amplitud total de los siguientes datos:70 25 ~ 80 ~ 90 28 31 46 ~ 57· 10026··98·94··7362
AT = ( 100 2:'i ) + 1AT = 76
°1 O2 03
25' I 251.
1251.
125'
SIl I I I •
25' 501. 75'
ESTADISTICA PSICO-EDUCATlVA
6.2 DESVIACION SEMI-INTERCUARTlL
93
Q¡ =Li +
Cuartil es un punto sobre la escala que divide el número de observaciones, dentro de dos grupos con proporciones conocidas en cada grupo.
Por ejemplo, hay tres cuartiles, Q. , Q2 Y Q3: ellos dividen un grupo de observaciones en cuatro partes, Q, es el punto sobre la escala numerada que comprende el primer cuarto del total de observaciones: lamitad de las observaciones hasta el punto Q2 y el 75~ de observacioneshasta el punto Q3.
La distancia entre el primer y tercer cuartiles de un grupo de puntuaciones (Q3 - Q¡) se llama amplitud intercuartil. Por tanto, desviación semi-intercuartil (Q) es igual a la mitad de la distancia entre el primer y tercer cuartil.
Q3 -Q¡
2
~~F~FA}
L¡ = Limite inferior de! intervaloen que cae el cuartil,
N =Total de frecuencias
Fa =Frecuencia acumulada del intervalo que precede al cuartil.
Fm=Frecueneia donde cae e! segundo cuartil.
Fq = Frecuencia donde cae e! tercercuartil.
94 JESUS DE LA ROSA
Ejemplo: Calcúlese la amplitud semi-intercuartil de la siguiente distribución:
Tabla 6.1
x F Fa
5-9 2 2
10 - 14 3 5
15 - 19 4 9
:W- 24 6 15
25 - 29 2 17
30 - 34 3 20
N=20
Primer paso: se obtiene Q¡ o primer cuartil de la siguiente forma:
al Contamos 1/4 de N desde el extremo de datos inferiores de la distribución. Un 1/4 de 20 es igual a 5, por tanto, Q¡ tiene que caeren el intervalo 10 - 14 que contiene 3 puntuaciones.
b ) De la tabla 6.1 concluimos que:
Li =: 10
N4=5
Fa= 2
Fq =3
i=5
e) Sustituimos la fórmula de Q¡ :
5- 2 15Q¡ = 10 + (-3-) 5; Q. = 10 + (-3-)
ESTADISTICA PSICO-E DUCATlV A
0 1 = 15
95
Segundo paso: se obtiene Q3 o tercer cuartil de la siguiente for-ma:
a) Contamos 3/4 de N desde el extremo de datos inferiores de la distribución. 3/4 de 20 es igual a 15, por tanto, Q3 tiene que caeren el intervalo 20-24 que contiene 6 puntuaciones.
b) De la tabla 6.1 concluimos que:
L=20
3/4N=15
Fa=9
Fm=6
i=5
e) Sustituimos la fórmula de Q3
Q3 =20 + ( 156-9
) 5; Q3 =20 +(~)
Tercer paso: Se sustituye la fórmula (13) para obcener la desviación semi-intercuartil (Q).
Q=5
6.3 DESVIACION MEDIA
25 152
10=-2-
La desviación media es otra medida de dispersión bastante exacta.Es el cociente que resulta de dividir la suma de los desvíos en relaciónCOIl la media, sin tener en cuenta el signo de los valores considerados.
La desviación media se representa con el símbolo DM y su fórmula en datos no agrupados es la siguiente:
96
(14) DM=~ IxI
N
JESu's DE LA ROSA
~ = Signo sumatorio
Ixl =Valores absolutos de x =X - M
N = Población o colectivo. Número total de datos.
Ejemplo: Calcúlese la desviación media por la fórmula 14, con lossiguientes datos: 50 - 49 - 48 - 47 - 46 - 45 - 44 - 43 - 42.
Solución: El primer paso es calcular la media aritmética que.deacuerdo con la fórmula conocida sería M=46.
A continuación elaboramos la tabla 6.2 y a partir colocamos losdesvíos, positivos hacia arriba y negativos hacia abajo, convirtiendoéstos en valores absolutos de X.
Tabla 6.2
X X IxI
50 4 4
49 3 3
48 2 2
47 1 1
46 O O
45 -1 1
44 -2 2
43 -3 3
42 -4 4
k 1 x 1 = 20
DM= klxI.. N
20=-9- = 2.2
ESTADISTICA PSICO-EDUCATIVA 97
Cuando los datos están agrupados, la fórmula 1S de la desviaciónmedia es la siguiente:
~ F 1dI(lS) DM= N F = Frecuencias
1 d 1 = Diferencias absolutas entrepunto medio y media aritmética.
¿Cómo se calcula? (Véase tabla 6.3)
1ro. Se busca la media aritmética.
2do. Se calcula el punto medio de los intervalos (pm)
3ro. Se buscan las diferencias entre los puntos medios y la mediaaritmética.
4to. Se buscan los productos de los valores absolutos de estas diferencias, por las frecuencias.
Sto. Se suman estos productos (sin tener en cuenta el signo).
6to. Se divide el total entre el colectivo o suma de frecuencias.
Ejemplo: Calcúlese la desviación media según la fórmula 15 de laspuntuaciones de la tabla 6.3.
Tabla 6.3
X F Pm F.pm d F IdI
5-9 2 7 14 -13 26
10-14 3 12 36 - 8 24
15 - 19 4 17 68 - 3 12
20- 24 6 22 132 2 12
25 - 29 2 27 54 7 14
30- 34 3 32 96 12 36
N =20 ~pmf=400 1.:d=O 1.:fldI = 124
M=
96
~ F.pm =~= 10N ~O-
D. M = ~ F~dl = l;~ = 6.~
jESUS De LA ROSA
6.4 DESVIACION TIPICA
Lo más sencillo para caracterizar una serie parece que debiera serhallar las desviaciones x de todos los elementos de la misma respcc tode la media y calcular el promedio como medida de la dispersión de' laserie; pero este razonamiento resulta ilusorio ya que la suma de las desviaciones con respecto a la media aritmética es nula.
Podemos tomar el promedio de los cuadrados de las desviacionescon respecto a la media, como cuadrado de un número al que llamaremos desviación ttptca que no será nunca nulo. por no poder serlo unasuma de cuadrados, más que en el caso de ser todos nulos. o sea, iguakslos elementos de la serie.
La desviación típica es la medida de variabilidad más exacta, másimportante y la más utilizada. Se representa mediante el símbolo S
Cuando los datos no están agrupados se calcula con la fórmula 16.que exponemos a continuación.
(16)
Cálculo de la desviación típica del ejemplo de la tabla 6.4.
Iro. Se calcula M (media aritmética) de la distribución.
2do. Se calculan las desviaciones con respecto a esa media.
3ro. Se elevan tales desviaciones al cuadrado.
4to. Se suman las desviaciones al cuadrado.
Sto. Se divide esa Suma entre el número de casos (N).
6to. Se extrae la raíz cuadrada de ese cociente.
ESTADISTICA PSICO-EDUCATIVA 99
Ejemplo: Calcúlese la desviación típica de un alumno que obtiene las calificaciones siguientes: 80,80,90,91,82,85,87,90,91,90.
Tabla 6.4
M.ATERIA CALIFICACION (X) x x 2
I 80 -6.6 43.56
2 80 -6.6 43.56
3 90 3.4 11.56
4 91 4.4 19.36
5 82 -4.6 21.16
6 85 -1.6 2.56
7 87 0.4 0.16
8 90 3.4 11.56
9 91 4.4 19.36
10 90 3.4 11.56
~X= 866
M =~X =866 =86 60N 10 .
S =v ~ x2 =V184.40 =V18.44
N 10
S=4.29
Cuando los datos están agrupados podemos utilizar dos fórmulas:el método abreviado (fórmula 17) es más corto y sencillo, pero tambiénmás inexacto; y la fórmula 18, es la más exacta y utilizada.
..:::......:::..,,=.__ ( ~ F x' )2N
.v~ FX,2S =)N
(17)
100
F = Frecuenciasx' = Desviación con respecto a un valor cualquiera CN = Número total de datos.
JESUS DE LA ROSA
(18) s= Jr:D2F = FrecuenciasD = Desviaciones de los puntos medios con respecto a la media aritmé
tica.N = Total de datos.
Ejemplo (tabla 6.5): Calcúlese la desviación típica por el métodoabreviado (fórmula 17), de acuerdo a los datos de la tabla 6.5.
Tabla 6.5
X F x' F x' F (X:)2
~-9 2 -3 -6 18
10 -14 3 -2 -6 12
15 - 19 4 -1 -4 4
20 - 24 6 O O O
25 - 29 2 1 2 2
30- 34 3 2 6 12
N =20 rFx= - 8 rFx,2 = 48
.Jr F x,jS =1 N
S = SV 2.40 - 0.16
ESTADISTICA PSICO-EDUCATlIfA
S=5~
s = 7.48
101
Ejemplo (tabla 6.6): Calcúlese la desviación típica por la fórmula18, según los datos de la tabla 6.6.
Tabla 6.6
X F PM FPM D D2 FD2
5-9 2 7 14 - 13 169.0 338
10 - 14 3 12 36 - 8 64.0 192
15 - 19 4 17 68 - 3 9.0 36
20 - 24 6 22 132 2 4.0 24
25 - 29 2 27 ~4 7 49.0 98
30 - 34 3 32 96 12 144.0 432
N= 20 r FP~OO r FD2 =1120
M = r FPM =..--iºº- = 20N 20
F = FrecuenciasPM = Puntos mediosF.PM =Producto de las frecuencias por puntos medios.
D = Desviaciones de los puntos medios de clase con respecto a la mediaaritmética.
F.D 2 = Producto de las frecuencias por desviaciones al cuadrado.
La varianza es el cociente de dividir la suma de los productos delas frecuencias por los cuadrados de las desviaciones correspondientessobre el número de las puntuaciones. Véase la fórmula 19, en datos noagrupados:
102
(19)
(10)
Fórmula para datos agrupados:
52 = ~ FD2
N
JESUS DE LA ROSA
Ejemplo 1: Hállese la varianza de un alumno que obtuvo las siguientes puntuaciones 80, 80, 90, 91, 8~, 85, 87, 90, 91, 90.
~ x2 184.452 =-N-= 10
52 = 18.44
Ejemplo '). Hállese la varianza de la tabla 6.6. según la fórmula20:
5 = 1""5"6
6.S DlSPERSION RELAT1VA
Las medidas de dispersión expresadas en valores absolutos. comofueron presentadas en las secciones precedentes, son convenientes paradescribir la dispersión de un solo conjunto de valores. Si dos conjuntosde valores están siendo comparados, los valores absolutos de sus desviaciones son convenientes solamente cuando los promedios de los dosconjuntos son aproximadamente del mismo tamaño y las unidades demedida de los conjuntos son iguales. Es obvio que la comparación dedos diferentes unidades, tales como las puntuaciones alcanzadas en untest de inteligencia con los sueldos de los profesores, no tiene sentido.
Cuando los promedios son claramente diferentes. aunque las unidades pueden ser las mismas, la tarea de comparar los grados de dispersión basados en los valores absolutos de los diferentes conjuntos es aúndifícil. Por ejemplo, los pesos de los estudiantes secund...rios son gene-
ESTADISTICA PSICO-EOUCATIVA 103
rulmcntc mayores que los pesos de estudiantes de escuela Primaria. Elpromedio y la desviación típica de los pesos de un grupo de -estudiantessecundarios. por lo tanto. se espera sean mayores que aquellos de un grupo de estudiantes de escuela Primaria. Examinaremos los dos conjuntosdl' valores de las tablas 6.7. Las medias aritméticas de los conjuntos esclaramente diferente (67 libras para uno y 50 libras para otro).
Aparece también mas alto grado de dispersión en los pesos de losestudiantes secundarios. La desviación t ípica es significativa solamenteen relación con la media respecto a la cual se calcula. Una medida dedispersión expresada en un valor relativo cs. por tanto, requerida poreste tipo de comparación. En general, una dispersión relativa es el 1.'0
cicntc de una medida dada de dispersión dividida por el promedio conrespecto al cual las desviaciones fueron medidas.
Tabla 6.7
cm1PARACION DE DESVIACIONESTIPICASEN VALORES ABSOLUTOS
Conjunto 1: Pesos de 3 estudiantes Conjunto 2: Pesos de 3 estu-secundarios diantes de escue
la primaria
PESOS EN LIBRAS PESOS EN L1BnASX x x2 X X x2
120 3.67 13.47 40 -10 100
121 2.67 7.13 45 - 5 25
130 6.33 40.07 65 15 225
~X=371 ~x = 0.01 LX2 = 60.67 ~X=150 ~x=O ~X2 =350
M = ~l = 4 = 123.67 M=~=~=50N 3
'1 Lx2' 60.(,7 fU rz:
S = \ . ,=V- -' - = 4.50 libras S = V=¡f--= V-~= 10.8 libras
104 JESUS DE LA ROSA
La medida de dispersión más comúnmente usada expresada en valor relativo es el coeficiente de variación representado por V. Es el cociente de la desviación típica dividida por la media aritmética, o segúnfórmula 21.
(21 )s
V=-M
La coeficiente de variación de los pesos de los tres estudiantes secundarios es:
4.50123.67
sV =~ = ----;-;;-:;--;-;;-- = 0.04
expresada esa medida en tanto por ciento, V = 4%
El coeficiente de variación de los pesos de los tres estudiantes deescuela Primaria es:
sV=~= 10.8 =O "16 ó "1 6 ~50 .- -..
La dispersión relativa de los pesos de los estudiantes de la escuelaPrimaria, es más grande que la de los pesos de estudiantes Secundarios.
Existen otras medidas de dispersión expresadas en valores relativos.cuyo estudio sale fuera del propósito del presente libro.
6.6 CARACTERlSTICAS y USOS DE LAS MEDIDAS DEVARIABILIDAD
l. La desviación típica es la más influida por los datos extremos, enrazón de que se elevan al cuadrado las desviaciones, en tanto que ladesviación media está menos influida por los datos extremos.
2. La desviación típica es la medida de dispersión más usada.
3. Si se desea hacer una investigación estadística con bastante cxactitud, se deben de aplicar las medidas según el orden siguiente:
1) desviación típica,2) desviación media, y3) amplitud total.
4. Si se quiere realizar un trabajorápidosin que la exactitud importe d,'masiado, se deben aplicar las medidas anteriores pero en sentidoinverso.
ESTADISTICA PSICO-EDUCATlVA
EJERCICIOS
105
1. Los siguientes valores representan los números de visita a una biblioteca por un grupo de ocho estudiantes en un mes: 1, 2, 2, 4, 5,11.11,20.
Calcule:
1) Recorrido
2) Desviación semi-in ter cuartil.
3) Desviación media.
4) Desviación tiptca.
2. Los pesos de 12 jugadores en cada uno de los dos equipos juveniles de baloncesto, están dados como sigue:
Club La Agustina. 130, 125, 114, 118, 120. 141, 137. 139, 121.135.118.141
Club San Carlos. 125. 118, 117, 116, 114. 116, 135. 136, 120.121,131,116.
Calcule con dos cifras decimales, lo siguiente por cada equipo:
1) U recorrido
::) La desviacián semi-Lntercuartil
3) La desviación media
4) La desviación t tpica
5) Comparte, mediante el coeficiente de mriacióll. la desviación deUII club CIl pesos en fa del otro,
'06 jESUS Df: LA ROSA
3) Las calil/I<lc/()i/, ' de Sil estudioni.-, cn UIIiI clase dé' n tacli-.rica,están dada; 11 coutinuacion
Calificaciones ,''¡¡II/cro de c-tudiantc:
lO ~ }9 3
30 -- 39 6
40 49 5
51) 59 7
(¡f) (,<) IU
71) 7'J }'J
:')() - 89 /}
'JO 99 \'
Caltu!« con do« cifras dccinutlr-.
al La di -viatiún media
/J) l.a dnJ';acir;1/ t init«
ti U cllcf!eienr,' de vnriucion
.:/, Tenemos los dos s;gllie/l{('\ series
.vlunmas (,rl//JII I (,ni/JO JJ
l ro. 86 SI)
ldo. ,\'.1 sr,
Jro. 83 85
4 to. 7'J S3
5ln. 75 81
tito, 74 7'J
Zmo, 7} 74
81'(). 67 73
9!lo. 66 71
1{J I/lII. r,5 6S
ESTADISTICA PSICO-EDUCATIVA
a) ¿Cuáles son los valores centrales de ([IIl!Jr"
b ) ¿Qué nos dicen las desviaciones t ipicas .t, c.ta. 1 '!!'¡I"í/)[/(/(ill conrespecto a la variabilidad que representan.'
¿En qué grupo se registra más rariabllidad "
5. Se ha aplicado un examen de ingreso a (vt ) 1/1('1",/1//1'5 u ' 1/1'1([1' eSII/·dios en la Academia Naval. He aqut' los reSI//I,IIIr,\
91, 68, 69, 72,41,54,65,48, 49, 5~, 11. -IS, 7Ii "', SO, (I}, 48,
52, 54, 56, 48, 42, 45, 70, 75, 76, 79, YO, CJ}, (1-/ (jl¡ AJ, (¡5, CJ t,62, 80, 84, 85, 86, 87, 88, 43, 45, 4fí, 47,41. 5_', e ~ :..J. 55. ()3.92,90,91,90,93,48,49,52,71
a) <'Cuál es la amplitud total recorrida de los (1II'i/'(/II[('\
b ) Construva con esos datos una tabla de trccucncias que CO/II/Jr1'l/l/¡1
10 intervalos ,1' las CO/¡llIllWS que convengan pura poder C"/CI//"I'
.\tedia Aritmctica (,1f)
Dcsviacion t tpica (S)
Cucticicn [e de variacion (e 1'.)
VII
MEDIDAS DE ASIMETRIA y APUNTAMIENTO
7.1 DlSTRIBUCION SIMETRICA
Diremos que una distribución de frecuencia es simétrica si a cadapuntuación X], distante de la media, por la derecha, una distancia K, kcorresponde otra puntuación XL, distante de la media, por la izquierda, la misma distancia K y tales que la frecuencia correspondiente a XI.es la misma que la correspondiente a XL.
En una distribución de frecuencia simétrica, los valores de la media aritmética, la mediana y la moda son el mismo; es decir, M = Mdn =Mo.
Una distribución de frecuencia simétrica significa que la clase central tiene la mayor frecuencia y que las frecuencias, arriba de la clasecentral de la distribución, corresponden exactamente a las frecuenciasabajo de la clase central, Si la distribución de frecuencia se muestra mediante una gráfica de barras (histograma) o una gráfica de línea (polígono de frecuencia), una recta vertical a través del punto medio de clasede la clase central puede dividir la gráfica en dos mitades idénticas perfectas.
La intersección de la recta vertical y el eje de las X, da los valores dela media aritmética, la mediana y la moda.
109
1'0 JE9US DE LA ROSA
Tabla 7.1
CALIFICACIONES DE 28 ESTUDIANTES EN UNAPRUEBA DE ESTADISnCA
Calificaciones Punto Medio de Clase No. de Estudiantes
30 y menos de 40 35 2
40 y menos de 50 45 3
50 y menos de 60 55 5
60 Y menos de 70 65 8
70 Y menos de 80 75 5
80 y menos de 90 85 3
90 y menos de 100 95 2
k Fd . OM=C + (-N-) 1 = 65 + (28 ) 10 = 65
_]'.1_ Fa2 J+3+5
Mdn=L+ (-"'--F-m--)i=60+l4-( ~ 8 )10=65
6 1Mo= L + ( 6
1+ 6
2) i = 60 + (
8-5(8 - 5) + (8~ 5» l O= 65
La distribución de frecuencias en el ejemplo de la tabla 7.1, seilustra en la gráfica 7.1.
Diremos que es asimétrica toda distribución que no cumpla con loacabado de indicar.
ESTADISTICA PSICO-E OUCATlV A 11'1
"(orr.O":" t'.;"ldlnnh.'"l>!!'I·,'\J{'rJ"ja;
r----------------
111 "l .. M
J('l 4üoL-L-L-_.l-_~_.L_+_.J.--..L--L--L~...J
.20 11)(, [lf l (CaJi!icn.
clones)
1, r!
'(~ ,
Gráfica 7.1llustracion del histograma .l' el pol igono de frecuencia
de U/la distribución simctrica
Caliticacíoncs dc LS estudiantes en una prueba de cstadistica.
7.2 INDICES DE ASIMETRIA BASADO EN LOS TRES CUARTllES
Si la distribución es simétrica. 0 3 O2 = O2 0 1 , Si la distri-bución es asimétrica positiva, 0 3 - O2 > O2 - 0 1 , Si la distribuciónes asimétrica negativa. 0 3 Q2 < O2 - 0 1 , (Véase las gráficas 7.2,7.3 Y 7.4)
De ahí podemos tomar índice de asimctr ia el siguiente criterio:
Si la distribución es asimétrica positiva, As > O. Si la distribuciónes asimétrica negativa, As < O. Si la distribución es simétrica As = O.Además, ~l < As < l. En efecto, al tender (0 3 - O2 ) a cero, As tiende a -1: y al tender (02 - 01) a cero, As tiende a 1.
112
Gráfica 7.2
1--
Q, Q, Q.,
Asimétrica Positiva
Gráfica 7.3
n
JESÚS DE LA ROSA
.---
~
1--
.--
r-r-r- 1--
r-r--:
IQ, Q, Q,
Asimétrica Negativa
5TADISTICA PSICO-EDUCATIVA
Gráfica 7.4
Q, Q Q
Simetrta
113
En general, cuando la distribución no es simétrica, sino casi simétrica, la mediana se localiza aproximadamente a un tercio de la distanciaentre la media y la moda sobre la escala de las X. La relación entre lamedia aritmética, la mediana y la moda podría entonces expresarse porla siguiente fórmula:
Mo '" M ~ 3 (M - Mdn)
7.3 APUNTAMIENTO O CURTOSIS
Diremos que una distribución de frecuencia es muy apuntada opoco apuntada según el correspondiente histograma sea alto y estrecho,o bajo y ancho.
La gráfica 7.5 muestra tres tipos de CUIVas: A) la CUIVa de mayorapuntamiento, también llamada leptocürtica, B) la CUIVa de apuntamiento intermedio, llamada mesocürtica y C) la CUIVa achatada, llamada platicúrtica. Se supone que las distribuciones son simétricas y como talestienen la misma media y la misma dispersión.
114 JESUS DE LA ROSA
Grdfica 7.5
M
Iiustracion de diferentes tipos de curtosis
La curva A indica que la mayoría de los estudiantes recibieron casila misma calificación en la prueba de inglés; la curva B indica la distribución normal de las calificaciones en historia; la curva e indica una amplia variación de las calificaciones de matemáticas entre el grupo de estudiantes. La distribución normal, a la cual nos vamos a referir ampliamente en capítulos siguientes, la cual no es ni apuntada ni muy achatada, es la curva con apuntamiento intermedio y se emplea usualmentecomo tipo para medir el apuntamiento de un distribución.
7.4 MEDIDAS DE APUNTAMIENTO
Para medir el grado de apuntamiento de una distribución. usamoslos siguientes índices.
A4-3=O
A4 - 3 >0
A4 - 3 <O
Indica Distribución Normal
Indica Distribución Leptocúrtica
Indica Distribución Platicúrtica
(Xi ~ M)4jN(8 2 )2
M4 = Momento cuarto
82 = Varianza
ESTADISTICA PSICO-EDUCATIV A
EJERCICIOS
115
l. Calcular el tndice de asimetrta basado en cuartiles a partir de lossiguientes datos: lO, 12, 12, 14, JQ, /0, 16, 12, 14, ID.
2. Calcular los tndices de asimetrta, propuestos en el tex,o, a partirde las siguientes distribuciones de frecuencias:
A) X F B) X F
/-3 15 0-2 24-6 20 3-5 6
7- 9 10 6-8 10
10 -12 5 9 -11 2
3. Calcular el tndice de apuntamiento, propuesto en el texto, a partirde las distribuciones del ejercicio anterior.
4. La siguiente distribución de frecuencias muestra las estaturas delos jugadores del equipo de baloncesto de la UniversidadAutónoma de Santo Domingo.
Estatura en pulgadas Número de jugadores
60 Y menos 62 2
62 Y menos 64 3
64 Y menos 66 7
66 Y menos 68 5
68 Y menos 70 N=18
Calcularcon dos cifras decimales
a) Desviación cuarttlica
b) Desviación ttpica
e) Coeficiente de variación
116
d) Tndice de asimetria
e) Jndice de apuntamiento
JESUS DE LA ROSA
5. Con respecto al ejercicio anterior, compruebe hasta dónde se manifiesta la fórmula:
Mo =M - 3(M - MdnJ
PARTE 11
ELEMENTOS DE PROBABILIDADES YFUNCIONES PRIBABILISTICAS
VIII
ELEMENTOS DE PROBABILIDAD
UNAPRIMERAMIRADA A LA PROBABILIDAD
El mundo real está lleno de incertidumbre. Las situaciones queimplican incertidumbre varran de simples juegos de azar, como los dados y las barajas, por ejemplo, a otros problemas en campos tan variados e importantes como las ciencias físicas, las ciencias sociales, la industria y los seguros, Los problemas representativos en estos camposimplican la predicción de lo que sucederá en circunstancias donde seincluyen elementos conoceros o mensurables y aleatorios o al azar,
$.1 CONCEPTO DE PRORABIUDAD
La probabilidad es el estudio de fenómenos ptlfllmente alutorios.U. Estadística se puede describir como ti ciencia de reunir y analiurdatos e inferir consecuencias a partir de estos elementos, Como elaz.¡r afecta tanto a la reunión de datos COlftO a su ¡úJisis, y le debetener en cuenta al hacer inferencías, el tener coeocímíeetos CR estadística implica poseer una buenabsee sobre la teoría 4c la pr.~4ad. Los principios que se desan-oulJI en me texto !tOn los mismosque se utilizan en el estudio rnú avanzado de estos temas, pero • hace notar que el contenido de este texto no se a¡x;.ya en el c:fIculo inr..nitesimal. Uf! conocimiento completo de Ptoblbilidad Y Estadística,sólo se puede lograr de¡pués de estudiu d ~kulo iDfutitesiJUJ )' elClIteu.ic integral.
8.2 DOS DEFINICIONES DE PROBABIUDAD
La palabra probabilidad se usa para indicar la posibilidad de que
119
120 JESUS DE LA ROSA
ocurra un evento o resultado. La definición clásica de probabilidad y,en cierto modo, la más simple. se usa cuando un experimento puedetener solamente ciertos resultados definidos, cada uno de los cuales esigualmente probable: si hay S elementos en el conjunto de resultadosposibles, la probabilidad para cualquiera dl' ellos es IIN. Así, se suponeque una moneda puede caer mostrando cara o escudo y, por tanto, laprobabilidad de cara es lI ~.
En forma más general. podernos escoger un sub iconjunto llamadoevento, que consiste de fII de los elementos posibles y preguntar cuál esla probabilidad de obtener un resultado que pertenezca a ese evento, alefectuar el experimento una sola V~Z. La probabilidad de un evento esla suma de las probabilidades de los resultados que lo componen. Ennuestro caso, "igualmente probables", la probabilidad es m/N. Si deuna baraja de 52 cartas con 4 ases se saca una, ¡,cuál ~s la probabilidadde que sea un As) Se supone que cada una de las 52 cartas, tiene lamisma probabilidad de ser sacada. El evento "sacar un As" consta de 4de los 52 resultados igualmente probables: la probabilidad ,le' obtenerun As es 4/52, Ó se 1/13
No siempre resulta evidente que huy un cierto numero de resultados igualmente probables, o cuáles son los igualmente probables. Porejemplo, ¿cómo se sabe que todas las cartas t icncn la misma probabilidad de ser sacadas del mazo') Quizá alguna de l'llas knga un de fccto ,bien pudiera que fuese un poco más larga que las otras, con lo queaurncntarfa la probabilidad de ser extraída. Tal Vl'Z una moneda. cuando se lanza al aire, tenga una probabilidad ligeramente mayor de caercara que cmz, En realidad para usar la definición lk "igualmente probable", es necesario hacer algunas observaciones desde diferentes puntos de vista. En la práctica, debemos razonar a partir de consideracionesintuitivas. intuitivamente aceptarnos que cualquier carta es igualmenteprobable, así como cualquier lado oe una moneda. Aunque en algunasocasiones nuestra intuición nos lleva por caminos equivocados. la mayoría de las veces nos resulta útil.
La mayor desventaja, es que se aplica sólo cuando suponernos quelos resultados son igualmente' nrobablcs. Las ideas y el lenguaje dl' lapn'¡ -ahilidad, son útiles en muchas situaciones que no son de este tipo.
1I concepto de probabilidad más aceptado en la actualidad es: siun cxpcrirncnto se repite muchas veces en condiciones idénticas. cntonc'c'S b I'r"b'lbilidad P de un evento E es "a 1'11' ,le- cuentas" el cociente
EST"DISTICA PSICO---€DUCATIVA 121
que resulta de dividir el número de veces que acontece d evento E. entre el número de intentos. Por ejemplo, para determinar la probabilidadde que una moneda caiga cara cuando se lanza al aire, lanzamos la moncda muchas veces y llevamos un registro del número dc' veces que caecara. Si aproximadamente, la mitad de los resultados c's cura. al finaldel experimento concluimos que la probabilidad de qu. c'ai!;a cara es
1/2.
Desde luego, el concepto anterior presenta algunos inconvenientes.¿,Cuántas veces son "muchas veces"? ¿Cuántas de éstas "muchas veces"deben ser caras para afirmar que, aproximadamente, la mitad de los intentos resultaron cara? Consideremos un experimento que no Sl' puederepetir. Por ejemplo, bajo esta definición, ¿es posible hablar de la probabilidad de que mañana llueva'! O bien, ¿de la probabilidad dl' que elequipo de baloncesto de San Carlos derrote al equipo de baloncesto deNuco en el juego de la próxima semana?
SI utilizamos el concepto de resultados igualmente probables, oel de probabilidad por experiencias muchas veces rcpcudas. ¿cuál esel numero mayor que puede ser una probabilidad? Como un evento esun sub conjunto del conjunto de resultados de un experimento. elnúmero de resultados contenidos en un evento debe ser menor oigual al número de veces que se efectúa un experimento. Por tanto no esposible tener una probabilidad mayor que uno. ¿,Cuáll" la probabilidadmínima posible," Si P es la probabilidad de que un C'Vc'1l10 ocurra en uncx pcrirncnto. O~ P ~ l.
8.3 :'.IODELOS \IATHfATICOS y PROBABILIDAD
Durante milc-, dl' aiios el hombre ha l'stado t ru t.uu!o de aprenderI113S y m3S acerca del universo en que vive. Uua dl' las pnncipalcs hcrramientas empleadas para entenderlo L'S la matcmatica . Aún cuando pa rall,ta no l'S técnicamente necesaria alguna relación con el mundo real.ca,¡ todas las matemáticas que se consideren importantes tienen al'éul1Jrcl.uión con el universo. Por ejemplo. la )!l'olllctría euclidiana es UI1,1ulcalizución LId concepto espacio que tuvieron sus contcmporancos. \;0
cx ist c nada en el espacio con las caractcrist icas exactas lk la h'nl'a rccla dc' la gl'olllL'tr(a euclidiana: en cambio hay muchas cosas para 1,1' cuaks la recta de l.uclidc-, L'S una buena aproxunación La recta l'S t íl'icadc' 1,,, mocklo, nuucm.í t ico».
122 JESUS DE LA ROSA
En general, un modelo matemático se basa, en parte, en el mundoreal, aunque no sea una descripción exacta del mismo. La ventaja delmodelo matemático es que se presta al análisis. Si el modelo es unaaproximación razonablemente buena de algún aspecto del mundo real,entonces el modelo se puede usar para describir esa parte de la realidad y predecir cosas que, de otro modo, serían impredecibles. Sin embargo, es importante recordar que cuando estamos estudiando el modelo, puede ser que las predicciones tengan poco que ver con la realidad;por estas razones, es conveniente comprobar y ver si determinados resultados matemáticos son realmente aplicables al mundo real. Puedesuceder que un modelo trabaje muy bien con algunos aspectos del mundo real y no del todo bien con otros. Se requiere perspicacia para decidir si un modelo matemático es aplicable a una situación particular de lavida real. En la teoría de la probabilidad constantemente se debentomar decisiones de este tipo aunque, a menudo, son difíciles.
Los fenómenos puramente aleatorios son de interés particular parael profesional de la estadística, debido a que los estudios que hace delos fenómenos sociales o científicos están, por lo general, diseñadospara determinar si los fenómenos son el resultado al azar o de algunainfluencia particular. Por ejemplo, si un médico desea probar que ciertadroga cura determinada enfermedad, ha de tener en cuenta que muchosde los pacientes sanarían aunque no la usasen. Supongamos, por el momento, que la mitad de los pacientes se recobra yla mitad se muere.cuando se le administra la droga. El médico prueba su droga en 100 pacientes. Si 55 se recuperan y 45 mueren, nada se ha probado ya que,comparando estos resultados con los obtenidos al tirar 100 veces unamoneda, encontramos que 55 caras de 100 tiradas no es un evento raro.Así, los juegos al azar son importantes como norma de comparación,
8.4 ESPACIOS MUESTRALES y PROBABILIDADES
Cuando se tira una moneda o un dado, es fácil listar todos los resultados posibles del experimento. Sin embargo, resulta fastidioso listartodos los resultados posibles que se tienen al tirar varios dados, y paramuchos de nuestros experimentos habrá tantos resultados posibles diferentes que no podemos listurlos todos. Por tanto, sería convenienteestablecer un modo sis1 cmát ico ya para describir conjuntos de resultados.
ESTI'DISTICA PSICD-EDUCATIVA 123
Los diagramas, como el que se muestra en la figura 8.1, son útiles,ya que, además de ser fáciles de dibujar, sepuede indicaren ellos los eventos rápidamente. En este diagrama, la curva de punto indica el evento "sacar un totai de 2 puntos", la curva continua indica el evento "sacar untotal de 6 puntos" y la curva de trazos muestra el evento "4 doble",
6
5
4
3
2 CJ. .2 3 4 5 6
Figura 8.1
Nótese que el diagrama es una gráfica del conjunto S, donde S esigual a [Ix, y)/siendo x e y enteros, I ~ x ~ 6, I ~ Y~ 6}. Los diagramas de ese tipo san tan útiles en el estudio de la probabilidad que resulta común el hecho de emplear las palabras punto y espacio para describir los resultados de un experimento,
Un espacio muestral de un experimento aleatorio es un conjuntode resultados del experimento tal que cada uno de los resultados corresponde exactamente a un elemento del conjunto. Un punto mucstrales un elemento del espacio muestral, Un evento es un subconjunto. delespacio muestra!.
124 JESUS DE LA ROSA
Para el cxpcruncuto tic- tirar un tlado común, si D = { 1. 2. 3.4,5.6}. entonces D es un espacio muestra'. El conjunto { 1,2,3,4,:5 }no esespacio rnucstrul del experimento aleatorio tirar un dado, porque el resultado (, no corresponde a algún elemento del conjunto. El conjunto{impar, par. divisible entre 3 } no es espado mucstral ligado a ese mismoexperimento aleatorio porque el resultado 6 corresponde a más de unelemento del conjunto "6", corresponde a los elementos "par" y "div i
sible entre 3".
En el experimento que consiste en tirar un solo dado, sí usamos elespacio mucstral {I. 2. 3. 4. 5. 6} Y suponiendo que el dado no esté"cargado", es decir. que no esté arreglado delibcrudamc ntc para obtener determinados resultados. la probabilidad de cada punto muestra! es
de 1/6, Cuando tiramos dos dados, un espacio muestral es el productocartesiano DI x D2 donde DI y 1)2 son cada uno iguales a ~ l. 2. 3. 1,
5. 6}, Como se ve, este espacio tiene 36 puntos y si los dados no este 1
cargados la probabilidad de cada punto mucstral es el producto Cartesiano O, x O2 X D3 son cada uno iguales a {I. 2, 3, 4, S, 6}. Este espacio muestra! tiene (6) (6) (61. o sea 216 puntos mucstralcs, y si los dados no están "cargados", la probabilidad de cada uno es 1/216,
Sea E el evento "la suma d,' los puntos tic' IJS caras superiores delos dados cs 7" es decir F = {(', 11. 15, 21. f~, 3), (3, 4), (2.5). (1. 6)}.
Si los dados no ,'sl.!n cargados. podernos responder a la pregunta:"Cu.O es la probabilidad d,' 111Jr 7 "<In 2 dados" LJ respuesta es simplemente la SlIlIIJ tic' LIS probubilidadv-, dc 10., elementos de L es decir6/36 o sea 1;("
Considcrurvmos uhoru ,,1 cx pvnmcut» ,le- tirar 3 monedas. indicando los ,'spaLios mucstr.rlr-, po,ibk, ~ diferentes para este experimento.¿Se ve que parece que cada punto mucstrul tiene la misma probabilidadque cualquier otro punto contenido-en el ,'spJcio mucstrul {(L. e, c ).(L, l. C), (l. e, el, (L, Z. l), ( " c. z ), (" l. C), (l. r . ll} donde e represen t;J
una cara y 1. un escudo? ¿Cu.!1 l'S 1.1 probabilidad ,k cada uno de lospunto, mucstralcs' Si el evento 1,', {IC. c. z i ic. l. O. (l. c. el} ;,Cl'álcs la probabilidud de l." (,('u;ll ,'s ,'ntOI1t:l'S 1;¡ probabilidad de obtenerdos caras y un escudo r cn cu.ilquicr "rdt'll) cuando s,' tiran J monedas'
Si parece razonable dvcir que lodo, it" plintos mucstralcs de unespacio mucst ral particular "'11 i~ll.dm'·1l1,' probable». entonces debe serpovihle d c tcmun.rr la I'roh,lhllldad ,te- cualquier cvv nto particular divi-
E5TADI5nCA P5ICO-EDUCATIVA 125
dicndo el número de puntos del evento entre el número total de puntosdel espacio muestral, Por ejemplo, los ocho puntos del espacio muestral,para el problema de las tres monedas, parecen igualmente probables,Por tanto, para encontrar la probabilidad del evento "dos caras y unacruz", podemos contar el número de puntos del evento y dividirlo entre el total de puntos. Así, encontraremos que la probabilidad de obtcne dos caras y un escudo es de 3/'1',.
8.5 PROBABILIDAD AXIOMATICA
Un evento elemental es aquel que contiene un solo clemente.
Para el experimento de tirar dos dados, sea A el evento "el número total de puntos mostrados es 4". A no es un evento elemental,puesto que (l. 3), (3. 1) Y (2. 21 son elementos de A. Si B representael evento "2 aparece en ambos dados", entonces 13 es un evento elemental debido a que (2, 2) es el único elemento de B.
Consideraremos ahora una relación entre dos eventos. Para elexperimento de tirar dos dados. si C es el evento "el número total depuntos mostrados es 5" y si D es el evento "el número total de puntosmostrados es 6", entonces C y D no pueden ocurrir simultáneamente.Sin embargo, si E es el evento "al menos un dado muestra un solopunto", entonces E y C pueden ocurrir simultáneamente. ya que elresultado puede ser ( 1,41 o bien (4, I l.
¿Pueden ocurrir simultáneamente E y D? Dos eventos que nopueden ocurrir simultáneamente se llaman eventos mutuamente exclu
sivos.
Para dos eventos cualquiera A y 13, se dice que A y B son mu tuamente exclusivos sí y sólo sí A n B = <p •
Ya que un evento elemental contiene s610 un elemento, se puedever que dos eventos elementales son mutuamente exclusivos o es elmismo evento.
Ahora, definiremos la probabilidad de un evento como un número que se asigna al evento de manera que satisfaga ciertas condiciones.
Para cualquier espacio muestra finito S = {UI . O2 •••• O, }, la pro-
126 JESUS DE LA ROSA
babilidad de un evento E es un número P(E) tal que se cumplen los siguientes axiomas de probabilidad:
(1) O'¡;;P(E)(2) l = P (S)(3) Si A YB son mutuamente exclusivos, entonces
P (A U B) =P (A) + P (B)
El axioma (1) afirma que la probabilidad de un evento debe ser unnúmero positivo o cero. El axioma (2) establece que la probabilidad deun evento seguro (que forzosamente debe ocurrir) es l. El espacio muestral es un evento seguro, ya que contiene todos los resultados posiblesde un experimento. El axioma (3) permite determinar la probabilidadde cualquier evento, siempre que se conozcan las probabilidades de loseventos elementales.
Teorema: P (4)) = O
Demostración: Por el axioma (3), sabemos que si A y B son eventos mutuamente exclusivos, entonces P (A) + P (B) = P (A U B). Ahora,sean A = 4> y B =S.
Como 4> () S = 4>, sabemos que 4> y S son mutuamente exclusivos.Entonces, tenemos P (rjl) + P (S) =P (4) U S). Pero, por el axioma (2),P (S) = 1. También, P (</J U S) = P (S). Por tanto, concluimos queP(rjl) + 1 = 1, asr P (rjl)=O.
Ahora, necesitamos demostrar que la probabilidad de un eventocualquiera A está unívocamente determinada, siempre que se conozcanlas probabilidades de los eventos elementales El, El En, sub-conjuntos de A.
Teorema: Si A es un evento contenido en un espacio muestral finito tal que la unión de n eventos elementales El, El, .... En es A,entonces P (A) = P (E¡) + P (El) ..... + P (En)'
Demostración: Si A es el conjunto vacío, entonces, por el teoremaanterior P (A) = P (4)) = O.
Supongamos que A no es el conjunto vacio y que es la unión den eventos elementales diferentes El, El ..... En. Si n = 1, se tieneP (A) = P (El)' Si n = 2, entonces P (A) = P (El U Ez ). Luego, por el
ESTADISTICA PSICO-EDUCATIVA 127
axioma (3), tenemos que P (A) = P (El) + P (E z ). Si n = 3, entoncesP(A)=P(E I UEz UE3 ) .
Agrupando, de modo que se pueda usar el axioma (3), tenemos
P (A) =P [(El U Ez ) U E3 ]
=P (El U E z) + P (E 3)
= P (E¡) + P (Ez) + P (E 3 )
En general, si se procede: primero agrupando y después aplicando repetidamente el axioma (3), finalmente, se obtiene
peA) =P(E¡)+P(Ez) .••... X+ P(En )
Esto se puede probar por inducción matemática.
8.6 EVENTOS COMPLEMENTARIOS
Algunas veces es más fácil encontrar la probabilidad de que unevento no ocurra que encontrar la probabilidad de que ese evento ocurra. El complemento A, de un conjunto A, se define como el conjuntode todos los elementos que pertenecen al conjunto universal U y que nopertenecen a A; esto es,
A = { x/x E U Y x f. A}
En probabilidad, el espacio S, corresponde al conjunto universal,la siguiente definición es para el complemento de un evento.
El complemento f de un evento E es el conjunto de todos los elementos del espacio muestral S que no son los elementos de E.
Teorema: Dos eventos A y B son complementarios si y sólo si A yB son mutuamente exclusivos y la unión de A con B es el espacio muestral S.
Por tanto, si dos eventos A y B son complementarios, entoncesA () B = <P y A U B = S.
128 JESUS DE LA ROSA
Este teorema se deduce fácilmente a partir de las definiciones. Lademostración se deja como ejercicio.
Ahora, consideraremos la relación entre la probabilidad de unevento y la probabilidad de su complemento.
Teorema: P (A) = 1 - P ( A)
Demostracion: Puesto que los eventos complementarios son mutuamente exclusivos, tenemos P (AUA)=P(A)+ P (A). Como A U A = s. P(AUA)=P(Sl=I.Entonces. P(A)+P(,:\)=I yP(A)=1 -P(A).Enotras palabras. restando P (A) de I se obtiene la probabilidad de que elevento ,~ ocurra.
Por ejemplo, para determinar la probabilidad P (A) de que por lomenos uno de dos dados. muestre un 5 o un 6, podemos determinar laprobabilidad P (Á) de que ambos dados muestren números menores que:; y después se resta esa probabilidad de l. Así, tenemos
8.7 LA PROBABILIDAD DE LA UNION DE EVENTOS
Del axioma (3), si A y B son conjuntos mutuamente exclusivosentonces la probabilidad de que A o B ocurra es igual a la suma de susprobabilidades; es decir, P (A U B) = P (A) + P (B). Pero, ¿cuál es P(A U B) si A y B no son mutuamente exclusivos?
Si se tiran :2 dados, ¿cuál es la probabilidad de que por lo menosuno de ellos muestre un número mayor que 3? La probabilidad paraambos es 1/1.
Si se fuese a usar un proceso de adición, la probabilidad parecería
se+ +~ , o sea l. Evidentemente es falso, ya que hay una probabilidad' mayor que cero de que ambos muestren números menores quetres.
¡.Cuál es el problema? En el diagrama de la figura 8.2, A es el con-
ESTADISTICA PSICO-€DUCATIIIA 129
junto de puntos para los cuales el primer dado cae y muestra un número mayor que 3, y B es el conjunto para el cual el segundo dado muestraun número mayor que 3. Si sumamos las correspondientes probabilidades, habremos contado dos veces los puntos contenidos en A () B. Portanto debemos restar la probabilidad de A () B para llegar al resultadocorrecto. Los puntos contenidos en A () B se indican en la parte sombreada del diagrama. Como hay 9 puntos en la intersección y 36 en elespacio muestra, tenemos
9 lP (A () B) =""36' o sea, -4-' Por tanto,
l l l 3P(AUB)=-+---==-2 244
At----_ ...- --- ---- .•
\
6 :. • • • • • \
II I
o 5 I · • • • • • 6 I
", ,
o ,I
"o 4 \ . • • • • • ¡." ..... - ----- -------- ,e:> 3 • • • • •O>J¡
L • • • • • •• • • • • •
2 3 4 5 6Primer dedo
Figura 8.2
El razonamiento empleado se puede utilizar en cualquier problema en que intervenga la unión de eventos, eñ general tenemos el siguiente teorema.
Teorema: P (A U B) :::P (A) + P (B) - P (A () B)
130 JESUS DE LA ROSA
Así que,
Demostración: Para demostrar ese teorema escribiremos A U B YB como sumas de dos eventos mutuamente exclusivos. Esto es,
AUB =AU(AnB)
B = (A n B) U (A n B)
Entonces,
P (A U B) =P [A U CA n B)]
=P (A) + P (A n B)
También,
P (B) =P [(A n B) U (A n B)]
= P (A) + P (A n B).
P (B) - P (A n B) =P CA n B)
Sustituyendo por P (A n B) en P (A U B) = P (A) + P (A n B),
P (A U B) =P (A) + P (B) - P (A n B).
8.8 PROBABILIDAD PARA EVENTOS SUCESIVOS
Probabilidad Condicional.
Si se lanzan dos dados, uno rojo y otro azul, y si sabemos que eldado azul muestra un número divisible por 3, ¿cuál es la probabilidadde que la suma de puntos de ambos sea mayor qu 8? La condición deque el número mostrado por el primer dado sea divisible por 3, cambiael espacio muestral que estamos considerando.
En particular, el nuevo espacio muestral contiene solamente 12puntos, que se ven en el interior de la curva cerrada de trazos de la figura 8.3. ¿Para cuántos de estos puntos el total es mayor que 8? Suponiendo que los 36 puntos que contienen el espacio muestral originalson igualmente probables, ¿es razonable decir que los 12 puntos eneste espacio muestral son igualmente probables? Dada la condición de
ESTADISTICA PSICD-EDUCATIVA 131
que el número del dado azul es divisible por 3, la probabilidad de obtener una suma mayor que 8 es igual a
_5_12
--- ----"--- ---Il· • • • • • \\_- --- - _._------, "
• •••• I 1:8 :• • 1 1
: I,----- ------ --- ,· ....!\ I~ - - - - - - - - _. - - --A• • • • • •
ié\.:: ~
~ ~
- iJr.i'ílf
._---~- ,
Figura 8.3
•¿
Para dos eventos cualesquiera A y B, usaremos el símbolo P (A/B)para designar la probabilidad de que ocurra un evento A, siempre quehaya ocurrido el evento B. Esto recibe el nombre de Probabilidad Condicional, porque se conoce la condición de que el evento B ha ocurrido.
Para evaluar P (A/B), consideraremos el problema anterior. Sea elespacio muestral original como el conjunto de 36 resultados posiblesmostrados en el diagrama que aparece en la figura 8.3; sea A el conjuntode puntos para los cuales el número total de puntos dibujados es mayorque 8, y sea B el conjunto de puntos para los cuales el número de puntos dibujados y mostrados para el primer dado es divisible por 3. Entonces, A n B consta de los 5 puntos indicados en la parte sombreadadel diagrama que aparece en la figura 8.3. En este caso, para determinarla probabilidad condicional P (AB/B), dividimos el número de puntoscontenidos en A n B entre el número de puntos contenidos en B. Des-
132 JESUS DE LA ROSA
de luego, si los puntos del espacio muestral inicial no fueran igualmente probables, no podrra obtenerse el resultado simplemente contando lospuntos. Por lo tanto, definimos la probabilidad de un evento A, dadoque ha ocurrido un evento B, como la probabilidad de A n B, divididaen la probabilidad de B.
Definición: Para dos eventos cualesquiera A y B tales que P(B) =1= O,
P(A/B) = P (AnB)P (B)
Al definir las probabilidades condicionales, hemos creado en efecto, nuevo espacio muestral SI, el cual es un subconjunto del espaciomuestral original S. Entonces, hemos asignado nuevas probabilidadesP(A/B) a los eventos contenidos en SI' Para justificar la definición deprobabilidad condicional, necesitamos demostrar que los númerosP(A/B) en realidad son probabilidades, es decir, que satisface los tresaxiomas de probabilidad.
El primer axioma P(A/B) ~ O, es evidente. Para demostrar quecumple el segundo axioma, basta notar que sIn B = B. Entonces tenemes
SI P(S2 n B)P ( P(B» = P(B)
P(B)= P(B)
Para el tercer axioma se requiere demostrar que si A n B = <P,entonces P [(A U B)/C) = P (A/C) + P (B/C). Como A n B = <P, tenemosque A n C y B n C son mutuamente exclusivos. Entonces,
P ((AUB)/C);:: P {(AUB) n C}P(C)
;:: P [(Anc) U (Bnc)JP(C)
= P (AnC) +P (Bnc)P (C)
= P (AnC) + p(Bn C)P (C) P (C)
=P (A/C) + P (B/C)
ESTADISTICA PSIC~DUCATlVA 13.1
Usando la definición anterior deprobabilídad cOlldicional, demuestre que la probabilidad de obtener dos cinco, cuando le tiran dos dados,sabiendo que al caer uno de ellos muestra 5, es
1-1-'8.9 EVENTOS INDEPENDIENTES
Suponemos que se sabe que la probabilidad de A dada la de B esigual a la probabilidad de A. ¿Qué se podría COftCluir respecto de loseventos A y 8? ¿El hecho de saber que el evento B ha ocurrído, afectade algün modo la probabilidad de A? La situacióftuterlor conduce a lanecesidad de definir otro tipo de eventos: Si A YB soneventos independientes, entonces P (A/B) =PíA).
Definición: A Y B son eventos independientes sí y SÓlo si
P (AnB) =P (A) P (B)
Teorema: Si A Y B son eventos independientes y P(A) *OY P(B)*O, entonces P (A/B) =P (A) Y P (B/A) =P (B).
Demostración: Por la definición de probabiJidad condicional, setiene
P (A/B)= P (AnB)P(B)
Puesto que A y B son eventos independientes,
P (AnB) = P (A) P (B)
Así que, P (A/B) = P <A) P (B) - P (A)P (B)
De manera semejante, P (B/A) =P (B)
Si se escoge una familia el conjunto de todas las que tienen 2 niños,¿cuál es la probabilidad de que ambos sean varones, si se sabe que, por
134 JESUS DE LA ROSA
lo menos hay un varón en esa familia? Sea S = { (m. m), (m, 0, (f. m),(f, O} el espacio muestral, donde la primera letra de cualquier parejaordenada indica el sexo del primogénito y la segunda inuica el sexo delsegundo.
Supondremos que los cuatros puntos son igualmente probables(esta suposición no es correcta por determinadas razones, pero es aceptable). Ahora bien, si se sabe que por lo menos uno de los hijos es varón,¿cuál es el nuevo espacio muestral? De los tres juntos de ese espacio,¿cuántos representan familias en las que ambos hijos son varones? Entonces, la probabilidad de que ambos lo sean? En este caso el espaciomuestral consta sólo de dos puntos. Entonces la probabilidad requeridaes 1/2.
Teorema: Si A Y B son eventos independientes, entonces
P(AUB)=P(A)+P(B)-P(A)P(B)
Este teorema es evidente a partir de lo demostrado anteriormentey de la definición de eventos independientes.
Demostración: De la teoría de conjuntos sabemos que A n B =AUB (verifique esto con un diagrama de Venn). Sabemos. por lo antes demostrado que P (A) = l - P (i\)' Por tanto. P (A n 13) = P (A:ui3)
I-P(AUB)
I - [ P (A) + P (B) -- P (Al P (B) II -P(A)-P(B)+P(AlP(B)
[1 -P(AI)[1 -P(B))
P (A) P (13)
Así, A Y 13 son eventos independientes.
8.10 TEOREMA DE BAYES
Se sabe que una urna amarilla contiene 3 bolas negras y I blanca.y que una urna roja contiene 2 bolas blancas y :. negras. Se tira un dado. con la condición de que si el número resultante es divisible por 3 seelige la urna amarilla; y en cualquier otro caso se elige la urna roja. De
ESTADISTICA PSICD-EDUCATIVA 135
la urna elegida se saca una bola al azar. Si la bola es negra, ¿cuál es laprobabilidad de que haya sido sacada de la urna amarilla?
El diagrama de árbol, que aparece en la figura 8.4 nos puede ayudar a entender la solución de este problema.
\ //
\j'
I
1
N e
V. I
"1 í.
l-igura 8.4
La probabilidad de escoger la urna amarilla es 1/3 y la probabilidad de sacar una bola negra, considerando que se escogió la urna amarilla, es 3/4. Por tanto, la probabilidad de escoger una bola negra de laurna amarilla es 1/3.3/4 = 1(4. De modo semejante, se puede ver que laprobabilidad de sacar una bola blanca de la urna amarilla es 1/12, laprobabilidad de sacar una bola negra de la urna roja es 1/3, y la probabilidad de sacar una bola blanca de la urna roja es 1/3. ¿Suman uno,las cuatro probabilidades?
A partir de la fórmula de probabilidad condicional, se sabe que laprobabilidad de que se seleccione la urna amarilla, considerando que sesacó una bola negra es:
P(A/N)= p(AnN)P(N)
Uli JESUS DE LA liOSA
Sin embargo, la única manera de obtener una bola negra, es (a)sacarla de la urna amarilla o bien; (b) sacarla de la urna roja.
En consecuencia,
P (N)=' (Af'\N) + P (Rf'\N) =_1- +_1_= _7_4 3 12
Por tanto,
Vale la pena hacer notar un aspecto interesante del ejemploanterior, el evento "sacar una bola negra", ha sido separado de doseventos: "sacar una bola negra de la urna amarilla" y "sacar una bolanegra de la urna roja".
Definición: Una colección de subconjuntos de un conjunto dado,es una partición sí y sólo sí cada uno de los elementos del conjunto original está incluido en uno y sólo uno de los subconjuntos.
Con anterioridad se vio la definición de dos eventos "mutuamenteexclusivos", Ahora se verá la definición de ti eventos "mutuamenteexclusivos" .
Definición: Los eventos Al y A2 • , , •• An , son mutuamente exclusivos,
Por tanto, una colección de subconjunto de un conjunto dado esuna partición sí y sólo sí los subconjuntos son mutuamente exclusivosy la unión de los subconjuntos es el conjunto dado.
Algunos ejemplos de una partición son: (1) la partición del conjunto mencionado "bola negra" en "bola negra de la urna amarilla" y "bola negra de la urna roja"; (2) la partición del evento "urna amarilla, bolanegra" y "urna amarilla, bola blanca"; (3) la partición de "sacar una baraja de un mazo de 52", en "sacar espada", "sacar corazón", sacar undiamante" y "sacar un trébol": (4) la participación de "sacar una carta"en "sacar un As", "sacar un dos", "sacar un tres" ... , , , "sacar un rey",(5) la partición de "sacar una carta" en los 52 subconjuntos: "sacar elas de espadas", "sacar el as de corazones", "sacar el as de diamante",
ESTADISTICA PSICO-E:DUCATIVA 137
"sacar el as de tréboles", "sacar el dos de espadas"..... "sacar el reyde tréboles".
Teorema. Si el evento E ha sido separado en n subconjuntos El,El , En, entonces
P (E) =P (El) + P (E 2 ) •••••• + P (En)
La demostración de este teorema se hace por deducción.
Teorema: "Si un conjunto de eventos 0 1 , Q2 ..... Qn son particiones de un conjunto O,y E es subconjunto de O.entonces El , E2 ••
. . . . En es una partición de E.
Figura 8.5
Q
Ahora bien, P (El) = P (01 n El y por la definición de probabilidad condicional P (Q n E) = P (O,) P (E/0 1 l. En forma similar, sepuede ver que P (Ek ) =P (E/Ok l para k =1, ::, n. Por lo ante-rior demostrado tenemos que P (E) = P (El) + P (E 2 l. Sustituyendopara cada P (Ek I, se obtiene:
P (E) =P (O, l P lE (O.) + P (Q2 l..... + P (Qn) P ( 3n »)
O'bien,P (E) =~ P (Qk) P ( O~ )
Teorema: (Teorema de Bayes): Si los eventos 0 1 • O2 .•••• Qnforman una partición de O, y E es un subconjunto de Q, entonces
P (..!L-E· ) = P O¡) P (E/Q¡)
P (0 1 ) P (E/O. ) + ..... P ro, )PíE «x I
Demostración: De la definición de probabilidad condicional. para dos eventos cualesquiera E y O¡
138
Por tanto,
JESUS DE LA ROSA
Ahora, por lo anterior demostrado y sustituyendo para P (E),obtenemos:
P (Oi) P CE) (Oi)P (Od P(E/Od P ro, )(E)/On)
El teorema de Bayes se puede emplear para simplificar la resolución de problemas como el siguiente: en una escuela, 35 0
0 de los alumnos son del primer grado, 25 %son del segundo grado, 20 %son del penúltimo y 20 %son del último grado. Si se escoge al azar un alumno yeste cursa matemáticas, ¿cuál es la probabilidad de que sea del segundo grado? Sea M el evento "el alumno cursa matemáticas". O. el evento "es del primer grado", Q2 "es del segundo grado". y as( sucesivamente. Entonces.
(0.25) (0.5)
(0.35) (1) + (025) (0.5) + (0.2) (0.21 + (0.2) (O.) 1
8.11 VARIABLES ALEATORIAS
0.1250.535
0.234
Consideramos el experimento aleatorio de lanzar dos monedas yver si cstus salen cara (e) o l.scudo (E 1. IJ espacio mucstral ligado aese experimento es:
ESTADISTICA PSICO-EDUCATlVA
(C, C), (C, Es), (Es, C), (Es, E)
139
Si sólo interesa el número de caras, de manera que los dos paresintermedios puedan ser considerados como equivalentes, podemosintroducir la función definida por X = número de caras, o sea:
X (C, C) = 2, X (CEs) = 1, X (Es Es) = O
Tenemos así un nuevo conjunto (2, 1, O), ahora formado por números reales, a cada uno de los cuales corresponde una probabilidad.
Así P (2) = P (C, C) = +, P (1) = (C, Es) + P (Es, C) =+ y
P(O)=P(Es¡ Es)=+
Vemos, pues, que la función X hace corresponder a cada elemento de E un número real y que, además el conjunto en elementos de E,cuya imagen es uno de estos números reales, en un elemento de B, osea, un suceso, y tiene, por tanto, una determinada probabilidad.
Por otra parte, dado que los valores de f (Xi) son probabilidades,es siempre f(xi);;;' O.
Las dos relaciones
L f(xi) ;;. O, Z; f (Xi) = I
Se cumplen siempre para cualquier función de probabilidad.
Supongamos que los valores de X cstun ordenados Xl < X2 ..•.
< X". Muchas veces interesa la probabilidad de que X tome un valorigualo menor que x]. Su valor sera:
F (xi)= P (X';;; Xi) = ~ f(xh)
lo cual da lugar a la siguiente definición.
luncíon de Distrihueión de la Variable Aleatoria X, ligad~1 al
140 .lE$US DE LA ROSA
experimento aleatorio E, es la probabilidad que la variable X tome unvalor igualo menos que uno dado x].
Ejemplo: Se lanzan 3 monedas.. Analícese la variable aleatoriaX =numero de caras.
Solución: El espacio muestral consta de 8 elementos
CCC, CCE, CEC, ECC, EEE EEC, ECE,
CEE,
Cada uno de los cuales tiene una probabilidad de 1/8. Los números posibles de caras son XI = O; x2 = 1, X3 = 2, x4 = 3.
X O l :2 3
f(x) l 3 3 _1_8 8 8 8
F (x) l 4 7 --ª-= I8 8 8 8
Las funciones X: E -- R que cumplen esas condiciones se llaman variables aleatorias. La palabra variable indica que la función puede tomar diversos valores (en el ejemplo anterior, 2, 1, O) Y la palabraaleatoria indica que estos valores provienen de un experimento aleatorio (en el ejemplo anterior lanzar dos monedas) y, por tanto, a cada unode sus valores corresponde una determinada probabilidad.
En realidad sería más apropiado llamarlas funciones aleatorias, pero el uso ha sancionado la primera denominación.
Vamos u limitar nuestra exposición a variables aleatorias que pueden tomar únicamente un número finito de valores. Esas variables reciben el norn bre de variables aleatorias finitas.
Su definición precisa es la siguiente:
Dado un espacio de probabilidad (E. B. PI. se llama variable aleatoria finita u toda función X: E~ R que pueda tomar unicamenteun número finito de valores X = XI, x2 ••••.. xn con la condición de
ESTADISTICA PSICO-EDUCATlVA 141
que cualquiera de ellos, por ejemplo x], el conjunto X- I (xj) sea un elemento de B.
Puesto que el conjunto X-i(Xi) (elementos de E cuya imagen porX es el número xj) es un elemento de B, tendrá una cierta probabilidadque se representa por:
P [X- I (Xi») = P (X ..;; xi) = F (xi)
y se establece la siguiente definición:
Sean XI. Xz xn los valores de X y pongamos Ai = X- I (xj)= {a t X (x) =xj },
Tendremos: t f (xj) = t P (Ai) = P (Al U Az U Al .... U An ) =P (E) = I.
8.12 ESPERANZA MATEMATlCA
Sea una variable aleatoria finita X que puede tomar los valoresXI, Xz , Xn con las probabilidades f (XI), [(xz) [(xn ) .
Se llama esperanza matemática o valor medio de la variable aleatoria X, a la expresión:
t (x) = t x¡ f (xj)
Si la [(xi) =constante, puesto que t [(Xi) = 1, [(xi) debe ser iguala Iln, y la esperanza matemática resulta ser k (x) = _1_ t Xi, o sea, es
nigual a la media aritmética de los valores de X.
Ejemplo: La esperanza matemática de la variable aleatoria X =número que resulta al lanzar un dado, será:
l l It (x) = Ix (6) + 2 (-6-) ..... + 6 (-6-) =3.5
Otro ejemplo: La esperanza matemática de la suma de los númerosresultantes al lanzar dos dados a la vez será
142 JESU!; DE LA ROSA
E (x) =-k (2 + 3.2 + 4.3 + 5.4 + 6.5 + 7.6 + 8.5 + 9.4 + 10.3 +11.2+12)=7
En caso de que la variable X sea continua la esperanza matemáticaE(x) es:
E (x) = Jx. f (x) dx
8.13 PROPIEDADES PRINCIPALES DE 1. .<\ ESPERANZAMATEMATlCA
a) La esperanza matemática es un número que depende de todoslos valores de la serie y de sus respectivas probabilidades ya que todasellas entran en el cálculo.
b) ¡; (X + y) = ¡; (X) + ¡; (Y), siendo X e Y variables aleatorias.
e) ¡; (aX) = a L (x), siendo (a) un número fijo y X una variablealeatoria.
d) L (XY) = L (x). L (y), siempre que X e Y sean variables aleatorias independientes.
e) L (X + Z + Y + T) =L (X) + L (Z) + L (Y) ... + L (T).
f) L (X.z. Y T) = L (X) x L(Z) x L (Y) ..... L (T) siempreque las variables aleatorias X, Z, Y, .... T sean independientes.
g) Mínima Mj ..-; L (X) ..-; Máximo Xj.
8.14 LA ESPERANZA MATEMATICA y LOS JUEGOS DE AZAR.
En un juego de azar, la esperanza matemática tiene un significadointeresante; expresa el promedio de la suma que se espera ganar porcada jugada, siempre que se realice un gran numero de jugadas. Entendemos por juego equitativo entre dos personas, aquel en que las esperanzas matemáticas de los dos contendientes sean iguales, lo cual significa que las posibles ganancias son, a priori, iguales para ambos. Enesas condiciones, el jugador deberá pagar, como derecho a participar,un valor igual a su esperanza matemática.
ESTADISTICA PSICO-EDUCATIVA 143
Veamos un ejemplo: Un jugador tira un dado, la banca pagarátantos pesos como punto obtenga el jugador. ¿Cuánto debe pagar eljugador a la banca para que el juego resulte equitativo?
Deberá pagar $3.50. Así tendrá 3 posibilidades de perder dinero, si obtiene 1, 2, 3, y 3 posibilidades de ganar dinero si obtiene el4,5,ó6_
Otro ejemplo: Un billete de lotería que sortea 25 millares, tienelos siguientes premios:
1 premio de $25,000;
5 premios de $1 ,000;
10 premios de $250.00;
50 premios de $100.00;
I25000
525000
1025000
5025000
Terminación 2500premios de $5.
_ 25,000x, x f rx, )- 25,000
25000 + 5 x 1000 + 10 x 250 + 50 x 100 + 5 x 2500~ (X) = 25,000 :2
En consecuencia, el valor del billete debería ser, estrictamente,$2.00. En la práctica, el valor comercial es mucho mayor: lo que va enbeneficio directo del que emite los billetes.
8.15 SOBRE LA TEORIA DE LA RUINA DE LOS JUGADORES
La noción de esperanza matemática permite resolver fácilmente elclásico problema de la ruina de los jugadores.
Dos jugadores A y B, cuyos capitales son, respectivamente, a y b.¿Qué probabilidad tiene A de arruinar a B; es decir, de ganarle todo sudinero y recíprocamente?
144 JESUS DE LA ROSA
Suponemos un juego equitativo, en que las esperanzas matemáticasde ambos resultan iguales. Sea P la probabilidad que tiene A de arruinara B, y Q = 1 - P la de que B arruine a su adversario A.
La ganancia posible de A es b, con probabilidad P; luego, su esperanza matemática es
~ (A) = b. P
y análogamente
~ (B) = a (1 - P)
y por la .equidad del juego
~ (A)= ~ (B)
es decir:
b. P =a (1 - P)
ab + a
y en consecuencia
bQ=-"--a + b
Es decir, la probabilidad de que A arruine a B es directamenteproporcional a su capital e inversamente proporcional a la suma de loscapitales de ambos.
De lo dicho resulta que un jugador A, usted por ejemplo, poseedorde un capital limitado (a), y que persiste en jugar con juego equitativocontra una banca de capital prácticamente ilimitado, la Lotería Nacional por ejemplo, o contra un conjunto de adversarios sucesivos, que suman también capitales prácticamente ilimitados, tiene una probabilidadque se acerca a la certeza de arruinarse.
¡NO JUEGUES TU DINERO!
ESTADISTICA PSICO-EDUCATIVA
8.16 MOMENTOS DE UNA VARIABLE ALEATORIA
145
Se llama momento de orden k de la variable aleatoria finita X, a laesperanza matemática de x", o sea
En particular Al = L (X). Los momentos centrados se definen dela ecuación:
Es particularmente importante el momento centrado de segundoorden. que da lugar a la siguiente definición:
Se llama varianza de una variable aleatoria X, al momento centrado de segundo orden; se representa por S2 Ó por S2 (X) ósea:
El número no negativo, raíz cuadrada de S2 (X), se llama desvíotípico de la variable aleatoria X.
Tanto la varianza S2 (X) corno el desvío tfpico S (X), miden la separación de los valores de X de su esperanza matemática Al'
Las siguientes relaciones en las cuales a, b son constantes, son importantes. Su demostración se sale del marco de este texto, por lo quenos limitaremos a enunciarlas:
L(aX+b)=aL(X)+b
L (X - A.)=O
S2 (X) = L (X2) - [ L (X)f
52 (aX + b)=a2 S2 (X)
8.17 LA DESIGUALDAD OE TCHEBYCHEFF
Sea tHX) una función de la variable X que no toma valores negat ivov. o <ea. X (Xi) = O para todos los valores X¡ de X. Sea K> O una'''lhLIIlIL lLida. y 'L'a Xi (i = l , 2, n) los valores de X, y Xa,¡,pl-,-II", \.11,,1',-, p~lr;1 lo, cuulcs H (Xa):;;;' K. Tenemos que:
146 JESUS DE LA ROSA
~ [ H (X)] = L H(Xi) f (Xi);;;¡' ~ H (X a) f (Xa ) ;;;¡, K f (X a )
P"j" I i (Xa) indica la probabilidad de que H (X) sea igualo mayor que K. Por tanto se tiene:
En particular, tomando H (X) = (X - A l ) 2 Y K = K2 S2. rc-ult a lallamada desigualdad de Tchbycheff, a saber:
IP [ IX - A¡ I ;;;¡, Ka] ~ -¡zr
Poniendo KS = K¡ , se puede escribir también
S2
K2I
Esa demostración también es válida para variables, aleatorias, descuentos y continuas.
ESTADISTICA PSICO-EDUCATIVA
EJERCICIOS
147
8.1 Dibuje un diagrama para el experimento de tirar dos dados y calcule la probabilidad de los siguientes eventos:
a) Tirar un parb) Tirar menos de 7e) Tirar 11 ó mds,
8.2 Un psicólogo tiene 100 ratas entrenadas para carrera través de unlaberinto: 25 fueron entrenadas para correr hacia la izquierda, 50para correr hacia el frente y 25 para hacerlo hacia la derecha. Suponiendo que el psicólogo mete la mano en la jaula y toma una rata al azar, al soltarla en el laberinto, ¿eudl es la probabilidad deque corra:a) hacia la derecha?b} hacia la izquierda?e) hacia el frente?
8.3 Se están estudiando 3 teortas psicológicas. A partir de la información que se tiene, cada una de ellas parece ser un modelo tan bueno para una personalidad dada, como para cualquier otra. La teona A predice una probabilidad de depresión de 0.6; la teorta B unaprobabilidad de 0.3 y la e una probabilidad de depresión de 0.2.Si en realidad ocurre una depresión, ¿cuál es la probabilidad deque la teorta B sea la correcta?
8.4 En un colegio de 700 alumnos de Segundo curso de la Secundaria,150 tienen automóvil. De 200 alumnos del curso, que provienende otras localidades, 90 poseen autómovil. Encuentra las siguientes probabilidades:a) Un estudiante residente y posee automóvilb) Un estudiante no residente y posee automóvil.
8.5 Indique si son falsas o verdaderas las siguientes proposiciones:
a) Si E es un conjunto vado P (E) = Obl P(A)=P(A)-le) Si E es el espacio muestral, entonces P(S) = O
IX
DlSTRlBUCION NORMAL DE PROBABIUDADES
9.1 DISTRIBUCIONES DE PROBABIUDAD
En el capítulo 3 se estudiaron las distribuciones de frecuencia. Laidea de distribución de frecuencia es paralela a la de distribución de probabilidad.
La distribución de probabilidad es una función que relaciona mediciones con probabilidades. En una distribución de frecuencias, lasuma de las frecuencias debe ser N, y en una distribución de probabilidades, la suma de las probabilidades debe ser l. Así:
En una distribución de frecuencias: ~ fi = N
En una distribución de probabilidades: ~ f (xj) =1
Las distribuciones de probabilidades, así como las distribucionesde frecuencias, se pueden especificar por medio de una lista, o una gráfica. Las distribuciones de probabilidad más importantes son las distribuciones teóricas que se pueden dar mediante una regla.
Las características básicas de las distribuciones de frecuencias y deprobabilidades son semejantes, pero con la diferencia importante deque, por lo general, las distribuciones de probabilidad representan distribuciones teóricas o hipotéticas, y las de frecuencias representan observaciones obtenidas de experimentos reales. Así, una distribución de probabilidad dice lo que se puede esperar observar en una distribución defrecuencias.
149
150
9.2 DISTRIBUCION NORMAL DE PROBABILIDAD
JE5U5 DE LA ROSA
En Pedagogía y Psicología, los datos empíricos nos suelen dar,normalmente, una curva que tiene forma aproximada de campana.Se ha buscado la ecuación de la curva teórica que se aproxima a muchos de los datos empíricos. Es la "ecuación de probabilidad". A lacurva correspondiente se le denomina "Curva Normal de Probabilidades".
y
03
02
-3 -1
01
o
CURVA NORMAL ESTANDAR
Figura 9./
La "ecuación de probabilidad" de la curva que aparece en la figura 9.1, es:
IY = v'21r
y =Ordenada correspondiente al punto x =X - X
e = Constante matemática igual a 2.71828, base de los logaritmos neperianos.
1f = Constante matemática, medida del círculo con su diámetro igual a3.1416.
x = Desvro igual a X - X
ESTADISTICA PSICO-EDUCATIVA
9.3 OBSERVACIONES DE LA CURVA NORMAL DEPROBABILIDADES
151
a) La curva normal de probabilidades es la gráfica de una ecuaciónmatemática.
b) El adjetivo normal no tiene carácter valorativo, no indica ninguna normalidad, es simplemente una denominación tradicional.Hay datos en Pedagogía y en Psicología que no se ajustan a lacurva normal.
e) A pesar de todo. es cierto que muchos datos en las ciencias biológicas y sociales se distribuyen en arreglo a esa curva.
9.4 PROPIEDADES DE LA CURVA NORMAL
La función normal de probabilidades: fo(x) = --l-.- e- x2
/2 estádefinida en todo el campo real y viene representada v'hpor una curva de forma campanular (figura 9.1). Las principales propiedades de la curva normal son las siguientes:
al l.s una curva uniforme con ordenadas siempre positivas y está definida para toda abscisa real. Es monótona, decreciente hacia ambos lados del máximo, lo que suele expresarse diciendo que tieneforma campanular.
b ] Es simétrica respecto del eje de las Y, y asintótica con el eje de las
x para x --- ooy x ---~ para estos valores, la función tiendea cero.
c) Tiene un solo máximo en x = O. En efecto,
~ (x ) = -r-X fo (x)
la cual se anula para el único valor finito x =O, o para los valoresinfinitos (± "'). Para comprobar que en x = Ohay un máximo, hallemos la derivada segunda:
~' (x ) =(x 2 ~ 1) fO (x)
~' (O) = fa (O) < O
lo que prueba que hay un máximo para x = O.
152 JE5US DE LA ROSA
En el punto máximo o modal; fo tiene el valor de fo = .~=0.39894. V 21T
d) fo(x) tiene dos puntos de inflexión para las abscisas ± l.
En efecto:
r'(x)=(x2 -1)fo(x)=O
.30
l-20
~20j
Figura 9.2
da valores finitos, soluciones de x2- l = O,que son:
x=l x=-I
9.5 FUNCION DE DISTRIBUCION
La función de distribución correspondiente a la función normal es:
Fo (x)x 2J e -u {2 du
_ 00
En la gráfica de fo(x), viene representada por el área comprendidaentre el eje de las x, la curva y la ordenada correspondiente a x. El dia-
ESTADISTICA PSICO-EDUCATIVA 153
grama correspondiente a Fa (x) es una curva del tipo ojival (Figura9.3).
La función de distribución (F o (x) tiene las siguientes propiedades:
a)1Fa (0)=-.,-; Fa (-00) = O; Fa (00) = 1; F~ (x)=fo (x)
La propiedad Fo (00) = I proviene de que
1= t O
o
2e-x /2 dx =
Demostración
En efecto, formemos el cuadrado de esta integral:
Esta integral es igual
k 2 2lim J I ¡k2 e-(x +y )/2 dx • dyo o
Haciendo la sustitución polar x = Q cos u; y = Q sen u, resulta:
En consecuencia, sustituyendo 12, se tiene que:
184
Tabla 11.6
Alumnos Dibujo Imaginación XYX y
I 13 II 143
2 12 14 168
3 lO II 110
4 lO 7 70
5 8 9 72
6 6 II 66
7 6 3 18
8 5 7 35
9 3 6 18
10 2 I 2
Totales 75 80 702
JESUS OE LA ROSA
X' y'
169 121
144 196
100 121
100 49
64 81
36 121
36 9
25 49
9 36
4 I
687 784
M =80Y .
702-10(7.5x8)
r = -Y-;::[=6=85=-==1==0=(7=.5=)2=]=[7=8=4=-=1=0=(=8)=2=
r = 702 - 600 =~ = O 76-J(124.5)(144) 132 .
r=0.76
b) Cálculo del Coeficiente de Correlación cuantitativa lineal simple endatos agrupados.
Los principios que rigen el cálculo del coeficiente de correlaciónen datos agrupados, son semejantes a los del cálculo anterior. Unicamente las expresiones matemáticas están adaptadas a este tipo de operaciones como el cálculo de r en datos sin agrupar. Tenemos varias fórrnu-
ESTADISTICA PSICO-€DUCATIVA
Fi¡¡:. V-3
o
F(x) = ~ - (1) (x)
figura Y.4
I •F(x) =-,- ~ (j! (x )
~ (x ) =~- 1'0 (x), para x ~ O
,;. (x )= Fo (X ) - +.pa ra x ;;, O
155
La ~ (x ) representa L'1 arca comprendida entre la ordenada dcl migen y la ordenada correspondiente a la abscisa Xl y es tal <J Ul' ~ (-- CXl)=
;(CXl)=-+-:~(Ü)=O: ~(·x)=~(xl.
156 JESUS'OE LA ROSA
c) La tabla <P (x) aparece en manuales de matemáticas y con ella sepueden encontrar los valores de Fo(x) mediante las fórmulas
1Fo (x) =2- <P (x), para x.,;; O
1Fo (x) =2+ <P (x), para x ~ O
d) Se puede verificar fácilmente, como ejercicio, que E(x) = O;S2(x) = 1 para la función de frecuencias fo (x).
9.6 D1STRlBUCION NORMAL GENERAL
Se dice que una variable aleatoria X está normalmente distribuidao que es una variable gaussiana, con esperanza matemática M y dispersión S, cuando la variable reducida.
X-MU=-.....,.--S
está distribuida según la función normal tipificada o función de GaussLaplace. Es decir, la función de probabilidad o función oe frecuencia es
f ( ) - 1 (-lf2)[(x-M)/xfo x - e~
Si representamos esta función, resulta una curva, campaniformecon máximo en el punto X = M, Y puntos de inflexión en las abscisas:
X=M±S
Las ordenadas del máximo es:
De esto resulta que la forma de la curva depende del valor de S,ya que la campana resultará más o menos alta y estrecha según que Ssea más o menos grande.
ESTADISTICA PSICO--EOUCATIVA 151
Podemos, ahora, definir la función de distribución normal mediante la fórmula:
F(a)=P(X:r;;;a)= l s' e<-1/2) [(X_M)/S)2 dx=FoC a-M)Y21TS _00 S
F(X) cumple las propiedades siguientes, que resultan de las pro-piedades análogas de Fa (x)
F (- 00) = O; F (M) =*; F ( 00) = l
I(x ) = F' (X) = I e(-lf2)[(x-M)/sI2 = -..L fa (X-M)vS;S 2 S
158
EJERCICIOS
JESUS DE LA ROSA
9.1 Determinar la ordenada máxima, puntos de inflexión y valoresde M y S, correspondiente a la función normal de probabilidades.
9.2 Sabiendo que X estd distribuida normalmente con M = O, S = 8,determinar (a) de manera que
4PO X I<'a)=-5-
9.3 Siendo la variable X normal con M := 120, S = 14, determine elvalor de X tal que
P[M -a<,X<,M +a=0.75
9.4 En la variable del problema anterior, determinar a, sabiendo queP (100 <, X <, 100 + a) = 0.90
9.5 Sabiendo que X estd distribuida normalmente con M =50 Y S =6¿Cuál es la probabilidad de escoger un valor al azar que esté pordebajo de 60?
..
x
DISTRIBUCIONES BINOMIALES DE PROBABILIDADES
10.1 EXPERIMENTO BINOMIAL
Un experimento es binomial (o de Bernoulli) sí y sólo sí cumplelas siguientes condiciones:
al En una ejecución cualquiera hay exactamente dos resultadosposibles, uno de ellos se llama arbitrariamente "éxito" y elotro "fracaso".
b) Hay n ejecuciones, donde n es un número entero y positivo fijado de antemano.
el Las ejecuciones son independientes; y
d) La probabilidad de éxito para todas las ejecuciones es la misma.
Podemos hacer que casi cualquier experimento satisfaga la condición (a), seleccionando un espacio muestral de tal manera que cada ejecución contenga exactamente dos elementos. A uno de ellos se le llamaéxito y al otro fracaso. Por ejemplo, sea (5 ó no 5) el espacio muestralde una ejecución del experimento "tirar 2 dados"; entonces, tenemosexactamente dos resultados y a cualquiera de ellos se le puede llamaréxito.
Un experimento que consiste en lanzar un moneda hasta caer cara,no satisface la condición (b), puesto que el número de ejecuciones no seha fijado de antemano.
159
160 JESUS DE LA ROSA
Para un experimento que es, o suponemos que es binomial usamos la notación:
b(x.n,p)
Para denotar la probabilidad de x éxitas en 11 ejecuciones, COII
probabilidad fJ de obtener un éxito en alguna.
Un jugador de pelota que tiene un record de haber bateado 10 home runs en cada 100 veces al bate: ¿cuál es la probabilidad de que batee:2 llame runs en sus próximas 5 oportunidades al bate"
Antes de resolver ese problema, pasaremos a demostrar el siguicnte teorema: "Si un experimento consiste de 11 ensayos binomiales. cadauno con una probabilidad p de obtener un éxito y una probabilidad l/para el fracaso (q '" l - PI, entonces, la probabilidad de x éxitos en nejecuciones es
nb(x,n,p)=( x í p" qn-'.dol1lkx=0.1.2, ... n
La probabilidad de que los primeros x ensayos sean éxitos y losn·-x restantes sean fracasos, es p' qn- x • Pero:
s. s, s, ... x ,
Tx de ellas
r, f, r, ... r
n-x de ellas
es s610 uno dc los diferentes modos en que se pueden tener x éxitos yn-x fracasos: los x éxitos pueden ocurrir para cualquier combinación
d I .. I n bi t (nde x e as n ejecuciones y iay ( x ) com macioncs: por tan o x) mo-dos diferentes los que se pueden obtener x éxitos en n ejecuciones. DI:'ahíqul:'
n!bex,n,p)=exn)Pxqn-x=(n pXq"-x-x)! x!
Ahora. resolviendo el problema anterior. la probabilidad de que el11L'loll'TO batee 2 homc runs en :) oport unid adcx ;11 bate es:
h(2.~.O.1(J)=( ~ 1(0.')' IO.')r'= I~-:--:"':-''--IIO.II~ IU-')I'1J') 12')
ESTADISTICA PSICo-EOUCATIVA H51
La función b (x, n, p) empleada en determinar la probabilidad deun numero dado cualquiera de éxitos en n ensayos de un experimentobinomial, recibe el nombre de [unción de probabilidad binomial.
10.2 ESPERANZAMATEMATICA y VARIANZA DE UNAVARIABLE BINOMIAL
Podemos considerar la variable aleatoria XB , llamada variable deBemoulli, que solamente puede tomar dos valores XI = 1, con probabilidad p, si el experimento aleatorio resulta éxito, y el valor X2 =O, enprobabilidad q, si el mismo resulta un fracaso. Entonces la variable aleatoria binomial X es la suma de n variables de Bernoulli.
La esperanza matemática de Xa es E (Xa ) = p. 1 + O • q = PLa esperanza matemática de x es igual a;
E (x) = E (xa + Xa + Xa .... XB)=E (XB) + E (xa) .... E (xa) = np
Por otra parte, S2 (Xa)=E(XB _ p)l = E (x~)- p2 =P _ p2 =pq.
10.3 TEOREMA DE BERNOULU
Aplicando la desigualdad de Tchebycheff a una variable binomial.Siendo E(x) = al = np, S2 =npq, resulta
P[ Ix-np Il~kVnpq~+
que puede escribirse
P[ ¡2...._ p Il~kvl pg .,¡;; _I_n n .k2
Dado un número positivo cualquier E, siempre se puede determinar k de manera que sea
KV pqn
.> E, K>EV~
162
Por lo que la anterior desigualdad puede escribirse
JESUS DE LA ROSA
Recordemos que x denota el número de éxitos en una sucesión depruebas binomiales, de manera que x/n es igual a la frecuencia relativacon que aparece el éxito en n pruebas. Por consiguiente, observando elsegundo miembro de la anterior desigualdad, el cual tiende a OcuandoM tiende a infinito, queda demostrado el siguiente terorema fundamental.
"En una sucesión de pruebas binomiales o de Bernoulli, dado unnúmero positivo E arbitrario, la probabilidad de que la frecuencia relativa del éxito en n pruebas difiera de la probabilidad p en una cantidadmayor que E, tiende a cero cuando n tiende a infinito".
Con esa definición, el teorema de Bernoulli puede ser enunciado brevemente así:
"En toda sucesión de pruebas de Bernoulli o binomiales, la frecuencias relativa x/m converge en probabilidad a p",
Ejemplo: Se lanza una moneda 1000 veces. Se desea una acotación de la probabilidad de que salga cara un número de veces comprendido entre 450 y 550.
x1000
= 0.9
o sea, que hay una probabilidad igual o superior al 90'1 de que elnúmero de caras esté comprendido entre 450 y 550.
10.4 LEYES DE LOS GRANDES NUMEROS
El teorema de Bernoulli pertenece a un tipo general de teoremasconocidos con el nombre de "leyes de los grandes números".
Esos teoremas difieren entre si el grado de generalidad, pero sonsiempre teoremas límites que relacionan frecuencias son probabilidadeso con valores medios. Vamos a dar otro ejemplo de ellos.
Consideremos U'1 dado. "?i x es la variable aleatoria que indica los
ESTADISTICA PSICO-EDUCATIVA 163
puntos de sus caras, es E(x) = 3.5. Supongamos que se lanza el dado nveces y se halla la "media experimental" snfn = suma total de lospuntos obtenidos dividida por n. ¿Cuál es la probabilidad de que estamedia experimental difiera de la teórica E(x) = 3.5 en menor de unnúmero dado E > O? Estamos ante una situación análoga a la delteorema de Bernoulli, sólo que a la vez de la probabilidad se trata delvalor medio.
Planteemos el problema en general. Sea Xl, X2, .... Xn una sucesión de variables aleatorias, independientes dos a dos, todos con lamisma distribución de probabilidad que la variable aleatoria x ..
Sea E (Xi) = E (x) = al' S2 (Xi) = S2 (x), Pongamos Zn =Xl +X2 . o ••• xn •
Tendremos:
E (Zn)=MalZE(_n_)=
n
Aplicando la desigualdad de Tchebycheff a la variable aleatoriaZn/n, tenemos
Z s IP<! ~-al I );;;>k .;;;-n-.;;;----¡zr-
o bien, poniendo ks/~= E,
Zn S2 :lnP[ \--a 1;;;. El ';;;--0 bien P(i--- a
n 1 NE2 n 1
S2l';;;E);;;>I--2En
Estas desigualdades permiten enunciar el siguiente teorema que esotra ley de los grandes números.
Dada una sucesión Xl, x2 . .. '" xn de variables aleatorias, independientes dos a dos, con una misma distribución de probabilidad y conmedia al y varianza S2 finitas, se verifica para todo E mayor que O".
lim P [1 Znn - al 1;;;> E) = Opara n ----:;-+ 00
donde Zj. v x¡ +x2 •••• ••• •• • +xn
164 JESUS DE LA ROSA
En otras palabras: el límite, con probabilidad, de la media experimental Zn/n, para n - 00, es igual a la media teórica al .
10.5 CADENAS DEMARKOV
Son frecuentes los problemas en que la probabilidad de un sucesodepende de la probabilidad de otros sucesos anteriores. Un caso simplees el de las llamadas Cadenas de Markov, de las que vamos a considerarun ejemplo simple, pero representativo.
En un determinado lugar, la probabilidad de que si un día lluevay al día siguiente no llueva es 1/3, y la probabilidad de que si un díano llueva, tampoco llueva al día siguiente, es 3/4.
Se desea la probabilidad de que, suponiendo que hoy no llueva,tampoco llueva dentro de n días.
Las probabilidades del enunciado pueden haberse obtenido mediante la estadística de muchos días, durante meses o años.
Para resolver el problema se construye la llamada matriz de transición (Pij), donde Pij =probabilidad del caso J. si en la prueba se ha dado el caso i.
En el problema anterior los casos son:
l = no llover;2 = llover.
Por tanto, la matriz de transición es:
3 l 31 .iz.T T 48 48T= T2 =
l 2 .iz 193 3 36 36
ESTACISTICA PSICQ---t;;CUCATIVA 165
La probabilidad que no Ilueva.al cabo de dos (2) días es el elemento O, l)de la matriz T2
, o sea 31/48, puesto que P~I =Pu . Pu +P12
P21 • En general, la probabilidad de que no llueva al cabo de n días esel elemento (1, 1) de la matriz TR .
¿Qué pasa para n --+ oc?
El limite de P~1 será la probabilidad de que no llueva un día tomado al azar, pues la influencia de que hoy llueva o no desaparece para ngrande. Según la ley:
p o p,0-Ip nJI-I P nJI 00-1 P n"-1 P11 = 11 11 + r12 21, lh ="11 12 + "1.2 22
Si se llama P al límite de Ifl y Q al límite de ~ - 1se tiene el siste-ma
(PI I -1)P+P21 Q=O'P12 P+(P22 -I)Q=O
Teniendo en cuenta que P + Q = 1, este sistema de ecuaciones da lasolución de que no llueve un día dado al azar.
10.6 FUNCION DEPROBABILIDAD DEPOISSON
La expresión b (x, n, p) de la función de probabilidad binomial podría resultar dificil de calcular directamente para valores un poco grandes de x y n. F, cierto que existen tablas apropiadas para su cálculo peTO muchas veces es preferible sustituir la expresión b (x, n, p) por otrade mejor manejo para calculo y suficientemente aproximada en las aplicaciones.
Un caso en que esto es posible para valores pequeños de p, talescomo el producto np sea relativamente pequeño aun para valores bastantes grandes de n. Planteemos el problema de buscar el límite de lafunción de probabilidad binomial para el caso en que p tiende a cero,al mismo .tiempo que n tiende a infinito, de manera que el valor mediose mantenga igual a una constante k, o sea,
np=k
166 JESUS DE LA ROSA
Desde luego que se trata de u caso límite teórico, pues la probabilidad p en cualquier experimento tiene un valor fijo y, por tanto, elproducto np crece con n. Sin embargo, el límite nos dará un valor aproximado de b (x, n, p) para los valores de n y p tales que su producto nodifiera mucho de k.
Se tiene
b ( ) =(n ) pX q" - x =(n ) (--'L)X (1 _ i)" - xx, n, p x x n n
= n en -l)... (n -; x + 1) (L)X ( 1 _.Ji....tx! (l - k/n) n n
=~ (1-I/n)(1-2/n)... (1-(x-l){n (1 _ ~)"x! (1 - k{n)" n
Para n - ClO, manteniendo fijo x, el numerador del segundo quebrado tiende a 1, puesto que es el producto de un número finito de factores, cada uno de los cuales tiende a l. El denominador también tiendeal.
El último factor tiende a e- k (véase el número e en un texto dematemáticas apropiado). Por tanto queda
kX
lim b (x, n, p)=-,-e- kx.
Donde se supone que n y p están ligados por la relación
k =pn
Se tienen así, siempre que k > Ouna nueva función de probabili-dad para una variable aleatoria X que tome los valores O. 1, 2 .
Esta función de probabilidad
kX
Pr=---e- x
n!x =0,1,2 .....
Se llama la función de probabilidad de Poisson. Una variable aleatoria que puede tomar los valores x = O, 1, 2.... con la probabilidad Pr,
ESTADISTICA PSICO-EDUCATIVA 167
se llama variable Poisson, La función de distribución de la variable aleatoria de Poisson será:
P (r) = 2: Pi
Teniendo en cuenta como ha sido obtenida, resulta que la funciónPr (de Poisson) nos da un valor aproximado de b, (x, n, p) (función deprobabilidad binomial) para valores pequeños de p. Practicamente seconsidera que la función es aceptable si p < 0.1 y np = K < 5. Por estose llama función o la ley de las probabilidades pequeñas.
Vamos a ilustrar con un ejemplo:
Se tira" dos dados 50 veces. Se desea hallar la probabilidad de quesalgan dos 6 exactamente 5 veces.
La probabilidad de que salgan dos 6 es 1/36.
En el esquema binomial, la probabilidad pedida es:
50!45! x 5!
Ese valor no es fácil de calcular directamente. Podemos aplicar lafórmula de Poisson ya que p = 1/36 = 0.028 < 0.1 y k = pm =0.028 x50 = 1.4 < 5.
Tenemos que:
kX
Fr=---e- X =x!
5(1.4) (27)- 1.28 = O 01151' .
Este valor 0.011 es suficientemente aproximado a 0.0099.
Otro ejemplo.
Una fábrica produce ciertas piezas y se sabe que la probabilidad deque una pieza sea defectuosa es p =0.02.
Se desea hallar la probabilidad de que en un lote de 100 piezas,no hayan piezas defectuosas y también de que hayan a lo sumo, 3 piezas defectuosas.
161
que
JESUS DE LA ROSA
Aplicando la función de Poisson para k =np = 2; x =0, resulta
Po=e-2 =0.135
y la probabilidad de que haya a lo sumo 3 defectuosas será F(3) =P(x<3)=Po + PI + P2 + P3 =~e-2 =0.857.....
ESTADISTICA PSICO-EDUCATlVA
EJERCICIOS
169
10.1 Dos urnas contienen, cada una, bolas negras numeradas de 1 a 10.Se saca una bola de cada urna y se suman los números obtenidos.¿Cuál es el valor medio de la suma?
10.2 Dos urnas contienen, cada una, 5 bolas numeradas de 1 a 5. Si sesaca una bola de cada urna y se multiplican los números obtenidos, ¿cudl es el valor medio de ese producto?
'0.3 ¿Cuántas veces hay que lanzar un dado para que, con probabilidad;;;. 0.9, la frecuencia relativa con que salga el1 difiera de 1/6 en nomÓJ de 0.0l?
10.4 Un artillero dispara a un blanco ~ sabe que la probabilidad de acertar es p =-rtm-. ¿Cuántos disparos tendrán que hacer para tener la
probabilidad mayor que 90 %de dar en el blanco por lo menos unavez?
10.5 Por un punto de una carretera pasa un promedio de 5 automóvilespor minuto. ¿Cudl es la probabilidad de que en un minuto no paseautomóvil alguno?
PARTE 111
ANAllSIS DE REGRESIOIyCORRELACIOI
XI
REGRESION Y CORRELACION
11.1 REGRESION.
La regresión estadística se debe al insigne matemático y psicológoinglés Francis Galton, quien efectuó una serie de trabajos, entre los quese destacan los relacionados con la estatura y la herencia.
Galtón encontró que los hijos de padres altos tienden a tener unaestatura más baja que la de los padres y viceversa, para concluir en queexiste la tendencia a que todos tengan estatura normal, es decir, la quese apunta a regresar a la media.
Hoy la regresión se emplea en el sentido de conocer el valor deuna variable a partir del valor de otra. Ejemplo: si la estatura es X,¿cuál será el peso?
Regresión es estimar valores de una variable, conocidos los valoresde otra variable. Las variables son dos; la predictor y la predictando. Laprimera se llama independiente y la otra, la que se busca, dependiente.
Los datos pueden estar agrupados o no. Cuando tenemos una seriehistórica de datos que nos indican la evolución del fenómeno que sepuede presentar, la nube de puntos se hace con los datos obtenidos enla tabla 11.1.
Tabla 11.1Peso (X) Estatura (x)
50 1.5060 1.7070 1.80
173
174 JESUS DE LA ROSA
Para construir una nube de puntos, unimos los puntos resultantesen el eje de coordenadas de las variables X e Y (véase figura 11.1).
Figura 11.1
---------------1III
8.0
1.8
1.6
1.4
1.2
1.0
----------------------,----------------, I
I II II II II I
I IEjemplo:
10 20 30 40 50 60 10
X=50y = 1.50
601.70
701.80
(peso)(estatura)
Para hacer una regresión se utilizan las coordenadas, con el fin dever qué tipo de regresión es: rectilínea, circular, elipsoide, hiperbólicao parabólica.
La geometría analítica nos dice cuáles son las ecuaciones de cadacurva; véanse las siguientes fórmulas:
Ecuación de la Recta:
Ecuación del Círculo:
Ecuación de la Elipse:
Y=a + bx
x' v'--+ ---ol- = la2 b2
2 2
Ecuación de la Hipérbola: + --7 = l
Ecuación de la Parábola: Y =ax2 + bx +c
ESTADISTICA PSICD-EDUCATfVA 175
Por medio de la representación en el eje de coordenadas, obtenemos la lfnea de ajuste, obtenida también mediante la ecuación correspondiente de la recta, o de la parábola, etc.
¿Cómo se encuentra la línea de ajuste?
La línea de ajuste la hallamos por medio de la ecuación de la recta(Yo = a + bx); a continuación procedemos a elaborar las dos ecuacionesnormales de la recta: la primera (a), se obtiene partiendo de la ecuacióngeneral de la recta (Y = a + bx); se multiplica por, (llcoeficiente de a yse suma con respecto a las variables. El coeficiente de a, es N, siendo Nel número de renglones de intervalos de clase:
~Y =Na + b ~ x (a)
La segunda ecuación normal (b) es la resultante de multiplicar laecuación general de la recta por el coeficiente de b que es x
Nonnas para hallar la línea de ajuste o regresión:
Iro. Se elabora la nube de puntos.
2do. Se observa la ecuación correspondiente.
3ro. Se elabora la tabla 11.2 (x, y, xy, X 2 ).
4to. Se sustituyen los valores hallados en la tabla por las ecuacionesnormales.
Sto. Se resuelve el sistema de ecuaciones.
6to. Se sustituyen los valores resueltos en las ecuaciones anteriores.
7mo. Se tabula la ecuación sustituida.
8vo. Se representa gráficamente.
Ejemplo: Se sometió a examen de matemática a cuatro estudiantes, los cuales obtuvieron las siguientes puntuaciones: 50 - 60 - 70 80. A esos mismos estudiantes se les sometió a una prueba de inteligencia, obteniendo respectivamente, al examen anterior las siguientes puntuaciones: ISO - 165 - 180 - 185. Calcule la línea de regresión o deajuste.
Solución: I ro. se elabora la tabla 11.2 (x, y, xy, x2)
176 JESUS OE LA ROSA
Tabla 11.2
2X Y XY X N= 4
50 150 7500 2500 X = de cono-cimiento
60 165 9900 3600 Y = Prueba de80 185 14800 6400 inteligencia
Total 260 680 44800 17400
2do. Se elabora la nube de puntos (véase figura 11.2)
1.9
1.8
1.7
1.6
1.5
1.4
1.3
1.2
1.1
50 60 70 80
Figura 11.2
3ro. Se observa la ecuaci6n correspondiente.
Por medio de la nube de puntos observamos que debemos aplicarlas ecuaciones normales de la recta.
~Y=Na+b~x
~ XY=a ~ X + b ~ x2
ESTADISTICA PSICO-EDUCATlVA 177
4to. Se sustituyen los valores hallados en la tabla 11.2 por las ecuacionesnormales:
680 = 4 a + 260 b44800 = 260a + 7400 b
Sto. Se resuelve el sistema de ecuaciones:
680 = 4 a + 260 b44800 = 260a+ 17400 b
Multiplicamos la primera ecuación por 65 y resulta:
44200 = - 260 a - 16900 b44800 = 260 a + 17400 b
600= 500 b
600500
a=
Sustituyendo tenemos
a=
680 ~ 260 b4
680 - 3124
a=92
6to. Se sustituyen los valores resueltos en ·las ecuacÍOl1es .anteriores:
y=a + bxv ==-"92 + 1.2 x
7Joo. Se tabula la ecuación sustituida (Tabla 11.3)
178 JESUS DE LA ROSA
Tahla JI. 3X Y
30 12X
20 116
10 104
O 92
-la XO
-20 68
--30 56
Ljcmplo: Si damos a x el valor de 30. tenemos:
Y=l)2 + 1.2 dO)Y = 128
Xvo. Se representa gráficamente (véase figura 11._~ 1
160
20
-30 -20 -10 10 20 30
/igll ra JI.."
ESTADISTICA P$ICO-EDUCATIVA
De' l'S~ forma hemos elaborado la lmca de regresión.
179
Coeficiente de Regresion Lineal: es aquel que expresa el númerode unidades en que varía el valor más probable de Y por cada unidad devar iación dl' X.
Por ejemplo, en la ecuación anterior:
y =92 + 1.2 x
El coeficiente de regresión es 1.2. Por tanto, 1.2 unidades es lo queaumenta el valor más probable de Y por cada unidad de aumento de x.
El coeficiente de regresión de Y sobre X cuando conocemos lacorrelación (r) se establece mediante la siguiente fórmula:
r = Coeficiente de correlación X e Ysy= Desviación típica en distribución ysx = Desviación típica en distribución x
Por otra parte la fórmula (c ) del coeficiente de regresión expresadaen términos de las desviaciones x l' y es:
11.2CORRElACION.
La correlación es una medida que estudia los cambios sucesivos dedos variables. No se trata de una medida de relación causalista, sino deuna relación asociativa. El método de correlación es uno de los más importantes en la investigación psicológica y educativa.
Por ejemplo, se ha comprobado que a medida que aumenta elurbanismo, aumentan las enfermedades psíquicas; esto es correlaciónentre una cosa y otra. Como veremos a continuación, se puede medir lamagnitud de la correlación y clasificar su resultado.
La correlación se puede clasificar en positiva, si al aumentar unavariable tiende a aumentar la otra, y negativa, si al aumentar una de lasvariables tiende a disminuir la otra.
Las c:oodaciones ... altas Y positiwas;~ y positiwas" OtiUilliaS aOtiO;.iauaIes a c:ao; altas y neptiYas, y bigas y neptiwu.
Ff&IIRIll.5
__lIIlE. Y ......,--=...........
11811
El ~1tfe *~ ICS UIlIIl wb Jliiiliil6¡iDoJ~ iiImiül::I si_~ <l:l1Iltllru:~~ J' CIIIid acll p-JIldlo * «JiIIIOllI1üIim 10 lIdEttNiiblJl Se~b paII" Jb¡ lIdIa r. V~ b 1lalIbJIa 11.4:
r= n..oo
Ir =1Ol..'9Jl!» ;a llJJ..99
Ir = «ll.711111 a 1Ol.99
Ir= 1Ol.1O;a llJJ39
I"=(J).OO
1"=-1.00
El coeficiente de correlación nunca puede ser maY01" de 1, ni menOl" de -l. Su waIor esU comprendido, por tanto, de O a :t l.
Los métodos de correlación podemos dirididos en dos grandesgtUp05: correlación cuantitativa lineal simple y correlación no cuantitativa.
¿Qué métodos utilizaremos en determinada investigación?
Quizás sea esta una de las cosas más complejas y que en algunoscasos deberíamos consultar a especialistas. Sin embargo, a continuacióncitaremos la forma de escoger una u otra correlación segl1n el tipo devariables.
SIGNIFICAOO DE TERMINOS.-
Cuantitativ« o continua: variable que teóricamente puede asumirun numero Infinito de valores entre dos puntos cualesquiera en determinada escala.
Ejemplo: El peso de las personas.
182 JE5US DE LA ROSA
No cuantitativa o discreta: cosas no rnedibles en unidades íraccionadas de cantidad.Ejemplo: Número de hijos en una familia (no se conciben cantidudcsque expresen, por ejemplo, 2 hijos y medio).
Dicotómica: Serie de dos categorías mutuamente excluyentes ocontrarias.Ejemplo: Macho y hembra.
La dicotomia puede ser auténtica como por ejemplo: sexo masculino y sexo femenino o artificial como: resistencia y capitulación a lapresión social.
Tabla 11,5
Variable A
Cuantitativa ocontinua
Número de orden: terrninosinferiores a 30, expresadosen rangos
Cuantitativa DicotómicaArtificial
Cuantitativa ocualitativa
Dicotómica Artificial
Cuantitativa Dicotómicaauténtica
Dicotómica Auténtica
Variable B
Cuantitativa ocontinua
Número de orden:términos inferioresa 30, expresados conrangos
Continua
Cualitativa
Dicotomía Artificial
Continua
Dicotomía Auténtica
Método
Correlación cuantitativa.Iineal, simple
Correlación ordinal
Correlación nocuantitativa "biserial"
Correlación nocuantitativa "contingencia"
Correlación nocuantitativa "Tetracórica"
Correlación nocuantitativa "Punto biserial"
Correlación nocuantitativa "Coeficiente fi".
ESTADISTICA PSICO-EDUCATIVA
n. 2.1 CORRELACION CUANTlTATIVA LINEAL SIMPLE
183
Este método se refiere solamente a series cuantitativas como, porejemplo, los coeficientes de natalidad y mortalidad, etc.
a) Cálculo del coeficiente de Correlación en Datos no agrupados.Para hallar el coeficiente de correlación en datos sin agrupar, tenemos varias fórmulas o expresiones matemáticas:
r = ~ xy - NMxMy
N ~ XY - ~X ~Y
J [N ~X2 - (~X)2 (N ~ Y2 ~ (~y)21
52 yx- -S-2--
- y
(1)
(2)
(3)
Sin embargo, nosotros aplicaremos la fórmula (4), más utilizadapara el cálculo del coeficiente de correlación de Pearson, que es la siguiente:
~ XY - N Mx My
JO:. X~ - NM~) (~ y2 - NM~ )(4)
Ejemplo: aplicamos a los estudiantes de la asignatura una pruebade dibujo y otra de imaginación creadora. Nos interesa buscar la correlación que existe entre esas dos variables.
XY = Suma de los productos de los valores correspondientes de lasvariables,
N = Número de valores de las series que se comparanMx = Media de XMy = Media de Y
ESTADISTICA PSICO-EDUCAnVA 1115
las con las que podemos averiguar r en datos agrupados; he aquí algunasde ellas:
(5)
(6)
CUy! ) )N
(7)
Ejemplo: Utilizamos el ejemplo que aparece a continuación señalando como variable A, las puntuaciones del examen A y como variable B. las puntuaciones del examen B.
Tabla 11. 7
Examen A
Alumno Puntuación Alumno Puntuación
Rosa 15 Patricia 34
Griscl.,., Yolanda 28
Mary 17 Bertilia 21
Sotero 30 Jesús 5
Carnejo .,., Altagrucia 10
Pichy 27 Manuel q
Paulina 18 Luis 12-----Virna 20 Domingo 23
Guillermo 14 Lidia 16
Leonor 24 Yolanda 31
186
Alumno
Rosa
Grisel
Mary
Puntuación
20
17
15
Tabla J t.«
Examen B
Alumno
Patricia
Yolanda
Bert ilia
JESUoS DE LA ROSA
Puntuación
34
24
14
Sotera
Camejo
Pichy
Paulina
Virna
Guillermo
Leonor
32
20
26
21
18
9
23
Jesús
Altagracia
Manuel
Luis
Domingo
Lidia
Yolanda
7
1I
8
19
20
8
30
ESTADISTICA PSICD-EDUCATIVA 187
Para calcular el coeficiente de correlación, en primer lugar debemos construir un diagrama de dispersión, como aparece a continuación:
Diagrama de Dispersión
222\
! I 11-------I---+----~--l-"-+_--_I_--_+-_+-_+-_+_-_+_-_1
- _ o I20 - 2-l 6 6 6 -1 -1
15 - 1'1- 1 oI 2 ·f o o o -3 o
10 - l-l-2
1o
1 2 -1 -2 2 -2 2-1 _1
5-'1.; -:! --1
2 ~ -2 -8 16 -9 18
:\ IH
2
:\'1 1+- --1
iM" = 18.75
JI, = 20
7 55 -8 3920
-lB
-H
~
6
'1
J2
2
2
:\2
oo
6
o
o
6
18 12 -l
-:1 -~ -1
--f -:\ O
-6 -6 --l
d,.
Tabla 11. 9
¿Cómo se construye el diagrama?
1- Se tabulan los datos en intervalos de clases con sus respectivasfrecuencias.
Ejemplo x = (5 - 9) (10 - 14) (15 - 19) .
1- Les iiJm1tlelwlm se~ * mmlClOOllr iIllDlIliJl}'W.~ IflIIlIWll:llllltllel!ejjlede~
3- U rroJlnammm¡ Jfy WllIl~ cqpwe~ al JIrm¡;iim~
de clmle llIIdI qe y. (Q) :llC'llI de JI¡¡¡ ][1JI1IIIdhIIl •• al~ 1l:j¡::mmpIk».
~ La¡~ 'lIIy SIOOlI JI¡¡¡<¡;~ al~iiJm~0llJIID lIll5
]pJ'N:1t(Q) al Ja¡ llIIIl'aBim. C.@IIlIIl(Q) m llIIIIIle!ittro ClI.'!lOJ Ja¡ l!IIIIIelllIiii (MrDS.71S1esü IOO!IIIllpremdm ellllttre el! iiJmltlflwJllkNr (DS - Dll}!)). aillD.ñ~ eJl(J): lInalciia UJ1IM llI1ll1l1lJllelllJJllllll<lJS a JI!"Idiir dd I y lInairciW al1b.ll!iicD iIl ¡pam1tiiJr dd-1.
5- La coIumm. fy iIy. es el ll1e'IIJIIUado de llIIIlllllltipliic3Jr bt aJImurmim dypm-fy.
6- La columna fy dJ!y. es el n:mItado de multiplirc:-.mr h coIumllIIa dyporfydy.
1- La coluJD113 }; fxydx, es el remlbdo de sumar los "Cndices'" _periores, Ejemplo: en el interw¡¡)o (5 - 9) tenemos tus c:&IIasocupadas por tres índices" cuya suma es -9.
~~~ ~
nu_lndice
-l
índice índice índice
8-- La columna d y ~ fxydl( es el producto de la columna dy por lacolumna ~ fxy-
9- Los índice se obtienen de la siguiente manera:
:jI El número de mayor tamaño que encontrarnos en la casilla in-
1_
1taioIr likII~ mJIll bs fiemrepci:as: de x e y. Ejemplo en el ejex ~1tc iIII ÜD.te.:mdo de cI;ucs (30- 34) apanxed~el llIIIiiIIIme.ro 3. 5Íiíl:'lIldlDl este llIIÍIImellO el de mayor tamaño. Ya su wez"lira fu:raulll:'.lllrciia de eseiintav.llo.
Abront bien" en el de y. en el inlcnillo (30 - 34). también le rolIeSpOIIIlde COIIIIIIO fm:lII.,.,.,-iaesemismo 3. Esto quiere decir que 3 esla fm:lmeDll:iíll (COIll nuestro ejaJmplo)" bbIa II!J. comprendida entreel m1tawllo x (JO - 34) Y en el de Y (30 - 34). Explicado de otralDiIlIlClI3l" 3 es el niimero de was que se remite una puntuación enlos eúmrelllii:S A Y B (de nuest:rosrejemplosdelas tablas(II.7y 11.8)Y que esU rromprendido entre los intenalos de dase (30 -34)"paR x o examen A y (30 - 34) para Y. o examen B.
b) Ese dI1mero de mayor tunano se multiplia por el desvío Y(dy).
Ejemplo 3 x 3 =9 D ese mimero. de tamaño inferior secoIoc:a. con el mg,¡- 3 lo inferior izquierdo de la cmna ro-IreSpOIIdiente. Así 9 .bail::emos en todas las demjs c'as:iUas,donde se encuentre la frecueocia o número mayor.
e) También ese mimero de mayor tamaño. se multiplica por eldesYÍo de X (bacia abago. dx). Ejemplo: 3 x 2 = 6
Ese otro n11mero de tamaño inferior. se coloca en el ;Inplo supeñor derecho de la casilla correspondiente. Asi bac:emo!< en todas lasdemáS casillas.
10-- Las columnas fx. dx, fxdx. fxdi 1: fxydy, dx 1: xydy. com:spondiente al eje de las x, su aO.culo es semejante al utilizado con el ejede las y.
11- Una vez que hemos hallado todos los cálculos mencionados del diagrama, sumamos las columnas fydy, fyd2 y, 1: fxy dx, dy 1: fxdx Ylas correspondientes al eje de las x, como fxdx, fxd2 s, 1: fx Ydy Ydx 1: fxydy.
12- Para comprobar si hemos hechos bien los cálculos en el diagrama
'90 JESUS DE LA ROSA
de dispersión, la suma de la columna fydy tiene que coincidir o serigual que la suma de la columna ¿ fxydy, la de ¿ fxydx con lafxdx Y la columna d y ¿ fxydx con la dx ¿ fxydy.
Una vez elaborado el diagrama de dispersión, sustituimos la fórmula 5, como se muestra a continuación,
1- ¿ xy = 39--(-8) (7)
20
¿ xy = 41.80
2 ¿ x2 = 48-(~8)2
20¿ x 2 = 44.80
3-
4- R = 41.80/ O.H6
V 44.8 x 52.55
11.2.2 CORRELACION ORDINAL
El coeficiente de correlación ordinal se debe a Spcrman. Utilizaremos ese método cuando las variables vienen expresadas en número deorden o "ranks", o también en trc dos series cuyo numero de términosno es superior a 30. El coeficiente de correlación ordinal se representacon la letra r.
Su fórmula (8) viene representada de la siguiente forma:
(, ~ lir = 1·· ". ,,'2 1 Ui)" (" )
D = Diferencia numérica entre los números de orden.N = Número de pares dc' observaciones
Ejemplo: Aplicamos a u n grupo de 10 estudiantes dos pruebas A y B.Según el resultado obtenido en 1<Is pruebas las clasificamos dela siguiente forma,
ALUMNO
PRUIB,\ 1\
PRl'IB.\ 11 3
-' 7 <)
10
7
7
10 H
() (,
lO
4
ESTADISTICA PSICO-E DUCATIVA 191
Para calcular el coeficiente de correlación ordinal entre las dos clasificaciones, preparamos la tabla 11.10.
Tabla 11.10
ALUMNOS PRUEBA (A) PRUEBA (B) D
4
-1
~ 4
2 4
4
~ 4
al La columna )) l'S resultante de restar los números de la prueba A y
B.
h 1 1 a columna ))~ c" resultado de elevar la, diferencias al cuadrado.
Sustitu , cndo la fórmula S. tenernos:
1 h x 2SI Ü (1 ü~ I 1
r = O.s3
1112
11.2-3. CORRELAOON NO CUANTITAnYA
JESUS DE LA ROSA
0íkuI0 del coeficiente de Correlación Bisertal.
El álculo de correlación biserial es muy empleado en educación ypsicología. Se utiliza cuando tenemos que relacionar una serie cuantitativa con una dicotómica. Una de sus aplicaciones más importantes escuando queremos buscar el poder discriminativo de los items de unaproeba; la correlación biserial es la más indicada como método de correlación. Se expresa con la letra Rbis y su fórmula (9) es la siguiente:
Rbis = Y D - Y g pqSt • -y- (9)
p = Proporción de casos contenidos en la distribución correspondien·te al valor menor de la variable dicotómica.
q = Proporción de casos contenidos en la distribución correspondiente al valor mayor de la variable dicotómica.
St = Desviación típica de la distribución total,
Mp = Media de los valores de x (p) para el grupo mayor de la variabledicotomizada
Me¡ = Media de los valores de x (q) para el grupo menor.
y = Ordenada del punto que divide la curva normal unitaria en lasproporciones p y q con una superficie igual a 1.00.
EJEMPW: Calcúlese el coeficiente de correlación biserial con 60estudiantes que contestaron positivamente o acertadamente (p) un cuestionario y 40 estudiantes que lo contestaron negativamente o nulo (q).
l. Comenzamos por construir la tabla 11.11 con las variables tabuladas y con las columnas correspondientes para calcular el coeficiente de correlación biserial.
f (p) = Frecuencia de P (variable A)
x' (P) = Desviaciones de la media de p expresadas en valores integralesempezando con cero en la clase donde cae la media de p.
Fx' (p)=Producto de frecuencias por sus desviaciones.
F(q) = Frecuencias de q (Variable B)x' (q) = Origen arbitrario de las desviaciones de la media de g expresa
das en valores integrales empezando con cero en la clase donde cae la media q.
ESTADISTICA PSICO-EDUCATIVA 193
Px'(q) = Producto de frecuencias por sus desviaciones expresadas envalores integrales.
F(t) = Frecuencia total o suma de las frecuencias de p y q.
x' = Origen arbitrario de las desviaciones de E (fp + fq) expresa-das en valores integrales empezando con cero en la clase 'don-de cae el promedio de las medias de p y q.
fx' (O = Producto de las frecuencias totales por sus desviaciones ex-presadas en valores integrales.
Fx,2 = Producto de las columnas x' [desviaciones de E (fp + fq) porla columna fx' (t)].
Tabla 1J.J 1
x f(p) x'p fx'(p) f(q) x'(q) fx'(q) f(t) -J(- fx'(t) fx,2
2S-29 O -7 O O -6 -6 -6 -6 36
30-34 O -6 O 2 -S -10 2 -S -10 SO
3S-39 O -S O 4 -4 -16 4 -4 -16 64
40-44 3 -4 - 12 2 -3 -6 S -3 -15 45
4S-49 4 -3 - 12 3 -2 -6 7 -2 -14 28
50-54 15-2 - 30 5 -1 -5 20 -1 -20 20
SS-S9 10-1 - 10 S O O IS O O O
60-64 lO O O 9 9 19 19 19
6S-69 S S S 2 10 lO 2 20 40
70-74 6 2 12 2 3 12 8 3 24 72
7S-79 4 3 12 2 4 8 6 4 24 96
BO-84 3 4 12 O 5 O 3 5 lS 75
TOTALES - 23 40 - 16 lOO -21 S45
2.- Elaborado el diagrama, calculamos las medias de p y q.
Fórmula (10) M(p) = 60
f x'(10)
M(q) = 52.8Mp=M +(~ -N-)i
M = Media de f(t)
194
Mp = 60 + ( - ¿~ )5 = 58.10
Asimismo:
I: fx'Mq=M+( N )i
Mq =54.8 +( - ~g )5 =52.8
60P=1Oü=0.6
40q=lüO=OA
q= 1 - P
JESUS DE LA ROSA
(11 )
3.- Buscamos en la tabla de ordenadas en valores Z (véase apéndice D).
Z =0.26Y=0.3857
4.- La desviación (Sr) la calculamos mediante la fórmula (12):
Sustituyendo tenemos:
0.240 ~0.3857 )
j 545 - 21 2Sr =5 lO'() - (-wo)
Sr = 11.60
5.- Una vez que conocemos todos los valores, sustituiremos estas en lafórmula (9).
R . = ( 58.1 - 52.8 ) (bIS 11.6
Rbis=0.28
ES,ADISTICA PSICO-EDUCATlvA '95
Cdlculo del Coeficiente de Contingencia.
Este cálculo se utiliza cuando tenemos 3 variables o cuando lavariable A es cuantitativa o cualitativa, y la variable B cualitativa ünícamente.
Se representa con la letra C y su fórmula, viene expresada de lasiguiente manera:
(12)
x' = Chi cuadradoN =Datos
Ejemplo: Se seleccionaron 500 personas para ver su grado de introversión, en las clases baja, media y alta, en la capital, cabecera de provincias y municipios.
1- Elaboramos la tabla 11.12 de la siguiente manera:
BAJA MEDIA ALTA TOTALES
CAPITAL 5 45 50 Fe 100
20 60 20 Ft
CABECERA DE PROY. 50 110 40 Fe 200
40 120 40 Ft
MUNICIPIOS 45 145 10 Fe 200
40 120 40 Ft
TOTALES 100 300 100 500
En la tabla 11.12 encontramos quizás dos términos o símbolosdesconocidos: Fe y Ft. Pues bien, Fe es la frecuencia empírica y ya nosviene dada en el ejemplo. Eso quiere decir que 5 es el numero depersonas de las 500 que seleccionamos de llt clase baja en la capital. Lafrecuencia empírica siempre viene dada al formular un problema. Elsímbolo Ft es la frecuencia teórica y se calcula a partir de los totales decada una de las columnas, tanto vertical como horizontalmente.
196 JESUS DE LA ROSA
Veamos: Para calcular Ft de la casilla baja-capital, multiplicamos100 x100 y dividimos ese resultado entre 500; esto nos dá 20, que esFt, En el caso de la casilla, media-capital, multiplicamos 100 x 300y dividimos ese resultado entre 500 (suma total de Fe); esto nos dá 60que es la Ft de 45. Así continuamos el cálculo de las frecuencias teóricas en las demás casillas.
Una vez calculadas las frecuencias teóricas, restamos las empíricas de las teóricas (Fe - Ft).
5 - 20 = - 15
50 -40 = 10
45 - 40= 5
Fe - Ft45 - 60 = - 15
110 - 120 = - 10
145 - 120 = 25
5 - 20 = 15
40 - 40 = O
10 - 40=-30
Después la diferencia entre (Fe - Ft) la elevamos al cuadrado(Fe - Ft)2
(-15)2 = 225
102 = 100
(- 5)2 = 25
(Fe - Ft)2
(-15)2 = 225
(-10)2 = 100
(25)2 = 625
(30)2 = 900
02 = O
(-30)2 = 900
Esas diferencias al cuadrado la dividimos entre su frecuencia teórica (Ft) y sumamos los resultados.
(Fe - Ft)2Ft
225/20 = 11.25
100/40 = 2.50
25/40 = 0.62
Totales = 14.37
225/60 =3.75
100/120=0.83
625/120 = 5.20
=9.78
900/20 = 45.00
0/40 = 0.00
900/40 = 22.50
=67.50
x' = 14.37 +9.78 +67.50=91.65
ESTADISTICA PSICO-EDUCATlVA
Sustituimos en la fórmula 12:
197
C=91.65
500 + 91.65
El coeficiente de contingencia (C) tiene el defecto de que sub-estima la magnitud real de la correlación, en razón inversa del número decasillas del cuadro. Existen correcciones apropiadas para paliar el problema cuyos fundamentos escapan al contenido de este texto.
CALCULOS DE LA CORRELACION TETRACORlCA.
Cuando dos variables son dicotómicas y siendo N mayor que 100,debemos utilizar el método de la correlación tetracórica.
Cuando hablamos de variables dicotomizadas, la variable A tienedos valores: X y (-X); la variable B tiene dos valores Y y (-Y). Cadaelemento se clasifica en una de las'cuatro categorías (X, Y) (X, -y),(-X, Y) (-X, -Y). La correlación tetracórica se debe a Cherire,Saffir y Thurstonc. Se representa con la letra rt y su fórmula 13,viene expresada de la siguiente manera:
rt =_1_ [1 __1_ j N2 _ 2hk (bc - ad)hk N H.K
rt =Correlación tetracóricaX In 2n
h =Es el valor de Sen 0.5-~ ó 0.5- NX nI n2K=Es el valor de - en O5 - -- ó O 5--S . N . N
H=Es la longitud de la ordenada en h
K= Es la longitud de la ordenada en k
] (13)
Los sfmbolos restantes se encuentran en la tabla 11.13.
Ejemplo: En el departamento de orientación de la U.A.S.D. se hanentrevistado 24 veces 3 64 personas, 36 veces, l ó 2; y no se han entrevistado 56 veces 3 ó 4 personas, ni 34 veces I ó 2. Calcúlese el coeficientede correlación tctrucórica.
198
1, Elaboramos la Tabla 11.13.
Tabla 11.13
JESUS DE LA ROSA
Nnmero de Personas Entrevistadas No entrevistadas Total-.l!LN
364 a bPersonas 24 56 1" 80
162 e dPersonas 36 34
,n70
ni n2TOTAL 60 90 N 150
0.60n2N
2.- Buscamos H y K
0.5 - 0.533 =0.0330.5 -0.600=0.100
Para calcular H y K encontramos en la representación 5 del apéndice, en la columna de las ordenadas, podemos comprobar que0.08 es igual aH =0.3976 Y K =0.3866.
4. Como ya tenemos todos los datos, sustituimos estos por la fórmula13
rt =0.08 x 0.25 [1 --do 2 2xO.08 x 0.25(56x36-14x34 )](150) - (0.3976)(0.3866) J
rt =0.40
De esta forma concluimos el apartado correspondiente a los meto-
ESTADISTICA PSICO-EDUCATIVA 199
dos de correlación, enfatizando el cuidado que hay que tener alaplicarlos y señalando, una vez más, la importancia que han adquirido en los campos investigativos de la sociología, educación ypsicología.
5.3 Predicción y Estimación.
El empleo de la predicción o estimación en psicología o educación constituye un recurso muy utilizado sobre todo en los textoso pruebas.
Para explicar mejor este punto, subrayamos que hemos aplicadoconjunto de pruebas de aptitud y conocemos su correlación, conel rendimiento académico de los alumnos de segundo año de psicología. A partir de la ecuación de regresión lineal por la fórmula 14.
rpb = Mp-Mg ~t V q (14)
Podemos predecir al comenzar el nuevo período académico, elrendimiento de cada alumno a partir de su puntuación en la prueba de aptitud.
Las fórmulas 15 y 16, pronostican o predicen directamente unapuntuación en una de las variables, conociendo la puntuación de laotra variable. Sabemos que x =(X - Mx) y y =(Y-My), por tanto,
_ Sxx = r-- (Y- My ) + M-xSy
y = r* (X - Mx) + My
(15)
(16)
Ejemplo: Utilizaremos a modo de ejemplo la tabla 11.14, que aparece más abajo, correspondiente a 10 estudiantes a quienes les fueronaplicadas, dos pruebas, una de dibujo y otra de imaginación:
200 JESUS DE LA ROSA
Tabla 11.14
Alumnos Dibujo ImaginaciónX y XY X
2 y 2
1 13 11 143 169 121
2 12 14 168 144 196
3 10 11 110 100 121
4 10 7 70 100 49
S 8 9 72 64 81
6 6 11 66 36 121
7 6 3 18 36 9
8 S 7 35 25 49
9 3 6 18 9 36
10 2 1 2 4 1
Totales 75 80 702 687 784
x= Estimado de X
y = Estimado de Y
Mx = Media de x
My = Media de y
r = Correlación x e y
Sx = Desvro típico de xSy = Desvfo típico de y
X=Variable x
y =Variable y
x=?
y=?
Mx=7.5
My =8.0
r =0.76
Sx =3.5
Sy =3.0
X= cualquier puntuación
Y= cualquier puntuación
Sustituyendo las fórmulas 1S Y 16
X=0.76 ( ~:~ ) (Y - 8.0) + 7.5
y=0.76 ( ~:~ ) (X - 7.5) + 8.0
ESTADISTICA PSICD-EDUCATIVA 201
Por tanto, si deseamos predecir la puntuación de un individuoen la variable X (Prueba de dibujo), sustituiremos la puntuación correspondiente a Y. Ahora bien, las predicciones están sujetas a un errorde estimación, llamado error típico de estimación. Se representa conlas fórmulas:
Sestim. y = Sy jI - (rxy)2
Sestim. x = Sxjl - (rxy)2
(17)
(18)
Sustituyendo en nuestro ejemplo tendríamos:
Sestim.x=3.5JI-(0.76)2 =2.225
Sestim. y = 3.0J I - (0.76)2 = 1.95
El error típico de estimación es menor cuanto mayor sea la correlación y menor la desviación típica de la variable que se utiliza para hacer las estimaciones.
202
EJERCICIOS
JESUS DE LA RDSA
11.1 Calcule el coeficiente de correlación de Pearson para el siguientecaso de puntuaciones obtenidas en los textos 1 y 2 respectivamente.
Sujeto Test I Test 2
A 50 22
B 54 25e 56 34
D 59 28
E 60 26¡. 62 30
G 61 32
H 65 30
1 67 28
J 71 34
K 71 36
L 74 40
11.2 Diga cuales de estos cocticientes expresan una correlación perfecta.
r=O.38r = Ir = o. 84r = - 1r=Or=O.50
11.3 /Jiga cudl de los anteriores coejicicntcs de corrclacion imperfectaestá más proxinu¡ a la perfecta.
1lA Un ulumno reuli:u 1111 test de 70 cuestiones de tipc) verdadero adiviIIl1J/(lo las respuestas de cada IIl1a. Obtiene una puntuacion de 45.
ES·;·ADISTlCA PSICO-EDUCATlVA 203
¿Difiere este resultado significativamente del que se esperariapor efecto del azar 1.
11.5 A continuación una tabla de Datos
Calificaciones CalificacionesEstudiantes en Estadística en Matemáticas
A 95 92
B 51 57
C 49 54
D 27 30
E 42 46
F 52 56
G 67 70
H 48 50
Calcule:
Correlación entre la calificacián en Estadistica .r Calificación enMatemáticas.
XII
ANALISIS DECORRELACION PARCIAL y MULTIPLE
12.1 GENERALIDADES
Hemos estado considerando hasta ahora la forma de relacionar dosvariables. Cuando hay más de dos variables se presentan dos problemas:
1.- Hallar la correlación entre dos variables, eliminando la influenciaque ejerce sobre ellas otra u otras variables. Este es el caso de correlación parcial.
2.- Hallar la correlación entre una variable y un grupo de ellas. Este esel caso de una correlación múltiple .
Ejemplo del primer caso: queremos hallar la correlación entre lainteligencia y la memoria de un grupo de muchachos comprendidos entre S y 14 aftoso Supongamos que la correlación entre inteligencia y memoria es, en este grupo elevado, ¿No se deberá 'a la influencia de laedad? ¿No será qué, aúnque en igualdad de circunstancias a mayor inteligencia no corresponde mayor memoria, sin embargo en nuestrogrupo se da esa correspondencia porque hay grandes diferencias en edady por ello el de más edad tiene más inteligencia y más memoria?
Para contestar a las preguntas podemos hacer dos cosas:1.- Hallar la correlación de cada grupo de una misma edad.2.- Utilizar todas las edades, usando el método de la correla-
ción parcial.
Ejemplo del segundo caso: en la industria se presenta con mucha
205
206 JESUS DE LA RDSA
frecuencia el tener que seleccionar entre un grupo de candidatos aquellos más aptos para una cierta tarea, con una serie de tests tratamosde pronosticar la actitud de esos individuos para la tarea que se les vaa encomendar y correlacionamos esos resultados con el éxito o fracasoen la profesión. En ese caso el grupo de variables sería la batería de testsque correlacionamos. La correlación entre el éxito y el conjunto de variables selectivases una correlación múltiple.
La correlación parcial del primer grado (r12.3) ¿Cuándo se emplea? Cuando queremos averiguar la correlación que hay entre dos variables, eliminando de ellas -la correlación- la influencia que ejerce otrau otras variables, ¿cómo se calcula la correlación parcial? La correlación entre dos variables I y 2, cuando la tercera se mantiene constante, se calcula aplicando la fórmula (a):
donde r I 2' r I 3 Y r23 son las correlaciones de Pearson que existen entrelasvariables 1-2, 1-3,2-3. Ejemplo: supongamos que tenemos un grupode muchachos comprendidos entre los 12 y 19 años de edad, en loscuales hemos medido las variables 1 (estatura), 2(peso) y 3(edad).
Sea la correlación entre las variables 1 y 2 (estatura y peso)=r12= 0.7; la correlación entre las variables 1 y 3 (estatura y edad)=r13 = 0.52; Y entre las variables 2 y 3 (peso y edad) =r23 = 0.54.
Queremos calcular qué relación hay entre estatura y peso, cuandose elimina la influencia de la edad.
Podríamos seleccionar muchachos que tengan la misma edad yhallar la correlación existente entre la estatura y el peso, pero estonos reduciría mucho el tamaño de la muestra y entonces lo que hacemos es tratar de eliminar automáticamente la influencia que puedetener la edad sobre la estatura y el peso de los individuos, para lo cualaplicamos la fórmula (a).
rl2 - r 13 . r:23
.j(l-r~i .(l-r~3)
ESTADISTICA PSICD-EDUCATIVA
0.78 - 0.52 x 0.54 069r¡H = J (1-0.522)(1-0.542 ) .
r 1 2 .3 =0.69
207
Donde vemos que la correlación ha bajado un poco al restar lainfluencia que ejerce la edad sobre la estatura y el peso.
Otro ejemplo. Supongamos que en el mismo grupo anterior tenemos otra variable más: la variable 4 = fuerza, que hemos obtenidometiendo a los muchachos a una prueba en un dinamómetro. Las relaciones de Pearson entre las variables l y 4 (estatura y fuerza) y entre2 y 4 (peso y fuerza) han sido: r¡4= 0.54 y r24 =0.72. Queremos calcular la correlación que hay entre la estatura y la fuerza (variables l y4) cuando eliminamos la intervención de la variable 2 (peso), para lacual aplicamos la fórmula:
0.58 - 0.78 x 0.72 004r14.2 = J (1-0.782)(1-0.72 2 ) •
Luego vemos en este caso que entre el grupo de muchachoselegidos no hay correlación entre estatura y fuerza cuando eliminamosla influencia peso.
Hay otros índices de correlación parcial, llamados de segundo grado, que se calculan por fórmulas especiales parecidas a (a) pero soncomplicadas. Por ejemplo:
r¡2'3 -rI4·3 .r24.3
J (1-r14'3)(I-r~4'3)(bY
La fórmula (b) nos da la correlación parcial de segundo grado entre la estatura y el peso (variables 1 y 2), cuando se elimina la influenciade la edad y la fuerza (variables 3 y 4). Para hallar esa correlación esevidente que hay que hallar previamente tres coeficientes de correlaciónde primer grado.
208 JES\JS DE LA ROSA
En general debe advertirse que cuando se quiere eliminar la influencia de más de una variable en la correlación entre otras dos, se puedeemplear la correlación parcial, pero no es conveniente, porque se acumulan los errores de imprecisión. Es preferible eliminar esas influenciasexperimentalmente o por otros métodos como el análisis de varianzas.
12.2 CORRELACION MULTIPLE
Hasta ahora hemos considerado tan sólo la correlación entre dosvariables. Más interesa estudiar el caso en que una variable depende o serelaciona al mismo tiempo con otras dos o más. Este es el caso generalen Pedagogía y Psicología. Veamos:
El-éxito escolar de un alumno no depende tan s610 de su inteligencia abstracta, sino de sus diversas aptitudes, de su carácter, etc. Interesa, pues, si poseemos medidas de todas esas variables, saber cuál esla correlación entre el éxito escolar por una parte y todas las demás tomadas en conjunto y al mismo tiempo. La correlación entre una variabley dos o más tomadas simultáneamente, se llama Correlación Múltiple.La correlación múltiple entre la variable 1 y las variables 2, 3, 4...sedenomina Rl.234...
La correlación múltiple no es la suma de las correlaciones por separado. Porque depende no s6lo de la correlación de cada variable conla dependiente, sino también de las intercorrelaciones entre las diversas variables independientes.
Vamos a un problema concreto.La tabla 38 contiene las intercorrelaciones entre cinco variables.
Tabla 12.1
Variables X2 X3 X4 Xs XlX2 0.562 0.401 0.197 0.465X3 0.562 0.396 0.215 0.583X4 0.401 0.396 0.345 0.546Xs 0.197 0.215 0.345 0.365Xl 0.465 0.583 0.546 0.365
X 19,7 49.5 61.1 29.7 73.8$X 5.2 17.0 19.4 3.7 9.1
ESTADISTICA PSICO-E DUCATIVA
X2 : Test de Aritmética
X3 : Test de Inteligencia
X4 : Nota media en Bachillerato
XI : Nota media en el primer semestre en la UASD
209
Veamos con estos datos cuál es la correlación múltiple entre eléxito en la Universidad y la Inteligencia, la habilidad aritmética, la amplitud de intereses y el éxito en la enseñanza medial. Veamos primero,por ejemplo, cuál es la correlación múltiple entre la variable dependiente y las variables 3 y 4.
r~ 3 + Ti 4 - 2r I 3 r14 r34
1 - r~4
(0.583)2 + (0.546)2 v- 2 (0.583)(0.546)(0.396)1 - (0.396)2
2R I .34 =0.457666; R I .34 = 0.677
20.3 INTERPRETACION DEL COEFICIENTE DE CORRELAClONMULTIPLER
R~ '34 es llamado el coeficiente de determinación múltiple. Esuno de los índices que más luz arrojan sobre la interpretación de R, enmúltiples caso. R~ .34 es la proporción de la varianza de XI, que depende o está asociada con X3 y X4 combinada. R2 es en nuestro ejemplo 0.45766, o sea que el 46 t de la varianza de X¡ es explicada por lasvariables X3 y X4. Veamos que rl3 =0.58~ o sea rl3 = 33.64 % de lavarianza de Xl es explicada por X3 cuando este se usa sólo. Y rl4 =0.564, ri 4 es igual a 29.81 t de la varianza de X¡ es explicada por X4éste se utiliza sólo. La unión de ambos X¡ y X4 no explican la suma desus determinaciones 45.8 = 33.64 + 29, sino menos, ya que X3 y X4 secorrelacionan (r34 = 0.396) Y por tanto, parte de lo que predice unalo predice también la otra.
210
EJERCICIOS
JESUS DE LA ROSA
12.1 A continuación una tabla que muestra las cantidades de ventas(Xl) hechas por un grupo de 8 vendedores durante un periododado, los años de experiencia en ventas (X2) Y las calificacionesde una prueba de inteligencia (X3 ) de cada vendedor.
Vendedor Cantidad de Anos de expe- Calificaciones enventas riencias pruebas de inteli·
sencia
A 9 6 3B 6 5 2C 4 3 2D 3 1 1E 3 4 1F 5 3 3G 8 6 3H 2 2 1
A) Calcule R2
Xl' X 2 X3 y RXI • X 2 X3
B) Calcule R2
X 2• Xl X3 Y R X 2.X 1 X3
C) Calcule R2
X 3 Xl' X 2 y R X 2 .X3 x 2
12.2- A continuación Tabla de Datos
Estudiantes Calificaciones Caliítcaciones CalificacionesEstadística Económica Matemática
A 95 88 92B 51 70 57e 49 65 54D 27 50 30E 42 60 46F 52 80 56G 67 68 70H 48 49 50
ESTADISTICA PSICO-EDUCATIVA
Calcule:
211
a) Correlación entre la calificación en Estadística y las calificacionesen Matemáticas y Economía juntas.
b) Correlación entre las calificaciones en Economía y las calificaciones en Estadtsticas y Matemáticas.
PAlIIIVEI'lltSflel IIfE.1C11l
XIII
MUESTRAS Y MUESTREO
13.1 ESTADISTICA DESCRlYI1VA y ESTADISTICA MUESTRAL
La estadística se divide, como apuntamos en la primera partede este texto, en descriptiva y muestra!. La Estadística Descriptivase ocupa de ordenar los datos obtenidos en una muestra y de representarlos por medio de los valores estadísticos más caracterizados:medias, medidas de dispersión y correlaciones. La Estadística Muestral trata de resolver problemas acerca de las poblaciones que esasmuestras representan. Por ejemplo, queremos averiguar si en laadolescencia los varones son más inteligentes que las hembras.Escogemos la edad de 13 años, Aplicamos un test de inteligenciaa los varones, y a las hembras de esa edad y observamos el resultado. Esto teóricamente. Prácticamente es imposible examinar a todoslos niños y niñas. Hemos de contentarnos con examinar un grupode ellos y comparar la puntuación media obtenida por los niños yniñas de ese grupo. Pero este proceder plantea muchas interrogantes:¿Hasta qué punto representa esa muestra de niños a la población totalde niños y niñas de 13 años? ¿Cómo elegir las muestras para que seanrepresentativas de la población? ¿Hasta qué punto corresponden lasmedidas de la muestra a las medidas de la población? ¿Qué podemosdecir acerca de la poblaci6n a partir de la información que nos suministran las muestras obtenidas de ellas? Tales son las cuestiones queestudia 'la estadística muestra!.
La más importante de las cuestiones que plantea la estadísticamuestral se refiere al error muestra!. Haremos una breve exposiciónde la tcorta del error rnuestral, y, basándonos en ella, --la teoría-, consideraremos los problemas de la significaci6n y fiabilidad de los va-
215
218 JESUS DE LA ROSA
lores estadísticos fundamentales. Después, enfocaremos el problema de la estimación del tamaño de la muestra y la teoría del errormuestra! cuando las muestras son pequeñas, como ocurre con frecuencia en materia de psicología escolar, finalmente, el concepto de"chi cuadrado" y el método del análisis de varianza, de considerableutilidad práctica, el primero, y uno de los más empleados y fecundos en la metodología estadística, el segundo.
13.2 POBLACION y MUESTRA
Población. Es el conjunto de casos que reunen ciertas características y que pueden ser estudiadas.
Muestra. Es un grupo de casos extraídos de la población.
El objeto de la teoría de las muestras es obtener, por caminoinferencial, conclusiones vlllidas para una población numerosa, partiendo de la obsereacion del comportamiento de una parte, en general pequeña, llamada muestra.
Nuestro conocimiento, nuestras actitudes, y nuestras accioneses~B basaaas, en gran parte en muestras. Esto es cierto en la vidacotidiana y en la investipcíón cietttifl(;a. Por ejemplo, la opinión deUN persona sobte maestra Ua~ estll, por lo regular, detcnninada por uno o 40s cllCUeAh'OS que eita persona ha tenido con algúnpenona,ie de nuestra An. Nater. en el carso de varios años. Los4ialftÓsticos de laboratorios sobre d edado de nuestra salud son realizados en basca U$\a$ cuanta.s IOtas de sangre. Este procedimientoestll basado en la suposición ele que, en el torrente circulatoria, la sangreesti bien mezclada y que una IOta cuenta la misma historia que lasdemás.
Pero ocurre, mllCus veces,~ el material está lejos de ser uniforme, y entOMes resulta crttico el método mediante el cual fue tomada la muestra y el estucho de las t6c:Ricas, que ilseguren la confiabilidadde la muestra, se welve importante.
En este capítulo intentamos una descripción de la teoría de muestreo, construida para proporcionar un soporte de los buenos métodosde muestreo.
13.3 VENTAJAS Y DESVENTAJAS DEL USO DEL MUESTREO
Podemos señalar las siguientes ventajas y desventajas del uso del
105TADI5TICA P5ICO-EDUCATIVA 217
muestreo, frente a la indagación de toda la población o censo, queexige la observación completa del comportamiento de la población.
VENTAJAS:
a) Un censo -indagación estadística de toda la población- hacenecesario un largo trabajo de compilación que requiere a veces añosde labor; el trabajo de gabinete para el cálculo de los resultados muestrales es expeditivo. Hay pues, además de la economía del esfuerzo ygastos, la economía de tiempo, que permite obtener los datos en oportunidad, cosa que habitualmente no sucede en los censos.
b) Un censo requiere para la captación de los datos la movilización de una gran masa de colaboradores, mientras que en una muestrasolamente intervienen unos cuantos expertos. Hay pues, economíade personal.
e) Como el trabajo de captación de una muestra es pequeño.puede realizarse con personal especializado, utilizando métodosapropiados para lograr una precisión conveniente. A su vez, la teoríamuestral proporciona métodos matemáticos que permiten determinarel grado de precisión de la estimación.
DESVENTAJAS
La existencia del error de muestreo, es decir. la diferencia cuantitativa que presentan las estadísticas que proceden de la población ylos errores pendientes que proceden de la muestra.
13.4 LA TECNICA DE MUESTREO
Muestreo es una técnica empleada en la selección de una partede la población llamada muestra que podría presentar todas lascaracterísticas de la misma.
Los valores atribuidos a la muestra se llaman estadísticos. Los valores atribuidos a la población se llaman parámetros.
13.5 TIPOS DE MUESTREO
El primer problema que se presenta en el diseño de la muestraes la elección de los individuos que han de formularla. I::.s muy irnpor-
218 JESUS DE LA ROSA
tan te ya que esto constituye la base sobre la cual ha de sustentarsetodo trabajo. Trataremos primeramente del diseño y la elección,cuando se trata de una población homogénea.
Decimos que una población es homogénea respecto de un atributo, cuando del conocimiento que tenemos de ella, surge la convicción de que existe simetría de posibilidades en el comportamientode todos lo individuos respecto de dicho atributo, es decir, no se destacan, a priori, diferencias sistemáticas notables.
En los casos que nuestros conocimientos previos no nos permiten asegurar la homogeneidad, se harán pruebas de sondeos tendientes a comprobar o descartar dicha homogeneidad. La naturalezade dichas pruebas no es material de este curso. Asegurada la homogeneidad, el método recomendable para efectuar la elección de la muestra esel llamado aleatorio o al azar.
13.6 MUESTREO ALEATORIO O MUESTREO AL AZAR.¿EN QUE CONSISTE?
Veamos:
Se parte de un listado o nómina completa de los individuos yse realiza una elección por sorteo (al azar) de aquellos números correspondientes a los individuos que han de formar la muestra. De esta manera satisfacemos el concepto de elección al azar que supone que tados los individuos del universo. a priori, tienen idénticas probabilidadesde ser elegidos. El problema práctico de elegir una muestra casual presenta algunas dificultudcs, cuando se trata de una población numerosa;hay dos caminos principales para resolverlo, el sorteo, por métodos mecanícos, y el empleo de tablas de números aleatorios.
13.7 METODOS MECANICOS
Los métodos mecánicos consisten en el uso de un ¡!lobo u otrométodo an.ilogo. en la forma que lo hacen las loterías. El procedimientomás usado es el de colocar tantos bolos como cifras tenga el número\: de individuos de la población: cada bolo tiene los números dígitosincluyendo el cero. un bolo corresponde a las unidades. otro a las decenas y así sucesivamente. Agitando previamente los bolos. se extrae
ESTADISTICA PSICO-EDUCAnVA 219
un bolo de cada uno, formando así el número sorteado. Se procedeen esta manera hasta completar los números que formarán la muestra.
13.8 METODO DE LAS TABLAS DE NUMEROS AL AZAR
Más usado en estadística, por su simplicidad y perfección, es elmétodo de las tablas de números al azar, o números aleatorios, de loscuales son ejemplos muy breves las tablas úe Fisher y Yates, así comola de Tiffet y otros.
Esas tablas fueron construidas y sometidas a severas pruebasde control. Contienen listas de números al azar, distribuidos por columnas y filas. Para elegir una muestra se procede de la manera siguiente.Supongamos que se trata de una población N '" 5000 Y se desea elegiruna muestra n =25. En un listado 'de la población se numeran los individuos del 1 al 5000. En una cualquiera de las páginas de la tablas denúmeros aleatorios, por ejemplo, la página segunda de la tabla de Fisher y Yates, se eligen filas de dígitos (en nuestro ejemplo los cuatrode la derecha) y se toman los números formados hasta completarlos n valores exluyendo los mayores que remiten en cualquier caso:
3809 4173 1-522 3252 26941227 1161 3911 3800 08091928 0825 1944 2744 11064921 4675 0872 2177 25393907 4876 3996 2498 0735
Si no hubiera suficientes números menores que 5000 en las cuatroúltimas columnas de la página segunda, pasarán a la página tercera.hasta completa r •
También es posible todos los números sin exclusión, para ello.si el número de la tabla fuera mayor de 5000 se le resta 5000 resultaasí::
3809 9103 9864 4675 52488119 1227 6427 4876 39117807 1928 4273 6116 71H\68535 4921 1161 8892 19446075 3907 0825 1522 OH72
220
de donde sale la muestra:
JESUS DE LA ROSA
3809 41033119 12272807 In81525 41291075 3907
48641427427311610825
46754876111638n1522
02483911088619440892
Debemos excluir los números repetidos.
13.9 MUESTREO ESTRATIFICADO
En muchos casos la hipótesis de homogeneidad de la población,respecto del atributo que se estudia, no es aceptable, existiendo una manera de clasificar la población de tal modo que en cada uno de los grupos o estratos que resultan de la clasificación, sea aceptable 1:1 hipótesisde homogeneidad. En este caso se efectúa lo que se llama una muestraestratificada, es decir, una muestra compuesta por tantas muestras alazar como estratos haya. Por ejemplo, si deseáramos estudiar presupuestos de gastos familiares en una ciudad, lo más lógico es dividir lapoblación en estratos por niveles de ingreso, y efectuar un muestreoal azar, en cada uno de los estratos, y luego combinar los resultados mediante promedios ponderados, en la forma que indicaremos más adelante. En este mismo ejemplo, si se desean obtener resultados aun másdetallados, a veces no basta la clasificación por ingresos y se hace OCCL'
saria otra clasificación, por ejemplo, por profesiones o por provinciaso ciudades dentro de un país.
Se tienen. entonces. dos estratificaciones o más. lo que hacealgo más laborioso el trabajo. pero suministra una información máscompleta.
13.10 MUESTREO POR AREA
Dentro de las estratificaciones. merecen especial rncncron lasllamadas muestras por áreas; ellas se originan en la siguiente forma: elcaso en que el motivo de la estratificación está ligado al lugar geográficoen que hahitan o están situados los individuos (personas. fábricas,comercios. etc .. ) que constituyen la población a la que refiere el estudiosuelen hacerse los muestreos por arcas. Difieren de los otros muestreosen que la selección no se hace mediante patrones de individuos sino
ESTADISTICA PSICO-EDUCATIVA 221
por una relación de tipo geográfico. Por ejemplo, si queremos efectuaruna encuesta de mercado para un determinado producto en una ciudad,podríamos proceder dividiendo el mapa en áreas, de manera que cadauna presente un grado de homegeneidad económica; en cada una deestas áreas se eligen las manzanas al azar, y dentro de cada manzanase eligen los casos o departamentos con algún criterio objetivo, porejemplo, el orden de colocación, el número de la casa u otro criterio.
Análogamente, si se quieren efectuar encuestas económicas, porejemplo, sobre pronósticos de producción o rendimientos de explotaciones agropecuarios, se hace la división del país o provincia en regiones geográficas que tengan un grado de homogeneidad aceptable. Encada zona se eligen los establecimientos al azar, hasta formar la muestra deseada.
En muchos casos la estratificación de áreas debe combinarse conotra, por niveles económicos, por especialidades, etc. En este caso sehace la clasificación y selección al azar en cada estrato de cada área.
13.11 MUESTREO POR CONGLOMERADO
Es un método especial de efectuar la estratificación donde acada encuestador se le asigna una proporción entre los tipos de individuos a los que debe interrogar. Por ejemplo, en una encuesta en fábricas o comercios se pide que cada encuestador interrogue a tantosdirigentes, tantos empleados, tantos técnicos, tantos obreros, etc.Esta forma de encuestas difiere de la corriente de estratificación, enque no se hace la selección al azar en cada estrato, sino que la hacecada encuestador. Este método puede ser muy práctico, en algunoscasos, como complemento del muestreo por áreas.
13.12 MUESTREO SISTEMATlCO
En el muestreo sistemático la selección de los individuos de lamuestra se hace mediante una regla sistemática o mediante una selección racional. Veamos primeramente un ejemplo de selección sistemática: si de una población de N individuos se desean determinar si paratomar la muestra (suponemos la población numerada della N y seaK el entero más próximo a N/n), la selección se hace tomando comoprimer individuo de la muestra el K/2 ó (K + 2) 12, según sea K, par o
222 JESUS QE LA ROSA
impar. Los sucesivos individuos de la muestra se obtendrán del primerosumando K, 2K, 3K... Este tipo de muestreo es utilizado cuando esaceptable la hipótesis de variación de la variable en forma continua.Una de las variantes de este método consiste en elegir el primer individuo al azar entre los primeros K y luego, para los siguientes, los quetengan el orden del primero más 2K, 3K, etc.
13.16 ETAPAS PRINCIPALES DE UNA ENCUESTAPOR MUESTRA
Como una introducción a una discusión sobre el papel que juegala teoría en una encuesta por muestreo, es útil señalar brevemente lospasos involucrados en la planeación y la ejecución de una encuesta.Las encuestas varían considerablemente con su complejidad. Es unatarea fácil el tomar una muestra de 5000 tarjetas cuidadosamentearregladas y numeradas en un archivo. Pero la situación es otra si setrata de los residentes de una región de no fácil acceso, sin mapas ydonde los habitantes son recelosos con el extraño inquisitivo. Lospasos principales en una encuesta están agrupados más o menos arbitrariamente bajo 11 encabezados.
a) Objetivo de la encuesta.
Una exposición clara de los objetivos es lo más útil. Sin esto, esfácil, en una encuesta compleja, olvidar los objetivos principales acordescon los detalles de la planeación, y tomar decisiones distanciadas de losobjetivos.
b) Población bajo la muestra.
La palabra población se emplea, como dijimos, para denominarel conjunto del que se elige la muestra. La definición de poblaciónpuede no presentar problema, como cuando se está muestrando un grupo de niños de edades comprendidas entre los 10 y 13 años con el finde estimar el coeficiente de inteligencia promedio. Por otra parte, enel muestreo de una población agrícola, por ejemplo, se deben fijar reglasfijas para defmir lo que es un rancho o una hacienda, y surgen muchasdudas al tratar de hacer una delimitación exacta. Estas reglas deben seraplicables a la práctica: el encuestador debe ser capaz de decidir en elcampo, sin mayores problemas, si un caso dudoso pertenece o no a lapoblación.
ESTADISTICA PSICO-EDUCATlVA
e) Datos que deben ser obtenidos
223
Es bueno ratificar que todos los datos son relevantes para lospronósticos de la encuesta y que no ha sido omitido ningún datoesenciaJ.A menudo existe una tendencia, particularmente con las poblaciones humanas, de preguntar demasiadas cosas, algunas de los cuales nunca serán analizadas posteriormente. Un cuestionario demasiado largo baja la calidad de la respuesta tanto a las preguntas importantes como a las de poca importancia.
d} Nivel de precisión deseado.
Los resultados de las encuestas por muestreo' están siempre sujetosa cierta incertidumbre debido a que sólo una parte de la población hasido investigada y a los errores de medición. Esa incertidumbre puedeser reducida, tomando muestras más grandes y usando métodos demedición adecuados. Esto, por lo general, cuesta tiempo y dinero; enconsecuencia, es un paso importante la especificación del nivel de precisión deseado. Este paso es la responsabilidad de la persona que va ausar los datos.
e) Métodos de medición
La encuesta puede emplear un cuestionario auto-administrativo,o un proceso de entrevistas que permita emplear la forma y el ordende las preguntas. Una parte principal, del trabajo preliminar, es laconstrucción de las formas de registro en las cuales se van a colocarlas respuestas, es decir, colocarlas de tal manera, que puedan ser rutinariamente transferidas a un equipo mecánico. De hecho, para la construcción de buenas formas de registro es necesario visualizar la estructura delas tablas resúmenes que van a ser usadas para obtener las conclusiones.
f) El marco de la muestra
Antes de la selección de la muestra, la población debe ser dividida en partes que son llamadas unidades de muestreo. Estas unidadesde muestreo deben contener la totalidad de la población y no se debensobreponer, en el sentido de que todo elemento en la población pertenezca a una, y solo a una unidad.
La construcción de la lista de unidades de muestreo, llamada mar-
224 JESUS DE LA ROSA
ca, es con frecuencia uno de los principales problemas prácticos. Debído a experiencias amargas, los técnicos tienen una actitud crítica delistas que han sido recolectadas rutinariamente para algún propósito.A pesar de que se asegura lo contrario, tales listas con frecuencia seencuentran incompletas, parcialmente ilegibles o contienen una cantidad desconocida de datos duplicados.
Un buen marco puede ser difícil de obtener cuando la población es especializada, como las poblaciones de educadores, editorialistaso etc.
s) Selección de la muestra.
Existe, actualmente, una gran variación de formas de seleccionaruna muestra. Porcada forma considerada se puede hacer, a grosso modo,estimaciones del tamaño de la muestra, partiendo de un conocimientodel nivel de precisión deseado. Los costos relativos y el tiempo involucrado para cada plan son también comparados antes de tomar una decisión.
h] Prueba del cuestionario
Se ha encontrado de gran utilidad el probar el cuestionario y losmétodos de campo en pequeña escala. Esto casi siempre da como resultado mejoras en el cuestionario y puede revelar otros problemas que serían serios en escala mayor, por ejemplo, que el costo del trabajofuera mayor que el esperado.
i} Organización del trabajo.
En encuestas extensas se encuentran muchos problemas de ordenadministrativo. El personal debe recibir un entrenamiento en relaciónal propósito de la encuesta y de los métodos de medición que se emplearán. Debe además ser adecuadamente supervisado en su trabajo.Procedimiento de verificación anticipado sobre la calidad de las respuestas es indispensable. Se deben hacer planes para manejar las no-respuestas, es decir, la falla del enumerador para obtener la información deciertas unidades de la muestra.
j) Resumen y andlisis de los datos.
El primer paso después de realizar la encuesta es revisar los cues-
ESTADISTICA PSICD-EDUCATIVA 226
tionarios obtenidos, con la esperanza de corregir errores o cuando menos desechar los datos que obviamente estén equivocados. Se necesitantomar decisiones acerca del procedimiento de tabulación, en los casosen donde las respuestas a ciertas preguntas fueron omitidas por algunosde los entrevistados, o fueron desechadas en el proceso de.revisión. Deahí en adelante se hacen las tabulaciones que conducirán a los estimadores. Hay diferentes métodos disponibles de estimación para la mismainformación. En la presentación de los resultados, es una buena práctica repartir la cantidad de errores esperados en los estimadores más importantes.
13.13 MUESTREO ESTRATIFICADO
Como apuntamos, cuando la población presenta signos visiblesde falta de homogeneidad, con respecto a cierta característica, se tratade dividir la población en partes o estratos de tal manera que en cadauno de los grupos o estratos que resulten de la división sea aceptablela hipótesis de homogeneidad.
Por ejemplo, cuando se estudian niveles económicos de estudiantes,es lógico estratificar la población respecto a los niveles de ingresos, supuestos en los padres, en estudiantes de colegios privados y estudiantesde los liceos secundarios.
En la estratificación se consigue una representación más de acuerdo con la naturaleza de la población y, por tanto, una mayor precisiónen la estimación que se desea realizar en la muestra.
Sea NI N2 , .... Nk, las poblaciones de los estratos y N igual aNI + N2 + Nk, la población total. Indicamos con ni, n2 .nk las poblaciones de las muestras en los respectivos estratos y n igua]a ni + n2....... + nk el tamaño de total de la muestra. Sean Yhi conh igual a 1,2, 3....K, i = 1,2,.... nh' los valores de los atributos quepertenecen al estrato h.
La media de la población será:
Siendo rnj, la media poblacional del estrato h.
226 JESUS DE LA ROSA
Si indicamos con Yn la media muestral del estrato h, la expresión
Y= ~ ---.&.... Ynh=1 N
Es una estimación de la m de la población. Podemos ver que laponderación de la media poblacional Nh es la misma ponderaciónque la media muestral N
Para obtener la varianza en cada estrato, se forma la expresión
Nh~ (Yhi - y n)2
= l
Resultando la varianza del estrato h:
2
Syh
y la varianza total de Y es
13.14 TAMARO DELOS ESTRATOS
El primer problema que se nos presenta al planear un muestreo estratificado es como distribuir los n individuos de la muestra entre K estratos. Es decir como determinar los tamaños de las muestras de cadaestrato.
Hay varios criterios para efectuar las determinaciones de los ni (ta-
ESTADISTICA PSICO-EDUCATIVA 227
mafia de las muestras en cada estrato); supondremos para ello conocidas los NI, N2 · ••••• , Nk que son las poblaciones correspondientesa los distintos estratos y también N la población total; este conocimiento proviene de algún censo anterior, y hasta que estos valoressean aproximados en el frente. Hay varias formas de determinar los tamafias de ni, n2 ..., nk de los estratos. El más usado es el proporcional,del que nos ocuparemos a continuación.
Nnh= n_h_
N
13.15 LA ESTIMACION DEL TAMAÑO DE LA MUESTRA
PLANEAMIENTO DE LA MUESTRA
Al planear un trabajo muestral, debemos tomar una decisión acerca del tamaño de la muestra. La decisión es muy importante. Unamuestra demasiado grande implica un desperdicio de recursos y unamuestra demasiado pequeña disminuye la utilidad de los resultados. La .decisión no siempre puede ser satisfactoria ya que con frecuencia noposeemos suficiente información para asegurarnos de que nuestra elección de tamaño de muestra es el mejor.
La teoría del muestreo proporciona un planteamiento generaldentro del cual puede pensarse inteligentemente en relación con elproblema.
Las principales consideraciones en la elección de un tamaño demuestra son las siguientes:
1.- Debe haber una indicación relativa a lo que es esperado en lamuestra. Esta indicación puede estar en términos de los límitesde error deseado, o en términos de alguna decisión que se va ahacer o acción que se va a tomar cuando los resultados de lamuestra sean conocidos. La responsabilidad para enmarcar laindicación descansa principalmente sobre las personas que vana utilizar los resultados de la encuesta, aunque con frecuencianecesita del concurso del estadístico para poner sus deseos entérminos numéricos.
228 JESUS DE LA ROSA
~.- Se debe encontrar alguna ecuación que conecte a n con la precisión deseada. La ecuación variará de acuerdo a la indicación sobrela precisión y al tipo de muestreo que se está considerando.
3.- Esta ecuación contendrá, como parámetros, ciertas propiedadesdesconocidas de la población. Esto debe ser estimado con el[m de dar resultados específicos.
4.- Usualmente es medida más de una característica en una encuestapor muestreo. Algunas veces el número de características es grande. Si se especifica el grado de precisión deseado para cada característica, los cálculos llevan una serie de valores conflictivos den, uno para cada característica. Se debe encontrar algún métodopara reconciliar esos valores.
5.- Finalmente, el valor elegido de n debe ser considerado para probarsi es consistente con los recursos disponibles para tomar la muestra. Esto demanda una estimación del costo, trabajo, tiempo ymateriales requeridos para obtener el tamaño de la muestra propuesto. En algunas ocasiones es aparente que n deba ser reducidadrásticamente. En estas circunstancias se debe hacer frente a unadecisión de proceder con un tamaño de muestra mucho más pequeño, reduciendo entonces la precisión o abandonar el trabajohasta que se puedan encontrar mayores recursos.
13.16 LA FORMULA PARA (n) EN EL MUESTREO PARA MEDIAS
Debemos, ante todo, buscar una ecuación que ligue a (n) con laprecisión deseada.
Decidimos trabajar a un nivel de confianza de un 95'&. Sabemosque el error muestral E es igual a 1.96 Si.
E = 1.96 Si
S
V--¡;S
E = 1.96--yn;
ESTADISTICA PSICO-EDUCATIVA 229
n =
1.96 SE
(1.96)~ S2E2
tiende a
n =
Ahora resulta que aparece una dificultad que es común en todoslos problemas de la estimación del tamaño de la muestra: se ha obtenido una fórmula para n, pero n depende de alguna propiedad de lapoblación que va a ser muestreada. En este caso la propiedad es lacantidad E que deseamos admitir como error.
Ejemplo: ¿De qué tamaño debe ser la muestra? si se quiere saberel costo de funcionamiento promedio por escuela de 5000 escuelas. Nose permite un error en la estimación mayor de $2.00 con una confianzade 9S~ sabiendo que S2= $16.00.
Siendo S2 = 16 E = 2 (máximo error tolerable)
4 x 16 = 164
La muestra deberá poseer 16 unidades.
Nos preguntamos: ¿cómo sabemos que es admisible tolerar unerror de 2? ¿Por qué no de 8? Ese margen de error tiene que necesariamente estar fundamentado en algún conocimiento de la población queva a ser muestreada.
13.17 LA FORMULA PARA (ti) EN EL MUESTREOPARA PROPORCIONES
Si se tratara de muestra de porcentaje, podemos partir de la fórmula:
POn
Q=I-P
230
E =VPQ (196)n .
JESUS DE LA ROSA
(a un nivel de confianza del 95%
n =
n E2 = PQ (1.96)2
P Q (1.96)2tiende a
P (1 - P) 4E2
por cierto que no conocemos exactamente P es necesario disponer deuna aproximación de este valor, haciendo una muestra previa o estimando P por otro camino. La determinación de n es bastante segurasi P y (1- P) son superiores a 0.1 ; en cambio, se hace más dudosa cuando P 6 (1 - P) es inferior a 0.1; requiriendo un número n muy grandepara asegurar el nivel de confianza.
ESTADISTICA PSICD-EDUCATlVA
EJERCICIOS
13.1 Conteste el siguiente cuestionario:
a. ¿ Qué es una muestra?
231
b. ¿Cómo se planea una muestra en una población aproximadamentehomogénea?
c., Diga en qué consiste una muestra estratificada y cómo se planea.
d. ¿Cómo se determinan las caractertsticas en una muestra estratificada y cómo se hace la determinación del tamaño de los estratosy de la muestra?
13.2 Suponga que está usando el muestreo para estimar el número totalde palabras de un libro que no contiene ilustraciones.
a) ¿Hay algún problema para la definición de la población?
b) ¿Cudles son los pros y los contras de: l) página, 2) la lineacomo unidad de muestreo.
13.3 Si se va a tomar una muestra de una lista de nombres que estánen tarjetas numeradas consecutivamente las cuales se encuentranen un archivo. Cada nombre tendrá la misma oportunidad de serincluido en la muestra. ¿Cuáles problemas surgen de las situaciones comunes?
a) Algunos de los nombres no pertenecen a la población objeto,a pesar de que este hecho no puede ser verificado para ningúnnombre hasta que no sea seleccionado.
b) Algunos nombres aparecen en más de una tarjeta, todas lastarjetas con el mismo nombre, llevan número consecutivo y,por lo tanto, aparecen juntas en el archivo.
e) Alguno nombres aparecen en más de una tarjeta, pero lastarjetas que lleva'! el mismo nombre pueden ser colocadas encualquier lugardentro del archivo.
232 JESUS DE LA ROSA
13.4 Precise el concepto de distribución de una estadtstico muestral.
13.5 Si puede conestar las interrogantes planteadas más arriba proceda Ud. a planear una muestra estratificada con miras a saberel número de muieres que cursan estudios en la UASD.
Reflexione sobre:
a)¿ Cómo calcular el tamaño de la muestra total (n}
b} ¿Cómo calcular el tamaño de la muestra en cada uno de losestratos.
XIV
INFERENCIA ESTADISnCA
TEORIA DEL ERROR MUESTRAL
14.1 ERROR MUESTRAL
El Error Muestral es la diferencia entre un estadístico y su parámetro correspondiente.
14.2 PRECISION y FIABILIDAD
Cuando estudiamos un problema pedagógico o psicológico deseamos saber lo que significa en la población total. Así, por ejemplo, siqueremos averiguar la inteligencia media de los niños capitaleños, deseamos, en efecto, saber la inteligencia media de todos ellos. En la práctica esto no puede ser conseguido directamente. No podemos examinara todos los niños capitaleños de \O años. No podemos averiguar el parámetro medio de esa población. Tenemos que contentarnos con examinar tan sólo a una muestra de niños de 10 años, o varias muestras. Loque en realidad obtenemos son medidas logradas en muestras o estadísticos, necesitamos, partiendo de ellas, calcular parámetros.
Precisión es la exactitud con que un estadístico representa a unparámetro. Decimos que un estadístico es preciso cuando su valor seacerca mucho a su parámetro. Es impreciso en caso contrario. Si la media de todos los niños capitaleños con test de inteligencia es 37, y la media obtenida con una muestra de 500 niños de esa población, es de 36,el error muestral es 1. El error muestra! indica la precisión del estadístico examinado. Un estadístico será tanto más preciso cuanto menor seasu error muestra\.
Hasta aquí todo parece claro. Sin embargo, surge enseguida una
233
234 JESUS DE LA ROSA
pregunta: ¿Cómo calcular el error muestral? Porque evidentemente,no podemos calcularlo hallando la diferencia entre el valor estad ísticoy su parámetro, ya que, en general, desconocemos el valor de éste, Poresa razón, en lugar de precisión se emplea otro concepto para indicarel valor representativo del estadístico, a saber la fiabilidad. Fiabilidadde un estadístico es la medida de una constancia cuando se obtieneen varias muestras de un mismo tipo,
Por ejemplo: queremos calcular la inteligencia media de los niños
capitaleños de 10 años. Supongamos que en una muestra de 318 niñosde esa población se obtiene, en un test de inteligencia, una media iguala 36. A partir de estos datos, ¿qué podemos decir acerca de la inteligencia media de la población total? Podemos hacer las siguientes observaciones:
1) Que 36 es, exactamente y sin error, la media de 1<.1 muestra;
2) Que a partir de los datos que tenemos, 1<.1 mejor estimaciónque podemos hacer de la media de la población es que su valor esprobable y aproximadamcnte igual a 36. Pero también queda porpreguntar ¿es muy probable o muy poco? ¿Es aproximado o pocoaproximado ese valor') Una primera contestación a esas preguntaspuede obtenerse cxurninundo la !;,hilid<.ld de la media obtenida, es decir, su constancia de muestra a muestra, Cosa que, teóricamente, se
podr ian hacer de la siguiente manera: obtenemos al azar de la mismapoblación de niños cupit alcños de 10 años, otra muestra. y luego otra.y así un gran número de ellas y averiguamos en cada caso la media.Si todas estas medias varran muy poco entre sr, cualquiera de ellasrepresenta bien a todas las demás, lo cual nos indica que nos podemosfiar de su valor, que son fiables. que tienen alta fiabilidad. Y. como nohay ninguna razón para que estas medias se aparten sistemáticamente dcla media de la población total, esta fiabilidad o constancia indica indirectamente una cierta precisión, es decir. señala que en general I<.IS
medias no se apartan mucho de 1<.1 media verdadera o parámetro. Silas medias de las distintas muestras varían mucho entre sí, no nos podemos fiar de ellas como valores que representan a un mismo paramctro. son poco fiables: tienen baja fiahilidad y seguramentc algunasde ellas, no sabemos cuáles, serán muy imprecisas.
14.3 ERRORES MUESTRALES: ERRORES DE SESGOY ERRORES ALEATORiOS
Vemos. pues. que, al no podrr examinar a toda la población y t c-
ESTADiSTICA PSICO-EDUCATIVA 235
ner que contentarnos con estudiar muestras de ella, cometemos errores,Est9S errores, cuando se deben a que, en lugar de estudiar toda la población, hemos estudiado una muestra de ella, reciben el nombre deerrores muestrales.
Los errores muestrales más importantes son dos: los de sesgo ylos aleatorios. Errores de sesgo son los que debido a que la muestrade donde se han obtenido no representan a la población, sino que hasido elegida de ésta con cierto sesgo o parcialidad. Por ejemplo, siexaminamos tan solo a los niños de 10 años de dos o tres colegios deprimera categoría, vamos a decir del Colegio Santa Teresita, del Colegio Santo Domingo, del Colegio Véritas, no podríamos tomar estamuestra como representativa de los niños de 10 años, porque sabemos que en esos colegios no están incluidos muchos niños de esa edad:los no escolarizados, los de clases económicamente inferiores, cte. Sitomamos la media obtenida de esos niños, como estimación de lamedia dc todos los niños de l O años de Santo Domingo, cometeremosun error muestral de sesgo. Esos errores son los peores, ya que nopodemos estimar su cuantía.
Los errores aleatorios se deben al mero azar, están constiturdospor las diferencias entre los parámetros de ciertas poblaciones y lasestadísticas de muestras extraídas al azar, su media, por ejemplo, seráseguramente distinta a la media de la población, pero esto no scrádebido a ningún sesgo o parcialidad, sino a la pura casualidad. Por esose llama error aleatorio. Su cuantía puede ser estimada aplicando lasleyes de la fiabilidad.
Los métodos para estudiar la fiabilidad y significación de lasestadísticas varían según el método de muestreo empleado. Aqu i' solo vamos a considerar los métodos que se refirieron al aleatorio. porlas razones siguientes:
l. Porque no podemos estudiarlos todos en un texto del alcance deeste libro y conviene estudiar el más general. El método para estudiarla fiabilidad y si¡!I1ificación del muestreo por azar se puede aplicara los demás casos dl' muestreo con la salvedad de que es cxccsivumcntcriguroso en los casos de muestreo cstra tit'icado y dirigido. h decir. quesi al aplicar el método que vamos a describir a muestras cstru t ificadus.obtenemos resultados si1!nít'ilativos. más signitkativos aún lo Sl'l(all siaplicásemos los métodos' corrcsponclicntvs a esas mues! ras, los nieto-
236 JESUS DE LA ROSA
dos de significación y fiabilidad aplicados al muestreo por azar. Así,podemos pecar de excesivamente exigentes y cautelosos, no de locontrario.
2. El método es más sencillo y para comprender los demás es precisohaber comprendido éste de antemano.
14.4 LA DISTRIBUC10N MUESTRAL
Supongamos que queremoscalcular la inteligencia media de losniños capitaleños de 10 años. Para ello, hemos elegido al azar una muestra de 318 niños, les hemos pasado un test de inteligencia, y hemosobtenido .los resultados siguientes: X=26 YSj{ = 12. Deseamos conocerla fiabilidad de la media, es decir, hasta qué punto nos podemos fiarde ella. Deseamos saber también algo sobre la media verdadera o parámetro de la población total, Hay varios métodos para averiguar esto.Aquí vamos a exponer algunos de los conceptos básicos de la lógica deestos métodos. El primero y fundamental es el de distribución muestralque explicamos a continuación.
Obtengamos un número infinito de muestras de 318 niños. Cadauna de estas muestras tendrá urn media en el test de inteligencia máso menos diferente. Hagamos la distribución, la llamamos distribuciónmuestral de las medias. Vemos, pues, que dada una muestra aleatoria deuna cierta población, se llama distribución muestral de un estadísticocualquiera de una muestra, a la distribución de frecuencias de los valores que el estadístico toma en un número infinito de muestras del mismo tipo y tamaño que la primera.
La distribución muestral de las medias de una muestra de 318 casos, es la distribución de frecuencias de las medias obtenidas en un número infinito de muestras de 318 casos cada una, obtenidas todas pormuestreo aleatorio simple a partir de la misma población.
Si presentamos la distribución muestral de la media, veremos quees la figura 14.1:
1.- Adopta la forma de la curva normal2.- La media de la distribución muestral es la media verdadera de la
población.
3.- La distribución es más o menos variable.
ESTADISTICA PSICO-EOUCATIVA
Distribución muestral de la media
FIGURA 14.1
237
Este último dato es muy importante. Si la distribución muestralvaría mucho, es decir, si tiene una sigma muy alta, las medias difierenmucho entre sí, son pocos fiables.
Si la distribución muestral varía poco, es decir, si su sigma esbaja, las medias difieren poco entre sí, es decir son fiables.
En resumen, para averiguar la fiabilidad de un estadístico hay queestudiar la variabilidad de su distribución muestral. Y como la variabilidad viene indicada por la desviación típica, tendremos que una medidade la fiabilidad de un estadístico será la desviación típica de su distribución muestral.
A la desviación típica de la distribución mucstrul de un estadístico se le llama error típico de la distribución muestral del mismo. Sele designa mediante el signo S.
14.5 NIVELES DECONFIANZA Y COEFICIENTES DE RIESGO
Hemos visto lo que significa la distribución muestral y el arartípico. Vamos a ver ahora cómo se emplean esos conceptos para cxaminar la fiabilidad de los estadísticos y apreciar hasta qué punto representan a los parámetros.
238 JESUS O E LA ROSA
Sigamos con el ejemplo anterior. Teníamos una muestra de 318niños capitalcños de 10 años, con X = 36 y Si = 12, en un test de inteligencia. ¿Qué podemos decir, a partir de estos datos, acerca de la inteligencia media de toda la población de niños de 10 años? Veamos.
Supongamos que hemos averiguado la distribución muestral delas medias de nuestra muestra. Calculamos la desviación t rpica de estadistribución muestral. Tal desviación típica es el error típico. Sea éste(ya veremos más adelante cómo se calcula) igual a 0.67.
Sabemos que:
1.- Que la distribución muestral de la media es normal.
2.- Que tiene una desviación t rpica igual a 0.68
3.- Que la media de la distribución muestral (m) es el parámetro o media verdadera de la población.
4.- Que la media de nuestra muestra X= 36, es una media cualquieraextraída al azar de la distribución mucstral de la media.
Sj(=0.67
Figura 14.2
Sabido esto, podemos hacer juicios de probabilidad acerca de lamedia verdadera. El razonamiento es el mismo que explicamos cuandoexponíamos la función normal de probabilidades.
En efecto, si tenemos en un globo 99 bolas negras y una blanca,podemos pronosticar que al sacar una bola al zar ésta será negra. No lo
ESTADISTICA PSICQ-EDUCATIVA 239
diremos con absoluta seguridad. Lo diremos con cierto riesgo de equivocarnos. Exactamente con cl riesgo del 1%. Si hacemos muchos pronósticos de este tipo, nos equivocaremos a la larga el 1% de las veces. En cada caso tenemos una probabilidad de un 99% de acertar y del 1% deerrar. Cuando hacemos esta clase de juicios, decimos que procedemosun nivel de confianza del 1%. Si en el globo hubiera 95 bolas negras y 5blancas, al afirmar que saldrá al azar una negra, admitiremos un juicioal-nivel de confianza del 5% con un coeficiente de riesgo del 5%.
De igual manera, sabemos que en una distribución normal, el95% de los casos se encuentran entre 1.96 sigmas por debajo y porencima de la media. Luego podemos afirmar que el nivel de confianzadel 5% en un caso elegido al azar de una distribución normal no se apartará de la media en más de 1.96 sigmas. En el ejemplo anterior, la distribución muestral de las medias tenía una Si' = 0.67. Por consiguiente,podemos decir que una media conseguida en la muestra no se apartaen más de (1.96)(0.67) = 1.31 de la media verdadera. Esto lo diremosa un nivel de confianza del 5%, que una media escogido al azar de la distribución no tendrá un error muestral (E) mayor que 1.31.
Ahora bien, nuestra media es precisamente la media obtenidaen una muestra que ha sido elegida al azar de la población, es pues unamedia obtenida de la distribución muestral de las medias. Por conguiente, podemos afirmar, al nivel de confianza del Sºó, que no se apartade la media de la población en más de (1.96) (0.67) = 1.31.
Vemos, pues, cómo podemos estimar la cuantía muestral de unestadístico. No lo podemos estimar con absoluta certeza, sino concierta probilidad.
Del mismo modo pueden establecerse otros niveles de confianzapor ejemplo del 1%. Sabemos que entre 2.58 sigmas. por encima y pordebajo de la media de una distribución normal están comprendidas el99% de las frecuencias. Por consiguiente, podemos afirmar a un nivelde confianza del 1% que un caso elegido al azar de una distribuciónnormal, no se apartaría de la media en más de 2.58 sigmas. Como elerror típico de nuestro ejemplo era de 0.67 resultaría que podemosafirmar, a un nivel de confianza del 1% que no se aparta la media delejemplo de la media de la población conmásde(2.58)(0.67)=1.73).
En resumen: si llamamos E al error muestral de las medias y
240 JESUS DE LA ROSA
Si el error típico de la distribución muestral de las medias, podemosafirmar a un nivel de confianza del 1%, que el error muestral de la media es igualo menor que 2.58 veces el error típico, o sea: E";;;; 2.58 Sj(.
De la misma manera podemos afirmar a un nivel de confianza deun 5% que el error muestral será menor que 1.96 veces el error típicode esa distribución.
E";;;; 1.96 Si
14.6 INTERVALOS CONFIDENCIALES
Sabemos que la media de una muestra obtenida al azar no se aparta en más de 1.96 veces su error típico de la media verdadera. Esto losabemos al nivel de confianza del 5% . Sabemos, pues, a ese nivel de confianza, que el error muestral máximo que puede afectar nuestra media es1.96 veces el error típico de esa muestra. Si sumamos y restamosde la media ese error muestral máximo, tendremos dos valores, unose encuentra la media verdadera, no con absoluta seguridad, sino conun coeficiente de riesgo del 5%. Estos valores limitan lo que se llama elintervalo de confianza o intervalo confidencial. Así para el ejemplo anterior el intervalo confidencial del 5% es el limitado por los valores.
X:t 1.96 SR = 36 :t 1.31 {
37.31
34.69
Si queremos precisar más, podemos averiguar el intervalo confidencial del 1°o. Este sera en nuestro caso:
X :t ::!.58 Sx = 36 ± 1.73= [ 37.73
34.::!7
Podemos afirmar. al nivel de confianza del 1°0 que la media vcrda
era está comprcnd ida entre 34.::!7 y 37.73.
eSTADISTICA PSICO-EDUCATIVA 241
14.7 COMPROBACION DEHIPOTESIS ACERCA DE PARAMETROS
Mediante los conceptos anteriores, se comprenderá fácilmenteque, cono~ido un estadístico y las características de su distribuciónmuestral, podemos someter a prueba hipótesis distintas acerca del valor de su parámetro.
Sea, por ejemplo, el caso anterior. Teníamos una media de X=36,la cual venía afectada por un error típico Sx = 0.67
Nos preguntamos si estos datos son compatibles con la hipótesisde que el verdadero valor del parámetro, es decir la media de la población total a que esa muestra pretende representar sea m = 38.
Como vemos, la diferencia entre la media estadística y el parámetro hipotético es d = IX - mi"" 2.
Según el razonamiento anterior, el problema que ahora se plantea es que probabilidad hay que de unas distribución que tiene 38de media y 0.67 sigma, se extraiga por azar un caso que se aparteen 12 unidades de la media. Para averiguar esto calculamos cuántasdesviaciones típicas se separarían de la media verdadera la media empírica:
oi? =3 sigmas, es decir, si fuera verdad la hipótesis, habríamosobtenido al azar un valor que se aparta tres sigmas de la media de unadistribución normal. Las tablas de la curva normal nos dicen que estotiene un probabilidad menor de 1% de ocurrir al azar. Por consiguiente,podemos hacer una de estas dos cosas; O admitir que de hecho ha sucedido por mero azar algo que solo sucede menos del 1% de las veces,y admitir, así, que nuestros datos son compatibles con la hipótesisde que la verdadera media sea 38; o pensar que no es razonable admitirque haya ocurrido por azar algo que tan baja probabilidad tiene, sinoque la diferencia ente nuestra media y la hipotética es tan grande porque de hecho la hipótesis no es correcta; afirmaremos en este caso,a un nivel de confianza superior al 1%, que nuestros datos no son compatibles con la hipótesis de que la media verdadera sea 38.
En resumen, cuando queremos comprobar una cierta hipótesis
242 JESUS 01: LA AOSA
acerca de un parámetro, por. ejemplo, la media, procederemos comosigue:
1.- Averiguamos la diferencia, (d), entre la hipótesis y .el estadísticod=IX-ml.
2- Dividímesesta diferencia por el error típico del estadístico
d--=Sx
IX-mI
S¡
3.- Si este cociente es igualo inferior a 1.96, rechazamos la hipótesis al nivel de confianza del 5%. Si no llega a1.96, no podremos rechazar la hipótesis de confianza del 5\.
14.8 LIMITES FlDUClALES
Se llaman limites fiduciales a los del 5% y del 1t. Son los másusados. Han sido aceptados por tos estadísticos como suficientemente significativos. El nivel del 51. es el más usado en pedagogía y enpsicología. Cuando hacemos un juicio a ese nivel, tenemos la probabilidad del 95\ de acertar, y corremos además un riesgo de 5% de error.Esto parece suficiente garantía. Cuando más rigurosos seamos y exijamos niveles más altos de seguridad, como el 1%, el uno por mil menosriesgo correremos de admitir como significativo algo que en realidad nosea. El nivel del 5% suele adaptarse cuando el problema que se estudiano implica grave responsabilidad: riesgo para alguien, costo excesivo,etc. Cuando mayor responsabilidad implica el problema, más seguridaddesearemos tener y mayor nivel de confianza exigiremos para admitirjuicios.-
~STADIST1CA PS/CO_EDUCATIVA
EJERCICIOS :
14.J Explique la diferenci4 entre:(1) un estadtstico y un ptuámetrob) un error ttpico y un errormuestral.
14.2 Explique brevemente:a) muestreo aleatorio:b muestreo por duo,e) muestreo es/ratificado.
243
14.3 Suponga que un inspector escolar desea seleccionar 10 estudiantes de una escuela de 200 estudiantes para indagarsobre el aprovechamiento en matemática. ¿Cómo deberd usar 14 tabkz de números aleatorios paraseleccionar los 10 estudiantes?
14.4 El promedio de los 15 1I1JJeStros ahorrantes en 14 cooperativa demaestros en unil fecha dada es de $325 y la desviación ttptca.delos deposuos es de $20 :
a) ¿Cudl es la probabilidad de que el promedio verdadero de los depósitos sea de $400?
b) Cudl es la probabilidad de seleccionar una muestra aleatoria simple de 200 depositantes con un depésito promedio entre $320 y$330?
xv
SIGNIFICACION y FIABILIDAD DELOS PRINCIPALESVALORES ESTADlSTICOS
15.1 SIGNIFlCACION y FIABILIDAD DE LAMEDIA
Se dice que un estadístico es significativo a un cierto nivel deconfianza, cuando a ese nivel puede afirmarse que es distinto decero. Así, por ejemplo', se dice que la diferencia entre dos medias esestadísticamente significamente al nivel del 5%, cuando podemosafirmar, a ese nivel de confianza, que la diferencia no es nula.
La fiabilidad es un concepto que ya conocemos. Se refierea la constancia de un estadístico cuando es hallado en muchasmuestras del mismo tipo. Suele expresarse mediante juicios queindican que podemos afirmar, a un cierto nivel de confianza, queel parámetro está comprendido entre los valores determinados.
La significación de la media se refiere, pues, al problema desi la media es o no estadísticamente distinta de cero. La fiabilidad de la media se refiere al problema de entre qué valores podemos afirmar que se encuentra la media verdadera de la población.
En todos los casos de este tema suponemos que las muestrashan sido obtenidas por muestreo aleatorio simple y que el númerode casos de cada muestra es grande, por ejemplo, no inferior a 100como mínimo.
Conviene comprender con todo rigor y pormenor la lógica delmétodo que vamos a emplear para estudiar la significación y fiabi-
245
JESUS CE LA ROSA
lidad de la media, porque es exactamente la misma lógica que seemplea para estudiar la significación y fiabilidad de todos los valores estadísticos.
15.2 SIGNIFICACION DELA MEDIA
Supongamos una muestra con los siguientes datos: n = 101;X=4O;Sx = 12. Sean, por ejemplo, 101 los sujetos que han obtenidolas mencionadas medias y sigmas en un test. Queremos saber si lamedia es realmente distinta de cero. Claro está, que una media tangrande como 40, obtenida de una muestra que tiene una variabilidad relativamente pequeña indicada por una sigma de 12, es evidentemente distinta de cero. No se trata de comprobar este caso particular. Se trata de exponer la lógica de estas comprobaciones, valedera para cualquier caso.
Pues bien, supongamos que esta muestra ha sido obtenida alazar de una cierta población. Nos preguntamos si la media M =40, es distinta de cero. Esto quiere decir, hablando con exactitud,que nos preguntamos hasta qué punto podemos estar seguros que lamedia de la población no sea cero, a pesar de que la media de unamuestra de esa población, obtenida al azar, haya resultado ser 40.
El problema así formulado nos indica que lo que tenemosque averiguar es qué probabilidad hay de que de una población quetiene cero de media, surja una muestra al azar que tenga una mediade 40. Si la probabilidad de que esto suceda es considerable, no podríamos rechazar la hipótesis de que la población tenga, en efecto,una media igual • cero (M = O). Si la probabilidad es poca. porejemplo, del 5\ o menor, podemos rechazar la hipótesis de queM=O.por lo menos al nivel de confianza del 5'1,.
Para averiguar esta probabilidad tenemos que recordar los conceptos de distribución muestral y error típico.
Supongamos que la población de donde ha SIdoextraída nuestra muestra tiene una media igual a cero. Entonces, si extraemos alazar muchas muestras como la nuestra, de \01 individuos, a partirde esa población, y hallamos la media de cada una de ellas. obtendremos una distribución muestral como la de la figura de más abajo, que tendrá de media la de la población, es decir, M =0, y cuya
ESTADISTICA f'SICO-EDUCATIVA 247
desviación tfpica indica el error .típico de la media de cualquiermuestra de esa distribución.
M=O
FigUra 15.1
Este error típico se halla mediante la fórmula:
Si =<?Pobo
-rz:
donde q,ob. significa la desviación típica de toda la población.Como esta sigma nos es desconocida, se sustituye por la sigma dela muestra, y entonces la fórmula para hallar el error típico de lamedia es:
sSx ='" n - 1
donde S es la sigma de la muestra. En nuestro caso:
Si( = 12 _1_2_= 1.26V99 9.45
Ahora ya podemos averiguar qué probabilidad hay de que unadistribución normal, como es la desviación muestral de la media,representada en la figura 15.1, que tiene una media igual a cero yuna sigma igual a 1.26 se extraiga por azar un valor X= 40, distante de M=O, en 33 sigmas.
Ahora bien, sabemos que un caso que se aparte de la media2.58 sigmas tiene sólo 1\ de probabilidad de surgir al azar; por
248 JESUS DE LA ROSA
tanto, un caso que se aparte 33.33 sigmas tiene una probabilidadmucho menor. Podemos afirmar a un elevadísimo nivel de confianza que nuestra media X= 40 no ha surgido por azar en una población cuya media verdadera sea cero. Decimos, pues, que nuestramedia es significativa a elevadísimo nivel de confianza, muy porencima del 1%. En resumen, para haIlar la significación estadísticade la media se procede como sigue:
Iro. Se decide a qué nivel de confianza vamos a trabajar, sea el5% ó al 1%.
2do. Se halIa el error típico de la media.
SS-=----x ~
3ro. Se halla el cociente entre el error típico y la media.
S
X
4to. Si este cociente es igual o mayor que 1.96 se afirma que lamedia es estadísticamente significativa al nivel de confianza del5%.
Si es igual o mayor que 2.58 se afirma lo mismo al nivel dell ~o·
Nos queda solamente por ver a qué se debe que la fórmuladel desvío típico de la distribución muestral de las medias sea:
Sx = o¡'ob
y''''''n---I-
La fórmula Sx =Ji,ob . deciquiere ecir:~
que el error típico de la media, o sea la desviación típica de su distribución muestra!, es universalmente proporcional al número decasos de la muestra. Lo cual es fácil de comprender. Es claro tam-
E5TADI5T1CA P5ICO-E DUCAT1VA 249
bién que cuanto más varíen entre sí los casos de población general(cuando mayor sea el desvío típico de la población) más variaránentre sí las medias de las muestras extraídas de esa población y portanto más grande será el error típico de la media (la sigma de la distribución muestral). En segundo lugar, es fácil comprender tambiénque cuanto mayor sea el tamaño de la muestra (n), menor será lavariabilidad de las medias obtenidas en ellas. Vemos la distribuciónde las figuras que aparecen a continuación:
CASO A
Ss¡ = 20
Figura 15.2
CASOB
Si{ = 20
Figura 15.3
CASO C
S;¡ = 10
Figura 15.4
Figura 15.5
250 JESUS DE LA ROSA
El caso A, muestra la distribución de todos los casos de la población. Supongamos que el desvío típico para el caso A sea iguala Si =20.
El caso B, representa la distribución muestral de las medias demuestras de n = l. Es decir, hemos obtenido de esa población muestras de I caso cada una, hemos hallado la media de cada muestraque coincide naturalmente con el valor del único de que consta,y hemos hecho la distribución de frecuencias de esas medias. Esevidente que la distribución resultante será exactamente la mismaque en el caso anterior y el desvío típico será de nuevo SiC = 20.Esta sigma es ahora el error típico de la distribución muestral delas medias para n = l.
Obtengamos ahora, muestras de n = 4 casos cada una. Se comprenderá que las medias de estas muestras variarán menos entre sique los casos individuales tomados uno a uno. En efecto, si tomamos un caso al azar puede salir; por casualidad, muy alto, muy desviado hacia el extremo de la distribución. Si tomamos otro con elazar Y,3 hay menos probabilidad de que salga tan desviado como elcaso anterior. La media de los dos estará menos desviada de la media general que lo que estaba el valor del caso más extremo. Sitomamas 4 casos al azar, la media de los 4 estará menos desviada queel más extremo de los 4 casos. Y así las medias de las muestras de 4casos cada una se diferenciarán menos entre sí que los valores de loscasos cuando se toman uno a uno. Está claro, pues. que la sigma dela distribución de estas medias será menor que la sigma de I;¡ población total que lo que indica el caso C. Por donde vemos que, efectivamente. cuando mayor sera el número de casos de la muestra. menor es el desvío típico de la distribución mucstrul de esa media. esdecir. menor es el error típico de la media. que es lo que queríamoscomprender.
La relación exacta entre el error t ípico, el desvío t fpico de lapoblación y el tamaño de la muestra viene indicada por la relaciónantes mcncionda,
ESTADISTICA PSICD-EDUCATIVA
15.3 FIABILIDAD DELAMEDIA
251
Si se ha comprendido lo anterior se entenderá fácilmente todo loque sigue:
Examinemos el ejemplo anterior n = 101, X = 40, Sx = 12.
Nos preguntamos ahora por la fiabilidad de la media, es decir,hasta qué punto es variable o constante; hasta qué punto nos podemosfiar de su valor, qué cuantía tiene su error muestral; entre cuáles límites podemos afirmar que está comprendida la media verdadera.
Para contestar a estas preguntas procedemos como sigue:
1.- Decidimos a qué nivel de confianza vamos a trabajar. sea el 5~.
") Hallamos el error típico de la distribución muestral de las medias.
Sx =_S_ = -,:::12==~ v'IOI-1
...lL=1.210
3.- Calculamos el error muestral máximo que estamos dispuestos a admitir por mero azar. al nivel de confianza del 5'l,.
E = 1.96 Si =(1.96)( U) = 2.352
Ya podemos afinuar el nivel de confianza del 5~. que nuestra medida no viene afectada por un error muestral mayor de 2.352 unidades.
M = X ± 1.96 Sí( =X± 2.352 =40 + 2.352 42.35237.648
Podemos afirmar. al nivel de confianza del 5'l,. que la media vcrdadera está comprendida entre 37 .64H Y 42.532. Estaremos en lo cierto.si hacemos este juicio. a menos que haya ocurrido algo que al azar sóloocurre el 5% de las veces.
El mismo procedimiento se sigue si adoptamos el nivel de confianza del 1'),.
l. ~. Adoptamos el nivel 1';
252 JESu's DE LA ROSA
2.- Hallamos:
SSj(=_-=:""-
vn=I3.- Hallamos el error rnuestral (E) máximo, al 1%
E = 2.58 Sj( = (2.58)(1.58) (1.2) = 3.096
Afirmarnos, al 1% de confianza, que nuestra media no viene afectatada por un error muestral superior a 3.096.
4.- Hallamos el intervalo de confianza del 1%:
M =X ± 2 58 S- =40 ± 3096 = { 43.096. x . 36.904
Afirmamos, al nivel de confianza del 1%, que la media verdaderaestá comprendida entre 36.904 y 43.096. En lo cual habremos acertadoa menos que haya ocurrido en nuestro caso algo que sólo ocurre el 1%d e las veces.
15.4 SIGNIFICACION DE LAS DIFERENCIAS ENTRE MEDIAS DI"MUESTRAS INDEPENDIENTES
Sea el caso del cuadro siguiente:
Tabla 15.1
1 2 d
n 318 197
X 36 37
S 12 13
Supongamos que hemos dado un mismo test de inteligencia a 318niños y a 197 niñas extraídas al azar de sus poblaciones respectivas de10 años. El grupo de las niñas tiene una media superior en I punto algrupo de los niños. Tratamos de ver si estadísticamente esa diferencia es
E57ADI5T1CA P5ICO-EDUCATIVA 253
significativa. Es decir, si es distinta de cero o si es, por el contrario,compatible con la hipótesis de que la verdadera diferencia sea cero, peroque, por azar, haya resultado igual a 1.
Para averiguar esto procedemos como en el caso antes examinado,de la significación de la media. Empezamos por establecer la hipótesisde que la diferencia verdadera sea cero. A esta hipótesis se le llama enestadística hipótesis nula. Y, después, vemos si nuestros datos nos permiten rechazar la hipótesis nula y a qué nivel de confianza nos permiterechazarla.
Iro. Decidimos a qué nivel de confianza vamos a trabajar. Sea el del5%.
2do. Averiguamos el error típico de la diferencia entre las medias.
3ro. Hallamos el cociente entre la diferencia. d. y su error típico.
d IX I ~ X2 IRc =--sct=V~2 + ~2
XI X2
A este cociente le llamamos razón critica o razon de significaci6n.
dRc =SJ=Razón Crílica o Razón de Significación
4to. Si Rc ;;;. 1.96 rechazamos la hipótesis nula al nivel de confianzadel 5%, Y afirmamos, en consecuencia. al nivel del 5'0. que la diferencia es significativa.Si Rc;;;' 2.58, hacemos lo mismo al nivel del 1%.
En nuestro caso particular
264
13
Vi96
JESUS DE LA ROSA
Sd =J (0.67)2 +(0.93)2 = 1.14
d _.;;...1_Rc=~= 114 0.88 ~ 1.96
Sto. Como la razón crítica (Re> es menor que 1.96 no podemos rechazar la hipótesis nula al nivel del 5%. Hemos de afirmar que la diferencia no es estadísticamente significativa. Lo que quiere decir queno podemos tener suficiente confianza de que se aparte de cero, o.con otras palabras, que nuestros datos son compatibles con la hipótesis de que la diferencia hallada se deba puramente.al azar, a loserrores muestrales aleatorios, aunque, de hecho, la diferencia entrelas dos poblaciones sea nula.
La lógica en que se basa este procedimiento es exactamente lamisma que la ya expuesta cuando examinamos la significación dela media. Recordémosla, brevemente, aplicada al caso actual.
Tenemos dos poblaciones: una de varones de 10 años, otra deniñas de 10 años. De cada población hemos extraído al azar unamuestra y hemos hallado que la diferencia entre las medias de estasdos muestras es igual a l. Extraigamos otras dos muestras del mismo tamaño de las anteriores; seguramente nos saldrán, por azar,dos muestras algo distintas que las que obtuvimos anteriormente,y que la diferencia entre ellas será ahora también distinta que antes. Escojamos al azar un gran número de pares de muestras. Cadapar tendrá una diferencia, que será por puro azar más o menosdistinta de la de otros pares. Si hacemos la distribución de frecuencia de estas diferencias tendremos la distribución muestral de ladiferencia entre muestras del mismo tamaño que las usadas comose indica en la figura 15.6.
ESTADISTICA PSICO-éDUCATIVA
Sd = 1.14
Figura 15.6
255
Esta distribución muestral es normal, su media es la diferenciaentre las medias de las dos poblaciones (MI - M2 ) , es decir la diferencia verdadera y su desviación típica es el error típico de la distribuciónmuestral de las diferencias entre medias.
j 2 1Sd= SX¡ +SX2 =1.14
Al plantear la hipótesis nula MI - M2 =0, es decir, que al afirmarno hay diferencia entre las dos poblaciones, en lo que al test de inteligencia respecta, las dos forman una sola población, y cada par de muestras extraídas al azar de una misma población de datos. Si esto fueraasí, la diferencia entre cada dos muestras sería sólo al azar, habría muchas diferencias nulas, otras serían pequeñasy sólo muy pocas, por mero azar, resultarían altas. La distribución en ese caso sería como la indicada.
31%
Sd = 0.88
Figura 15.7
Ahora bien, sabemos que la diferencia obtenida en nuestro caso esd = 1 Yque es una de las diferencias que forman parte de la distribuciónde la figura 15.6 extraída al azar de ella. Nos preguntamos ¿qué proba-
256 JESUS DE LA ROSA
bilidad hay de que, siendo la verdadera diferencia igual a cero, surjapor azar una diferencia tan grande o mayor que I?
En efecto, esa diferencia se aparta de la media en 0.88 sigmas.La. tabla de la curva normal nos muestra que entre la media y 0.88hay el 31% de los casos, luego, por encima de 0.88 hay 19%, y pordebajo de -0.88 sigma hay otros 19% de casos.
Esto quiere decir que existe una probabilidad de 38% de que uncaso elegido al azar de esa distribución cuya media verdadera es cero seaparte de la media en más de I unidad.
Como existe esa gran probabilidad no nos atrevemos a rechazarla hipótesis de que esa diferencia haya aparecido por pura casualidad ydecimos que la diferencia no es significativa para afirmar que tenga5%, de probabilidad de surgir al azar de una población cuya distribuciónmuestral es la diferencia entre medias escogidas al azar fuera O.
Esto es lo que significa rechazar la hipótesis nula al nivel de confianza del 5%. En este caso la razón crítica, Rc = 0.88.
IS.s SIGNIFICACION DE LAS DIFERENCIAS ENTRE MEDIASRELACIONA DAS
Supongamos los datos siguientes:
Tllhfll 15.2
::X 36 37
S 12 13
n 31H 31X
Hemos elegido 31 H pares de hermanos. de distintos sexos; el grupode varones han dado 36 de media y el grupo de las hembras 37 en untest de inteligencia y deseamos comprobar si esta diferencia de I puntoes estadísticamente significativa. Pero ahora hemos de tener en cuentaque las muestras no son independientes con respecto a la inteligencia.Pues es sabido que los hermanos se parecen mds entre sí en inteligenciaque los demás individuos cualesquiera de la población general. Suponga-
ESTADISTICA PSICD-EDUCATIVA 257
mas que la correlación entre los dos grupos es de 0.90 en un test dado.Para comprobar la significación de la diferencia entre medias procedemos como sigue:
1ro. Adoptamos un nivel de confianza, sea éste del orden del 1%.
2do. Hallamos el error típico de la diferencia, que, en el orden de medias relacionadas es:
J 2 2Sd = S- + S-x I Xl
En nuestro caso:
12Sj{ 1 = -J 317 = 0.6 7
13Sjh = .; 31t O.69
Sd=J(0.67)2 +(0.69)2 -2(0.9)(0.67)(0.69)=0.32
3ro. Hallamos la Rc
d lRc=----sd= 0.32 =3.12
4to. Como la razón crítica es mayor que 2.58 sigmas, es decir, como ladiferencia de l unidad se aparta de la supuesta media nula en másde 2.5H sigmas, rechazamos la hipótesis nula por encima del nivelde confianza del I ~ Y afirmamos que la diferencia entre las dosmuestras es significativa por encima del nivel de confianza del 1%.
Como se ve, la misma diferencia de l unidad no era estadísticamente significattva en el caso de muestras independientes, y lo es en elcaso que ahora examinamos, de muestras relacionadas. Ello es debido aque en este último caso el error típico de la diferencia es mucho menoren el caso anterior y así la razón crítica resulta mucho mayor. Lo cualse comprende fácilmente si se tiene en cuenta que la variabilidad de lasdiferencias entre pares de muestras relacionadas que en el caso de muestras independientes. Pues si las muestras son independientes es posibleque en algunos casos una resulta compuesta por azar de sujetos muyinteligentes y la otra, también por azar resulta formada por sujetosmuy inteligentes y la otra, también por azar resulta formada por sujetos
:158 JESUS DE LA ROSA
muy torpes, mientras que si las muestras se relacionan. cuando, porazar, una contenga muchos sujetos inteligentes, la otra tenderá tambiéna contener muchos sujetos inteligentes.
15.6 OBSERVACIONES
Para la justa interpretación de la significación estadística de diferencias, téngase muy en cuenta lo siguiente:
l ro. Cuando decimos que una diferencia es estadisticamente significativa, afirmamos tan sólo eso, a saber que podemos tener ciertaconfianza en que hay diferencia real. Ello no quiere decir que estadiferencia sea significativa desde otros puntos de vista, como elpedagógico, el industrial, el clínico, cte. En el último caso examinado, podemos afirmar que la diferencia en el test de inteligenciaentre hermanos es significativa, es decir, estadísticamente hablando, las hembras de 10 años, de la población estudiada, son superiores en inteligencia a sus hermanos. Pero esta superioridad de Ipunto en un test de inteligencia es psicológicamente significativa.¿Merece la pena tenerla en cuenta al trazar por ejemplo, un ciertoprograma de enseñanza? Estas son cuestiones que el investigadorha de decidir en función de sus fines y conocimientos generales.Lo que aquí indicamos es que no pueden considerarse ya resueltas al averiguar que la diferencia entre las muestras es estadísticamente significativa.
2do. Cuando decimos que una diferencia es estadísticamente significativa, afirmamos, a un cierto nivel de confianza. que no es debida alazar. Pero no sabemos a qué es debida. Esto sólo puede saberseconsiderando las circunstancias totales del caso. En el ejemplo anterior, afirmamos que la diferencia entre hermanos no se debe alazar. ¿A qué se debe? Eso lo averiguaremos examinando todos losdatos de la población: si las hembras han sido educadas en un ambiente menos favorable que los hermanos podrfa deberse a eso. Silas hermanas proceden de una población en la cual las niñas tienenque abandonar antes la escuela que los niños para dedicarse al trabajo doméstico, y el test de inteligencia es de carácter verbal y escolar, eso podría explicar la diferencia.
Si todas estas circunstancias y otras similares han sido debidamente "controladas", la diferencia puede reflejar una auténtica diferencia
ESTADISTICA PSICO-EDUCATIVA 259
en inteligencia y ser referida en buena parte a caracteres hereditarios.En todo caso, la significación estadística de una diferencia 5619pruebaque la diferencia no se debe al azar. Para averiguar a qué se debe, el investigador ha de recurrir a otros procedimientos.
U.7 SIGNIFICACION y FIABILIDAD DE LA MEDIANA
La fórmula para hallar el error típico de la distribución muestralde la mediana es:
Smd = 1.25 Si(
Para comprobar la fiabilidad de la media se procede como sigue:
Iro. Determinarnos el nivel de significación a que vamos a trabajar.Sea el 1%.
2do. Hallamos Smd, mediante la fórmula anterior.
3ro. Hallamos el error muestral máximo que estamos dispuestos a admitir por mero azar.
E=2.5S Smd
4 too Hallamos el intervalo confidencial del 1%.
Mdn±E
Ejemplo:
2
n= 101; X=50; Mdx=54;S 20
Sx =v'n- I = v'100
4to. Hallamos el error E:
S=20
E =2.58 Smdx =(2.58) (2.50) =6.45
Podemos afirmar, al nivel de confianza del 1% que nuestra mediana,no está afectada por un error muestral mayor que 6.45 unidades:
260
Mdx =mdx ±2.58 Smdx =54 ± 6.45 =
JESUS DE LA ROSA
r 60.45
\ 47.55
Afirmamos, al nivel de confianza del 1'1, que el valor muestra mediana está comprendida entre 47.55 y 60.45.
En cuanto a la desviación tfpica, el procedimiento es el mismo. Acontinuación ofrecemos el error típico de la distribución muestra) delos errores típicos.
s¡ = 0.707 Si(
El error típico de la distribución muestral de las desviaciones Upicas es igual a 0.707 multiplicado por el error típico de la distribución muestral de las medias.
15.8 SIGNIFICACION y FIABILIDAD DE LASPROPORCIONES
Pongamos un ejemplo: queremos saber con qué frecuencia va alcine universitario cierta población de estudiantes. Elegimos )00 al azary resulta que 65 de eUos declaran que van al cine universitario por lomenos una vez o más por semana. Según la muestra examinada pareceque los estudiantes en cuestión van al cine al menos una vez por semanaen la proporción 0.65, es decir, 65 de cada 100. ¿Cuál es la fiabilidad deesta proporción? Porque, está claro que si elegimos otros 100 estudiantes al azar, la proporción de los que van al cine una o más veces por semana será posiblemente algo distinta, ¿cuál juicio podemos hacer acerca de la verdadera proposición?
Para contestar a estas preguntas procedamos como en los casosanteriores.
1ro. Adoptamos un nivel de confianza. Sea del 5'1, .
2do. Hallamos el error típico de la proporción. La fórmula es:
N: Población total
ESTADISTICA PSICO-EDUCATIVA 261
Sp; error típico de la distribución muestral de las proporciones empíricas.
Ppob = proporción verdadera de sujetos que van al cine una o más vecespor semana en toda la población de la que se ha escogido la muestra.
Qpob. = 1 - Ppob. Proporción verdadera de sujetos que no van al cineuna o más veces por semana en toda la población de la que se haescogido la muestra.
Como desconocemos "Ppob." podemos, en ciertos casos que, luego diremos, emplear p de la muestra en su lugar. Así:
p= j --ll-n
p =proporción de los que van en la muestra.
q = 1 - p: proporción de los que no van en la muestra.
En nuestro caso:
= 0.048
3ro. Hallamos el error muestral máximo a nivel del 5%.
E = 1.96 Sp =(1.96)(0.48) =0.094
4to. Hallamos el intervalo confidencial del 5%
P =p ± 1.96 Sp =0.65 ± 0.094 = { 0.7440.556
Con lo cual podemos afirmar que la proporción hallada de 0.65no se aparta. de la verdadera en más de 0.094 unidades, o sea, podemosasegurar, al nivel de confianza del 5% que la verdadera proporción desujetos de la población estudiada que van al cine una o más veces porsemana está comprendida entre 0.556 y 0.744, es decir, entre un 56%y un 74% aproximadamente.
262 JESUS DE LA ROSA
15.9 INCONVENIENTES DEL USO DEL l\IETOOO DESCRITOPARA IETERMINAR INTERVALO CONFIDENCIAL EN ELCASO DE PROPORCIONES
El método descrito más arriba no siempre se puede emplear.Cuando (n) es muy pequeño, es claro que la proporción y los porcentajes son pocos fiables; además, cuando la misma proporción hallada es muy grande, por ejemplo, "p" = 0.90, o muy pequeña, por ejemplo "p" = 0.05, las fórmulas anteriores no sirven por varias razonesla más importante de las cuales es que cuando "p" tiene valores extremos, la distribución muestral de la proporción no es normal sino asimétrica.
Los autores recomiendan que sólo se use la fórmula:
pqN
utilizando en el radical "p" de la muestra, cuando pn y qn sean mayores que 10. En nuestro caso n = 100; p = 0.65; q = 0.35.
pn= IOOxO.65=65> 10qn =100 x 0.35 =35> 10
Cuando np O nq sean menores que 10, es decir, cuando la muestran sea pequeña y la proporción sea extrema, conviene empicar el método que a continuación explicamos, el mismo puede aplicarse con todorigor a todos los casos.
Supongamos el caso siguiente: estamos investigando el desarrollodel miedo a la oscuridad entre los niños. Supongamos que, como partedel programa deseamos saber con qué frecuencia se manifiesta el miedoa la oscuridad en las sucesivas edades. Para averiguarlo en la edad de 4años, hemos escogido 100 niños al azar de la población de barrios capitaleños de clase media. Y hemos encontrado que 14 de ellos tienen miedo a la oscuridad. Deseamos saber si los niños de otros ambientes tienenmiedo en igual o diferente proporción. Pero ante todo queremos verhasta qué punto nuestros datos son fiables. Para ello procedemos corno
ESTADISTICA PSICO-EDUCATlVA 263
2.58
sigue: sabemos que el error típico exacto de una proporción viene dadopoda fórmula:
s = j Ppob. Qpob.p n
y que, para fijar el intervalo, confidencial del 1~, por ejemplo, tenemosque dar a la proporción valores x tal que
X-pSp
Si llamamos "x", como hemos dicho, a los valores que limitan elintervalo confidencial del 1% o del 5~ para averiguar cuales son esosvalores no tendremos más que resolver la ecuación
x - p
Sp= 2.58
donde sabemos que p = 0.14. En nuestro ejemplo resolvemos, pues estaecuación:
X-pSp;
= ~.S8
X-p------ =:!.58; X - 0.14 =2.58 Sp
Sp
Sustituyendo ~p por su expresión equivalente:
Ppob. Qpob.n
y teniendo en cuenta que el valor Ppob que estamos buscando es X, quelimita el nivel del It:
j X(I - X)X-0.14= n
264 JESUS DE LA ROSA
Elevando al cuadrado, y teniendo en cuenta que n = 100
X2 + (0.14)2 _ (2)(0.14) X = (2.58?~6X - x2
)
multiplicando por 100 ambos miembros
100 x 2 + 100 (0.14)2 - (lOO) (2)(0.14) X = (2.58)2 X - (2.58)2 X2
Realizando algunas operaciones:
100X2 + 1.96 - 28X = 6.66X - 6.66X 2
Pasando todos los términos al primer miembro
I06.66X2 - 34.66X + 1.96 = O
que tiene forma general de una ecuación de segundo grado con unaincógnita. El valor de x se halla, como es sabido mediante la fórmula:
- b ±/b2 _ 4 acX=---l<.-----
2a
En nuestro caso:34.66.¡r-(3-4-.6-6-?---4-(-1-06-.-66-)-(-1.-96-)
X = 2 (106.66)
X =0.25 ó 0.07
Lo cual quiere decir que los límites entre los cuales podemos afirmar, a nivel de confianza del 1%, que se encuentra la verdadera proporción buscada, son 0.07 y 0.25. Cuando en 100 individuos obtenidos alazar de una población hallamos el 14% tiene cierta característica, estoquiere decir que podemos asegurar, con bastante confianza (del 1%),que entre un 7% y un 25% de los individuos de esa población poseen esacaracterística.
Como se ve, este juicio no parece indicar mucha precisión. Lo cualnos enseña:
ESTADISTICA PSICO-EDUCATIVA 265
Iro. A. no fiarse mucho de los resultados cuantitativos, sino por el contrario. procurar siempre tener una estimación de su precisión yfiabilidad. y
2do. A emplear siempre que sea posible un gran número de sujetos ennuestros estudios y hacer comprobaciones pues cuanto mayor seael número más fiables son los resultados ya que hay menos probabilidades de que por mero azar se aparten mucho de la realidad nivaríen mucho de un estudio a otro.
Quizá convendría agregar que dentro de la ciencia experimentalaún no se ha alcanzado el verdadero nivel científico cuando ni siquiera podemos establecer estimaciones cuantitativas en los problemas queestudiamos.
Lo cual no significa que no existan otros métodos y modos deconocer, distinto del experimental y cuantitativo, que por otras razones y otros sentidos puedan llamarse también científicos.
15.10 DIFERENCIAS ENTRE PROPORCIONES
Supongamos que hemos dado un cuestionario a 400 hombres y400 mujeres. En este cuestionario figuraban las palabras "explorar" y"sinfonía". Los sujetos han declarado si les eran agradables o no estosconceptos. Los resultados figuran en la tabla siguiente:
Tabla 15.3
explorar sinfonía r difer. d ReHombres 0.8775 0.6850 0.342 0.1925 0.0234 8.23
Mujeres 0.8700 0.8875 0.495 0.0175 0.0175 0.97
Diferencia 0.0075 0.2025
d 0.0235 0.0281
~c 0.32 7.21
266 JESUS DE LA ROSA
El procedimiento a seguir es el mismo de siempre. teniendo cncuenta que el error upico de la diferencia entre proporciones vienedado por la fórmula:
Adaptando el nivel de confianza del 1~
(O.X775I (0.1225)
400=j---
(O.tJX50) (0.3150)400
R¡ 2 = 0.342
Ampliando la fórmula a l'stos valores rcsultu
~id = 0.0234
l' <1 O.ltJ25'c - \1 - 0.0234
Como la razón critica es superior a 2.5X podemos afirmar quela diferencia entre las dos proporciones es significativa al nivel del 1';,.
Del mismo modo se comprobaría la significación cstudrsticu dea diferencia entre los otros tres pares de proporciones, uhtcniéndoscos resultados que figuran en el cuadro anterior. que el alumno debe;onfrontar.
15.11 SIGNIFICACION y FIA8IUDAD DEL COEFICIENTE DECORRELACION DE PEARSON
Los problemas de csladíslic;1 muestra) que hemos examinado en
ESTADISTICA I"SICD-EDUCATlVA 267
lecciones anteriores se plantean también con respecto al coeficientede correlacíón,
Supongamos que la correlación entre un test de amplitud mecánica y la eficacia de un trabajo de torno sea r = 0.60. ¿Qué significaesto? Desde luego, no significa que la correlación entre ese test y laeficacia en trabajo de torno sea siempre y con cualesquiera sujetos 0.60.Lo que significa es que en el grupo de sujetos que hemos examinadohay tal correlación. Si hubiéramos tomado otro grupo. hallaríamos probablemente otra correlación, incluso si tomamos el mismo grupo enotra ocasión. Lo que nos interesa saber es hasta qué punto representaese coeficiente al verdadero que obtendríamos examinando a toda lapoblación que realiza o aspira a realizar esa clase de trabajo. Supongamos que de esa población hemos tomados 100 sujetos al azar y los hemos examinado con el test y luego, después de cierto aprendizaje hemoscomprobado su influencia en el trabajo obtenido entre el test y el trabajo una correlación = 0.60. Y ahora nos hacemos las preguntas desiempre: ¿es esta correlación estadísticamente significativa'? ¿Cuáles su fiabilidad?
Para contestarlas seguimos el mismo procedimiento que ya conocemos:
Significación de r
I ro.- Adoptamos el nivel de confianza deseado. Sea el 5~,
::!do.·· Hallamos el error t (pico de la distribución muestra! de lascorrelaciones.
Donde Rpob es el verdadero coeficiente de toda la población. Como desconocemos éste, ponemos en su lugar el coeficiente de I;¡ muestra:
.10.69 )2
ViGO
268 JESUS DE LA ROSA
3ro.- Hallamos la razón crítica
9.390.600.064
Rc=_r_ =_-""'=_Sr
Como la razón crítica es mayor a 1.96, podemos afirmar, muy porencima del nivel del 5%, que la correlación hallada es estadísticamentesignificativa, es decir, que no se debe al azar, sino que indica una efectiva correlación entre las dos variables.
Fiabilidad de r
l ro.- Nivel de confianza. Sea el del 5%.
2do.- Sr-~--==-1-(0.60)2
YT60
3ro.- E =(1.96)(0.064) =0.125
4to.- Intervalo confidencial del 5%
R= r + 1.96 Sr = r ± E = 0.60 ± 0.125 = {~:~~;
Podemos afirmar, al nivel de confianza del 5%, que la verdada correlación se encuentra entre 0.475 y 0.725.
Ambos procedimientos, el de la significación y el de la fiabilidad,se basan en las propiedades de la distribución muestral de "r", que es,como sabemos, la distribución de los coeficientes "r" obtenidos en muchas muestras como la examinada. Cuando la distribución muestral esnormal (tiene como media "R" de la población y como sigma el errortípico de r) están justificados los procedimientos expuestos.
Pero la distribución de r no siempre es normal. Es aproximadamente normal cuando n es grande, digamos mayor que 50, y cuando"r" no tiene un valor extremo, sin medio, por ejemplo, n =60 y r =0.65en este caso se puede usar el procedimiento anterior.
Cuando n no es grande y r es extremo tenemos que usar un proce-
ESTADISTICA PSICO-EDUCATlVA 269
dimiento fuera del alcance de lo contemplado por este texto. Por elmomento anotamos que, frecuentemente lo que mas suele interesarcuando se emplean coeficientes de correlación, es saber si son o no significativos, si indican una efectiva y real correlación entre las variablesexaminadas. En este caso, y con tal que n sea 30 o más, se puede siempre resolver el problema con toda facilidad y prontitud, recurriendo a lahipótesis nula.
Significación de otros índices de correlación
Se procede a la misma forma, a continuación ofreceremos el errormuestral para cada caso.
Correlación Ordinal (e)
S =e
Correlación biserial, rb
En el caso de la hipótesis nula (rb = Ol. la fórmula es
Correlación biscrial puntual rbp
Correlación tctracórica r t
270 JEf:U;¡ DE LA ROSA
15.12 H1POTESIS ESTADISTICAS: Toma de Decisiones
Muy a menudo, en materia de Estadística, se tienen que tomardecisiones sobre poblaciones partiendo de. informaciones muestrales delas mismas. Por ejemplo, se puede desear decidir, a partir de los datosencontrados en la muestra, si talo cual método pedagógico ofrece mejores resultados que otro: si la fiabilidad de tal prueba psicológica es mayor que otra. etc.
Claro está que para llegar a tomar decisiones, debemos partir desupuestos () conjeturas acerca de las poblaciones que se estudian. Talessupuestos pueden ser o no ciertos. Esos supuestos reciben el nombrede hipótesis estadísticas.
En muchos casos resulta práctico formular hipótesis estadísticascon el sólo propósito de rechazarlas o invalidarlas. Por ejemplo, si sequiere decidir. en base a la diferencia encontrada en una muestra, si losniños son más inteligentes que las niñas, se formulan la hipótesis deque no existe diferencia entre la inteligencia de los varones y la inteligencia de las hcm bras. Análogamente, si se quiere decidir sobre si unmétodo es mejor que otro, se formula la hipótesis de que son iguales, esdecir, que cualquier diferencia observada se debe meramente a fluctuaciones en el muestreo de la misma población. Tales hipótesis se llamanhipótesis nulas y se denotan así: HO'
Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis alternativa. Por ejemplo, si una hipótesis p =0.5, una hipótesis alternativa sería p = 0.8; si p = 5 se plantea como hipótesis, p = 3 seríala hipótesis alternativa. La hipótesis alternativa de la hipótesis nula(HO) se denota Hi.
En general, el problema de la verificación de la verdad o falsedadde una hipótesis referente a parámetros de una población, mediante lainferencia muestral, se presenta de la manera siguiente: Se tiene una hipótesis (H) referente a un parámetro de una población, de la cualse dispone de una determinada muestra. Se trata de establecer, porcamino inferencial basándose en los datos muestrales, si H resulta comprobada o rechazada. Sea H la hipótesis que deseamos verificar. Vamosa suponer que la hipótesis sea H: M =a. Para ello fijamos un margende riesgo, vamos a decir un 5%, es decir, nuestros resultados tendríanuna probabilidad de un 95%de estar acertados.
ESTADISTICA PSICO-EDUCATlVA 271
Se efectúa una muestra al azar tic' 11 individuos y resulta una mediamucstrul X. Deseamos saber si este resultado confirma o rechaza la hipótesis: M =a.
Para ello, nada más Iacil que dividir el campo de variabilidad deX en dos regiones una de aceptación y la otra (Ic' rechazo. El problemaquedará reducido a una simple verificación de si X cae en una u otrare,gión.
En nuestro planteamiento H: M =a, es decir X= a, los 1ímitesde la aceptación se determinan por la condición:
a-l.96 S X{a+l.lJ6Sxx
1flEGION,
qEACEPTACION
Figura 15.8
REGlaN
DERECHAZO
Esos límites envuelven el 95% de todos los casos. Como se indicaen la figura, se puede contar con un 95% de confianza de que. si la hipótesis es cierta, l'I valor t ipico obtenido de una muestra real se encontraráentre -1,96 Si( y 1.96 Si(, lo que quiere decir que es un suceso conprobabilidad de solamente 5% de no ocurrencia.
Vamos a ilustrar con un ejemplo.
Se supone que la nota promedio alcanzada en matemática por unatanda de clase es de 70 puntos. Se procede a verificar la hipótesis. Paraello se toma una muestra de 101 estudiantes. En la misma se registraron
los datos siguientes: X = 72 Sj( = 10. Para verificar la hipótesis M =70en base a lo encontrado en la muestra, procederemos de la manera siguiente: 1) Establecemos un cierto nivel de confianza, vamos a decir un95%, 2) Calculamos Si( (desvío típico de la distribución muestral de lasmedias).
272 JESUS DE LA ROSA
Sj( = _S_=-1º-= \v;;-:-\ y'¡QQ
3.- Procedemos a establecer las áreas de aceptación y rechazo,
Vemos que 72 en medida típica es igual a:
Medida ésta, que se encuentran dentro de la zona de reckllo. Inbase a lo encontrado en la muestra concluimos que la mr dia tic' la población no es 70.
- 1.96 S;¡ = 1,96 70 1.96. ~ = 1,96.
tigura 159
Adelnjs dc plant car la hipótesis 11: M = a. podemos plantear lashipótesis H' m) a.\'xisk un valor mínimo M = a.
Si ~!: M;:;' a, existe un mínimo M = a.
I·.n este caso, el cstadrstico muestra! X deberá tener una distribución normal con media y un desvío típico igual a S-" .
Con un límite interior L = a 1.6~ Si(. siendo 1Jli\ el valor que nosda la tahla dc' la función de distribución normal para qUL' se verifiqueP (x ;:;, 1.6X 1 = I l·.: para el caso concreto de ser l. (coeficiente de
riesgo) igual aS",.
ESTADISTICA PSICO-EDUCATIVA 273
De lo dicho resulta que para 2'5% de confianza X ~ a - 1.645 Si 'es la región de aceptación, siendo X E;;; a - 1.645 Si. la región de recha
zo .
•§~
1.645 Si(Figura 15.10
Para el caso de H: M < a, la región de aceptación viene dada porXE;;; L; L =a + 1.645 Si(, gráficamente.
REGION DE RECHAZO
Figura 15.11
En resumen:
Hipótesis
H:M =a
H:M~a
H: M E;;; a
Confianza
95%
95%95%
Región de Aceptación
-1.96 Sj¡ a .196 Sx
de -1.68 Sx en adelante
de menos infinito a 1.68 Si
15.13 ERRORES EN LA VERIFICACION DE HIPOTESIS
En la comprobación de una hipótesis caben los siguientes casos:
1.- Que H sea verdadera y que X caiga en la zona de aceptación.
274
2.- Que H sea falsa y que X caiga en la de rechazo.
JESUS DE LA ROSA
3.- Que H sea verdadera y que Xcaiga en la zona de rechazo
4.- Que H sea falsa y que X caiga en la zona de aceptación.
En los casos I y 2 no habremos cometidos ningún error. En elcaso 3 y 4 hemos cometido errores. En el tercer caso, hemos puesto demanifiesto la eventualidad de que algo verdadero sea pasado como falso. Esa eventualidad suele llamarse riesgo del productor o error tipo 1.En el cuarto caso, hemos puesto de manifiesto la eventualidad de quealgo falso pase como verdadero, produciéndose el llamado error tipo 11o error del consumidor.
15.14 ENSAYOS BILATERALES Y UNILATERALES
En párrafos anteriores, hemos atendido a valores extremos de estadísticos y sus signos a ambos lados de la media así como también devalores extremos a un s610 lado de la media. Los primeros reciben elnombre de ensayos de dos colas o bilaterales y los segundos, ensayosde una cola unilaterales.
Los ensayos bilaterales presentan una región crítica o de rechazocon dos áreas -una a cada lado de la media-; mientras que los ensayosunilaterales, su región crítica o de rechazo comprende una sola área situada en uno, de ambos lados de la media.
A continuación presentamos una tabla con los valores críticos deS para ensayos uni y bilaterales a distintos niveles de significacrén.
Tabla 15.4
Nivel de Significación 0.10 -1.645 0.01
Valores críticos de S 1.28 -1.645 - 2.33Ó ó 6
(Unilateral) 1.28 1.645 2.33
Valores críticos de S 1.645 - -1.96 - 2.58y y y
(Bilaterales) 1.645 1.96 2.58
ESTADISTICA PSICQ-EDUCATIVA
15.15 NIVEL DE SIGNIFlCACION
275
La probabilidad máxima con que en el ensayo de una hipótesis sepuede convertir un error del tipo 1 se l1ama nivel de significación del ensayo. Esa probabilidad se fija antes de la extinción de las muestras, haciendo, el tamaño de las mismas, función de ese valor, de tal modo quelos resultados obtenidos no influyen en la elección.
En la práctica se acostumbra a utilizar niveles de significación de0.05 a 0.01, aunque, claro está, puedan emplearse otros valores. Así,por ejemplo, si se elige un nivel de significación de un 5% al diseñar unensayo de hipótesis; entonces hay aproximadamente 5 ocasiones en 100en que se rechazaría la hipótesis cuando debería ser aceptada, es decir,se está con un 95% de confianza de que se tome la decisión adecuada. Ental caso se dice que la hipótesis ha sido rechazada al nivel de significacación del 5%, lo que significaría que se puede cometer error con unaprobabilidad de un 5%.
A continuación ofrecemos algunos problemas resueltos, complementarios de aspectos teóricos empleados en este capítulo, que servirán para esclarecer y ampliar 10 expuesto, en 10 tocante a aquellos puntos más críticos y de más difícil comprensión.
Ejemplo 1
Los registros conocidos indican que la calificación media de losestudiantes de economía es de 65 puntos con una desviación típica de16 puntos. Para ensayar un nuevo método de enseñanza se seleccionauna muestra al azar de 64 estudiantes, y se encuentra que la media es de69 puntos. Se pregunta, ¿existe una diferencia real entre 65 puntos y lamedia de la muestra de 69 puntos?
Ha : u =65 puntos
H¡ : u;;;' 65 puntos
S- =_s_= 16 =2x V;=-l V64
69-65--=2
2
276 JESUS OE LA ROSA
Estableciendo los limites de aceptación:
1.96 Si( 65 1.96 Si(
Figura 15.12
Vemos que 2 cae dentro de la zona de rechazo, a un nivel de significación de un 51,. Es decir, entre la media de la población y la mediaencontrada en la muestra hay diferencia significativa. Ello, apoya la pretención de que el nuevo método de enseñanza puede mejorar el nivel deconocimiento de los estudiantes de economía.
Ejemplo 2
Investigaciones previas indican que el 20\ de las familias de unaciudad están suscritos al periódico K. Hay ~otivos para creer que en losnltímos tiempos ha disminuido la tasa de suscripción.
1.64 x 0.0420
Figura 15.13
1.64 Sp
Para comprobar si en realidad ha habido algün cambio, se torrnauna muestra al azar de 100 familias y se observa que la proporción enencontrada en la muestra es que el 16\ estarán suscritos al mismo perió
'dico. Se desea comprobar si hubo o nO,una disminución en la suscripcíen. Consideremos, en principio, que no hubo aumento o todo se quedó como estaba. es decir, trataremos de comprobar la hipótesisH:M ~ aes decir, p;¡' 20. Establecemos un límite de confianza, vamos a decir un20\.
ESTADISTICA PSICO-EDUCATIVA
Sp= j ;q = j 0.¡~0.8
Sp=O.04%
277
La zona de aceptación está desde 20% - 1.64 Sp = 14% en adelante. Esto nos inclina a afirmar que no hay diferencia signifiéativaque el%de suscritos permanece igual.
Ejemplo 3
En enero el 40% de 2000 comerciantes comunican que van a incrementar su demanda de lavadoras; en marzo se puede pensar que yadebe haberse realizado el incremento. Para comprobarlo se toma unamuestra al azar de 400 comerciantes y se comprueba que la proporción de muestra es p = 46% . ¿Ha sido significativo el aumento de lademanda?
Vamos a plantear la hipótesis de que no hubo aumento, es decir,que H: 1!! = a = 0.40. Para ello establecemos la zona de aceptación.
1.96 Sp 0.40 1.96 Sp
Figura 15.14
Sp= jP(1- p) N-n 0.4 x 0.6 2000 - 400N-I 400 x 2000 - 1n
Sp =0.02
S =0.46 ~ 0.40 0.06
= 33 Cae en la zona de rechazo.0.02 0.02
278 JESUS DE LA ROSA
Rechazarnos la hipótesis nula, existe diferencia significativa. Quiere decir con ello, que efectivamente los comerciantes incrementaron sudemanda de lavadoras.
15.16 TEORlA DE LAS MUESTRAS PEQUEÑAS
Hasta ahora en la estimación del error muestral hemos utilizadola curva normal, porque las distribuciones muestrales de los valores estadísticos son, excepto en algunos casos, normales.
Cuando la distribución muestral de un estadístico X es normal, sabernos que 1.96 sigmas a un lado y otro de la media de esa distribución,comprende el 95'1, de los casos. Por eso podernos afirmar, en ese caso,que el estadístico en cuestión no se aleja de su parámetro en más de1.96 errores típicos. Esto no lo afirmarnos con toda seguridad sino conun coeficiente de riesgo del 5'1" corno dicen los matemáticos, a un nivelde confianza del 5'1, •
Ahora bien, esto no sucede más que en el caso en que las muestrassean grandes, por ejemplo, cuando n = 1000. Cuando las muestras sonpequeñas, por ejemplo, cuando n = S, la distribución mucstral de losestadísticos no es normal. Si tenemos una muestra de n = 200, conuna media de un test X = 40, sabernos que la distribución muestralde esa media es una curva normal que tiene como media la mediaverdadera de la población y como sigma el valor:
SSi( =~;::=::==::.
v' 200 - l
donde S, es la sigma de la muestra. Pero si esa media X = 40 se ha hallado de una muestra aleatoria de n = S sujetos, la distribución muestral de la media no es normal, sino la platicútica, es decir, más aplasiada que la curva normal. En la figura la curva A es normal, la curva Bes platicúrtica.
ESTADISTICA PSICO-EDUCATIVA 279
e M
Figura I5.15
La característica que más nos interesa ahora de las curvas platicúrticas es que los extremos de la curva están más levantados que losde la curva normal, de modo que, siendo ambas curvas simétricas, unmismo punto e de las abscisas limita con la media una porción de máscasos en la curva normal que en la platicúrtica. En efecto, por debajode la media quedan, como se ve en la figura, más casos en la curva Bque en la A: por lo tanto, entre el punto e y la media quedan menoscasos en la curva B que en la A. Supongamos que el punto e es igual a-1.96 sigma, es decir, que está al.96 errores típicos por debajo de lamedia en ambas curvas. Entre M más o menos e, es decir, entre M ±1.96 Si( sabemos que queda el 95% de los casos en la curva normal(curva A); por eso este punto indica el límite del nivel de confianzadel 5%. Pero es evidente que en la curva B, M ± e = M -t 1.96 Sjf nocomprende el 95% de los casos, sino menos. Para comprender el 95%de los casos habremos de separarnos más de la media por ambos lados,supongamos, por ejemplo, que 2.08 Si(. Entonces, en la Curva B, habráque averiguar los valores M ± 2.08 Si( para fijar el intervalo de confianza del 5%.
Pues bien. cuando n es pequeño, las distribuciones muestra1es delos diversos estadísticos son del tipo platicúrtico. Se llaman entoncesdistribuciones de "t ".
280 JESUS DE LA ROSA
En realidad "t" no es más que la razón crítica cuando el númerode casos de la muestra es pequeño.
Cuando n es grande, decíamos que Rc;;' 1.96 para ser significativaal 5% de confianza. Cuando Rc se halla en muestras pequeñas, se llama"t", y entonces diremos que "t" es significativo al nivel del 5% cuandotenga un valor que se aleje de la media en tantos signos como sea necesario para comprender el 95% de los casos. Ese valor dependerá, claroestá, de la forma de la distribución de "t" será muy próximo a 1.96 sila forma es próxima a la normal, será tanto más alejado y mayor que1.96 cuando más platicúrtica sea la curva de "t" y más se aleje, porconsiguiente de la normal.
Afortunadamente los matemáticos han averiguado la forma exactade la distribución de "t" en muchos casos, y han construido tablas quenos dan los valores que "t" ha de alcanzar para ser significativa a losdiversos niveles de confianza. Para utilizar estas tablas sólo hay que saber cuantos son los grados de libertad de la "t" que estamos empleando. Porque la forma de la distribución de "t" sólo depende de estosgrados de libertad,
Antes de examinar los métodos correctos del uso de "t" conviene,pues, tener una idea clara de estos dos conceptos: "muestra pequeña"y "grado de libertad".
Se dice que una muestra es pequeña cuando la distribución muestral de sus estadísticos, debido al poco número de casos, se aleja de lakurtosis normal.
La distribución normal de los estadísticos comienza a alejarse dela kurtosis normal cuando n < 100, se va acentuando muy lentamentey llega a ser de importancia cuando n ..;; 30.
En adelante diremos que una muestra es pequeña cuando n < 30.En este caso habrá que utilizar la tabla "t" cuando queramos apreciarla significación o fiabilidad de los estadísticos. Cuando n > 30 consideraremos que la muestra es grande y utilizaremos la tabla normal pararesolver esos problemas. Adviértase que esto se refiere tan sólo al problema general de cuando utilizar la tabla normal y cuando la tabla "t",no quiere decir que basta siempre con emplear 30 sujetos para obtenerresultados suficientemente representativos y precisos. Es evidente que
ESTADISTICA PSICO-EOUCATlVA 281
30 sujetos son pocos sujetos si con ellos queremos, por ejemplo, representar una población de varios miles. No obstante, no diremos que esuna muestra pequeña, porque para apreciar la significación y fiabilidadestadística de sus resultados, no basta con utilizar la tabla normal, lacual nos dirá que, en efecto, los resultados obtenidos en muestras deese tamaño son poco fiables. Ya hemos advertido, por otra parte, quemuchos valores estadísticos, por ejemplo, las proporciones y los porcentajes, las correlaciones, etc., son muy poco fiables a menos que seempleen muestras de 200 sujetos o más.
Quede, pues, en claro que sólo consideramos que una muestraes pequeña cuando n < 30. Pero que esta no tiene nada que ver con elproblema de cuántos casos hemos de utilizar para que los resultadossean suficientes estables y precisos. Sólo indica que cuando n < 30tenemos que recurrir a "t".
En segundo lugar, decíamos que la forma de la distribución de"t" depende de los grados de libertad.
Se llaman grados de libertad al número de da tos que puedan variarindependientemente. Por ejemplo, si decimos: fórmese un conjunto detres números cualesquiera. Ese conjunto tiene tres grados de libertad,porque hay tres datos que pueden variar independientemente. Así,puede formar el conjunto: { 1,2, 3} ó el conjunto: {lO, 20, 50},u otro cualquiera, pudiendo variar a capricho los tres datos.
Si se trata de un conjunto de tres datos que tiene que sumar 40,entonces ese conjunto sólo tiene dos grados de libertad, porque sólopueden variar independientemente dos datos, ya que el tercero vienedeterminado por la condición de que entre los tres sumen 40. Así, lostres datos pueden ser 10, 18 Y 12, podemos variar a voluntad dos deesos datos, por ejemplo, poner 20 en lugar de 10 Y 3 en lugar de 18,pero entonces no podemos variar de cualquier modo el tercer dato,sino que está determinado por los otros dos, que ha de ser necesariamente 40 - (20 + 3) =17.
En general un conjunto de datos tiene tantos grados de libertadcomo dimensiones en las que sus datos pueden variar independientemente. A veces no es fácil saber exactamente el número de grados delibertad que tienen los datos de un problema concreto. Afortunadamente los matemáticos han resuelto estas cuestiones en la mayoría
2B~ JESUS DE LA ROSA
de los casos concretos que se pueden presentar en Psicología. En lossucesivos, daremos los grados de libertad que corresponden a cada unode los problemas que vamos a tratar.
15.I7 SIGNIFICACION y FIABILIDAD DE LA MEDIA DE UNAMUESTRA PEQUEÑA
Significación
En este caso, salvo pequeñas variaciones, el procedimiento es elmismo que el utilizado con muestras grandes. Sólo se diferencia en doscosas:
1) Hay que tener en cuenta los grados de libertad (gl): y
2) Hay que consultar la tabl a "t".
Pues bien, en el caso de la media, los g.l. son n- 1, es decir, elnúmero de casos de la muestra menos l.
Resolvamos un ejemplo:
Sea una muestra n = 10, que han obtenido en un test una mediaX = II y S =3.6.
Significación.
1) Adoptamos un cierto nivel de confianza vamos a decir un 5~
2) Hallamos el error típico de la media
ss;¡ = --====--
V;--I
3) Hallamos "tOO
3.6----=1.2..¡<)
Xs;¡
_1_1_=911.2 .
4, Consultamos la tahla '" 'o y Yl'IllOS el valor que corresponde a lacolumna 5~, y a la fila (). Es decir, averiguamos el valor que ha
eSTADISTICA PSICO-EDUCATIVA 283
de alcanzar t para ser significativa al nivel del 5~ cuando se hahallado en un grupo de n = 10 sujetos y que, por tanto tiene 9grados de libertad. En la tabla vemos que, para 9 g.l. t =2.262 paraser significativa al 5~.
5. Luego como muestra t = 9.1 ~s mayor que 2.262, afirmamos al5% de confianza que la media X = II es significativamente distintade cero.
Fiabilidad.
Sea el mismo ejemplo anterior:
1.- Adoptamos un nivel de confianza; 5%
2.- Hallamos Si( = 1.2
3.- Hallamos en la tabla "t" cual es el valor que ha de tener "t" paran - I =9 g.l. para ser significativa al 5~ de confianza. Este valor,ya lo hemos visto antes, es t = 2.262. Lo cual significa que en estadistribución "t" hay que ir 2.262 sigmas a uno y otro lado de lamedia para comprender el 95% de los casos, en lugar de 1.96 Si(como ocurriría en la curva normal. Recuerden que esto se debe aque la curva de "t" es platicúrtica y tiene sus extremos más levantados que la curva normal.
4.- Hallamos el error muestral máximo que estamos dispuestos a admitir el 5% de confianza. En la curva normal este error era, al niveldel 5%, 1.96 Si(: en la curva "t", para 9 g.l. será 2.262 Sj( por tanto
E = 2.262 Sj( = (2.262) (1.2) = 2.7 144
Afirmamos, pues, al nivel de confianza del 5% que nuestra mediaX = 11, no viene afectada por un error mucstral superior a 2.7144unidades.
5.- Determinar el intervalo confidencial del 5'".
- -M = X ± 2.262 S¡¡ =X + E = I l + 2.7144 =
13.71H.2H
284 JESUS DE LA ROSA
Afirmamos, al 5% de confianza, que la media verdadera se encuentra entre 8.28 y 13.71.
15.18 SIGNIFICACION DE LA DIFERENCIA ENTRE LAS MEDIASDE OOS MUESTRAS PEQUEÑAS E INDEPENDIENTES.
Los grados de libertad de "t" son en este caso (n l + n 2 ) - 2. Lamejor manera de calcular "t" en este caso es la indicada por Fisher, asaber:
Sabido esto, para comprobar la significación de la diferencia XI X2 entre dos medias XI y X2 hacemos lo siguiente:
1.- Adoptamos un cierto nivel de confianza. Por ejemplo del 5%
2.- Averiguamos "t"
3.- Comparamos el valor "t" averiguando con el que nos dan las tablaspara g.l. = (ni + n2) - 2 Y el nivel del 5%. Si aquel es igualo mayor que éste, concluiremos, al nivel de confianza del 5% que la diferencia es- significativa,
Por ejemplo:
Sean los datos del cuadro siguiente:
Tabla 15.5
2
X
S
n
19.50
2.65
5
15.13
3.20
11
ESTADISTICA PSICO-EDUCATIVA
1.- Adaptamos el nivel de confianza del 5%
2.- Calculamos "t"
19.50 - 15.13
5 (2.65) + 11 (3.2W J [5 + 11(5+11)-2) . J l(S)(I1)
285
3.- En la tabla "t" vemos que para ni + n2 - 2 = 5 + II - 2 =14 g.l., t = 2.145 para ser significativa al 5%. Como nuestra t =2.49 es mayor que 2.145 podemos afirmar, al nivel de confianzadel 5% que la diferencia entre las medias es significativa.
15.19 SIGNIFICACION DE LA DIFERENCIA ENTRE MEDIAS DEMUESTRAS PEQUEÑAS RELACIONADAS
Lo mismo que ocurna en el caso de las muestras numerosas, cuando están relacionados el error típico de la diferencia entre sus mediases menor que cuando son independientes. Por eso no se puede aplicar elprocedimiento anterior.
Este caso es muy importante en la práctica, pues a menudo usamosun mismo grupo de sujetos, o dos grupos relacionados, para averiguar ladiferencia entre ellos con respecto a algunas características, Así, porejemplo, si queremos averiguar cuál de los dos métodos de enseñanza esmejor, conviene aplicarlos en dos grupos de sujetos, pero es evidenteque estos dos grupos deben ser iguales en todo lo que pueda influir enlos resultados: inteligencia, educación previa, ambiente económico, ambiente familiar y social, motivación. cte.
Supongamos que elegimos 8 pares de sujetos. de tal manera que
286 JESUS DE LA ROSA
cada par esté compuesto por 2 individuos que sean aproximadamenteiguales en las mencionadas características. Aplicamos, a continuación,un método de enseñanza a cada grupo, y, después, observamos los resultados del aprendizaje de ambos grupos mediante un test de rendimiento.Sean los datos obtenidos los que figuran en la tabla siguiente:
Tabla 15.6
Par Muestra! Muestra 2 nr. X X2
l 20 16 4 I I2 34 35 - I -4 163 24 22 2 - I I4 37 29 8 5 255 23 24 - I -4 166 35 30 5 2 47 30 27 3 O OS 29 25 4 I I
~ Xl =232 ~ X2 = 208 ~ X2 = 64
XI = 2~2 =29 X2
= 20S = 268
rifSd = ± -S- = 2.82S
Sxd =2.828
1.07; g.l. = 7v8=T
Es evidente que en este caso, aunque los dos grupos estén igualados en inteligencia, por ejemplo, los individuos más inteligentes tenderán a beneficiarse más de cualquier método y por lo tanto habrá unacorrelación entre las puntuaciones obtenidas por los dos grupos en eltest final. Esta correlación, como ya sabemos, rebaja el error típico dela diferencia entre las medias. Hay, pues, que tenerlo en cuenta.
ESTADISTICA PSICQ-EDUCATlVA 287
Uno de los modos de tenerlo en cuenta es calcular la "t" de la diferencia entre los dos grupos, de la manera siguiente:
"t" =__d__ = IX. - X2 '
Sd YS~. + §x¡ - 2 r n Sx¡ Sx¡
es decir, hallando el error típico de la diferencia, como ya sabemos, porla fórmula que aparece en el denominador. Pero para ello tendríamosqu calcular los errores típicos y la correlación, y el resultado no seríaadecuado porque las muestras son pequeñas.
Hay otro método más breve y sencillo, que es el que aconsejamos,por ser, además, el único correcto con muestras pequeñas.
Escríbanse, como se hace en la tabla anterior, los pares de sujetosen dos columnas paraleías. Hállense luego la diferencia entre los dos sujetos de cada par, Las meQias d~ estas diferencias Xd será igual a la diferencia entre las medias X¡ - X¡. En nuestro caso Xd = 3. Ahora sólofalta hallar si esta media es o no significativamente distinta de cero, paraello procederemos como siempre:
\.- Adoptamos un nivel de confianza de 5%
2.- Hallamos el error típico de la media: Sx que será igual a la sigmade la distribución de diferencias.
Sd=j--64
-8- = 2.828 dividida por p
dSx d = ----'''---v"Il=l
3.- Hallamos "t"
2.828 =1 07~.
d 3t = s;¡ =1":07= 2.8
4.- Consultamos en la tabla "t", cual es el valor de "t" significativo alnivel del 5% con n - I =8 -1 == 7 grados de libertad, este valor esde 2.365.
2BB JESUS DE LA ROSA
Afirmamos pues, al nivel del 5% de confianza que hay diferenciassignificativas, lo cual indica que el primer método de enseñanza esmejor que el segundo siempre que los dos grupos examinados sean igua-.les en todo lo demás.
15.20 SIGNIFICACION y FIABILIDAD DEL COEFICIENTE DECORRELACION (r) CON MUESTRAS PEQUEÑAS
La fórmula de t es la siguiente:
n-2
donde r es el coeficiente de correlación de la muestra utilizada y n elnúmero de sujetos.
Los grados de libertad de esta "t" son n - 2.
Por ejemplo: En un grupo de 20 sujetos hemos hallado una correlación r = 0.30 entre un test y un criterio. Deseamos saber si esa correlación es significativa al 5%.
18I ~ 0.09 = 1.355t =0.30 j _,---:-~c;;-
En la tabla de "t" vemos que ésta ha de alcanzar el valor t = 2.101con 18 g.l. para ser significativa al 5%. Como nuestra t es igual a 1.335,no llega a ese valor, no podemos rechazar la hipótesis nula y por lo tanto concluimos que la r = 0.30 no es, en este caso significativa.
Es fácil calcular los valores a que tiene que llegar r para alcanzarlos niveles de significación del 5% Y del 1% con diversos n. Estos valoresfiguran en la tabla que aparece en el anexo correspondiente. Así, porejemplo, vemos en dicha tabla que, para n = 20. como succdfa en elcaso anterior, t tiene que ser igualo mayor que 0.444 para ser significativa al 5% y ser igualo mayor que 0.561 para serlo al 1%.
Dado un. coeficiente de correlación r cualquiera y el número de
288 JESUS DE LA ROSA
Afirmarnos pues, al nivel del 5% de confianza que hay diferenciassignificativas, lo cual indica que el primer método de enseñanza esmejor que el segundo siempre que los dos grupos examinados sean igua-.les en todo lo demás.
15.20 SIGNIFICACION y FIABILIDAD DEL COEFICIENTE DECORRELACION (r) CON MUESTRAS PEQUEÑAS
La fórmula de t es la siguiente:
donde r es el coeficiente de correlación de la muestra utilizada y n elnúmero de sujetos.
Los grados de libertad de esta "t" son n - 2.
Por ejemplo: En un grupo de 20 sujetoshemos hallado una Correlación r = 0.30 entre un test y un criterio. Deseamos saber si esa correlación es significa tiva al 5%•
1.35518
I - 0.09t =0.30 j -,.--~~
En la tabla de "t " vemos que ésta ha de alcanzar el valor t =2.10 Icon 18 g.l. para ser significativa al 5%. Como nuestra t es igual a 1.335,no llega a ese valor, no podemos rechazar la hipótesis nula y por lo tanto concluimos que la r =0.30 no es, en este caso significativa.
Es fácil calcular los valores a que tiene que llegar r para alcanzarlos niveles de significación del 5% y del )%condiversos n. Estos valoresfiguran en la tabla que aparece en el anexo correspondiente. Así, porejemplo, vemos en dicha tabla que, para n =20. como sucedía en elcaso anterior, t tiene que ser igualo mayor que0.444 para ser significativa al 5'1, y ser igualo mayor que 0.561 para serlo al 1%.
Dado un. coeficiente de correlación r cualquiera y el número de
290
2.- Hallamos "t":
JESUS DE LA ROSA
t = (0.77 - 0.68) (J 147 - 3) (J l + 0.84) 3
fi ..¡ 1 - (0.68)2 - (0.77)2 - (0.84)2 + 2 (0.68) (0.77) (0.84)
3.- En la tabla t vemos que para 144 grados de libertad t =2.58 puesto que n ~ 30, la tabla "t" coincide prácticamente con la tabla dela curva normal para ser significativa al 1%. Como nuestra "t" esigual a 3 y, por tanto, mayor que 2.58 afirmamos que la diferencia entre las correlaciones de los dos test con el criterio es significativa al nivel del 1%.
Adviértase que si hubiéramos seguido el método que expusimosen la lección anterior, convirtiendo los r en valores y comprobando lasignificación de la diferencia entre los valores z, esta diferencia no hubiera resultado significativa ni al 10% de confianza. Compruébese ésto,como ejercicio. La razón es que el método de los "z" sólo era aplicable,como dijimos, en caso en que las muestras fueran independientes.
lS.22 SIGNIFICACION DE LA DIFERENCIA ENTRE LAVARIABILIDAD DE DOS MUESTRAS PEQUEÑAS.PRUEBA DE "F"
Ya sabemos que la significación entre la diferencia entre las desviaciones típicas de dos muestras numerosas se halla por la fórmula:
Re = _d_ = --:~lS:::1=-=S::2=1-=.Sd y si + S~
Pero este procedimiento no puede emplearse cuando n .,;; 30 porque la distribución muestral de la sigma de muestras pequeñas no esnormal.
Vamos a exponer a continuación un método aplicable a este caso,que después tendremos ocasión de analizar cuando tratemos el análisisde varianza.
ESTADISTICA PSICO-EDUCATIVA 291
S~F=--S~
Sean dos muestras de variables diferentes, deseamos saber si la diferencia es significativa. Pues bien llamamos "F" a la razón entre dosvarianzas.
Donde Si es la varianza de la muestra 1 y S~ es la varianza de lamuestra 2.
Lo que deseamos saber es si una razón "F", tal y como la hallada entre dos muestras determinadas, es compatible con la hipótesisde que ambas muestras procedan por azar de una única población y,por lo tanto, que sus variabilidades sean estimaciones de una mismavariabilidad y sólo difieren entre sí por azar.
~ x~
nS~ = _=--:::..L__~ xi
nsi =
Cuando se comparan las varianzas de dos muestras, la razón F secalcula poniendo en el numerador la mayor de las dos varianzas.
Por ejemplo: Sean dos muestras. En la primera hay 9 casos ysi = 42.1 yen la segunda 5 casos y S~ = 6.3.
Queremos saber si ambas variabilidades (varianzas) son significativamente distintas.
Calculamos F2:
42.16.3
F2 = ----.,;~-- = 6.68
Ahora lo único que tenemos que averiguar es qué probabilidad hayque en una población surjan por azar dos muestras cuyas variabilidadesden una razón F igualo mayor que 6.68. Si esta probabilidad es grande,no podremos rechazar la hipótesis nula, es decir, no podremos rechazarla hipótesis de que ambas muestras proceden de una única población ode dos poblaciones con la misma variabilidad. Pero si la probabilidad espequeña, por ejemplo, menos del 5%, podremos rechazar la hipótesisnula a un cierto nivel de confianza, por ejemplo al nivel del 5%, y afirmar por consecuencia, a dicho nivel, que las dos variabilidades son distintas.
292 JESUS DE LA ROSA
Los estadísticos Fisher y Snecor han preparado tablas para averiguar esta probabilidad. Las más sencillas y útiles son las tablas de Snecor, en la que vienen datos de los valores que, n ha de alcanzar en cadacaso, F para ser significativa al 5~ y al 1%.
La tabla de F es muy extensa y no fácil de reproducirla. Se puedeconsultar en algunos libros de Estadística. Es una tabla de doble entrada. Las columnas corresponden a los grados de libertad de la varianzamayor (el numerador), y las filas a los grados de libertad de la varianzamenor (el denominador). Estos grados de libertad son siempre n - 1,en nuestro caso 9 - I = 8 y 5 ..c. I == 4.
En el ejemplo tenemos una F = 6.68 hallada en los muestrados de9 y 5 casos respectivamente, es decir, con 8 y 4 grados de libertad.
La tabla F nos indica que para 8 y 4 g.l., la F ha de de ser igualomayor que 6.04 para ser significativa al 5~. Como nuestra F es en efecto mayor que 6.04 concluimos, al nivel del 5%, que las dos variabilidades son distintas y que no proceden por azar de una población única.
15.22 X2 ("Cut" CUADRADO)
En general, X2 ("Chi" cuadrado) es un estadístico que indica ladiscrepancia entre ciertas frecuencias empíricas y las que se hallaríande ser cierta una determinada hipótesis.
Supongamos, por ejemplo, que hemos elegido al azar 90 estudiantes de la Universidad Autónoma de Santo Domingo, concretamentede la Facultad de Humanidades, y hemos averiguado a cuál de estostres profesores prefieren: profesor Díaz Castillo, profesor Enerio Rodríguez Arias y profesora Zoraida Suncar. Los resultados indican que27 prefieren a Díaz Castillo, 35 a Enerio Rodríguez Arias y 28 a Zoraída Suncar. Esto parece indicar que entre los estudiantes de la Facultad de Humanidades tiene más aceptación el profesor Enerio RodríguezArias. Pero esta conclusión puede objetarse bajo el alegato de que quizás las diferencias entre las frecuencias sean debidas al azar y que esposible que, en realidad, la población de estudiantes sea homogéneacon respecto a sus preferencias por los tres profesores. De ser verdadera esa hipótesis, las frecuencias serían 30, 30 y 30 para cada profesor.¿Cómo podemos poner a prueba esa hipótesis?
Dei mismo modo que en las lecciones antciores. Primero hay que
ESTADISTICA PSICO-EDUCATIVA 293
emplear un estadístico que exprese la discrepancia entre los datos empíricos y la hipótesis. Luego, hay que averiguar la distribución muestral de ese estadístico para ver la probabilidad que tiene que surgir alazar una discrepancia tan grande o mayor que la observada en nuestrocaso. Este estadístico es X2 ("chi" cuadrado).
Se halla así:
Donde fe es cada una de las frecuencias empíricas obtenidas en lamuestra, y ft es la frecuencia teórica que le correspondería de ser verdadera la hipótesis que consideramos.
En el ejemplo anterior:
Tabla 15.7
Profesor fe ft fe-ft (fe-ft}2(fe - ft}2
ft
Díaz Castillo 27 30 -3 9 0.300
Enerio Rodríguez 35 30 5 25 0.833
Zoraida Suncar 28 30 -2 4 0.133
90 90 X2 = 1.266
Como se ve X2 es una medida de la discrepancia entre unos datosempíricos y una determinada hipótesis.
Si cada frecuencia empírica fuera igual a su correspondiente frecuencia teórica, X2 ("chi" cuadrado) sería cero. Cuanto más se apartenlas frecuencias empíricas de las teóricas, más grande serán X2. Lo quenos interesa saber de cada caso es la probabilidad que tiene esa discrepancia de surgir por azar en una muestra aleatoria elegida de una población que se distribuya según la hipótesis. Si la probabilidad de una discrepancia tan grande o mayor que la encontrada es muy elevada, nopodríamos rechazar la hipótesis. Si la probabilidad es pequeña, porejemplo, del orden de un 1%, podremos rechazar la hipótesis al 1% de
294 JESUS DE LA ROSA
confianza y afirmar, a ese nivel, que la discrepancia entre los hechos yla hipótesis es significativa.
Hemos calculado Xl del ejemplo, con respecto a la hipótesis deque las frecuencias teóricas fueran iguales. Lo mismo podemos hacercon respecto a cualquier otra hipótesis. Por ejemplo, podemos poner aprueba la hipótesis de que los profesores Díaz Castillo, Enerio RodríguezArias y Zoraida Suncar son preferidos en la población por el 20%, el60% y el 20% respectivamente de los sujetos. De ser cierta esa hipótesisen nuestra muestra de 90 sujetos, los profesores Dfaz Castillo, EnerioRodríguez Arias y Zoraida Suncar, serían preferidos por 18, 54 Y 18 sujetos respectivamente. También podemos calcular Xl en ese caso, y nosindicaría, como en el caso anterior, la discrepancia entre los hechos yesa segunda hipótesis.
En realidad x- nos sirve para expresar la discrepancia entre lasfrecuencias empíricas las frecuencias teóricas de cualquier grupo de 3frecuencias con tal que éstas sumen 90 casos en total. Esto quiere decirque al hacer una hipótesis podemos asignar los valores que queramos ados de estas frecuencias, pero el valor de la tercera viene ya determinado por el hecho de que entre las tres tienen que sumar 90. Por lo tantodecimos que en el caso de tres frecuencias, hay dos grados de libertad.
El concepto de "grado de libertad" es importante porque laforma de distribución de Xl ("chi" cuadrado) depende frecuentemente de los grados de libertad de la tabla de frecuencias en que se halla.
15.24 GRADOS DE LIBERTAD
Antes de explicar la distribución de Xl (vchí" cuadrado) convienedar algunas reglas practicas para determinar los grados de libertad de losdiferentes casos.
En general, los grados de libertad de un conjunto de datos están' fijados por el número de datos que puedan variar independientemente.
El número de grados de libertad de una tabla de frecuencias seráel nümero de frecuencias a los cuales podemos asignar libremente losvalores que queramos, cumpliendo las condiciones externas impuestasa la tabla. Por ejemplo, cuando la única condición que se impone es que
ESTADISTICA PSICO-EDUCATlVA 295
las frecuencias sumen un cierto total,. el número de grados de libertad esuno menos el número de frecuencias. Es el caso del ejemplo anterior,donde teníamos 3 frecuencias y 2 grados de libertad. En otros casos seimponen más condiciones a la tabla de frecuencia y se reducen, por tantOo más considerablemente los arados de libertad.
Por ejemplo, sea la siguiente una tabla de frecuencia:
Tabla 15.8
Solteros Casados Total
Aprobados 186 758 944
Suspendidos 936 120 1,056
Total 1,122 878 2,000
Frecuencias de un grupo de estudiantes solteros y casados, segúnéxito en el estudio.
Acabamos de presentar 4 frecuencias, divididas en dos filas y doscolumnas, tales que cada fila y cada columna tienen un cierto total osuma. Si imponemos la condición de que las sumas de las filas y lascolumnas se mantengan siempre iguales, en el ejemplo anterior sólo seda un grado de libertad.
En efecto, es fácil ver que podemos hacer muchas combinacionesde 4 frecuencias tales que cumplan esa condición (que las sumas de lasfilas y las columnas se mantengan siempre iguales), por ejemplo, las doscombinaciones siguientes:
Tabla 15.9
100 844 944
1022 34 1056
1122 878 2000
296 JESUS DE LA ROSA
Tabla 15.10
200 744 944
922 134 1056
1122 878 2000
Pero al escribir estas frecuencias se observa que sólo podemos variar a voluntad una de las cuatro, las otras ya vienen determinadas porlas sumas de las filas y columnas. Si escribimos 100 en la primera casilla de la primera fila, no tenemos más remedio que escribir 844 en lasegunda casilla de la primera fila para que la fila entera sume 944. Asímismo hemos de escribir 1022 en la segunda casilla de la primera columna, para que el total de esa columna sea 1122. Finalmente hemosde escribir 34 en la última casilla de la segunda fila para que las sumasde las segundas ñlas y la segunda columna sean respectivamente, 1056 Y878.
Igualmente, si en la otra tabla escribimos 200 en la primera casilla,hemos de escribir 744, 922 Y 134 en las otras tres para mantener invariables las sumas de las filas y columnas. Vemos pues, que en esta tablaIe frecuencia sólo hay un dato que puede variar independientemente y'ibremente. Sólo hay un grado de libertad. En general, en una tabla defrecuencias de doble entrada, los grados de libertad son iguales al produeto de (f - 1) (c - 1), donde "f" es el número de filas y "e" es eliümero de columnas.
Para el caso de 2 filas y 2- columnas;
Grados de libertad = (f - 1) (e - 1)=(2 - 1)(2 - 1) =1
La tabla de "chi" cuadrado es una tabla de doble entrada, por unlado tiene grado de libertad y por otro los diferentes niveles de confianza. Por ejemplo si tenemos 5 grados de libertad, vemos los diferentesvalores de X2 ("chi" cuadrado) a distintos niveles de confianza. Vemosque X2 ("chi" cuadrado) es superior a 6.064 en el 30% de las muestrasaleatorias, de ser cierta la hipótesis sometida a prueba mediante X2 , yque X2 es superior a 11.070 es el 5% de tales muestras.
STADISTICA PSICO-EDUCATIVA 297
Si en una muestra de frecuencia de 5 grados de libertad obtenemosun X2 ("chi" cuadrado) de 6.064, sabremos por consiguiente, que deser cierta la hipótesis que estamos comprobando, una discrepancia tangrande o mayor ocurriría por mero azar el 30% de las veces. En estecaso X2 ("chi" cuadrado) no sería significativo y no podríamos rechazar razonablemente la hipótesis en cuestión. Si en los 5 grados de libertad, X2 es igual a 11,070, las tablas nos dicen que una discrepanciatan grande o mayor que la obtenida entre la hipótesis y los datos, sólotiene una probabilidad del 5% de ocurrir por azar. Por consiguiente, rechazamos, al nivel de confianza del 5%, la hipótesis considerada.
15.25 PRUEBAS DE INDEPENDENCIA
Las pruebas de independencia que pueden resolverse mediante eluso de X2 ("chi" cuadrado) son muy frecuentes en Pedagogía y en Psicología. Esas pruebas se refieren a aquellas situaciones en que deseamossaber si dos variables o atributos están o no relacionados. La lógica deestos casos consiste, primero, en suponer que no hay correlación; ensuponer que las dos variables o atributos son independientes, y, segundo, en poner a prueba esa hipótesis.
Sea por ejemplo, el caso de frecuencias de un grupo de estudiantes,solteros y casados, según éxito o fracaso en el estudio.
Tabla 15.11
Solteros Casados Total
186 758 944Aprobados
(530) (414)
936 120 1056Suspendidos (592) (464)
1122 879 2000
La hipótesis que deseamos poner a prueba es que no hay ningunarelación entre el estado civil (soltero o casado) y el éxito en el estudio.Si fuera esto cierto, entre los estudiantes aprobados habría el mismo nú-
298 JESUS DE LA ROSA
mero de solteros que casados e igual sucedería con los suspendidos. Ennuestro caso tenemos 2000 sujetos, 1122 solteros y 873 casados. Esdecir, 1122/2000 de la muestra son solteros. Si no hubiera ningunarelación entre el estado civil y el éxitoen el estudio, encontraríamos lamisma razón 1122/2000 de solteros entre los aprobados y entre los suspendi tos, Es decir, entre los aprobados que son 944, habría 1122/2000x 944 igual a 530 solteros, y entre los suspendidos, que son 1056, habríá 1122/2000 x 1056 igual a 592 solteros.
Esas frecuencias teóricas aparecen debajo de las empíricas, entreparéntesis, en las casillas respectivas. Según esto, vemos que entre losaprobados hay 186 solteros (frecuencia empírica). y tendría que haber(de ser cierta la hipótesis de que el éxito en los estudios. y el estadocivil no guardaran ninguna relación), 1530 (frecuencia teórica). Lomismo ocurre en las demás casillas. Puesto que hay 878/:!000 de lamuestra total que son casados, de no existir relación alguna entre estado civil y éxito en el estudio, habríamos de esperar que hubiera lamisma proporción de casados entre los que han aprobado y entre lossuspendidos. Es decir (878)(944)/2000 igual a 144 casados entre losaprobados y (878)(1056 )/:!OOO igual a 464 casados entre los suspendidos.
Todas esas frecuencias teóricas se hallan mediante la fórmulageneral:
donde ft = frecuencia teórica en una determinada casilla
k ff = suma de todas las frecuencias teóricas de la fila en que estádicha casilla.
2: fc = suma de todas las frecuencias empíricas de la columna en queestá dicha casilla.
n = numero de casos de la muestra.
Así, para averiguar la frecuencia teórica correspondiente a la casilla de la primera fila y la primera columna.
ESTADISTICA PSICO-EDUCATIVA
(944) (1122)
2000530
299
La frecuencia teórica de una casilla se calcula, pues, dividiendo porel número total de casos el producto de la suma de la fila por suma de lacolumna en que está dicha casilla.
Adviértase que las frecuencias teóricas deben dar las mismas sumasen filas y columnas que las frecuencias empiricas. Por consiguiente, entablas de cuatro casillas sólo es preciso calcular una sola frecuencia teórica: las demás se obtienen por sustitución de la primera casilla de la primera fila es 530, la de la segunda casilla será 944 - 530 igual a 414.
Una vez halladas las frecuencias teóricas (f t), se calcula X2 mediante la fórmula:
ft
en nuestro caso:
x2 = (186 - 530)2530
+(758 - 414)2
414
Para ver la significación de X2 = 964.04 consultamos la tabla X2 ,
en la fila de un grado de libertad que es el que tiene la tabla de frecucncia del ejemplo que estamos tratando. En la tabla X2 ("cili" cuadrado)vemos que una discrepancia entre una hipótesis y ciertos datos tan grande o mayor que la indicada por un "chi" cuadrado X2 igual a 6.635sólo tiene un 1~ de probabilidad de ocurrir por mero azar. Como nuestro X2 C'chi" cuadrado) es igual a 964.04, es decir, muchísimo mayorque 6.635. la discrepancia y los datos tienen mucho menos probabilidad del I~ de ocurrir por mero azar. Luego podemos rechazar la hipótesis de independencia entre estado civil y éxito en los estudios. a unelevadísimo nivel de confianza.
Como acabamos de ver. la prueba de X2 ("chi" cuadrado) nos per-
300 JESUS DE LA ROSA
mite afirmar que ambas variables están relacionadas. No indica, sin embargo, el grado de correlación.
Cuanto mayor sea X2 ("chi" cuadrado) más es la confianza conque podemos afirmar que ambas variables (estado civil y éxito en losestudios) están relacionadas.
Otro ejemplo;
Supóngase que en una muestra aleatoria de 150 alumnos entre loscuales hay 80 niños y 70 niñas, 56 de los varones resuelven correctamente un determinado elemento de un test, mientras que sólo 34 hembras lo resuelven correctamente. ¿Pueden estos datos surgir de una población en la que haya la misma proporción de niños que de niñas queresuelven correctamente dicho elemento? Es decir, ¿hasta qué puntoson compatibles esos datos con la hipótesis de que dicho elemento es independiente del sexo? Para comprobar esa hipótesis mediante X2 ("chi"cuadrado) procedemos así:
1.- Ordenamos los datos en una tabla de 4 casillas:
Tabla 15.12
Varones
Hembras
TOTAL
Correcto
56 (48)
34 (42)
90
Incorrecto
24 (32)
36 (28)
60
80
70
ISO
2.- Calculamos la frecuencia teórica que correspondería a la casillaprimera, de ser cierta la hipótesis de independencia.
n
(80) (90)ISO 48
Escribimos 48 entre paréntesis debajo de 56, y calculamos las demás frecuencias teóricas restando de los totales marginales lasfrecuencias teóricas ya conocidas.
ESTADiSTICA PSICO-EDUCATIVA
3.- Calculamos X2:
301
(fe - ft) 82 82 82 82
X 2 = ~ -=--f-t---=-~=---;¡s + 32 +~ + ---z8 = 7.14
4.- Consultamos la tabla X2• Vemos que con un grado de libertad,
X2 es igual a 5.412 al 5% y X2 es igual a 6.635 al 1%. Como nuestro X2 es igual a 7.14 es mayor que 6.635, podemos afirmar, aun nivel de confianza superior al 99% que existe diferencia significativa entre los resultados obtenidos en el test entre varones. Esdecir, rechazamos la hipótesis de independencia para afirmar queel sexo ha tenido que ver con los resultados a alcanzar en la prueba.
15.26 PRUEBAS DE HOMOGENEIDAD
A las pruebas de independencia se les puede considerar, desde otropunto de vista, como pruebas de homogeneidad. Probar que dos variables, como sexo y respuesta a un test, son independientes, equivale aprobar que las respuestas de ambos sexos al test son homogéneas, esdecir, semejantes, que lo mismo de bien responden los varones que lashembras.
Volvamos al primer ejemplo de esta lección. Una muestra aleatoriade 90 estudiantes había manifestado sus preferencias por uno de los tresprofesores. Los docentes Díaz Castillo, Enerio Rodríguez Arias y Zoraida Suncar había sido preferidos por 27. 35 y ':::8 alumnos. Queremosahora comprobar si estos resultados son compatibles con la hipótesis deque la población de estudiantes es homogénea con respecto a sus preferencias por los tres profesores.
Para resolver el problema, planteado en el párrafo anterior, podemos recurrir al X2 ("chi" cuadrado), de acuerdo al procedimiento siguicnte: Sea esta la tabla de preferencia.
Tabla 15.13
Docentes
Díaz CastilloEncrio- AriasZoraida Suncar
No. de estudiantes que lo prefieren
273528
:\ = 90
302 JESUS DE LA ROSA
\.- Calculamos las frecuencias teóricas que se obtendrán en la hipótesis de homogeneidad de frecuencia. Puesto que hay 90 sujetos ytres profesores, esas preferencias serían 30,30 y 30. Cada profesorsería igualmente preferido.
2.- Calculamos X2 = ~ (fe - ftf 1.266ft
3.- Averiguamos los grados de libertad del caso. Como hay tres frecuencias que tienen que sumar 90 en total tenemos 2 grados delibertad.
4.- Consultamos la tabla X2. Vemos que, para 2 grados de libertad,
X2 ha de ser igual a 5.991 para ser significativo al 5%. Como nuestro X2 es menor, no podemos rechazar la hipótesis de homogeneidad. No es que hayamos probado que la hipótesis sea cierta, sinoque afirmamos que los datos no nos permiten rechazarla con suficiente garantía. Una discrepancia entre las frecuencias empíricas y las que se obtendrían de ser verdadera la hipótesis de igualpreferencia por los tres profesores, tan grande o mayor que la obtenida, ocurriría por azar, incluso si la hipótesis fuera cierta, conmás del 5% de muestras aleatorias; ocurriría en más de un 30% delas muestras aleatorias (esta última afirmación puede comprobarse en la tabla X2
) . Es tanta, pues, la probabilidad de alcanzar esadiscrepancia por azar que, sin pretender haber probado que hayasurgido casualmente, no podemos rechazar esa hipótesis a un nivel de confianza suficiente.
Otro ejemplo:
Supongamos que una escuela tiene 4 aulas, con 100, 140, 70 Y90 alumnos cada una. En la escuela se está realizando un estudio delas actitudes del conglomerado, incluyendo, por ejemplo, la actitudcon respecto a las relaciones entre maestros y alumnos.
Supongamos que en esos cursos 70, 90, 50 Y60 alumnos respectivamente, manifiestan descontento en relación con ese punto. Nos preguntamos, ¿indican esos datos un estado de descontento homogéneoen toda la escuela o hay diferencias entre los cursos? Esa cuestión puede resolverse mediante el uso de X2 ("chi" cuadrado) de la siguientemanera:
ESTADISTICA PSlCO-EDUCATlVA 303
1.- Hágase la tabla de frecuencias, con las empíricas y las teóricas:
Tabla 15.14
Cursos2 3 4
.Descontentos 70 90 50 60 270(67.5) (94.5) (47.25) (60.75)
Conformes 30 50 20 30 130(32.5 ) (45.5) (22.75) (29.25)
100 140 70 90 400
Las frecuencias teóricas se calculan empleando la fórmula ya conocida:
100 x 270400 67.5
2.- Se calcula
(50 - 47.25)2+ 4725
(50 - 45.5)2+ 45.5
(94.5 - 90)2
+
94.5
(32.5 - 30)232.5
(30 - 29.25)2+ '29.25
(70 - 67.5)67.5
(60.75 - 60)267.5
(22.75 _ 20)222.75
+
+
x2 = 1.465
La tabla 15.14 tiene tres grados de. Iibertad, pues son 2 filas y 4columnas. g.l. = (f - 1) (e - 1);: I x 3 =3.
304 JESUS DE LA AOS~
3.- La tabla X2 indica que, con tres grados de libertad, X2 = 7.815al nivel del 5%. Como nuestra X2 no llega a ese valor, no podemosrechazar la hipótesis de homogeneidad en toda la empresa con respecto a la actitud examinada. El que la actitud con respecto a lasreacciones entre profesores y alumnos sea homogénea en toda laescuela no quiere decir naturalmente, que haya el mismo númerode contentos que de descontentos, sino que la razón entre ellos,cualquiera que sea, es aproximadamente la misma en todos loscursos. Para ver, en cada curso, si el número de alumnos contentos, podríamos utilizar los procedimientos ya conocidos de significación de proporciones o bien aplicar de nuevo X2
•
Por ejemplo, para poner a prueba la homogeneidad del primer curso con respecto a las relaciones entre profesores y estudiantes, tendríamos que comparar las frecuencias empíricas de descontentos y contentos, 70 y 30, respectivamente, con las teóricas que habrán de obtenersecon la hipótesis de homogeneidad, que serían, claro está, 50 y 50.
Tabla 15.15
PRIMER CURSO
fe ft fe-ft (fe-f¡)2(fc-fd
fc
Descontentos 70 50 20 400 8
Contentos 30 50 20 400 8
X2= 16
Lstc X2 tendría un grado de libertad, pues, hay dos frecuenciasque tienen que cumplir con la condición de menor de 100. por lo quesólo una de ellas puede variar indcpcndicn temen te,
En la tabla X2' vernos que. con un grado de libertad X2 = 16 esSignificativo muy pcr encima del 1"0, Por consiguiente. rechazamos lahipó tesis de hom'ogcneidad a un elevado nivel de confianza. afirmando
EST ADISTICA PSICO-E DUCATIVA 305
a ese nivel que el número de estudiantes descontentos es significatiyamente superior al número de estudiantes contentos.
15.27 OBSERVACIONES PARA EL USO DE X2
("CHI" CUADRADO)
La prueba de X2 ("chi" cuadrado) debe emplearse sólo cuando elnúmero total de casos sea superior a 50, y no haya ninguna frecuenciateórica inferior a 5. Cuando esto último sucede. y hay suficientes casillas en la tabla de frecuencia, conviene reunir dos o más categorías enuna. hasta conseguir que ladas las frecuencias teóricas sean superioresa 5.
Se habrá advertido, además, que la tabla de >:2 sólo se refiere acasos del I a 30 grados de libertad. Ello es debido a que cuando los grados de libertad son más de 30, se puede usar la tabla normal, convirtiendo previamente X2 a su valor equivalente con unidades típicas de la curva normal, mediante la fórmula:
s =~ -,¡2I1=l
donde "s" significa un valor típico, es decir, en unidades sigma. y "n"significa los grados de libertad. Por ejemplo. supongamos que X2 = 30,en un caso que tiene 40 grados de libertad.
s = ..J'f.X'í-y 2n - I =J 2 (3W -y 2 (40 - 1) = -1.14
Ahora bien. la probabilidad de superar al azar un valor dado de X2
es la misma que tiene una medida seleccionada al azar de una poblaciónnormal de estar situada a la derecha del punto -1.14. Si consultamos latabla normal vemos que esta probabilidad es de 87.29%, es decir, 37.29'1,+ 50%. Es evidente que teniendo tanta probabilidad de surgir por azar.no podemos decir que X2 = 30 con 40 grados de libertad, sca significativo.
En general. cuando X2 tenga más de 30 grados de libertad, se hacelo siguiente:
1.- Se convierte X2 en S. por la fórmula:
s=~-J 2n-1
ESTADISTICA PSICO-EDUCATIVA 305
a ese nivel que el número de estudiantes descontentos es significatiyamente superior al número de estudiantes contentos.
15.27 OBSERVACIONES PARA EL USO DE X2
("CHI" CUADRADO)
La prueba de X2 C'chi" cuadrado) debe emplearse s610 cuando elnúmero total de casos sea superior a 50, y no haya ninguna frecuenciateórica inferior a:; Cuando esto último sucede, y hay suficientes casillas en la tabla de frecuencia, conviene reunir dos o más categorías enuna. hasta conseguir que todas las frecuencias teóricas sean superioresa 5.
Se habrá advertido, además, que la tabla de X 2 s610 se refiere acasos della 30 grados de libertad. Ello es debido a que cuando los grados de libertad son más de 30, se puede usar la tabla normal, convirtiendo previamente X2 a su valor equivalente con unidades típicas de la curva normal, mediante la fórmula:
s =~ -.J2i1=T
donde "s" significa un valor típico, es decir, en unidades sigma. y "n"significa los grados de libertad. Por ejemplo, supongamos que X2 = 30,en un caso que tiene 40 grados de libertad.
s =vnxr-y2l1"=1 =J :2 (30)Z -.y :2 (40 - 1) - -1.14
Ahora bien. la probabilidad de superar al azar un valor dado de X2
es la misma que tiene una medida seleccionada al azar de una poblaciónnormal de estar situada a la derecha del punto - 1.14. Si consultamos latabla normal vemos que esta probabilidad es de 87.29%, es decir, 37.29%+ 50%. Es evidente que teniendo tanta probabilidad de surgir por azar.no podemos decir que X2 = 30 con 40 grados de libertad, sea significativo.
En general. cuando X 2 tenga más de 30 grados de libertad. se hace
lo siguiente:
1.- Se convierte X 2 en S. por la fórmula:
S=~-J 2n-1
ESTADI5TICA P5ICO-EDUCATIVA
EJERCICIOS
307
r5.1 Supóngase que las alturas de 3000 estudiantes de una universidad se distribuyen normalmente en media de 68 pulgadas y desviación ttpica de 3 pulgadas. Si se toman 80 muestras de 25 estudiantes cada una ¿cuál será la media y la desviación tipica esperada de la distribución muestral de medias resultantes?
15.2 En cuántas pulgadas del problema 1 cabria esperar una media (a)entre 66.8 y 68.3 pulgadas(b) menor que 66.4 pulgadas.
15.3 Los métodos de una elección demostraron que el candidato delgrupo UNER obtuvo el 46 por ciento de los votos. Determinar laprobabilidad de que entre 200 estudiantes elegidos al azar de entrela población votante se hubiera obtenido una mayoria de votospara dicho candidato.
15.4 La desviación tipica de los pesos de una población de estudianteses de la libras. Se ex traen muestras de 200 estudiantes cada unade la población y se calculan las desviaciones tipicas de los pesosde cada muestra.a) Halle la media de las desviaciones tfpicas de las muestras.b) Halle la desviación tfpica de la distribución muestral de las des
viaciones tipicas.
15.5 Al medir el tiempo de reacción, un psicólogo estima que la desviación tipica del mismo es de 0.05 segundos. ¿Cuál será el númerode medidas que deberá hacer para que sea de un 95 por ciento laconfianza de que el error de un sistema no excederá en 0.01 segundos?
15.6 Supongamos que hemos seleccionado la estatura de 100 estudiantes de la UA.S.D., como una muestra aleatoria simple. La mediade la muestra es 68 pulgadas. La desviación ttpica de las estaturasencontradas en la muestra es de 2 pulgadas. Encuentre la alturamedia de los 28 mil estudiantes de la 1J.A.S.D. con una confianzade un 95 por ciento.
308 JESUS DE LA ROSA
15. 7 A continuación calificaciones de examen de admisión de :lOO estudiantes primeros en presentar examen.
Calificaciones No. de Estudiantes
OY menos de 20 15
20 Y menos de 40 45
40 Y menos de 60 70
60 Y menos de 80 50
80 Y menos de 100 20
n =200
Encuentre la media esperada de las calificaciones de todos los estudiantes que se presentaron a examen.
15.8 Un grupo pol itico en una población grande desea conocer el porcentaje de electores que votarán por cierto candidato. Una muestrade 400 electores ha sido tomada al azar. La muestra arroja que 140electores votarán por ese candidato. Estimar el porcentaje de rotosesperado a Sil [arar en las elecciones generales.
15.9 Una muestra de 60 estudiantes varones del departamento de Educación Fisica de una universidad, tiene una estatura media de 69.5pulgadas con U/la desviacion ttpica de 3 pulgadas. Otra muestra de40 estudiantes varones del Departamento de Lconomia en la Universidad, tiene una estatura media de 68.4 pulgadas COII una desviacion t ipica de 2 pulgadas. <;Hay diferencia significativa entre lasestaturas medias a niveles de 1 por cientr. de significacion'
151OSuponga que le ha preguntado a 35U trab iiadores docentes en relación con sus salarios mensuales COIllO un.i muestra al azar de UII sistema de 20,000 trabajadores de la el/se/lanza. Los resultados de suspreguntas están tabuladas más abajo. Estime la media de la población de los salarios ganador por los maestros mediante intervalo deconfian:a de un 95 por cielito.
fSl'ADISTICA PSICO-E DUCA TI VA
Salario Mensual No. de maestros
309
S50 a menos de S70 50
$ 70 a menos de S90 70
S90 a menos de S I1 O 125
SIIOam('JIIJ.\' úe SIJO 75
S IJO a mCI/IJI úe S 150 JO
Total = 350
J5/1 Un alumno realiza 111/ test de 70 cuestiones de ti!)() falso -verdadero adivinando las respuestas a cada una. Ob ticnc una puntuaciánde 45. .Dificr« este resultado signiflcativumente de! que se esperaria por cfcct«¡ de! azar:'
15. 12A 200 niños de ambos scxc»: se les dio a probar IIl1a nueva marcade chocotatc .\' H' les pidió que expresaran Sil preferencia. lIe aqu {los resultados
Aceptación No aceptación
[ Hembras J4 46
Varo/les 72 48
)'1' diferencian signiflcutívamente las preferencias de los dos sexossespecto a la aceptacurn o no de la nueva marca de chocolate,
IJ13.1 una muestra grande const itu (da por 200{) alumnos de liceo seprcgun u¡ si estaban o no conforme con la declaración "no debepermitirse que los esludian tes se organicen para luchar contra la11'.1 r e! orden", LIJs resultados de ambos sexos se tabularon porseparado .1' fueron tos siguientes:
310
Varones
Hembras
Conforme
360
290
JESUS DE LA.ROSA
No conforme
640
710
¿Difieren significativamente las opiniones entre los dos sexos?
15.14A 200 jóvenes, cuyas madres unas tenian estudios superiores yotras no, se les preguntó si estaban o no de conformes acerca delcomportamiento actual de la juventud. Los resultados fueron lossiguientes:
Madres con estudios superioresMadres sin estudios superiores
Conformes
3884
No confonnes
1266
¿Existe alguna relación con la formacián de las madres, las respuestas dadas?
1515 En una encuesta realizada en República Dominicana entre profesores universitarios se hizo la siguiente pregunta: ¿considera ustedbeneficioso laparticipación estudiantil en el gobierno universitario?Tabuladas las respuestas por universidad se obtuvo la distribuciónsiguiente:
Conformes Indecisos No conformes
UA.S.D. 150 25 25
UN.P.H.U 40 30 80
UC.M.M. 50 30 50
UC.E. 10 5 15
Contrastar la hipótesis de que la inconformidad de los entrevistados no tiene relación alguna con la Universidad donde trabajan los mismos.
PARTE VMETODOS DEEIPERIMENTACIIN ESTAIIITICAS
XVI
ANALISIS DE LA VARIANZA
16.1 ANALlSIS DE LA VARIANZA SIGNIFICACION
El experimento ideal en todas las ciencias es aquel en que semodifica una variable llumuda independiente y se observan los cambios que en cunsccucncia se producen en otra variable llamada dependiente. Así, para avcriguur la influencia de la temperatura en la longitudde metales, se somete un metal a varias temperaturas (variable independiente) y se observa la longitud (variable dependiente) que correspondea cada temperatura. Este tipo de experimento requiere que todas lasvariables puedan influir en la longitud se mantengan constantes durante el experimento y solo se modifique la variable independiente bajoestudio.
En materia de Psicología y de Pedagogía es difícil. y a menudo,imposible conseguir estas condiciones. Si se desea investigar. por ejemplo, cual de de dos métodos de la enseñanza es el mejor. no basta conaplicarlos a dos grupos y observar los resultados. porque en éstos influyen tambicn otros factores, conviene utilizar algún método que permita conocer la influencia de cada uno en los resultados. Tal es el fin d eanalisis de varianza. El análisis de varianzas pcrmite resolver dos clasesde problemas:
,) El comprobar la significación cstad istica ,1<: las diferencias entre' lasmedias de varios grupos. l.n este sentido cs una aplicación de losmétodos de la razón crrtica y de' "t", expresados en caprtulosanteriores.
314 JESUS DE LA ROSA
b) El comprobar la influencia relativa de diversas variables independientes y de sus interacciones mutuas cuando en un experimentointervienen dos o más variables de ese tipo.
El caso más sencillo podemos ilustrarlo con el siguiente ejemplo.Se tratar de investigar la bondad relativa de cuatro métodos para enseñar una cierta tarea o lección. Supongamos que tenemos a nuestra disposición 20 sujetos. Probamos al azar 5 sujetos con cada método y, alfinal, les aplicamos un examen en el que se obtienen las siguientespuntuaciones.
Tabla 16.1
PUNTUACIONES EN EL EXAMEN FINAL
A B C D
7 6 4 33 7 2 44 10 5 53 8 I 46 5 3 2
L 23 36 12 18
X 4.6 7.6 2.4 3.6
Vemos que [as medias de los cuatro grupos son distintas. Lacuestión es si son suficientemente distintas o si sus diferencias puedenfácilmente atribuírselos al azar.
Esta es la aplicación más sencilla del análisis de varianza, muyútil por cierto. en numerosos casos prácticos. Por ejemplo, cuandoqueremos investigar la influencia de varias intensidades de iluminaciónen la fatiga ocular: cuando deseamos investigar las influencias de tiposde relaciones humanas en el grado de satisfacción en el trabajo, etc.
16.2 LA LOGICA DELANALlSIS DEVARIANZA
Es muy sencilla. Volvamos al ejemplo de la tabla 16.1. Tenemos20 sujetos divididos en 4 grupos de a 5 sujetos cada grupo. Cada grupoha sido sometido a un método distinto de aprendizaje obteniendo ciertos resultados.: ¿Cómo averiguar si los grupos (es decir, los métodos)
ESTADISTICA PSICO-EDUCATIVA 315
son distintos entre sí? Sencillamente, viendo si las diferencias halladasentre grupo Y grupo son suficientemente mayores que las diferenciashalladas dentro de cada grupo. Si no lo son, quiere esto decir, que lossujetos varían tanto cuando son sometidos al mismo método comocuando son sometidos a métodos diferentes, en cuyo caso está claroque no hay razón para atribuir sus variaciones a las diferencias entre losmétodos, dichas variaciones se debieron simplemente a la variabilidadde los sujetos.
Si las diferencias entre los grupos son suficientemente mayoresque las diferencias dentro de cada grupo, quiere decir que la simplevariabilidad que los sujetos muestran, cuando son señalados con unmismo método, no explica suficientemente las variaciones observadasde un grupo a otro y, por tanto, siel experimento ha sido bien preparado, habrá que atribuir estas variaciones a lo que distingue a los gruposentre sí; en nuestro ejemplo, a los métodos de la enseñanza.
En resumen, lo que hemos de hacer es comparar la variabilidadde los grupos entre sí (variabilidad intcrgrupo), con la varibilidad delos sujetos dentro de cada grupo (variabilidad intragrupo). Y comola varianza es un índice de la variabilidad, lo que se hace, en fin decuentas, es comparar la varianza intergrupo con la varianza intragrupo.
16.3 EL DESARROLLO MATEl\IATICO DEL ANALISIS DEVARIANZA
Hemos visto que el análisis de varianza consiste, en esencia, en dividir la variación total de los resultados en dos partes, la debida a la variabilidad de los sujetos dentro de los grupos y la debida a la variabilidad de los grupos entre sí.
Vamos a ver ahora cuáles son los fundamentos matemáticos de este método.
Después. indicaremos la manera práctica de ordenar los cálculos.Finalmente aplicaremos esas ideas a varios ejemplos concretos. Supongamos una muestra de N sujetos dividida al azar en r grupos de n sujetos cada unos: N = nr. Cada grupo es sometido a una situación distintay cada sujeto obtiene al final, el resultado X. Estos resultados varíanen torno a una media total Xl.: los resultados de cada grupo i varíanen torno a la media del grupo Xi. Así:
316 JESUS DE LA ROSA
x = una variablen = número ele casos en cada grupor = número de gruposN=; nr, número total de casos
M; = media total
du = X¡ - Xt = diferencia entre la media de un grupo y la mediatotal.
Consideramos un grupo cualquiera:
x = X- X txi =X - Xi
x = xi + di
Elevando al cuadrado:
Sumando los valores X2
de todos los n sujetos del grupo:
,- 2 _ Y 2 + "X d 12 - y X 2 ",1 "X d2- Xi - - (Xi - ¡ i + ( i ) - - i +_ui':" i + n i
Como 2: xi = O
v 2_," ,2+ ,,2- Xi - ~:Xi n U¡
Lo mismo ocurre en cada grupo: luego sumando los X2
de todoslos sujetos de todos los grupos:
(1)
l.xuminamos cada uno de los tres términos de esta fórmula, Sonmuy importantes en l'I an~llisis de varianza.
ESTADISTICA PSICO -F: DUCATIVA
El primero de ellos es:
n1: ¿; Xl
317
Se le llama suma de cuadrado total o variabilidad total, indica lasuma de los cuadrados de las diferencias entre cada valor y la media total y expresa la variación total ele los :, sujetos en torno a dicha mediatotal.
El scgu ndo es:
n r2.:
n- 2
¿ (Xi - Xt )
Se le llama suma de cuadrado intragrupo, indica la suma de loscuadrados de las diferencias entre cada valor y la media de n grupo yexpresan la variación de los sujetos dentro de cada grupo.
El último término es:
r 2;:. d. = n
1
Se le llama suma de cuadrados intergrupo, indica la suma de loscuadrados de las diferencias entre la media de cada grupo y la total(multiplicada esta misma por n l. y expresa la variación n de los sujetosgrupo a grupo en torno a la media general.
Hemos demostrado un importante teorema del análisis de varianza: "cuando una muestra de N sujetos l'st<1 dividida en r grupos de nsujetos cada uno. la suma ele cuadrados total. representativa de lavariación total de los sujetos, es igual a la suma de cuadrados intragrupomás la suma ele cuadrados intcrgrupo".
16.4 MEDIA CUADRATlCA INTRAGRUPO
Supongamos que los N casos agotan toda la población. Entoncestendremos r muestras aleatorias de n sujetos ea da una, tules que nr =N.
318 JESUS DE LA ROSA
Sabemos que:
r n 2L LX
r n 2 rL LXi + n L di (1)
Que también puede escribirse:
(2)
Si dividimos (2) por N = nr:
N
F n -2 I __ 2L L (X - Xi) L (Xi - Xü
n r r(3)
El primer término de (3) será la varianza de la población ya quehemos supuesto que N e, el número total de sujetos de la población.
El segundo término de (3) puede escribirse:
I r___ '5'r ~
n - 2L (X - Xi)
n
Por donde se ve equivale a hallar la varianza de cada grupo.
- 2L (X - Xi)
n
Sumamos todas esas varianzas de los grupos y dividimos el resultado por r. Es decir, ese término expresa la varianza media de todos losgrupos, a lo que llamaremos.
El tercer término de (3) indica la varianza de las medias de n entomo a la media de la población, es decir, indica el cuadrado del error
ESTADISTICA PSICO-EDUCATIVA 319
típico de la media, S~, pues ese error típico es, como ya sabemos, ladesviación de la distribución muestral, la cual, a su vez, es la distribución de las medias de muestras aleatorias del mismo número de casosen tomo a la media de la población.
Por consiguiente (3) puede escribirse:
(4)
Peto2
2 S PoboSx=--- (5)
n
Luego sustituyendo (5) en (4)
2
2 2 Sp bS =S +_0_Pob m n
S2 (n - 1)Pob-n-
S2 2 nPob = Sm ( n _ l
Como, por otra parte, sabemos que
nrresulta:
r n _ 2
L L (X - X)S2 = ~_......:..._
ro
r n _ 2
2 n L L (X - Xi)Spob+ nr(n-l)
r n - 2L L (X - Xj)
r (n - 1) (6)
La fórmula (6) indica la manera de hallar la varianza de la población en el caso en que N abarque la población total.
320 JESUS DE LA RDSA
En el caso, mas frecuente, en que la muestra total N no agote lapoblación, el segundo mie~nbro de (6) es tan solo una estimación de lavarianza de la población Spob.
r n _ 2
L L (X - Xi)
r (n - 1)(7)
Se le llama MEDIA CUADRATICA INTRAGRUPO, por ser unamedia de los cuadrados de las diferencias entre los sujetos DENTROde cada grupo. Cuando N no abarca la población total, (7) es una estimación de la varianza de la población basada en r (n-I) grados de libertad.
16.5 LA MEDIA CUADRATICA INTERGRUPO
Ya hemos visto que cuando N es toda la población, entonces:
Pero también
Tenernos que:
Por tanto:
r _ 2L (X¡ - X)
r
2
Spobn
2 2Spob = n S¡¡
r __ 2
n L (X¡ - Xj)
r
(8)
(lO)
Volvamos a nuestro ejemplo: Tenernos 20 sujetos, cada uno conun resultado en el examen final; dividirnos en 4 grupos de 5 sujetos cadauno. Querernos saber si las medias de los grupos son significativamentedistintas entre sí. Para ello formularnos la hipótesis nula y vernos a qué
ESTADISTICA PSICD-EDUCATIVA 321
nivel de confianza podemos trabajar. La hipótesis nula consiste, eneste caso, en suponer que los 4 grupos de resultados son muestras aleatorias de una misma población común y que, por tanto, las diferenciasentre ellas no se deben más que al azar. De ser cierta esa hipótesis esevidente que la media cuadrática intcrgrupo será igual, excepto por azar,que la media cuadrática intragrupo, pues ambas, como se ha demostrado, son estimaciones de una y la misma varianza de la población. Paracomprobar la hipótesis nula sólo tendremos por consiguiente, que ver siestas dos estimaciones de la misma varianza son o no significativamentedistintas. Y, como lo que nos interesa particularmente es averiguar si lamedia cuadrática intergrupo es significativamente mayor que la intragrupo, eso es lo que concretamente haremos.
Para ello dispondremos los datos de la siguiente manera:
Tabla 16.2
TABLA DE ANALISIS DE VARIANZA
Grado deLibertad
(1)
Fuente devariación
lntergrupo
(2)
Suma deCuadrados
(3) (4)
MediaCuadrática
r _ _ 2
N ~ (Xi ~ Xt )
(5)
Intragrupor _ 2
~ N (X - Xt ) r (n - 1)
r n _ 2
~ ~ (Xi - X)
r(n-})
TotalN 2~ (X - Xt ) N - 1
2En la columna (4) tenemos las dos estimaciones de Spob basadas
en la variación intergrupo e intragrupo. Para ver si la primera es significativamente mayor que la segunda procedemos como sigue: Si es igualo menor la primera que la segunda no hay que seguir; resulta evidenteque no es significativamente mayor. Si es mayor hallamos F, dividiendola media cuadrática intergrupo por la intragrupo. Luego, interpretamoseste cociente mediante la tabla F, por la 'que averiguamos que valorhabrá de alcanzar F con r - 1 y r (n - 1) grados de libertad, para ser significativo al 5~ o al 1% . Si la F de nuestro caso es igual o mayor que
322 JESUS DE LA ROSA
ese valor, rechazamos la hipótesis nula al nivel de confianza del 5% odel 1% .
Tal es, en esquema,la lógica del análisis de varianza. Veamos ahoracómo se produce en la práctica.
16.6 ANALISIS DE VARIANZA EN LOS COMPONENTES
Según lo expresado anteriormente, el análisis de varianza serealiza en dos fases. La primera consiste en hallar las sumas de cuadrados, los grados de libertad y las medias cuadráticas. La segunda en hallarel cociente F entre la media cuadrática intergrupo y la media cuadráticaintergrupo y la media cuadrática intragrupo.
La única parte que exige cálculos laboriosos es la que se refiere alas sumas de cuadrados. La manera más rápida y sencilla es hallar estassumas de cuadrados es la que exponemos a continuación; primero, en general; luego en forma práctica, y finalmente, aplicada a un caso concreto.
16.7 CALCULO DE LAS SUMAS DE CUADRADOS
Total ; (X _ Xt)2 = ~X2_ (f ~2N
Demostración:
N N- N N 2 LX LX
-2XtLN=LX +N-N- N
nLX
-2-l--LX=N
n 2 NLX n 2 2
2 '<¡'F 2 LXLX -+-'~-2-'''"~-=LX ---N--
ESTADISTICA PSICO-EDUCATIVA
Intergrupo:
323
[
n 2( ~X)
n
Demostración:
r n 22 r -2 -2 r
(~ X)n ~ (Xi - Xt) =n~ (XI + Xt - 2 Xt Xi) =~n
n2
n n 2 n 22 (~ X) ~ X)
+nr(~ X)
2I
~I
N2 N N
n 2 &X)2~X)
~1 1----N N
Intergrupo
Total - Intergrupo
16.8 ORDENACION PRACTICA DE LOS CALCULOS
lro. Fórmese la tabla de los resultados X, con tantas columnas comogrupos, tantas filas como individuos en cada grupo.
2do. Hállense las sumas de las filas y columnas, la suma total ~ Xha de ser coincidencialmente igual a la suma de las filas y a la sumade las columnas.
3ro. Hállese la suma de los cuadrados de los valores de cada columna:
4to. Hállese la suma de los cuadrados de todos los valores:
324
n n2do. Hallamos ~ X en cada columna y ~ x total
n~ X=89
JESUSDE LA AOSA
n3ro. Hallamos ~ X
2 en cada columna o grupo, y sumando todasesas sumas parciales:
n 24to. Hallamos ~ X = 497
Sto. Hallamos el término de corrección
2(89)20
396.05
6to. Hallamos la suma de cuadrados total:
n 2(~ X)
I
N
7mo. Hallamos la suma de cuadrados intragrupo:
n 2(~ X)
N
n 2(~ X)
I
N
(23i (36)2 (12)2 (18)2-5- + -5- +-5- +--5- - 396.05
=458.60 - 396.05 =62.55
Sum~ de cuadrados Total .- Suma de cuadrados intergrupos,
ESTADISTICA PSICO-EDUCA TlVA
Sto. Hállese el término de corrección:
6to. Hállese la suma de cuadrados total:
325
n 2(~ X)
N
7mo. Hállese la suma de cuadrados intragrupos:
Suma de cuadrados Total -Suma de cuadrados intergrupos.
r 2(~ X)
1
n
n 2(~ X)
1
N
8vo. Hállese la suma de cuadrados intragrupos:
Suma de cuadrados Total -Suma de cudrados intergrupos.
16.9 APLlCACION DE UN EJEMPLO CONCRETO
Sea el ejemplo anteriormente citado
Ira. Formamos la tabla de los resultados
Tabla 16.3
A B C D 3X7 6 4 3 20
3 7 2 4 164 10 2 5 21
3 8 I 4 16
6 5 3 2 16
:E X2
:!3 36 12 18 89~ X 119 274 34 70 497
326
Total - Intergrupo = 100.95 - 62.55 = 38.40
JESUS DE LA ROSA
Una vez halladas las sumas de cuadrados, ordenamos los resultados en una tabla de análisis, como sigue:
Tabla 16.4
(1) (2) (3) (4) (S)
Fuente de Suma de G.L. Medias FVariación Cuadrados CuadráticasIntergrupo 62.55 3 20.85 8.69Intragrupo 38.40 16 2.40Total 100.95 19
En la columna (1) escribimos las fuentes de variación, que en estetipo sencillo de análisis de varianza se reduce a dos: la variación entrelos grupos (intergrupo) y la variación entre los individuos dentro decada grupo (intragrupo). Por eso se llama a este tipo de problemas,ANALISIS EN DOS COMPONENTES.
En la columna (2) escribimos las sumas de cuadrados respectivos,
En la columna (3) se escriben los correspondientes grados de libertad. Así, a la suma de cuadrados intergrupo, como hay r =4 grupos.corresponden r - l =3 grados de libertad. A la suma de cuadrados intragrupo, como hay r =4 grupos, cada uno con n - 1 = 4 grados de libertad, le corresponden (n - 1) = 16 grados de libertad.
La suma de la columna (2) debe dar la suma de cuadrados total.La suma de la (3) debe dar el número de grados de libertad de la muestra total, que son N - 1 = 20 - I =19, pues hay N datos que varían entomo a una media total Xt; la cual al usarse como estimación de un 'parámetro n (la N) resta un grado de libertad.
La columna (4) resulta de dividir los valores correspondientes delas columnas (2) y (3).
S610 queda, ahora, hallar F:
ESTADISTICA PSICO-EDUCATIVA 327
_..;;;2..:.,0:..;;.8_S_F= 2.4 8.69 con 3 y 16 grados de libertad.
Según la tabla de F, con 3 y 16 grados de libertad, F=S.29 parasignificativa al 1%. Como nuestra F = 8.69, es menor que este valor, defenderemos su significación a un nivel superior 1%, al cual rechazamos,por consiguiente, la hipótesis nula.
Concluimos, pues, que las diferencias entre los grupos no se debenal azar.
¿A qué se deben? Eso depende de cómo haya sido preparado elexperimento. Si los grupos son homogéneos en todo, excepto en elmétodo con que han sido enseñados, esas diferencias se deberán a ladiversa eficacia de los distintos métodos.
Podemos concluir que los diferentes métodos son distintos entresí. Pero, ¿lo son todos? Esto es otro problema. Puede que F resultesignificativo debido a las diferencias entre 'un grupo y todos los demás;o a combinaciones. Una vez probado que las diferencias entre los gruposno pueden razonablemente ser atribuidos al azar, podemos pasar acomprobar cuales son las diferencias significativas entre los pares degrupos que nos interesen. Para ello utilizaremos la conocida técnicade "t".
16.20 EL USO DE "t" COMO CONSECUENCIA DE UN ANALISISDE VARIANZA
Como ustedes saben para comprobar la significación de la diferencia entre las medias de dos grupos, se usa "t" según la fórmula:
donde:
328 JESUS DE LA ROSA
Saben ustedes, que: Sx =J ~2. Ahora bien, la media cuadrática intragrupo es precisamente, como hemos mostrado, la media de lasvarianzas de todos los grupos, y, si suponemos que la varianza de grupoa grupo s610 varía al azar, resulta la mejor estímación que podemoshacer acerca de la varianza de la población; así:
Sx S~obN
media cuadrática intragrupon
2.405
En nuestro ejemplo:
Sr. =j--=-=-=-=--- = 0.693
Este es el error típico de cualquiera de las medias de nuestro ejemplo. Por consiguiente, el error típico de lasdiferencias entre dos mediascualesquiera de este ejemplo será:
s- - =js~ + s- = ~ =s- r; =(0.693)(1.41)XI- X2 Xl X2 V" "XI XI V L
=0.98
Ahora no queda más que dividir por 0.98 cualquiera diferenciaque queramos examinar y ver si la "t" resultante, con 16 grados delibertad (lo mismo que la media cuadrática intragrupo usada) es o nosignificativa.
Así, la diferencia entre los grupos A y D, da un "t".
0.981.02
ESTADISTICA PSICO-EDUCATIVA 329
Como, según la tabla "t" ésta ha de ser igualo mayor que 2.12para ser significativa al 5%, resulta que no podemos rechazar la hipótesis de que las dos muestras resultadas A y O proceden de una mismapoblación de resultados y su diferencia se deba al mero azar.
En general, como sabemos que "t" tiene que ser, en este ejemplo,por lo menos igual a 2.12 para alcanzar el nivel del 5% podemos hallaruna vez para siempre, cuál es el valor que tiene que alcanzar la diferencia entre las medias de dos grupos cualesquiera para ser significativa al5%:
Xi -Xk0.980
Por tanto:
Xj - Xk ~ 2.12 x 0.98 = 2.08 para ser significativa al 5%.
La diferencia de los 6 pares de grupos que en nuestro ejemplo pueden hallar son:
XB - Xll = 2.6 t
XA-XC = 2.2 t
XA - XO = 1.0
XB - XC = 4.8 t
X8 - XO = 3.6 t
XD - Xc= 1.2
Son significativas, al 5%. las diferencias de medias señaladas con
En general, el método 13 parece ser el mejor de todos.
330 JESUS OE LA ROSA
16.21 OTRO EJEMPLO DE ANA LISIS 00 VARIANZA EN DOSCOMPONENTES:
Supongamos el siguiente caso: 'tenernos 4 medicamentos que, se-gún los prospectos publicitarios, combaten la fatiga intelectual. Supon-gamos, además, que disponemos de 40 sujetos. Los dividimos al azar en5 grupos de 8 sujetos cada uno, y asignamos al azar un medicamento acada uno de los primeros 4 grupos, sometiendo al quinto a una supuestamedicación que en realidad consiste en agua coloreada y otra substanciaconocida como inofensiva y sin efectos, Después del período oportunode medicación se someten todos los grupos a cierta prueba de resisten-cia a la fatiga intelectual y se obtienen los siguientes resultados:
Sujetos 2 3 4 5 Suma
14 16 2 7 5 44
2 16 7 10 10 9 52
3 3 10 9 10 10 42
4' 10 4 13 13 7 49
5 9 7 11 3 12 42
6 10 23 9 11 17 70
7 21 12 13 7 14 67
8 17 13 9 11 " 72
LX 100 92 76 7' 96 436
L X2 1472 1312 806 718 1368 5676
Los pasos que hay que dar para efectuar el análisis de varianza son:
lro.) La tabla
N2do.) " X =436...
NJro, ) " X2 =
N4(0,) " X2 = 5676
ESTADISTICA PSICO-EDUCATIVA 331
5to.)(436)2
40 =4752.4
6to.) Suma de cuadrados total:N 2
~ X2 - (1: X) = 5676 _ 47524 = 9236N ..
7mo.) Suma de cuadrados intergrupo:
± (iX)2 __ ~ X2_ (I00~2 + (92)2 + (76)2 + (72)2 + (96)2
n N - 8
- 4752.4 = 77.6
8vo.) Suma de cuadrados intragrupo:
Total - Intergrupo = 923.6 - 77.6 = 846
Esos resultados se ordenan en la tabla 16.5 que aparece a continuación:
Tabla 16.5
Fuen te de Sumas de g.l. Medias FVariacion Cuadrados Cuadráticas
Intcrgrupo 77.6 4 19.40 <1
lntragrupo 846.0 35 24.17
Suma 923.6 39
La suma de cuadrados intcgrupo tiene 4 grados de libertad. pues elnúmero de grupos l.:S r = 5. y sabernos que sus grados de libertad (g.l)son r - l. La suma d... cuadrados int ragrupo tiene 35 grados de libertad,¡JUl'S hay r =5 grupos y cada uno tiene n =1\ casos. y sabemos que susg.l.sonrln 1I =5U~- 1)=35.
332 JESUS DE LA ROSA
Como la varianza intergrupo es menor que la intragrupo, resultaclaro que no puede ser significativamente mayor, y, por consiguiente,no podemos atribuir las diferencias entre los distintos grupos a lo quees propio de cada uno de ellos (el medicamento) sino a las simples variaciones que experimentan los individuos en fatiga intelectual inclusocuando son sometidos a una misma medicación y aún, cuando no sonsometidos a ninguna.
Declaramos, pues, que las diferencias entre los diversos medicamentos, incluso el falso o reconocidarnente inoperante, no son significativas. Añadamos que éste es un ejemplo ficticio. En realidad, los valoresde cada grupo han sido elegidos al azar de una distribución normal.Cosa que ha comprobado, como hemos visto, el análisis de varianza,pues según él no podemos rechazar la hipótesis de una misma poblacióncomún de la que procedan al azar todos los resultados.
El análisis de varianza se puede aplicar a muchos casos de muy variada índole. Los ejemplos anteriores representan el caso más sencillo.Con las ideas antes expuestas le será fácil al estudiante indagar por sucuenta otros casos más complejos en los textos correspondientes deEstadística, por ejemplo, en el libro de A. L. Edwards "ExperimentalDesign In Psychological Rescarch", New York, Rinchart. 1951. Unaexposición elemental de varios ejemplos eoncretos pueden verse en Mariano Yela: "Observaciones Sobre el Análisis de Varianza", Revista dePsicología General y Aplicada. Madrid, J954, vol. IX, números 30 y 31.páginas 363-382.
xvn
DISEÑO EXPERIMENTAL
17.1INTRODUCCION
En este capítulo, ofreceremos, a grandes rasgos, la naturaleza yfunción del diseño experimental en psicología y educación. Nuestropropósito es presentar en forma esquematica los elementos básicos queenvuelven el diseño de experimentos en el contexto de la investigación.Una mayor información al respecto se puede encontrar en textos especializados en la materia.
La disciplina Estadística presenta tres dimensiones: la primera serefiere a la descripción de observaciones con el fin de resumir hechos yencontrar las características de los grupos; la segunda, está relacionadacon la función de la estadística como inferencia acerca de las hipótesiscientíficas tomadas de las observaciones, y por último, la tercera dimensión, de la cual se ocupa la estadística moderna, se refiere al diseño deexperimentos con el fin de elaborar inferencias apropiadas.
El diseño experimental proporciona el método para probar lashipótesis y puede ser definido como el procedimiento para alcanzarinformación científica mediante la recolección de nuevas observacionesbajo condiciones controladas. Indudablemente, el concepto control esel que distingue la experimentación de cualquier otra forma de investigación en las ciencias de la conducta. Control éste que puede asumirla forma de manifestación con el fin de cambiar deliberadamente losvalores de la variable, o puede asumir la forma contraria de constantepara prevenir cualquier cambio de la variable.
334 JESUS DE LA ROSA
El propósito inmediato del diseño experimental es el de prevenirhechos del conjunto experimental, y el final es el de generalizar lasrelaciones de la variable. Es conveniente señalar que cuando nos referimos a la experimentación en la investigación de las ciencias de la conducta, nos estamos refiriendo a una situación de investigación, en lacual uno o más factores son cambiados sistemáticamente de acuerdo aun plan preconcebido, con el fin de determinar los efectos de estos cambios.
17.2.1 VARIABLES
Un experimento envuelve la comparación de diferentes tratamientos entre sí. Esto conlleva la creación convencional de dos grupos, unollamado "grupo experimental" y el otro, "grupo de control". El grupoo grupos experimentales, son expuestos a la influencia de los tratamientos (T) o factores considerados, mientras que el grupo de control no sele expone a la influencia de dichos factores. El juego experimental estáen determinar las diferencias o similitudes, cambios, etc., que aparecenen el grupo experimental al contraste con el de control. Dentro de esejuego, el experimentador puede o no manipular ciertos elementos. Estosson variables.
El concepto de variable es lo contrario de constante, es decir, deaquella característica que se mantiene igual en las unidades que se observan. Por tanto, podemos definir la variable como una característicaque toma diferentes valores en las distintas unidades observadas. Estodo aquello que cambia, apareciendo como cantidad, cualidad, atributo, característica, etc. En investigación experimental tenemos diferentes tipos de variables, que son denominadas independientes, dependientes, organicistas, interventoras, discretas, continuas y externas o extrañas.
17.2.2 VARIABLES INDEPENDIENTES YVARIABLES DEPENDIENTES
La variable independiente es aquella que es manipulada por el investigador. A la vez, para ciertos propósitos de investigación, la variable independiente se puede considerar como aquella que clasifica lasunidades observables, La variable que es observada con el fin de ver
ESTADISTICA PSICO-EDUCATIVA 335
qué le sucede como resultado de la manipulación, es denominada variable dependiente. En otras palabras, estas son las variables que se espera que cambien, aquellas que reflejan los efectos de la investigación.Un ejemplo sencillo puede ayudamos a clasificar la diferencia entreestas variables, Supongamos que planeamos un experimento para estudiar el efecto del refuerzo positivo sobre la ejecución de una unidadde álgebra en estudiantes de último año de Secundaria, En este experimento, la variable manipulada por el experimentador serra el refuerzo positivo, con el fin de observar los efectos de esa manipulación sobre la ejecución de álgebra. Por tanto, la variable independiente seriael refuerzo positivo, y la ejecución de álgebra (puntuaciones de unaprueba de álgebra), la variable dependiente.
17.2.3 VARIABLES ORGANICISTAS yVARIABLES INTERVENTORAS
Las variables organicistas u orgánicas son aquellas que caracterizan las formas en las cuales un grupo particular de organismos cambia.Esas caracterrsticas no pueden ser manipuladas por el experimentador. Por ejemplo, las observaciones al medir la estatura de un grupo deindividuos se describen como variables orgánicas. Edad, sexo o raza,en cuanto a la medida de sus caracterrsticas, son ejemplos claros deese tipo de variable.
Las variables interventoras son aquellas que no pueden medirsedirectamente y que aparecen en el proceso del experimento entre lacausa y el efecto. Ese tipo de variables pueden crear problemas al experimento, por lo que deben ser neutralizadas con el diseño experimental apropiado. En nuestro ejemplo anterior, la ansiedad que puede aparecer en la imposición del refuerzo positivo sobre la ejecución de álgebra, podría considerarse como una variable interventora.
17.2.4 VARIABLES DISCRETAS YVARIABLES CONTINUAS
Ese tipo de clasificación es utilizado principalmente en las escalasde medición (nominal, ordinal, intervalo, proporción) y se denominanvariables de medición numérica. La variable discreta es aquella quetoma ciertos valores en el rango de medición, mientras que la variable
ESTADISTICA PSICO-EDUCATIVA 335
qué le sucede como resultado de la manipulación, es denominada variable dependiente. En otras palabras, estas son las variables que se espera que cambien, aquellas que reflejan los efectos de la investigación.Un ejemplo sencillo puede ayudamos a clasificar la diferencia entreestas variables. Supongamos que planeamos un experimento para estudiar el efecto del refuerzo positivo sobre la ejecución de una unidadde álgebra en estudiantes de último año de Secundaria. En este experimento, la variable manipulada por el experimentador sería el refuerzo positivo, con el fin de observar los efectos de esa manipulación sobre la ejecución de álgebra. Por tanto, la variable independiente seríael refuerzo positivo, y la ejecución de álgebra (puntuaciones de unaprueba de álgebra), la variable dependiente.
17.2.3 VARIABLES ORGANICISTAS yVARIABLES INTERVENTORAS
Las variables organicistas u orgánicas son aquellas que caracterizan las formas en las cuales un grupo particular de organismos cambia.Esas caracterfsticas no pueden ser manipuladas por el experimentador. Por ejemplo, las observaciones al medir la estatura de un grupo deindividuos se describen como variables orgánicas. Edad, sexo o raza,en cuanto a la medida de sus características, son ejemplos claros deese tipo de variable.
Las variables interventoras son aquellas que no pueden medirsedirectamente y que aparecen en el proceso del experimento entre lacausa y el efecto. Ese tipo de variables pueden crear problemas al experimento, por lo que deben ser neutralizadas con el diseño experimental apropiado. En nuestro ejemplo anterior, la ansiedad que puede aparecer en la imposición del refuerzo positivo sobre la ejecución de álgebra, podría considerarse como una variable interventora.
17.2.4 VARIABLES DISCRETAS yVARIABLES CONTINUAS
Ese tipo de clasificación es utilizado principalmente en las escalasde medición (nominal, ordinal, intervalo, proporción) y se denominanvariables de medición numérica. La variable discreta es aquella quetoma ciertos valores en el rango de medición, mientras que la variable
ESTADISTICA PSICO-EDUCATIVA 337
Sin embargo, Skinner, mantiene la premisa de que las hipótesis noson necesarias en el estudio científico; su método se puede denominar"científico informal", debido a que no establece reglas de juego: "cuando a usted le interesa una cosa, deje todas las demás, y estüdiela". Esametodología, como sólo involucra amplio dominio del área específicadel conocimiento, requisito necesario también en el método formal, nose estudiará en este capítulo. Referencia sobre ese punto de vista pueden tomarse de la obra "A Case History in Scientific Method" del mismo Skinner.
17.3.2 HIPOTESIS: NULA O ALTERNA E HIPOTESIS DEINVESTIGACION
Las hipótesis como una declaración o manifestación acerca de unparámetro, se pueden expresar como nula o alterna. La hipótesis nulaes aquella que no diferencia entre grupos y es formulada generalmentecon el propósito ·de ser rechazada, Se representa con el símbolo Ho.Cualquier prueba estadística de una hipótesis es esencialmente unapruebas de hipótesis nula, ya que la prueba estadística nos informa solamente la probabilidad de que una diferencia ocurra al azar. La hipótesisalterna es lo contrario, en términos operacionales, a la hipótesis nula;viene dada por la hipótesis de investigación, que es la predicción de hechos derivados o basados en una teoría o investigaciones previas. Porejemplo, si pensamos que la media de una población, en cuanto al número de accidentes que ocurren, es igual a la media de otra población,las hipótesis pueden expresarse así:
Hipótesis alterna: a, : flA =I=]lB
Hipótesis nula: H1 : ]lA = ]lB
Por tanto la hipótesis de investigación viene dada operacionalmente por la hipótesis alterna.
17.3.3 SIGNIFICACION ESTADISTICA
La hipótesis nula y alterna no pueden ser enunciadas sin acompafiar el nivel de significación que el investigador propone para su estudio.Ese nivel de significación, en psicología y educación, es aceptado al 5~.
338 JESUS DE LA ROSA
Los niveles predeterminados para rechazar la hipótesis nula 5% ó 1%sonesenciales y determinantes en las pruebas de hipótesis. Cuando rechazarnos éstas con un nivel de significación o dé importancia de un 5%. estarnos indicando que las diferencias encontradas entre dos medias, porejemplo, son el resultado de un error de la muestra en más de 5 en 100aplicaciones del experimento. En otras palabras, estamos rechazandola hipótesis nula con un 95% de fidelidad o de significación. Ese 5% delárea de una curva normal designado por el nivel de significación es dividido igualmente entre las dos colas o extremos de la distribución (véasefigura 17.1). Esto es debido a los valores extremos de las medias de lasmuestras sobre cualquiera de las partes de la media supuesta o hipotética que podría resultar en él rechaza de la hipótesis.
La decisión del experimentador de tornar un nivel de significaciónde un 1%o 5% depende del problema que se va a investigar. El primernivel debe ser usado cuando el estudio conlleva decisiones muy drásticas como por ejemplo, una investigación con el fin de implantar un nuevo método de enseñanza en todas las escuelas de una región o país.
El proceso de rechazar o aceptar la hipótesis nula (Ho) para aceptar o rechazar la hipótesis alterna (H1 ) puede producir dos tipos deerrores conocidos como error tipo 1 o error ~ (alfa) y error tipo 11 oerror P(beta).
2.5% del área
Región deAceptación
95%
2.5% del área
Valor hipotético de la media de una población
Figura 17.1
ESTADISTICA PSICO-EDUCATIVA 339
Esos errores se producen debido a que no sabemos con certezasi los parámetros representan completamente toda la población o universo. Esos dos tipos de errores se pueden observar en la tabla 17.1 queaparece más abajo:
Tabla 17.1
POSIBLES RESULTADOS DE LAS HIPOTESIS
Situaci6n Actual de las Hipótesis
Decisión al investigador Verdadera Falsa
Rechazo de la Hipótesis Error Tipo 1 Correcto
Aceptación de la Hipótesis Correcto Error Tipo 11
En esa forma podemos decir que el error tipo 1 aparece cuando serechaza la hipótesis nula, siendo verdadera. Por ejemplo, cuando un investigador rechaza una hipótesis al nivel del 5%, está corriendo un 5% deriesgo de rechazar lo que podría ser explicado por error muestral cuando es probablemente verdad. El error tipo 11 aparece cuando se aceptala hipótesis, siendo falsa. El problema de reducir y controlar las probabilidades de esos dos tipos de errores no es nada fácil: reduciendo elriesgo del error tipo 1, se incrementa el riesgo del error tipo 11. A su vez,la probabilidad de cometer un error tipo 1 es la misma que el nivel designificación. Si por ejemplo, podemos reducir el nivel de significacióna un 1%, tenemos solamente la probabilidad de rechazar una hipótesisverdadera de l en 100, pero por supuesto, al reducir el nivel de significación se incrementa el riesgo de aceptar una hipótesis falsa. La probabilidad de caer en un error tipo II envuelve la relación del valor actualdel parámetro, pero al no conocer su valor real, contiene otra hipótesisalterna.
El procedimiento clásico para la reducción de los dos tipos deerrores, consiste en incrementar el número de elementos o sujetos de lamuestra n; y a su vez, las diferentes pruebas estadísticas a través de lapotencia de una prueba, que no es sino la probabilidad de rechazar lahipótesis nula Ro cuando es falsa, proveen las posibilidades para contra-
340 JESUS DE LA ROSA
rrestar los dos tipos de errores. La potencia de una prueba viene dadapor la siguiente expresión:
P=I-13
fJ = BetaP=Potencia
En otras palabras, si tenemos a el! (error tipo 1) como constante,podemos incrementar la potencia de una prueba por el aumento del número de observaciones en la muestra. En conclusión, el investigador estábien protegido contra el error tipo 1,pero tiene poca protección contrael error tipo 11.
t7.3.4 PRUEBA 00 HIPOTESIS ESTADlSTlCAS:
Las pruebas de hipótesis más importantes, serán discutidas en forma teórica y sinóptica. A su vez, es conveniente, antes de entrar en elcontexto teórico de las inferencias sobre hipótesis, que el lector regreseal capítulo 14 (Inferencias y Errores), con el fin de entender los procedimientos utilizados.
Las propiedades inferenciales de cada estadístico serán expresadasde la siguiente forma, resumiendo a Glass y Stanley:
a) Formulación de las hipótesis nula y alterna;
b) M'anifestación·de las suposiciones y prueba estadística utilizada;
e) Valores críticos para probar la hipótesis nula; y
d) Elaboración de los intervalos de confianza o significación sobre elparámetro.
A continuación presentamos 9 pruebas de hipótesis diferentes, deacuerdo a las características de nuestras inferencias:
Prueba1: Inferencias sobre la media de una población (M).
a) Hipótesis a probar: la media de una población es igual a algún número real:
Ho : M=aH1 : M*a
ESTADISTICA PSICO-EDUCATIVA 341
M= Media.a = Número real.n = Muestra.
S =J!f!~• ., N - 1
I t=~/~ I(1)
b) Suponemos que la X tiene una dilltribuci6n normal en la muestrade la población, por lo que no es necesario conocer el valor de 17:. H« esprobada mediante el test t:
,
e) Los valores críticos para probar Hu al nivel a; de significación COl!
la prueba estadística t. son:
-1 - (a/z)"-' y 1 - (a/z)'O-O.
d) El intervalo de confianza 100(1 - a)% sobre la media es:B.
M + 1 - (<</z)'·-',¡y¡
Prueba 2. Inferencias sobre la diferencia entre dos medias de la poblacién cuando utilizamos muestras independientes.
a) Hipótesis:H«: MI - M2 =0]J. : MI - M2 #00
b} Suponemos que X. está normalmente distribuida con una media}t. y una varianza r.y X" está también normalmente distribuida con unamedia 1-'2 y la misma varianza 17:. La prueba estadística utilizada para probar 80 frente a H. es:
(2)
r.•. == Estimaciones de las muestras de las poblaciones 1 y 2 de la varianza común cr::
e} Valores criticos:-1- (<</2)101"'2- 2 Y1 - (<</2) tn l + 0 2 - 2
d) El intervalo de confianza 100(1 - «) % sobre la diferencia entrelas dos medias (l-" - /L2) es:
(M. - M2) ± 1 - (<</2)101+ 0 2- 28.......
342 JESUS DE LA ROSA
MI - M2 =0MI - M2 *0
Prueba 3. Inferencia sobre las diferencias entre dos medias de la población cuando utilizamos muestras dependientes.
a) Hipótesis:
b) Suponemos que las muestras l y 2 son escogidas al azar de unapoblación normal con la misma varianza u~. Las muestras son dependientes, como por ejemplo, hijos-hijas, esposo-esposa, antes-después, etc. Laprueba estadística utilizada es:
ti1=--::-=
Slj-../il
d =~(Xl ~ X.)
s, = J ~[(Xl - X.)
" !).-I
dJ'
e) Los valores críticos son:
-1 - (<</2)ln- 1 y 1- (a/2)ln- 1
d) El intervalo de confianza o significación 100(1 - a)% es:
- t ~d ± l - (a/2) n-lvJi
Prueba 4. Inferencias sobre la varianza de una población (u;).
a) Hipótesis:H. : u; = aH1 : u; =F a.
b) Suponemos que la variable independiente X tiene una distribuciónnormal en la población y a su vez, que la muestra al azar de n número deobservaciones, ha sido seleccionada de la varianza a estimarse. La pruebautilizada es:
(4)._~(X-M)·
X-¡ ñ-l
e) Los valores criticos son:
- 1 - (a/2)x~_¡ y 1 - (a/2)x~_1
d) El intervalo de confianza 100(1- a)% es:
-- 1)8; (n - I)S.17 /'0-,-;'-- < ~ < (aj?)X"-¡
n- . 1\--
ESTADISTICA PSICO-EDUCATIVA 343
Prueba 5. Inferencias sobre la varianza de una población sobre lavarianza de otra población (r./~) cuando utilizamos muestras independientes.
a) Hip6teais:H. : r. ;:; a:n, : r.*a:.
b) Suponemos que las observaciones en cada grupo 'son independientes y provienen de una distribución nonnal. La prueba estadfstica es:
r (S) F=~ Ie) Los valores criticos o tablas son:
~'- 1-«/2 Jll-l,n2,-I,y l _ (a/2)Fft 1- l ,n2- 1
~;:; v.a: ::: 11.
d) El intervalo de confianza 100(1 - a) % se representa así:
F •ex/2 nl-l,n2_1~<~<1 exI2)~-1 n2-~1:1;1 (J'~ - 'tiro
Prueba 6. Inferencias sobre 0':/0'; cuando utilizamos muestras dependientes.
a) Hipótesis:H') : a~ = cr:H, : O'~ =1= 0';:
b) Suponemos que las observaciones dentro de cada grupo son índependientes y provienen de una distribución normal. La prueba es:
(6)
n = Número de pares de observaciones.
r.2 = Coeficiente de correlación sobre n pares de observaciones.
e) Los valores críticos son:-1 - a./2ln-2 y 1 - (a/2)ln-2
d) El intervalo de confianza para este tipo dé prueba está bajo estudiodebido a las complicaciones que implica estimar las varianzas obtenidas demuestras dependientes.
Prueba 7. Inferencia sobre las diferencias entre dos proporciones cuando utilizamos muestras independientes.
344
a) Hip6tesis:
JESUS DE LA ROSA
Hu: PI = pzH1: PI '*" pz
b) Suponemos que los errores muestrales están distribuidos normalmente, es decir, que la muestra 1 es inferida de la. población 1 y que lamuestra independiente es inferida de la población 2. La prueba es:
(7)
PI Y Pz = Proporciones.pq = Valores dicotómicos (véase correlación hiserial}.
_....RL+-&p - ni nz
q = 1- p
e) El valor crítico o nivel de confianza proviene de la tabla normal:
- 1 - a/2z y 1 - (a/2)z.
d) El intervalo de confianza 100(1 - a) ~~ se exprep así:
(PI - pz) ±1 - (a/2)Z J[(F1 +F2 )(1 _IF• + F-=.)(; + ..!..)J" .nl + n2 ni + n2 I n2
Prueba B. Inferencias sobre dos correlaciones lineales (T1 - T2) cuandoutilizamos muestras independientes.
a) Hipótesis:H. : 1. = 1.2
H, : T. =1= 12•
.o) Suponemos que la 'muestra al azar es inferida de una poblaciónnormal bialterada 1, en la cual el coeficiente de correlación lineal es T. yque la muestra al azar es inferida de una población normal bíalterada 2 conuna correlación T2. La prueba estadística utilizada es T transformado enpuntuaciones Z. Se expresa así:
I z = Z" - Z,.
I(8) . 1 1
~ ni - 3 + n2 - 3_1 ..!__.•. . •
Zr1 y Zr, = Valores transformados en Z, correspondientes a los valores de y r«.
ESTADISTICA PSICO-EDUCATIVA 345
e) El valor crítico al probar Hu : rl = r~ al nivel de significación a, seexpresa así:
- l - a/2~ y 1 - (a/2)Z.
d) Los intervalos de confianza de lOOp - tr) % son:
(Zrl - Zra) ± 1 - (tr/2)~ J_._1_3
+ _l_. "ni - n2 - .3
Prueba 9. Inferencias sobre las correlaciones lineales cuando utilizamos muestras dependientes.
a) Hip6tesis:Hu: r", = r..Hl : r", =1= ro:.
b) Suponemos que existen tres poblaciones normales hialteradas, unapara cada par de variables X-Y, X-Z y Y-Z. Las relaciones entre ambasvariables son de tipo lineal. La prueba estadística utilizada es:
(9)
o lo que es lo mismo,
I(lO) Iz = -..{if(r", - r.=)/-· ... I
V (1- r..)+(I-r;.)'-2r.=-(2r••-r••r••) (l-r..-r;.-r:=)
e) Los valores críticos se expresan así:
- 1 -a/2z y 1 - (tr/2)z.
d) La explicación del nivel de confianza de este tipo de prueba,por su extensión y dificultad, está fuera del alcance de este capítulo.Profundidad sobre este tema, puede conseguirse en la discusión presentada por Olkin; en su obra "Correlation Revisited".
Otras pruebas de hipótesis relacionadas con las medidas estadísticas estudiadas en los capítulos anteriores, no entran en nuestra "introducción"; sin embargo, debemos recalcar la importancia y necesidadde establecer adecuadas inferencias en las pruebas de hipótesis, teniendo como referencia el tipo de variables utilizadas y los procedimientosestadísticos empleados en su manipulación.
346
17.4 LOGIeA DEWS DISElil"oS EXPERIMENTALES
JESUS D~ LA ROSA
Los diseños experimentales tienen como fin controlar los variadosfactores que pueden influenciar en el experimento y quizá, afectar losresultados en los cuales se basan las conclusiones. Estas últimas, sonderivadas de la estructura del experimento y de la naturaleza de loscontroles expuestos. Por tanto, es muy importante destacar que dichasconclusiones no provienen de la prueba de las hipótesis. La prueba estadística de una hipótesis indica únicamente la probabilidad de que unresultado dado nos informe que la hipótesis es verdadera o falsa. Pero alhacer esta aseveración, la estructura y control del experimento tienenque ser tenidos muy en cuenta.
El control de las variables externas que no interesan al investigadorpuede ser aumentado, disminuyendo la influencia de dichas variablesmediante diferentes métodos:
a) Cambiando o eliminando la variable, es decir, reducir el experimento a menos variables. Por ejemplo, eliminar de nuestra investigación el nivel de Secundaria, dejando únicamente el nivel de educación Primaria, con lo cual ponemos fuera el nivel de educación.Otra forma sería dejar ünícunente mujeres en el estudio, con loque eliminaríamos la variable sexo.
b) Haciendo el muestreo al azar, con el objeto de que cada miembrode la población tenga la misma oportunidad de, pertenecer a lamuestra. La aleatoriedad es el método más importante y efectivo para la igualdad de grupos y para el control de las variables externas.
e) Apareando los casos mediante la selección de pares de individuoscon idénticas características y asignando un individuo de cada paral grupo de control, y el otro, al grupo experimental. Sin embargo,el proceso de apareamiento ha sido ampliamente discutido sobretodo cuando se utiliza un sustituto de la aleatoriedad. En este casosería preferible asignar los individuos mediante el apareamientoy ubicarlos mediante aleatoriedad, uno al grupo experimental yotro al de control. Este procedimiento recibe el nombre de "bloqueo".
d) Utilizando el análisis de covarianza, que no es sino un derivado delanálisis de varianza, mediante la utilización de las medias de las
ESTADISTICA PSICO-EOUCATIVA 347
puntuaciones de un pretest como covariados, El análisis de covarianza es una técnica paramétrica que requiere como mediciónuna escala de intervalo mediante la prueba F, pero que a diferencia del análisis de varianza, la proporción F no prueba las diferencias observadas entre las medias, sino que observa esas diferenciascon objeto del ajuste entre las medias, es decir, éstas son ajustadassobre la base del covariado. En consecuencia, podemos definir un"covariado" como la medida utilizada en el análisis de covarianzapara ajustar las puntuaciones de la variable dependiente. Los procedimientos para el cálculo del análisis de covarianza pueden encontrarse en Allen Edwards. Estudios muy recientes (Campbell,1971), sin embargo, han criticado el análisis de covarianza, en elsentido de que no es un procedimiento totalmente recomendable,y proponen a cambio, la utilización del procedimiento de correlación.
El control de las variables externas presupone dos importantesconceptos en el diseño experimental, la validez interna y la validezexterna, las cuales discutiremos de acuerdo al excelente tratamientoexpuesto por Campbell y Stanley.
17.5 VALIDEZ INTERNA
La validez interna implica el control adecuado sobre las variablesexternas, los procedimientos de selección o medición, etc. El diseñoexperimental debe ser elaborado con el propósito de que el investigador pueda cotejar adecuadamente los factores que amenazan la validezinterna. Esta la podríamos definir como el requisito mínimo necesario para hacer que los resultados del experimento sean interpretablesen términos de control, medición, análisis y procedimientos. Un ejemplo clásico que trae consigo problemas de validez interna se refiere aldiseño en el que las relaciones mostradas por las diferencias entre losgrupos experimentales son dignas de poca confianza.
La lista de fuentes de invalidez o de variables extrañas que amenazan la validez interna, de acuerdo a Campbell y Stanley, son:
A. HISTORIA
Son diferentes los eventos específicos a los del tratamiento experi-
34R JESUS DE.LA ROSA
mental que ocurren entre la causa y el efecto o entre el pretest y postest dándonos explicaciones alternadas de efectos. Estos eventos aparecen desde fuera del individuo afectándole su ejecución antes o despuésdel tratamiento. Por ejemplo, a un grupo que se le somete a un tratamiento de actitudes, aplicándole una prueba al iniciarlo, el lapso comprendido entre la medición de actitudes desde el pretest hasta el postest, puede estar influenciado por hechos capaces de cambiar la actituddel grupo bajo experimentación, distorsionando de esta forma, los resultados del postest y en cierto modo: todo el experimento.
B. MADURACION
Comprende los procesos dentro de las unidades sociales observadasque producen cambios como una función del tiempo per se, como elcrecimiento físico o psicológico, fatiga, aburrimiento, etc., o influenciado simplemente mediante las experiencias o aprendizajes que se encuentran en los individuos a través del proceso normal de maduración. A diferencia de la variable historia, la maduración aparece de adentro haciaafuera del individuo, afectando o invalidando el experimento.
e COMPROBACION o PROCESO DE APLICACION DE PRUEBAS,"TESTINC"
Es el efecto del proceso que conlleva pasar o tomar un test sobrelas puntuaciones de una segunda administración del test. Los efectosdel pretest al comienzo de un experimento, pueden producir un cambioen los individuos. La prueba test-retest para buscar el coeficiente deconfiabilidad puede involucrar esta variable, amenazando el experimento y por consiguiente, invalidando dicho método.
D. INSTRUMENTACION
Este aspecto está relacionado con los instrumentos de baja confiabilidad o validez, o con aquellos cambios en la calibración de los mismos, que al ser usados, producen diferencias en las mediciones obtenidas.
E RECRESION ESTADISTICA
Este concepto estudiado en el capítulo 11, opera cuando los grupos han sido seleccionados sobre la base de sus puntuaciones extremas.
ESTADISTICA PSICO-EDUCATlVA 349
Individuos que obtuvieron altas puntuaciones en el pretest, están predispuestos a obtener puntuaciones relativamente más bajas en el postest, y aquellos que obtuvieron puntuaciones bajas en el pretest estáninclinados estadísticamente a obtener puntuaciones más altas en el postest. En resumen, ambos grupos tienden a concentrarse en la media.Esta variable debe tenerse muy en cuenta, fundamentalmente, en losdiseños que contienen pre y postests.
F. SELECCION
Las preferencias derivadas de la recolección diferencial de gruposproducen diferentes niveles de significación sobre las medidas. Estaspreferencias selectivas aparecen generalmente en los estudios, dondese solicitan voluntarios para utilizarlos como grupo experimental. Porsupuesto, la aleatoriedad de los sujetos eliminaría la amenaza de estavariable.
G. MORTALIDAD EXPERIMENTAL:
La pérdida de sujetos en los grupos comparados a través del experimento, puede afectar su validez ihterna. Una alternativa o suposiciónque debemos tener en consideración, es que los sujetos que quedan enel experimento después de un largo período, quizá tienen una motivación diferente, a aquellos quelo abandonaron.
La pérdida de sujetos en los grupos comparados a través del experimento, puede afectar su validez intema. Una alternativa o suposiciónque debemos tener en consideración, es que los sujetos que quedan enel experimento después de un largo período, quizá tienen una motivación diferente, a aquellos que lo abandonaron.
H INTERACCION DE LAS VARIABLES;SELECCION-MADURACION, ETC.
Esta variable se explica mediante las selecciones parcializadas quetienen como resultado dentro de las proporciones diferenciales de maduración o cambio externo.
Otras fuentes que pueden afectar la validez interna, que no estanincluidas en Campbell y Stanley, son:
350
l REACTIVIDAD O EFECTO DE HA WTHORNE:
JESUS DE LA ROSA
El concepto de reactividad debido al famoso estudio de Hawthorne relativo a las condiciones de trabajo, ocurre cuando los sujetos de lainvestigación se empiezan a dar cuenta de que están formando parte deun experimento, ocasionando mediante dichos conocimientos, conductas diferentes a las que se establecerían en el caso de desconocer su involucración en el experimento.
J. CONTAMINACION
Esta es un tipo de selección parcializada que se introduce cuandoel investigador tiene algunos conocimientos anteriores acerca de los individuos del experimento. Con objeto de eliminar esta variable, se utilizan generalmente otros investigadores u observadores sin conocimiento previo de los sujetos para escogerlos o analizar sus tendencias.
K INESTABILIDAD
Esta variable está relacionada con la desconfianza de las medidaso fluctuaciones en el muestreo de los sujetos con las medidas equivalentes. Esta variable involucra, por tanto, los errores 1y II.
17.5.2 VALIDEZ EXTERNA
Además de los criterios expuestos sobre la validez interna, es también necesario, cuando estudiarnos la conducta humana, que los resultados obtenidos y basados en un grupo puedan generalizarse a toda lapoblación de donde procede. Los tipos de condiciones o efectos quenos previenen de generalizar nuestros datos a todos los seres humanos,envuelven un problema de validez externa. Esta la definiremos corno laextensión y aprovechamiento de la generalización de los resultados delexperimento. Ahora bien, la validez externa no solamente se relacionacon la población de la cual el investigador espera generalizar sus resultados, sino también incluye la generalización de sus datos hacia otrasvariables independientes interrelacionadas. La validez externa es importantísima en los experimentos, una vez que éstos pueden afectar ono los cambios de toda una población, o corno dicen Campbell y Stanley: "Las fuentes de validez externa son, por tanto, conjeturas corno las
ESTADISTICA PSICD-EDUCATIVA 351
leyes generales en una rama de la ciencia; conjeturas en las que los factores interactúan legítimamente con nuestras variables de tratamientoy por consecuencia, conjeturas de las que pueden hacerse caso omiso".
Las fuentes principales que amenazan la validez externa son:
A. Efectos de interacción de "testing"
Esto implica el efecto de un pretest en incrementar o decrecer lasensibilidad del sujeto aplicado hacia la variable experimental. En otraspalabras, la interacción del tratamiento y del proceso de aplicación deltest pueden limitar el estudio e imposibilitar la generalización a la población.
B. Interacción de selección y tratamiento experimental:
Implica que las respuestas de los sujetos no son representativas dela población tratada. Esto puede suceder por ejemplo, cuando seleccionamos individuos, que por ciertas circunstancias, como algunos gruposvoluntarios, están identificados ampliamente con el experimento. Indudablemente que esta posición afectaría el criterio de validez externa.
C. Efecto reactivo del convenio experimental:
Esta fuente se refiere al efecto de Hawthorne, que además de afectar la validez interna, se puede interpretar muchas veces como inhibición de las generalizaciones. La conducta de un sujeto puede ser influenciada parcialmente por su percepción del experimento y sobre la formacomo podría responder al estímulo experimental.
D. Interferencia de tratamientos múltiples:
Esta variable se hace presente cuando son aplicados varios tratamientos diferentes para un mismo grupo de individuos. Esto se puedeexplicar, en el sentido de que, cuando aplicamos el tratamiento 2 nopodemos borrar los efectos del primer tratamiento, por lo que no sepueden generalizar los resultados sino al grupo de sujetos que tuvieronlos tratamientos en forma ordenada.
Otras fuentes de validez externa, de menor aplicación, pero deigual importancia son:
352 JESUS DE LA ROSA
E. Artiflcialidad del experimento:
Proviene al crear un ambiente artificial mediante el control exagerado de las variables externas, o en otros términos, de la validez interna'.
F. Capacidad de respuestas irrelevantes de lasmedidas:
Esto viene dado en relación a que todas las medidas son complejase incluyen componentes irrelevantes que pueden producir efectos aparentes.
G. Replicabilidad irrelevante de los tratamientos:
Al igual que las medidas, los tratamientos también son complejosy algunas replicaciones de ellos pueden fallar en incluir los componentes que actualmente son responsables por los efectos.
H. Efectos del experimentador:
La conducta de los individuos puede ser influenciada inintencionadamente por ciertas características o conductas del investigador.
Existen algunas otras fuentes de invalidez que en cierto modo, dependen de las descritas anteriormente, por lo que no las mencionaremos. En conclusión, los diseños experimentales en la investigación de laconducta son difícilmente perfectos. Ambos tipos de validez son necesarios en el díseño experimental, ya que deseamos utilizar éste con altavalidez en .ambos tipos, pero en muchas ocasiones, depende del tipo deestudio; cuando aseguramos un tipo de validez estamos poniendo enriesgo el otro tipo.
17.6.1 TIPOS DE DISE~O EXPERIMENTAL
El significado de que los controles sean introducidos en los experimerrtos constituye la base de los diseños. La selección de un diseñoen particular está basado en los propósitos del experimento, en el tipode variables que van a ser manipuladas y en las condiciones en que vaa ser manejado el experimento. A continuación describiremos en formamuy general, adecuada a esta introducción, los 16 diseños expuestospor Campbell y Stanley y el diseño factorial. El tratamiento completo
ESTADISTICA PSICO-EDUCATIVA 353
de estos diseños y los factores de validez que los afectan están excelentemente escritos por estos autores, por lo que recomendamos ampliamete su lectura, para una comprensión integral. En la exposición delos diferentes diseños utilizaremos una serie de símbolos, que aparecena continuación:
Ro---
x
o
+
R o una línea horizontal indica que los sujetos han sidoasignados a los diferentes grupos en forma representativa, mediante el método aleatorio.
Una línea de rayas horizontales entre niveles, indica quedos grupos no fueron equivalentes ni en apareamiento oazar al comienzo del experimento.
Variable experimental manipulada o tratamiento.
Observación o test.
Indica que el factor es controlado.
Indica que el factor es débil o incontrolado.
? Expresa que existe una posible fuente de invalidez en elfactor o variable externa.
Ningún símbolo o signo en las tablas de fuentes de invalidación indica que el factor no es relevante o importante para el experimento.
Las letras A, a, e, D, etc., indican o expresan las fuentes de invalidez o variables externas, descritas anteriormente; por ejemplo: A == historia; B =maduración, etc. (validez interna) o A =efectos de interacciónde "testing", etc. (validez externa).
17.6.2 DISEÑOS PREEXPERIMENTALES:
Diseño 1: Estudio de casos en "una dirección".
Este tipo de diseño está prácticamente ausente de control por parte del experimentador y no tiene valor científico. Lamentablemente te-
354 JESUS DE LA ROSA
davía se sigue elaborando este tipo de estudios, principalmente en educacion, Su diagrama se representa así:
x O
Explicación: Un grupo escogido sin ningún método aleatorio esestudiado una vez, en relación a un presumible tratamiento que produce cambios.Como dijimos anteriormente, este tipo de estudio no tiene significación científica o como dicen Campbell y Stanley, el "diseño1, si es tomado en conjunción con las comparaciones del "conocimientocomün" implícito, tiene más inconsistencia que cada uno de los subsiguientes diseños" (2 y 3).
Fuentes de invalidez:
Validez interna Validez externa
e D E F G H A B e D
llsefio 2: Un grupo "pretest-ipostest".
Este diseño adolece, casi, del control expresado en el diseño l. Surelevancia es muy relativa y carece de seguridades, derivadas del hechode que no comprende ni una comparación con otro grupo. Se expresaasí:
x
Explicación: Un sólo grupo es estudiado una sola vez en dos fases,antes del presumible tratamiento y después de él. El grupo se escogeprácticamente sin ningún procedimiento de control.
ESTADISTICA PSICO-EDUCATlVA
Fuentes de invalidez:
Validez interna Validez externa
355
A BCD E F G H A B e .D
+ ? + + +
I»sefío 3: Comparación de "grupa-iestdttco",
Este tipo de diseño seudoexperimental tiene un cierto control enrelación a los diseños, pero sin embargo, carece en general, de consistencias externas e internas. Un ejemplo clásico de este tipo, lo encontramos en los estudios de "rating", como la comparación de un grupo queve cierto programa de televisión con otro que no lo ve:
Explicación: En este diseño se compara un grupo que ha experimentado cierto tratamiento (X) con otro que no lo ha hecho, con elpropósito fundamental de establecer el efecto del tratamiento.
Fuentes de invalidez:
Como hemos podido apreciar, estos tres tipos de diseños carecenfuertemente de validez interna y externa, y su uso es muy delicado encuanto a la interpretación de causa y efecto. Dichos experimentos involucran variedades de análisis descriptivos y podríamos clasificarloscomo "estudios correlativos" o ex post facto,
17.6.2 IISE1il"OS EXPERIMENTALES (realmente experimentales)
Estos diseños que están comprendidos en tres tipos, son los másrecomendados en la metodología científica. Mediante la utilización deellos, el investigador prácticamente tiene completo control sobre lasituación experimental, en el sentido de poder determinar con precisión,los sujetos que participarán en el experimento y cuales de ellos recibirán o no, el tratamiento experimental. La presentación de estos diseñosse hará sobre la base de un solo tratamiento (X) enfrentado a un grupoque no recibe dicho tratamiento. Por tanto debemos expresar que los
356 JESUS DE LA ROSA
diagramas que aparecen a continuación representan la unidad básica deldiseño, pero por supuesto, si tenemos diferentes tratamientos, el díagrama se amplía de acuerdo al número de X o de grupos experimentales o de control, siguiendo en todo caso, la misma forma de presentación en derivación. En el caso de querer comparar tres métodos de enseñanza, los tratamientos se expresarían como X¡ , X2 y X3 •
Diseño4: "Grupo-control, pretest-spostest".
o.
x o.
o.
Explicación: En el diseño 4 los sujetos son divididos aleatoriamente en dos grupos, uno experimental y otro de control, determinadosuno y otro en forma azarizada. Al comienzo del estudio, esto es, antesdel tratamiento respectivo, se aplican uno o los pretest correspondientes (0 1 - 0 3 ) . Al finalizar el experimento se aplican nuevamente lostests. Mediante la azarización y "bloqueo" se pueden obtener gruposequivalentes en el momento de iniciar las observaciones o al aplicar elpretest. El procedimiento más efectivo en el análisis de los datos, esmediante un análisis de covarianza, utilizando las puntuaciones delpretest como los covariados. Este diseño es fuerte en validez internay externa, pero esta última está ligeramente afectada por una posibleamenaza, proveniente de la existencia de una interacción entre el proceso del pretest y el tratamiento experimental. Por último, es conveniente señalar que los pre y postests son aplicados al mismo tiempo paratodos los grupos.
Fuentes de invalidez:
Validez interna Validez externa
A B e D E F G H A B e D.._----
+ + + + + + + + - ? ?
ESTADISTICA PSICO-EDUCATIVA
Diseño 5: "Cuatro grupos" de Saloman.
357
o. x o,
o,
O. o.
x O,
O.
Explicación: Este diseño es una extensión del diseño 4. Incluyedos grupos de control y dos experimentales. A uno y solamente uno decada dos tipos, le es aplicado el pretest después del tratamiento experimental. Como está indicado por la linea horizontal, los cuatro grupostienen asignados los individuos mediante aleatorización, Este diseñoestá calificado como el más deseable de todos, ya que tiene la ventajade permitir el experimentador examinar los efectos del tratamiento encuatro comparaciones diferentes, y a su vez, aparece como el diseñomás fuerte en ambos tipos de validez. Los métodos utilizados son elanálisis de covarianza para los datos de los grupos que tuvieron elpretest y un análisis de varianza en dos vías, para ser computado sobre losdatos del postest. En este diseño el pretest puede ser considerado comouna variable independiente, pero por supuesto, que las dos variables independientes serían el tratamiento experimental frente al de control yel pretest frente al postest. Las puntuaciones de este último vendríana ser la variable dependiente.
Fuentes de invalidez:
Validez interna Validez externa
A B e D E F G H A B e D
+ + + + + + + + + ? ?
Disefio6: "Grupo control -solamente- postest".
I X
358 JESUS DE LA ROSA
Explicación: Este diseño envuelve dos grupos, el experimental yde control, divididos por azarízación, El grupo experimental es el querecibe el tratamiento experimental, después del cual, ambos grupos sonobservados o medidos sobre la variable dependiente bajo estudio, comopor ejemplo, mediante un test. Si la diferencia encontrada es demasiadogrande para atribuirla a un error muestral, puede ser imputada al efectodel tratamiento de la variable. Este diseño, es quizá después del Saloman, el más fuerte en validez externa e interna. El problema que }iluedesurgir en el diseño 4 en relación a la validez externa al aplicarlo a nuestro estudio particular mediante el uso del pretest, puede ser eliminado,cambiando el diseño del 4 por el 6. Las pruebas utilizadas son la t deStudent cuando pueden ser elaboradas suposiciones paramétricas, o sitenemos más de dos grupos, es recomendable el análisis de varianza deuna vía.
Fuentes de invalidez:
Validez interna Validez externa
ABCDEFGH ABCD
+ + + .+ + + + + 1+ ? ?
17.6.3 DISEÑOS CUASIEXPERIMENTALES:
Cuando es posible utilizar diseños experimentalmente verdaderos,ya sea por razones de consecución de muestras o económicas, o sobretodo, en aquellos casos en que la investigación educativa o psicológicaenvuelve, por ejemplo, estudios en el mismo lugar de los salones de clase, usamos los diseños denominados 'cuasiexperimentales. Al tomar, porejemplo, dichos salones de clase, siendo estas poblaciones ensambladasartificial o naturalmente, diferentes factores están involucrados dentrode ellos, con lo que el proceso de azarización no se realiza, y recordemos que una de las normas básicas de un diseño experimentalmenteverdadero consiste en que todos los sujetos tienen igual oportunidadde formar parte en el experimento. En general, estos diseños comprenden al menos, dos grupos en el experimento pero también existen diseños cuasiexperimentales, utilizando solamente un grupo. Veamos entonces, los diferentes tipos de este tipo de diseños denominados también, posexperimentales.
ESTADISTICA PSICO-EDUCATIVA
Diseño 7: "Series de tiempo" (número de veces).
359
Este diseño y los dos que le siguen están relacionados con el estudio de un sólo grupo y con mediciones periódicas sobre la variable dependiente entrelazadas con un tratamiento experimental. El diseño 7 sediagrama así:
o o o o x o o o o
Explicación: Este diseño consiste en realizar una serie de medidasantes y después de un tratamiento experimental especifico. Este tipo dediseño es bastante efectivo en la investigación física o biológica, perotiene algunas fuentes de invalidez en la investigación de la conducta.El tratamiento experimental es introducido al azar entre la secuencia.El análisis de los datos en los diseños cuasiexperimentales no está tanbien definido como en los anteriores diseños. Sin embargo, podemosemplear una "prueba de significación" que -dependerá en parte, de la naturaleza hipotética sobre el efecto del tratamiento. La validez externano es particularmente muy fuerte y la variable historia amenaza el criterio de validez interna, p<:?r cuanto diferentes eventos entre las diferentes observaciones, pueden aparecer afectando el experimento.
Fuentes de invalidez:
Validez interna Validez externa
ABCDEFGH ABCD
+ + ? + + + +
Diseno 8: "Muestras de tiempo equivalente",
? ? ?
x.o x.o z.o x.o
360 JESUS O E LA ROSA
Explicación: Este diseño es derivado del anterior, pero con la diferencia de que utiliza dos muestras equivalentes: en una está presentela variable experimental y en la otra, ausente. Este diseño tiene la ventaja sobre el anterior, en el sentido de controlar la variable historia einstrumentación, pero la interferencia que resulta de los tratamientosmúltiples debido a la comparación de X¡ con Xo , puede generalizarúnicamente para condiciones repetidas de X¡ . Por tanto, la validez externa está seriamente afectada. La prueba más recomendable, a pesar dela inconsistencia de las medidas, es de "significación"
Fuentes de invalidez:
Validez interna Validez externa
A B e D E F G H A B e D
+ + + + + + + + - ? - -
Diseño 9: "Muestras de materiales equivalentes".
IM.J(,O M6X.O MrIX.O, etc. I
Explicación: Este diseño derivado de los dos anteriores, se diferencia del diseño 8 en que utilizamos materiales equivalentes (M. b Cd) encada serie. En este tipo se pueden utilizar pretests o no, de acuerdo a lascaracterísticas del experimento. Como el diseño 8 tiene alta validez interna, pero la externa es baja, con la posibilidad de poder controlar losefectos reactivos del pacto o convenio experimental, debido a la variedad de materiales heterogéneos y a que la conducta de los individuos noes influenciada por la visión del experimento, por cuanto existe un número grande de tratamientos dados a diferentes intervalos de tiempo.
Fuentes de invalidez:
Validez interna Validez externa
A B e D E F G H A B e D
I+ + + + + + + + - ? ? -
ESTADISTICA PSICO-EDUCATlVA 361
Diseño 10: "Grupo control no equivalente':
o x o
o o
Explicación: Este diseño como puede observarse, contiene el grupo experimental y de control. A ambos se les administra el pretest ypostest. Se diferencia del diseño 4, en que los sujetos no son asignadosa los grupos mediante el proceso de azarización. Por ejemplo, el estudiode los alumnos de dos grados o clases diferentes en una escuela, no involucraría proceso de aleatoriedad, ya que son grupos intactos. La validezinterna del experimento está controlada, con la excepción de que puedan surgir interacciones entre la variable selección y otros factores. Asu vez, la regresión estadística podría aparecer debido a que los gruposno son azarizados y por tanto, podría darse el caso de que las dos clasescontengan individuos con puntuaciones muy altas o bajas. Sin embargo,estas variables podrían controlarse, si modificamos este diseño de dosgrupos a cuatro, en los cuales, grupos a los que le son aplicados un pretest no se les administra el postest, y viceversa. La validez externa esdébil. El análisis de covarianza es el método más adecuado en el análisisde los datos.
Fuentes de invalidez:
I Validez externa
---J-l-_~I_~~__~_II " '---; ,: I
Validez interna
I~ B e D E F GI .C- ~ -!- -+- ..;- _LII
Diseño 11: Diseños contrabalanceados.
Estos diseños están incluidos en CampbeIl y Stanley como cuasiexperimentales debido a la presentación que hacen del mismo, en cuanto a que no contienen proceso azarizado, pero cuando este último esposible, podemos establecer otro tipo contrabalanceado que denomina-
362 JESUS DE'LA ROSA
remos diseño 11 b Y que no podría ser considerado como cuasiexperimental. Los diseños contrabalanceados provienen del concepto de "diseño factorial", el cual lo estudiaremos al final del capítulo, y que comprende aquellas situaciones que están bajo control de investigación mediante diseños reales o verdaderos, donde se incluyen observaciones dealgunos individuos a todos los niveles de todas las variables experimentales. Los diseños contrabalanceados necesitan observaciones de todoslos individuos bajo todos los tratamientos. El diseño contrabalanceadosin azarizacián se diagrama así:
X,Q
X.o
X.o
X.o
X,O
XaO
X,Q
X,O
X,O
X.O
X.O
X.O
X,O
Explicación: La diagramación anterior se denomina cuadro latino.Este se define como una formación cuadrada N x N, incluyendo N letras o símbolos diferentes, ordenados en tal forma, que cada letra osímbolo aparece una y solamente una vez en cada fila, y otra vez encada columna. El tamaño de un cuadro latino se puede elaborar desde2 x 2, hasta el infinito y dependerá del número de tratamientos del experimento. Este tipo de diseño se llama también rotatorio. Si observamos el diagrma que aparece arriba, veremos que cada tratamiento (X)aparece solamente una vez en cada fila y una vez en cada columna. Deesta forma podríamos rediagramar este diseño en las siguientes formas:
Primera Segunda Tercera Cuartavez vez vez vez
A, Grupo A X,O X,O XaO X.O----,---------
Grupo B X,O X.,Q X,O X.O-------------
Grupo e x.o X,O X.O X,O-------------
Grupo D X.O X.O X,O X,Q
ESTADISTICA PSICO-EDUCATIVA
Diseño 7: "Series de tiempo" (número de veces),
359
Este diseño y los dos que le siguen están relacionados con el estudio de un sólo grupo y con mediciones periódicas sobre la variable dependiente entrelazadas con un tratamiento experimental. El diseño 7 sediagrama así:
o o o o x o o o o
Explicación: Este diseño consiste en realizar una serie de medidasantes y después de un tratamiento experimental específico. Este tipo dediseño es bastante efectivo en la investigación física o biológica, perotiene algunas fuentes de invalidez en la investigación de la conducta.El tratamiento experimental es introducido al azar entre la secuencia.El análisis de los datos en los diseños cuasiexperimentales no está tanbien definido como en los anteriores diseños. Sin embargo, podemosemplear una "prueba de significación" que dependerá en parte, de la naturaleza hipotética sobre el efecto del tratamiento. La validez externano es particularmente muy fuerte y la variable historia amenaza el criterio de validez interna, por cuanto diferentes eventos entre las diferentes observaciones, pueden aparecer afectando el experimento.
Fuentes de invalidez:
Validez interna Validez externa
A B e D E F G H A B e D
- + + ? + + + + - ? ? ?
Diseño 8: "Muestras de tiempo equivalente".
XoO X.o
364
Diseño 11b: Contrabalanceado al azar.
JESUS DE LA ROSA
Explicación: El diseño 11b es idéntico al 11a con la diferenciacomo expresábamos anteriormente, de que los sujetos son asignados alazar dentro de los grupos. La validez externa e interna tienen alta posibilidad de controlarse como en el anterior diseño, pero la validez externa absorbe más fuerza debido al procedimiento de azarización utilizado.El análisis de varianza debe ser el método que utilicemos para el tratamiento de los datos.
Diseño 12: "Muestras separadas, pretest-spostest".
o (X)
x O
Explicación: El diseño 12 nos expresa que los subgrupos son equivalentes y escogidos al azar. La X entre paréntesis, indica que la presentación del tratamiento es irrelevante para el experimento. Una muestraes medida antes de la simulación del tratamiento y otra equivalente,después de X. Este diseño se utiliza cuando es posible seleccionar lasveces y sujetos sobre quienes se hacen las observaciones o también,cuando elaboramos una observación sobre cada persona y el tratamiento acontece para todos los grupos o grupo, o para ningún miembro delmismo. La validez interna está afectada, pero puede ser en muchos casos controlada, si los grupos de investigadores o entrevistadores son aparejados al azar. La validez externa es controlada. Este diseño es bastanteutilizado en ciencias sociales y pueden derivarse de él tres tipos de diseños, de acuerdo al número de grupos y observaciones, en relación al número de veces que se aplican.
Fuentes de invalidez'
Validez interna Validez externa
ABCDEFGH ABCD
+ + + + + +
ESTADISTICA PSICO-EDUCAT1VA 365
Diseño 13.; "Muestras separadas - grupo control, pre y postest ".
o (X)X o
oo
Explicación: Este diseño está considerado como el mejor de loscuasiexperimentales y es similar al diseño 10 con la diferencia de que enéste, a las personas especificadas no le son aplicadas nuevamente el test,con lo que desaparece la interacción de la aplicación de pruebas con eltratamiento, defecto del que adolece el diseño de grupo de control noequivalente. A su vez, elimina los factores historia y maduración del diseño 12, puesto que se incluyen muestras separadas a los grupos de control, lo que implica que no necesitan ser equivalentes para las muestrasseparadas de los grupos preexperimental y posexperimental. Pero todavía incluye un factor que sería la interacción entre selección y uno delos otros factores o variables externas. La validez externa de este diseñoes bastante alta.
Fuentes de invalidez:
Validez interna Validez externa
A B e D E F G II A B e D----_.
+ + + + + + + - + + +
Diseño ]4: "Series de tiempos múltiples':
OO 0-1------ I
O O O II
O
o
X
X
o
O
O
O
o
oO
O
366 JESUS DE LA ROSA
Explicación: El diseno 14 es derivado de las series de tiempo (diseno 7), con la diferencia de haber agregado otro grupo al experimento,por lo que se controlan los factores historia e instrumentación, dándolealta validez interna. Sin embargo, la validez externa no tiene muchaconsistencia por lo que no es producente hacer inferencia hacia otrosgrupos, una vez que las muestras no han sido equivalentemente azarizadas. El análisis de los datos, para encontrar las diferencias entre dos series experimentales y de control, pueden hacerse mediante las pruebasde significación.
Fuentes de invalidez:
Validez interna Validez externa
ABCDEFGH ABeD
~ + + + + + + +
DiseñO li "Ciclo institucional".
?
Clase A
Clase B,
Clase B2
Clase e
CPG-Clase B
CPG-Clase e
x o,
02 x
x
o.o.
o.
o.
o.
x
CPG = Controles de la población general para las clases B y C.
Explicación: Este diseno fue elaborado con el fin de ayudar a reformar diseños inadecuados de investigación que se llevan al cabo, yque se ven en la necesidad de controlar factores específicos en los dostipos de validez. Por tanto, el diseño 15 contiene en la clase A, el diseno1, considerado como no experimental, y a través del proceso de ajuste
ESTADISTICA PSICQ-EDUCATIVA 367
para controlar las fuentes de invalidez, observamos otros diseños queen interacción, pueden controlar la situación de acuerdo a los factoresque nos están invalidando el estudio. En esta forma, estableceremos lassiguientes comparaciones entre las observaciones o tests para las clases A,ByC:
Fuentes de invalidez:
Comparaciones Validez externa Validez interna
A B e J) E F G 1I A B e D
I0., 01 + - + + ~ - ? + ? +I O. O. + - + + ') - " + ? ..;- I
I o. o. - - - r ~ + + - ? +1
I 0, O. - - + ? ? + ? ¡+ ? ?I I
La selección de los controles de poblaciones generales (CPG) dependerá de la particularidad de las hipótesis. 06 y 07 proveen el controldel factor maduración aparecido en el segundo período de la prueba Esto implica de acuerdo con Campbell y Stanley, que debemos aplicar laspruebas a dos grupos de personas de la población general que difierensolamente en edad y cuyas edades fueron tomadas para coincidir conaquellas de las clases B y C, en el momento de la aplicación de las pruebas. Por tanto para poder confírmar la hipótesis del efecto del tratamiento, los grupos 06 y 07 deberán ser iguales, o por lo menos, demostrarmenor discrepancia que al hacer las comparaciones, abarcando la exposición del tratamiento. En esta forma, las fuentes de invalidez para06 = 07 son: control sobre maduración y debilidad en la interacción deselección con maduración. Los demás factores no son relevantes o carecen de importancia en este diseño.
Disefio 16 : "Discontinuidad de regresión".
x OX OX O
OOO
368 JESUS DE LA ROSA
Explicación: En este diseño no existen líneas a niveles, 10 que indica que los grupos no son equivalentes y a su vez, personas que difierenen diferentes cantidades de conocimientos a través de una de las variable. El objeto de este diseño es estudiar la relación de dos variables {JI-introducirlas en un tratamiento. En esta forma la discontinuidad de regresión se utiliza en aquellas situaciones en que fueron usados previamente diseños ex post facto. Las pruebas de significación son las másadecuadas para el análisis de los datos y las fuentes de invalidez son máso menos controladas, a excepción de la interacción de selección sobre eltratamiento.
Fuentes de invalidez.'
Validez interna
A B e D E F G!-._- ._------j
.L + -i- _L~.
17.6.6 mSEÑO FACTORIAL
II
-/-
V.Jidez externa
el BCD!• __ 0 _
.L _ -L -4---
!
El diseño factorial es uno de los más empleados actualmente enpsicología y educación. A diferencia de los diseños de grupos equivalentes, el diseño factorial toma todos los niveles de cada variable independiente en combinación con los niveles de las otras variables independientes. Además, es posible observar las interacciones de dos o másvariables independientes sobre la variable dependiente. La técnica másapropiada para llevar al cabo esas observaciones es el análisis de varianza. Si el experimento incluye pretest, obviamente debemos utilizar unanálisis de covarianza, El diseño factorial requiere como mínimo dosvariables independientes con dos niveles, al menos, en cada variable.Este diseño se llama factorial 22 o 2 x 2. Un estudio detallado de losdiferentes métodos de análisis factorial es presentado por Fruchter,Harinan y Edwards.
Supongamos que desamas estudiar el efecto sobre los logros alcanzados en la enseñanza de la estadística mediante dos métodos, dosprofesores y en cuatro cursos diferentes. El diseño factorial de esteestudio sería 2 x 2 x 4. Esto implica que tenemos tres variables inde-
ESTADISTICA PSICO-EDUCATIVA 369
pendientes con dos, otra vez dos y cuatro niveles, respectivamente. Eldiagrama de este diseño factorial 2 x 2 x 4 se representa así;
Variable A
l 2
Variable B Variable B
1 2 l 2
l AIBIC I AIBzCI AIBICZ A IB zC2
2 AzBIC¡ AzBzCI AzBICZ AzB zC2
Variable 3 A 3B¡C¡ A3BzC I A 3B IC Z A3B2C2
C 4 A4B¡C¡ A4BZC¡ A4B IC Z A4BzC2
Figura 17.2Diseño Factorial2 x 2 x 4
Las variables independientes están representadas por las letras A,By C, respectivamente. Este diseño contiene 16 grupos y se representagráficamente así.
370 JESUS DE LA ROSA
Cada cubo está representado por las tres variables independientes,mediante las letras A, B, C con sus respectivos subíndices.
El diseño factorial tiene alta validez interna, pero no debe preferirse por ello en relación a los otros diseños, sino debido a que con él podemos controlar en un sólo estudio todas las variables y porque tambiénnos proporciona la posibilidad de analizar la interacción de dichas variables.
ESTADISTICA PSICQ-EDUCATIVA
EJERCICIOS
17.1 Establezca la diferencia entre estos dos diseños.'
371
xy I ~
x OO
17.2 ¿Qué indica el diseño de más abajo?
xx
17.3 Conteste las siguientes preguntas:
a) ¿Qué es el Diseño Experimental?
b) ¿Qué nombre recibe el grupo que recibe un tratamiento espect
fico?
e) ¿Cómo se llaman las caractertsticas que toman diferentes valores?
d) ¿Cómo se lleva a cabo el control de las variables externas?
e) Describa los tipos de variables.
XVIII
FUN DAMENTOS DE COMPUTACION
18.1 GENERALIDADES SOBRE LA COMPUTADORA
El auge e importancia de las computadoras en el mundo actual yen cualquier rama de las ciencias físicas, sociales y naturales nos obligaa introducir los conocimientos basícos sobre su uso y a enfatizar por lomenos, sobre un medio de comunicación con la computadora, que seasencillo y adecuado a los problemas de interés estadístico.
18.1.1 NOCIONES PRELIMINARES
Descartando de antemano la posibilidad de poder definir una computadora, debido a la complejidad y rnültiples variaciones de las mismas, nos limitaremos a dar un concepto general.
Existe cierta tendencia a considerar la computadora como una prolongación de la inteligencia del hombre; es decir, se la tiene como unamáquina que puede razonar, pensar, decidir y sentir. Esto es completamente erróneo, ya que la computadora no es más que un "simple" instrumento o herramienta que hace lo que el hombre le ordena. Segúndice H. Lacobowitz, en su obra "Computadoras Electrónicas Simplificadas", México, Ediciones Minerva, 1967, página 1, desde el punto devista operaciones: "las computadoras son lo que pueden hacer".
Ya Quelas computadoras son lo que hacen, analicemos brevementequé es lo que pueden hacer. Las computadoras efectúan operaciones lógicas sobre datos e informaciones significativas. Esto equivale a decir
373
374 JESUS DE LA Re
que las computadoras no resuelven problemas, sino que operan cordatos, de acuerdo a instrucciones que les son dadas por el hombre.gracias a su habilidad para operar a alta velocidad, dar resultados eX3tos, almacenar gran cantidad de información y columnar en forma arplia y compleja, podemos estudiar múltiples alternativas en la resolción de cualquier problema.
Vemos así, que es el hombre quien tiene que escoger los métodcadecuados para resolver el problema planteado; en algunos casos estresulta sencillo, pero por lo general requiere un perfecto conocimient.del problema y los campos pertinentes a las matemáticas, en nuestncaso, referidos a los conceptos y fórmulas estadísticas.
18.2.1 SISTEMAS
Entendemos por sistema cualquier combinación de partes o elementos reunidos entre sí para obtener un resultado o formar un conjunto. Bajo ese concepto, consideremos dos sistemas inherentes a laparte operativa de la computadora: los sistemas numéricos y el sistemaelectrónico de procesamiento de datos.
En nuestro diario acontecer estamos acostumbrados al uso del sistema decimal de numeración, sin embargo, existen muchos otros sistemas para el cálculo numérico, algunos de los cuales se adaptan mejor ala estructura interna de la máquina.
Debido a que las computadoras están compuestas por dispositivoseléctricos o electrónicos y estos en su mayoría solamente poseen dosestados estables (cerrado o abierto, corriente o no corriente), el sistemamás adecuado para ellas, sería aquel que consta de dos dígitos o caracteres (O y 1). Esto es el llamado sistema binario.
Ahora bien. ese sistema presenta algunas dificultades en cuanto asu escritura, ya que por lo general la combinación de dígitos binariosresulta muy extensa. Por esa razón, se utiliza otro sistema más amplio,el sistema Hexadecimal, que consta de dieciscis caracteres, a fin de expresar los números escritos en binario en una forma más condensada.Sin embargo, hay que tener presente que las computadoras trabajansiempre en hinario y sólo utilizan el hexadecimal para ciertas informaciones de tipo operativo.
ESTADISTICA PSICO-EDUCATIVA 375
A pesar de que las computadoras pueden efectuar cualquier tipode operaciones, internamente ejecutan únicamente la operación suma.Por ejemplo, para realizar una resta, suman por complementos; parauna multiplicación simplemente suman; en una división, restan, o sea,suman por complementos; en una potenciación, multiplican, es decir,suman, etc. Por tal motivo las siguientes reglas se limitan a la operaciónsuma, y han sido deducidas a través de la experiencia y de acuerdo conH. Jacobowitz, podemos expresarlas cuma sigue:
l. En cualquier sistema de conteo, la base viene dada por el númerode caracteres o dígitos de que dispone el sistema considerado.Ejemplos:
a) El sistema decimal consta de 10 dígitos (O, 1, 2, ..... 9), portanto su base es 10.
b) El sistema binario consta de dos (2) caracteres (O y 1), siendoasí su base 2.
c) Al agregar una unidad al dígito más alto del sistema, la cuentaregresa a O y se acarrea I a la inmediata columna significativaa la izquierda.
Ejemplos:
1. En el sistema decimal : 9 + 1 =o 10,199 + 1 =o 200,109 + 2 =o
(109 + 1) + I =o I 10 + I =o I II
'") En el sistema binario 1 + 1=010, 101 + I =o 110
1011 +JI
1100 +l
II JO
En este caso las computadoras suman primero los dígitos correspondientes y luego ejecutan el acarreo.
376 JESUS DE LA ROSA
Basándonos en las reglas expuestas, las equivalencias existentes entre los sistemas binarios, decimal y hexadecimal, aparecen en la tabla18.1 que se encuentra más abajo:
Tabla 18.1
Decimal Binario Hexadecimal
O O OI 1 1
2 10 2
3 11 3
4 IDO 4
5 101 5
6 liD 6
7 111 7
8 1000 8
9 iOOI 9
10 1010 A
11 1011 B
12 1100 e13 1101 D
14 1110 E
15 1111 F
16 10000 10
17 10001 II
Como sabemos, los números en decimales pueden expresarse comepotencias de 10. Así:
583 = 5.10 2 + 8.10 1 + 3.10° = 500 + 8 + 32678 = 2.103 + 6.10 2 + 7.10 1 + 8.10°= 2000 + 600 + 70 + 8
ESTADISTICA PSICO-EDUCATIVA 377
Análogamente, los números en binario se expresan mediante potencias de 2, teniendo en cuenta la posición. Esto quiere decir, que sitenemos 2", n representa la posición, contando de derecha a izquierdaa partir del O,del dígito binario correspondiente.
Ejemplos:
100001
101011
1.23 + 0.2 3 + 0.22+ 0.I1 + 1.2°16+0+0+0+1=17
1.25 + 0.2 4 + 1.23 + 0.2 2 + 1.21 + 1.2°32 + O + 8 + O + 2 + l = 43
Siguiendo el proceso de los anteriores ejemplos, obtenemos unaforma sencilla para convertir un número binario a decimal. El procesoinverso, o sea, la conversión de decimal a binario se logra mediantedivisiones sucesivas por 2 hasta obtener como resultado O.
Ejemplo:
25 corresponde al binario 1100 l. El proceso para obtenerlo es elsiguiente:
2512631O
1OO1l
= 11001 ~ 25
Donde los números que aparecen en la columna de la izquierda sonlos cocientes de las divisiones sucesivas y los dígitos a la derecha son losrestos de dichas divisiones. Estos restos, tomados de abajo hacia arriba,representan el binario correspondiente.
Antes de introducirnos en el sistema electrónico de procesa-
378 JESUS DE LA ROSA
miento de datos es conveniente fijar algunas ideas necesarias para su generalización.
En primer lugar, veamos qué significa información. Esta puede tomarse como todo símbolo o signo inteligible. por ejemplo. un semáforo,una bandera. un saludo, etc. Por otra parte, la palabra procesar puedeser considerada como una transformación de información. por ejemplo:
Como sabemos, las computadoras proccsun información y en esesentido podemos hacer una analogía con el hombre, considerando unesquema general del proceso operativo de una computadora.entrada,procesamiento. almaccnamiento y salida. Las equivalentes correspondientes en el hombre vendrían dadas respectivamente por los sentidos,el cerebro y el sistema nervioso. la memoria y los medios de expresión(véase figura 18.1 l.
- -- --," Sentidos:: 1
Ientra<-Ia R
",..-------, ------'(' 1 I ,'Md' I,ere JrO I I e lOS II I :de expresión I
Proce~amiento 1-~--------1~-----'
"M- - ---,( emona;
..-_.a.....:a--'-__-, J
Figura 18.1
Con el fin de detallar un poco el esquema presentado en la figura18.1. consideremos como ejemplo un sistema corrcspondeintc a la computadora IBM 130, teniendo en cuenta que dicho sistema, como cualquier otro. está sujeto a posibles modificaciones, con sólo cambiarle.añadirle o quitarle una unidad: vemos así que una de las propiedades deun sistema electrónico de procesamiento de datos es su flexibilidad. Elsistema en consideración consta de las siguientes unidades:
l. Unidad de entrada. IBM 250 I (modelo Al l, lectora de tarjetas.
ESTADISTICA PSICO-EDUCATIVA 379
Esa unidad lee tarjetas perforadas d razón de 600 tarje tus por minuto. Además de la lectura de tarjetas existen otros medios de en
trada como puede ser lectura de papel magnetizado y cintas magnéticas.(Véase figura 18.2, que aparece más abajo).
Figura J8.2
IBM2501 Card Rcader
") Unidad Central de Procesamiento de Datos Como su nombre loindica, es la unidad donde se procesan y almacenan los datos. Incluyela memoria primaria y la memoria secundaria, la primera no visible,dinámica y de menor capacidad (8192 palabras) que la segunda, estaúltima es estática y consiste de uno o más discos sustituibles capacesde almacenar 512000 palabras; entendiéndose por palabras un conjunto formado 16 bits binarios. Siendo un bit la combinación de los dígitos binarios (O y 1).
Además de esa unidad incluye la consola (Kcyborad) que puedeser utilizada como unidad de entrada y salida (Input y Output),permitiendo de esa manera que la unidad 1130 pueda operar sinnecesidad de otras unidades adicionales (véase figura 18.3 J.
3. Unidades de Salida. 113M 1403 (Modelo 6 J e IBM 1442. La primeracorresponde a I:J impresora. posee 120 posiciones de impresión e
380 JESUS DE LA ROSA
imprime a razón de 340 líneas por minuto. La 1442 es la perforadorade tarjetas con una velocidad de 180 columnas por segundo (véase figuras 18.4 y 18.5).
Figura 18.3Central Processing Unit.
Figura 18.4
IBM 1403 Printer
ESTADISTICA PSICO-EDUCATIVA
Figura 18.5
IBM Card Read Punch
381
4. Unidad de Control de Comunicación: IBM 1133. Su función escomunicar las unidades externas (2501, 1442 Y 1403) con la unidad central de procesamiento de datos (l130) (véase figura 18.6).
Analizadas las unidades del sistema 1130 considerado, veamos unesquema general con objeto de tener una visión global del sistema representado en la figura 18.7.
En dicha figura, las flechas rectas ( ... ), representan las interacciones entre las distintas unidades del sistema. Las líneas quebradas(~) indican el sistema de comunicación ejercido por la 1133.
'18.1.3 ELEMENTOSEN EL PROCESO DE PROGRAMACION:
Como ya sabemos, las computadoras no resuelven problemas sino
382 JESUS DE LA ROSA
que procesan información. El proceso a seguir para resolver un problema cicnt rfico (como por ejemplo en Estadística), usando una computadora se puede esquematizar como sigue:
l. Piauteamiento del problema' Consideración de las variables, etc .
.., Análisis matemático: Análisis numérico y selección delos métodos estadísticos a utilizar.
3. Diagramación: Consiste en una descripción gráfica de la secuencia de operacionespor realizar para obtener la solución de un problema. Constituyeuna guía para el programador.Generalmente se le llama diagrama de flujo u organigrama).
Figura 18.6
Unidad dual hasta 58 millones
NCR Modelo 657
ESTADISTICA PSICO-EOUCATIVA
ControldaJ
Comunicación
1133
383
Figura18. 7
4. Codificación: Planteado ya el problema en forma gráfica, es necesario escribirlo en un "lenguaje" que pueda ser "entendido", luegode haber sido traducido por el Ilamado compilador de lenguajeinterno de la maquina (binario). Existen varios tipos de lenguaje,entre ellos el COBOL, ASSEMBLER, ALGOL, RPG, PLl, FORTRAN-IV, etc.
En este texto nos dedicaremos solamente al FORTRAN IV, porser uno de los más sencillos y adaptables a cualquier tipo de problemas.
5. Verificación: Comprobación y correciones, en caso de errores.
6. Ejecución del programa.
7 Interpretación de los resultados obtenidos.
384 JESUS DE'LA AOSA
Para mejor comprensión de ese proceso véase la figura 18.8.
Los dos primeros puntos anteriormente tratados (planteamiento yanálisis matemático) no presentan problemas en cuanto a la computadora se refiere, ya que ésta poco puede hacer para ayudarnos. La responsabilidad sobre estos dos puntos recae completamente en la personaque plantea el problema, y requiere un amplio y perfecto conocimientodel mismo y dela materia inherente.
rI CORRECCION
MALOS
PLANTEAMIENTO
•ANALlSIS MATEMATlCO
•ORGANIGRAMA
•CODIFICACION 1
•rVERIFICACIONI
I~
ICOMPROBACION
I MALOS'~ BUENO
I EJECUCION
•f
INTERPRETACIONDE
\RESULTADOS
l BUENOS
I FIN IFigura 18.8
Interpretación de resultados
ESTADISTICA PSICD-EOUCATIVA 385
El diagrama de flujos, que como dijimos sirve de guía al programador, es de suma importancia en la realización de cualquier problema, yaque nos da una idea visual de su planteamiento y resolución.
Para nuestros propósitos, podemos resumir el conjunto de figuraso símbolos que componen el diagrama de flujo como sigue:
\--------../
<>oo
•..r1
El trapezoide representa una instrucción de entradao de salida (INPUT y OUTPUT) con ellos READ oWRITE.
Un rectángulo indica cualquier tipo de operación deprocesamiento excluyendo una decisión.
Un rombo indica una decisión (lF)
Un pentágono se usa para conexión de página.
Un círculo conecta cualquier entrada de la salidapara cualquier otra parte del diagrama .
Las flechas indican la dirección del flujo en el organigrama.
El óvalo especifica el punto de partida, alguna interrupción y el final del diagrama.
386 JESUS DE LA ROSA
En la codificación se requiere el conocimiento del lenguaje utilizado. Para efectuar esa parte necesitamos de la llamada hoja de codificación y de la tarjeta IBM (véase figura 18.9).
Cada línea de la hoja de codificación representa una instrucciónen lenguajer FORTRAN (siendo el lenguaje un sistema de traductor),o sea en cada línea no puede ir más de una instrucción y ésta equivale auna tarjeta.
Siguiendo reglas preestablecidas la hoja de codificación y la tarjeta serán utilizadas en la siguiente forma:
l. Las columnas laS se utilizan para los números que especificanuna instrucción.
2. La columna 1 se utiliza también para colocar un C. En caso decomentario, éste no es una instrucción, sencillamente es una información para el programador o el operador.
3. Para la descripción de las instrucciones se usan las columnas 7 a22.
4. La columna 6 se utiliza para indicar una tarjeta de continuación,para ello se coloca un número empezando desde l y en orden creciente hasta 9, en caso de necesidad.
5. Las columnas restantes, o sea de la 73 a la 80 sirven para identificación de las instrucciones, a fin de facilitar la ubicación de losposibles errores. Los caracteres que en ellas aparecen no son procesados por el compilador FORTRAN y se pueden utilizar paracualquier tarjeta.
6. En la hoja de codificación se coloca un solo carácter en cada casilla, teniendo en cuenta que los espacios en blanco pueden utilizarse libremente.
Las reglas antes mencionadas se refieren a la codificación y perforación del programa en sí; para los datos se puede empezar indistintamente a partir de la columna l.
La perforación de tarjetas se hace a través de máquinas similares a
ESTADISTICA PSICO-EDUCATIVA 387
las de escribir, llamadas perforadoras; no es absolutamente necesarioque el programador sepa utilizarla. Sin embargo, es conveniente conocerlos códigos de perforación. En la tabla 18.2 se dan los códigos utilizadosen un sistema considerado.
18.2 LENGUAJE FORTRAN
Como sabemos, el FORTRAN es uno de los lenguajes más sencillos.Su nombre proviene de una combinación de los términos FORmulaTRANslation, o sea, traducción de fórmulas. Podemos verlo tambiéncomo un "convenio" entre el programador y la computadora.
Un programa FORTRAN consta de una serie de instrucciones,sentencias o proposiciones (statement) que puede ser de varios tipos,entendiéndose por sentencia una frase escrita en FORTRAN.
DEPARTAMENtO DE MATEMATICAS CENTRO DE COMPUTACION
1 '1 IMt.rvecIOMl de perforoci6n IN.... .... J..- .cj¡¡ 10.."... 1 I 1 M....Io ......1Óto1 .....IRcacl6n_........1".... """....d.~ 1 I I A""··· ..
,...-....."A ceM.NTA"'IO.
~o=c1;nl~.PROPOSICION fOOIAN
50 .~ 60 70 n10. 15 20 25 30 35 60 .., 65............,
~-:".. .~..... •~
......--PROPOSlCION FORTRAN - 1--'-. ...........................".................................... ........ 1-.......................................................... ·._111__•._.._ ti,,,,, 1-,,, tI1111';"I""'II"""II'II"""""""1"""""""""""
ti UtUntllUJlzUUtU,uUUntUullUnUtlUUnlUllUIJIUI 111111. I-n JIIIIUJI,UUIUUIIIUIIIUIIUIIIIIUIUII,JIUUIUU3UnUJ Utun
1-... ..............................................................~"u ............................ ....,....1----'-.. Iluuusn,uunnsus""I""",'n.'n"Uu.'n~"IU""" 'UI""
¡.... ................................................................. ....... 1----'-
'" 11111111 11111Jllll'11l1lJll'll11111fllllllllffl lllll 11lnllrlnlfl lllllfll 1--"-.............................................................Il¡........ ....... 1-----'-" "t.!.\!!.""uaUWt!.C!tttt~ttttt~t~~~~~ttt~~~~t:.!:.:.:.:.~~~~~ .......,.........,
-
Figura 18.9
Hoja de Codificación FOR TRAN
388 JESUS DE LA ROS~
El conjunto de proposiciones escritas en FORTRAN y perforadasen tarjetas nos da el llamado programa fuente; éste se convierte a travésdel compilador FORTRAN en programa objeto que es el que va a serprocesado por la computadora. Como dijimos, el compilador se encargade traducir el programa fuente a lenguaje de máquina y no es más queun programa interno del computador proporcionado por los fabricantesdel mismo.
Perforación I PerforaciónCarácter tarjeta IBM Carácter IMjela IIJM
O O 0 11-61 1 P 11-72 2 Q 11-83 3 R 11-94 4 S 0-25 5 T 0-36 6 U 0-47 7 V 0-58 8 W 0-69 9 X 0-7A 12-1 Y 0-8B 12-2 Z 0-9e 12-3D 12-4 12-8-3E 12-5 ( 0-4-8F i2-6 ) 12-4-8G 12-7 I + 12H 12-8 i * 11-8-41 12-9 - 11
J 11-1 I
I0-1
K 11-2 > 0-8-3L 11-3 I • 8-5M 11-4 =.
I8-3
N 11-5 Espacio Blanco (no perf.)
NOTA: La máquina perforadora puede interpretar algunos de los caracteres especialescon otros símbolos en la parte superior de la tarjeta; sin embargo, lo que re,mente la computadora procesa es lo perforado en las columnas. En la tabla, losnúmeros 12 y 11 se refieren respectivamente a las zonas 12 y 11, ya que las letrasson escritas en mayúsculas, para evitar confusión entre la "O" y el cero, convencionalmente se ha escogido el símbolo 9J para la letra "O", o viccYeJW..
Tabla 18.2
18.2.1 ESQUEMA GENERAL
Estando el FORTRAN constituido por proposiciones (instrucciones), veamos algunos de los distintos tipos que de éstas se presentan:
l. Instrucciones de entrada y salida; son ellas el READ y el WRITE
ESTADISTICA PSICO-EDUCATlVA 389
2. Instrucciones de transferencia de control; entre ellas tenemos IF,para una transferencia condicional y el G(/) T(/) para una transferencia incondicional.
3. Instrucciones de información (no ejecutables); las más utilizadasson el FqRMAT y el DlMENSION.
4. Otras nos indican ciertos procesos en la ejecución del programa sinque se requiera computación alguna; las más usuales son CALL,EXIT o ST(/)P, PAUSE y END.
5. Un quinto tipo se utiliza para determinar o especificar las operaciones aritméticas.
De las proposiciones indicadas en los puntos 1, 2 Y3 nos ocuparemos más adelante. En relación a los nombrados en el punto 4, hagamosuna breve descripción en cuanto a su utilidad y propiedad:
El CALL, EXIT o el ST(/)P, ocasionan un paro definitivo en la ejecución de un programa. Existen ciertas diferencias entre los dos, el primero permite la ejecución en serie de varios programas, mientras que elST(/)P no goza de esa propiedad. Ambos pueden ser utilizado más deuna vez en el mismo programa, siempre que sea necesario.
El PAUSE ocasiona un paro temporal en la ejecución del programay ésta puede ser continuada con sólo pulsar en la computadora el botónde START (comienzo). Puede aparecer más de una vez en el programa.
El END (fin) indica al compilador que se ha llegado al término delprograma. Debe ser la última instrucción en la codificación y es unaproposición no ejecutable, a diferencias de las anteriores.
Antes de especificar las expresiones aritméticas más usuales y sencillas, es indispensable considerar los elementos constituyentes. Tenemoslas constantes, las variables y los operadores.
Las constantes pueden ser consideradas como cualquier númeroutilizable en un cálculo sin que se altere su valor, en el transcurso delprograma. En el lenguaje considerado, las constantes se limitan a dardiferentes clases en forma y extensión, aunque puedan tener el mismovalor. Son ellos, las constantes enteras y las reales.
390 JESUS DE LA ROSA
Un número entero en FORTRAN, coincide con la concepciónmatemática, salvo diferencias en la extensión. Puede ser negativo. positivo o cero y el rango depende de la computadora utilizada. En elcaso de la 1130, los límites de existencia están entre -32768 y 32767.
Un número real en FORTRAN es un número escrito con puntodecimal, donde el punto equivale a la coma en lenguaje matemáticocorriente. Su rango varía de acuerdo, como en las constantes, con lacomputadora utilizada. Podemos, sin embargo, aproximar sus límitesentre 10-4 0 y 104 0 . Las constantes reales pueden también escribirseusando la forma exponencia~ en base 10. Esta se indica con la letra F.por ejemplo el número S x 10 puede escribirse como S.DE8 y Sx IO-~ .puede escribirse por 5 x DE-8, con el fin de representar en forma máscompacta las constantes reales.
Veamos ahora algunas de las propiedades más importantes relacionadas con ambos tipos de constantes:
1. El compilador FORTRAN diferencia las constantes reales de losenteros por la presencia o ausencia del punto decimal.
Ejemplo:
378
378.0 Q 378
Constante entera
Constante Real
2. Las dos formas no se pueden intercambiar debido a que por logeneral son almacenadas en formas completamente diferentes.
3. En las constantes reales, el punto decimal puede aparecer antes,después o entre dos dígitos cualquiera.
Ejemplo:
• 3 ó 0.33 • Ó 3.3 Ó 3.00
4. No existe restricción alguna en el número de dígitos decimales,pero no tiene sentido utilizar más de 8 Ó 9, ya que en su mayorra, las versiones de FORTRAN no retienen más.
ESTADISTI~A PSICD-EDUCATlVA 391
Una variable en FORTRAN es una representación simbólica queasume diferentes valores durante la ejecución del programa.
Las características que éstas presentan, pueden resumirse como sigue: los nombres de variables deben contener de 1 a 5 caracteres (números y letras), excluyendo los caracteres especiales. El primer caracterdebe ser una letra, que va siempre escrita en mayúsculas.
Como en las constantes, las variables pueden ser enteras y reales.
Las variables enteras pueden tomar cualquier valor permitido poruna constante entera. Estas se caracterizan por comenzar con cualquierade las siguientes letras: 1, J, K, L, M ó N.
Las variables reales toman cualquier valor permitido por una constante real y se diferencian en notación de los enteros por comenzar conuna letra cualquiera distinta de las utilizadas para las enteras, o sea, 1, J,K, L,MóN.
La distinción entre los dos tipos de variables, mediante la diferenteutilización de letras, al comienzo de la variable, se debe a que la computadora distingue una de otra por la primera letra.
Ejemplos:
1. Variables enteras permitidas: M, N, JL, Ll, 23, 16M5, etc.
2. Variables enteras no permitidas: 3JL (comienza por un número)1, 132 (tiene un caracter especial), MA235L (tiene más de cinco caracteres), K (321) (presentacaracteres especiales.
3. Variables reales permitidas: AL32, TARJ, PR(/)D, etc.
4. Variablesreales no permitidas: EPSIL(/)N (tiene más de 5 carac-teres), AR, T (tiene un carácterespecial), JPI (comienza con unaletra entera).
Aunque las variables se puedan usar con un nombre cualquiera,
392 JESUS DE LA RDSA
siempre es conveniente identificarlo con el cálculo que habremos dehacer, por ejemplo, si efectuamos un producto, lo llamaremos PRfl)D.
18.2.2 OPERACIONES
El lenguaje FORTRAN nos proporciona cinco operaciones básicasrepresentadas en la siguiente tabla:
Tabla 18.3
Descripcion de la operación
Suma
Resta
Multiplicación
División
Potencia
Operador
+
*
**
Nótese que ** se considera como un sólo símbolo. Los operadoresseñalados son los únicos permitidos, en caso de expresiones complicadasse procederá a combinarlas mediante el uso de paréntesis. En la utilización de esos operadores hay alguna restricción, entre ellas tenemos:
l. No se permite el uso de símbolos operativos contínuos.
2. Los paréntesis se utilizan para indicar grupos de operaciones, demanera similar a la notación matemática, salvo la diferencia queen FORTRAN no se permite el uso de otros símbolos de agrupaciones (corchetes, llaves, etc.), que son sustituidos por paréntesis.Los paréntesis especifican el orden de ejecución, realizándoseprimero la operación interna.
3. La ejecución de las operaciones sigue el siguiente orden:
a) Potenciaciónb) Multiplicaciones y/o divisionese) Sumas y/o restas (adiciones y/o sustracciones)
ESTADiSTICA PSICO_,EDUCATIVA 393
4. En caso de haber en una misma expresión multiplicaciones y divisiones, sumas y restas, se sigue el orden anterior, efectuándolasde izquierda a derecha.
Ejemplo: Es la expresión A/B * C, primero se efectúa la divisióny el resultado de ésta se multiplica por C.
18.2.3 INSTRUCCIONES DE ENTRADA Y SALIDA
Son aquellas que comunican a la computadora con el mundo exterior. La instrucción de entrada en FORTRAN tiene la siguiente forma general:
READ (a,b) lista,
donde READ es el nombre de la instrucción, a es un número enterofijo que indica la unidad de entrada (en nuestro caso se utiliza el 8 porla 2501); b es un número entero, también, que indica la instrucciónF0 RMAT vinculada al READ; en éste se especifica la manera como vana ser leídas las variables correspondientes. Lista, representa las diferentes variables que :van a ser leídas: pueden ser de cualquier tipo y número arbitrario.
Ejemplo:
READ (8,12) A, K, MER, RAIZ12 F0RMAT (especificaciones)
La forma general de la instrucción de salida es:
WRITE (a, b) lista,
donde a, b y lista tienen las mismas funciones que en READ WRITEsignifica escribir y es el nombre de la instrucción. En nuestro caso la aestá representada por los números 5 para la 1403 y 9 para la 1442 y 1para la consola.
El F0RMAT, como dijimos antes, da información a la computadora de cómo van a ser escritos o leídos los datos. Como existen variostipos, analicemos brevemente los más importantes y usuales:
39" JESUS O F LA ROSA
Fl,l)RMAT. tipo l sc usa para variables enteras y su forma ~cneral esIW. donde W representa el número de posiciones que ocupa la variaole escrita o lc úla: el valor de W, lógicamente no debe ser mayor que 5.
Fr¡') RMA T tipo F. se usa para variables reales y su forma ~cncral vienc dada por FW.d: donde W representa el número de posiciones, incluyendo el punto, las cifras decimales y el signo: y d se refiere al númerode cifras decimales que posee dicha variable.
Fl,l) :~MAT tipo X o Q o T. Su función en caso de lecturas, es saltarcolumnas y en caso de impresión o perforación. saltan posiciones: susforms gl'nerales son WX y TW, donde W es el número de columnas oposiciones que van a ser saltadas. Se diferencian en que la W en el Xindica un número de posiciones a saltar antes de la que va a leer o imprimir, y" en la T cae exactamcn te en la posición en que se va a imprimir
o leer.
Fr¡') RMA T tipo H o ( , , ), se utiliza generalmente en la impresióny sirve para escribir alguna leyenda o snnbolo. En el caso de usar H seescribe WH, donde W indica el número de caracteres a ser escritos. Siusamos apóstrofe. sólo basta encerrar con ellos la frase a escribir.
Fl,l) RMAT tipo L su función en caso de lectura es saltar tarjetas,sin procesarlas yen caso de impresión es saltar líneas.
18.2.4 INSTRUCCIONES DE TRANSFERENCIA DE CONTROL
Son aquellas que interrumpen la secuencia lógica que se sigue enun programa. Los elementos de que disponemos en el FORTRAN paraeste tipo de transferencias son entre otros el G(/J T(/J y el IF aritmético.
El G(/J T(/J indica una transferencia de control incondicional a alguna otra proposición existente en el programa. Su forma general es:
G(/) Tr¡') n,
donde n representa el número que especifica la instrucción a donde vaa ser transferido el control. Cuando encontramos una instrucción de este tipo, no se ejecuta la que sigue en el orden lógico, sino la que estáespecificada con el número n. Este debe ser entero. La instrucción nopuede estar antes o después del Gr¡') T(/).
E5T ADI5TICA P5ICQ-EDUCATIVA 395
El 11" aritmético transfiere el control, bajo cu-rtas condiciones, Suforma general es IF (a) ni' n2' n3' en cl cual a pUl'dc ser una expresióncualquiera y n l' n 2 , n 3, son números de instrucciones a donde se transfiero el control.
El proceso que se sigue es el siguiente:
Si la expresión encerrada en paréntesis es negativa, la instruccióna ejecutar es la ni, si es cero se ejecuta la n , Y si es positiva se transfiereel control a n3'
Las expresiones en FORTRAN indican especificaciones de cálculosconstituidos por constan tes, variables y operadores, Pueden ser constan,tes o variables solas,
Ejemplos:
La siguiente tabla nos da algunos ejemplos de expresiones permitidos en FORTRAN:
Tabla 18.4
Expresión Descripcion
K El valor de la variable entera K
A + 2,18 La suma del valor A y la constante 2.18
RH(¡) - SIGMA La diferencia entre RH(¡) y SIGMA
OMEGA(6.2832 El cociente de la variable OMEGA y 6,2832
e * * 2 e2
(A + F)(X + 2,0) A+FX + 2
e + D(B + AC+ ~ +A
I(X * * 2 + Y * * 3) El recíproco de (X 2 + y 3)
396 JESUS DE LA ROSA
Las expresiones en FORTRAN pueden mezclar constantes y variables enteras con reales, aunque para la potencia, una expresión enterasólo puede ser elevada a una potencia entera, mientras que una real puede ser elevada a cualquier potencia.
Las proposiciones para calcular estas expresiones se les llama deasignación aritmética; tienen la siguiente forma: a = b, donde a es unavariable cualquiera, y b una expresión de cualquier tipo. El signo ( = )no tiene el mismo significado que en matemáticas, se toma como "esreemplazado por".
Es por ello que aparecen con bastante frecuencia proposiciones deltipo M = N + l que significa que el valor de la variable N va a ser reemplazado por su sucesor.
En las proposiciones de asignación matemática se pueden convertirexpresiones enteras a reales y viceversa. Esto puede visualizarse con unejemplo 1 = (A + 12.5) * * 2. Aquí la expresión real es calculada enreal y convertida a entero, el resultado se almacena en la variable I. Estoquiere decir, que si escribimos una variable entera a la izquierda y unaexpresión real a la derecha, el resultado obtenido será entero, teniendoque la parte decimal, la computadora no la aproxima sino que la trunca,por tanto no es muy conveniente su resultado.
Hasta aquí, una breve introducción al uso de las computadoras,que el autor recomienda a quienes tengan interés en cursos de programación y manejo de computadoras que suelen ofrecerse en universidades e institutos superiores del país.
ESTADISTICA PSICO-EoUCATIVA
Calculador electrónico impresor, Olivetti-Programma 101.
Figura 18. 10
397
TABLASY
APENDICES
APENOICE A
APENDICE MATEMATICO
REPASO. DECONCEPTOSFUNDAMENTALES DELA ARITMETICA y EL ALGEBRA
En este apéndice trataremos dos temas: la aritmética y el álgebraelemental, acompañado de una exposición de la naturaleza de la medición. Resulta que muchos errores que se cometen en los cálculos estadísticos son equivocaciones en las operaciones aritméticas sencillas. Porello, comenzaremos con un repaso breve de las reglas que se deben seguir para que los cálculos sean correctos.
DECIMALESAdición y Sustracción: Para sumar y restar decimales se disponen
los números con los puntos decimales unos debajo de los otros. Así,para sumar 3.094, 235.67 Y 45.7 se colocan los mlmeros como sigue:
3.094235.6745.7
284.464
Multiplicación: Al multiplicar decimales, el producto tiene tantascifras decimales como hay en el multiplicando y en el multiplicadorconjuntamente, como se muestra a continuación:
1.072x 0.02
0.02144
0.00007Á 0.2
0.000014
1.2x 1.2
24121.44
401
402 JESUS DE LA ROSA
División: Al dividir dos decimales, el número de cifras decimalesdel cociente es igual al número de decimales del dividendo menos el nü- .mero de decimales del divisor, siempre que la división sea exacta.
0.0120.3 0.04 2.0648 = 10.324
0.20.008
0.8 0.0001
FRACCIONES:
Adición y Sustracción: Para sumar o restar dos o más fracciones,deben reducirse a un común denominador, como se indica a continuación:
. _1_+_1=.2...+-.1...=_5_ 2 2-.L+2_1_=J..!...+~=-!l-=3_123666 42444 4
ya + xbyb
Multiplicación: Para multiplicar fracciones, se multiplican todoslos numeradores y se divide por el producto de todos los denominadores, como se indica a continuación:
Al multiplicar fracciones, se ahorra tiempo si se suprimen antes losfactores comunes del numerador y denominador de una fracción por unmismo número. El producto no varía. Repitamos las operaciones delúltimo ejemplo.
Primero se suprime el factor 3 del numerador en el factor 3 del
ESTADISTICA PSICO-EDUCATIVA 403
denominador. Después, el factor 4 del numerador con el4 del denominador. El 2 del numerador se divide por el 6 del denominador, con loque queda un 3 en este último. Resulta entonces 1 x I x 4 en el numeradory Ixl x 3 x 5 en el denominador.
El producto de los términos del numerador es igual a 4; el producto de los términos del denominador es 15. Se obtiene la misma respuesta, cuatro quinceavos, como era de esperar.
División: Para dividir dos fracciones se multiplica la fracción dividiendo por la fracción recíproca del divisor.
3 2 3 3 9 1I--+-=--x-=--=--4 3 4 2 8 8
2 II Il 7 7 132-.!.. -=--x--=-=--3 . 7 4 II 4 4
x a x b xb----=-x--=--y b yaya
NUMEROS NEGATIVOS
Adición: Para sumar números que son todos negativos se sumancomo si fueran positivos y se antepone el signo menos al resultado.
(-6) + (-8) + (-12)= -26
Si s610 existen dos términos y uno es positivo y otro negativo, parasumarlos se resta el menor del mayor y se antepone el signo del mayor.
-682
-2228
6
56-72- 16
19- 39- 1I
Cuando se suman más de dos números de signos diferentes, se suman todos los números positivos y todos los negativos por separado yse combinan los resultados como antes.
JESVS DE I.A ROSA
(-4) + (-7) + (8) + (13) + (-12) + (-5)= 21 + (-28)=-1
Multiplicación: El producto de dos números del mismo signo, positivo o negativo es siempre positivo. Si el signo de uno de ellos es positivo, y el otro del otro es negativo, el producto siempre es negativo.
6
....!.l12
(-6)x (-2)
12
6x (-2)- 12
-6..!.QL- 12
EMPLEO DEL CERQ
La regla principal que es preciso recordar cuando interviene el ceroes: cualquier numero multiplicado por cero es cero.
2x O = O
(0.5) (3.550) x (O) = O
abe x 0=0
Empleo de la tabla de cuadrados, raíces cuadradas y recíprocos delos números enteros del 1 al 1000: El que aprende a utilizar la tabla decuadrados, rnl<'es cuadradas y recíprocos de los números enteros ahorraría mucho tiempo en sus cálculos. Supongamos que se desea calcularlo siguiente;
4 133"4=y:¡
Naturalmente, se podría reducir a un común denominador y luegosumar las fracciones. Pero existe otra forma más fácil. Los recíprocos decada uno de los denominadores se pueden leer en la cuarta columna dela tabla de cuadrados, raíces cuadradas y recíprocos, y cada uno se multiplica por su respectivo numerador.
1"3'4= 0.025641
137= 0.027027
eSTADISTIC.o. PSICO-EOUCATlVA
4 (0.025641) 13 (0.027027) <::0.102564 0.351351= 0.453915 = 0.454
Si se tiene que dividir un número por la raíz cuadrada de otro sepuede'etectuar muy fácilmente. Sea:
13.¡rr
Utilizando la quinta columna de la tabla de cuadrados, raíces cuadradas y recíprocos se procede así:
13 (~)== 13 x (0.1644) = 2.1372 = 2.14
RAIZCUADRADA:
En !as operaciones estadÍSticas, con mucha frecuencia, es necesario extraer una raú O1&4dtada. La tabla de~, raíces cuadradasy recíprocos~ la raíz ouadrada de todos los nóIneros enterosQOI.RpreDdidos ontre 1 y .1000. DesgraciadaJbe* amchOll de losnómelOI que le obtieM1t al)as dfJdntas 0peracorl8~1 no IOn enteros Y. pOI" con$igUiente, no pueden leerse~te en la tabla.
SUpongamos que se quiere extraer la raíz cuadrada de 144. En latabla de cuadrados, Rioes cuadradas y recíproool se obtiene la raízde dicho numero que es 12. Supongamos que no tenemos la tabla amano. Si el número es entero se procede así:
144I
44 22 x244
Se divide el número en grupos de dos cifras, empezando por laderecha. El primer par contiene sólo un dígito, l. Hallamos el mayor
406 JESUS DE LA ROSA
cuadrado contenido en el mismo. En este caso, el mayor cuadradocontenido en 1 es l. Se escribe este número debajo del 1, y se resta.Luego se sitúa la raíz cuadrada de este cuadrado, 1, en la caja de la derecha del radical. A la derecha del resto se escribe el segundo grupo de cifras, 44, separando mentalmente la última cifra. El número que queda ala izquierda, 4, se divide por el duplo de la raíz hallada, 2 x 1 o 2. Elcociente 2. Se escribe esta cifra a la derecha del duplo de la raíz hallada, y el numero resultante, 22, se multiplica por aquella misma cifra, 2.Si el producto puede restarse del dividendo seguido del grupo de cifrasseparadas, 44, cilio valor, 2, será la segunda cifra de la raíz. Si la restano puede hacerse, se disminuirá aquélla en una unidad y se repetirá elproceso hasta que la resta pueda efectuarse. El último resto sería elresiduo de la operación que en este ejemplo no existe.
Supongamos ahora que se quiere extraer la raíz cuadrada del número 876.457
876.457000 29.6054------476 49 x 9441---3545 586 x 63516----297000296075 59205 x 5
975
Ahora, a partir del punto decimal, se separan las cifras en gruposde dos hacia la derecha y hacia la izquier.da.
A la izquierda del punto, el primer par separado es 76 y el segundoes 8. A la derecha, el primer par separado es 45 y el segundo 70. Obsérvese que hemos añadido un cero para obtener un número de cifras par.Haciendo como en el caso anterior, el mayor cuadrado contenido el). 8es 4. Se escribe el 4 debajo del 8 y se resta la raíz cuadrada de 4, que es2, se coloca en la caja de la derecha del radical. Junto al resto obtenido,
ESTADISTICA PSICO-EDUCATlVA 407
4, se escribe el siguiente par de cifras, 76, resultando el valor 476. Ahora se busca el dígito, que, colocado a la derecha de 4, duplo de la raízhallada, el número que resulta multiplicado por dicho dígito, se aproxime lo más posible a 476, pero siendo menor que 476. El dígito buscado es 9. Por tanto se coloca un 9 como segunda cifra de la raíz. Luegose resta 441 de 476 y se halla el siguiente para de cifras, 45. Ahora semultiplica la raíz hallada hasta el momento, 29, por 2, obteniendo 58.De nuevo, por tanteos, se obtiene un 6 como tercera cifra de la raízpedida y, por consiguiente se escribe un 6. Obsérvese que el punto decimal se ha colocado inmediatamente después del segundo dígito de laraíz, que corresponde al lugar inmediato al segundo par de cifras delnúmero original.
Una vez efectuada la multiplicación y hecha la resta, se halla elsiguiente par de cifras, 70, situándolo a la derecha, del resto, en loque resulta 2970.
Tomemos ahora la raíz hallada, 296, se multiplica por 2 y resulta522. Por simple inspección se observa que no existe número alguno quese pueda emplear ahora, puesto que cualquier número, distinto de cero,por el que se multiplique, da un producto mayor que 2970. Por tantose sitúa un O en la caja de la raíz cuadrada y se baja el siguiente par decifras, que está formado por los dos ceros que se han añadido a la derecha del número. Conviene aclarar que se pueden añadir tantos parescomo se necesiten y deseen, continuando la extracción de la raíz cuadrada con todas las cifras decimales que se quiera. Se repite de nuevoel proceso multiplicando por 2 las cuatro cifras de la raíz hallada en laque resulta un 5 como nueva cifra de la raíz. En este momento se hacalculado la raíz con tres decimales.
Debe tenerse en cuenta que lo más importante al extraer una raízcuadrada es separar los números por pares, empezando a partir del punto decimal a izquierda y derecha. Se dan seguidamente algunas raícescuadradas para hacer, con su solución una guía de comprobación.
45678.94567.89
4.5678945.6789
0.04567
045678.904567.89
04.56789045.6789
0.045670
408 JESUS DE LA ROSA
Sin embargo, con el auxilio de la tabla de cuadrados, raíces cuadradas y recíprocos, se pueden extraer raíces cuadradas con aproximaciónmés que suficiente. Supongamos que se quiere extraer la raíz cuadradadel numero 45360.0 mediante la tabla citada. Se busca, en la columnaW un número lo más aproximado a 45360 cuanto sea posible. Dichonúmero es 45469. Leyendo en la columna a la izquierda de 45369, resulta que la raíz .cuadrada es 213. Hallamos ahora, la raíz cuadrada delnúmero 453609. Se halla por la columna N2 hasta llegar al numero452929. El námero dado está aproximadamente en la mitad entre elnúmero anterior y el siguiente, con lo que la raíz cuadrada es 673.5.Debed observarse que si se quisiera extraer la raíz cuadrada del número4536.09 se procederra de la misma forma, bajando por la tabla hastallegar al nümero 452929. La única diferencia es que se separan lascifras de otra manera. En este último caso la respuesta sería 67.5.
Análogamente, bJ raíz cuadrada del número 4,5309 es, aproximadamente, 2.13.
POTENCIAClON:
Aunque el emplto J~ potencias en la esta4fstica elemental es muyUmitado, el estudi.!ttte lieheÑ saber qué es una poteacia y qw sígnífica.En la potencia 23 , el ftlbnéro 3 .os el exponente, y significa las veces quehay que multiplicar la~> 2, por sí misma. En este caso, 2 x 2 x 2 es_al a la tercera potencia;
32 =3 x 3 =9
43 = 4 x 4 x 4 =64
x· =(x) (x) (x) (x)
It'RACClONES y TAN1t>S PORCIENTO:
Una fracción, ll'le desigaaremos por p, es una parte de un todo.Tambim se llama proporción. Si un pastel se divide en seis trazos iguales, cada parte es una fracción del total y se puede escribir p = 1/6 obien 0.167.
Otro ejemplo: Supongamos que en una clase de 400 alumnos, 40
ESTADISTICA PSICO-EDUCATIVA 409
de ellos obtienen una calificación final igual a A; lOO alumnos obtienenla nota B; 150 alumnos obtienen C; 70 alumnos obtienen la nota D, y40 alumnos obtienen la nota F. ¿Cuáles son las fracciones o proporciones de cada calificación?
N P PA 40 0.10 10%
B 100 0.25 25 %
C ISO 0.375 37.5 %
D 70 0.175 17.5 %
F 40 0.100 10%---
N 400 1.000 lOO %
Debe observarse que la suma de las fracciones correspondientes aun todo es siempre la unidad; el valor máximo de una fracción de un todo es l. Al multiplicar el valor de una fracción por 100 se obtiene untanto por ciento. El símbolo que utilizaremos paca expresar un tantopor ciento es P. En nuestro ejemplo, los tantos por ciento correspondientes se encuentran en la columna de la derecha. Se observara que lasuma de los tantos por ciento de un todo es siempre igual a 100.
Es preciso advertir algo acerca de los tantos por ciento y las fracciones. Cuando el número de casos del todo es pequeño, los tantos porciento son inestables. Es decir, una variación de un caso puede producirun cambio relativamente grande en el tanto por ciento. Por ejemplo,cuando hay diez casos, una variación de uno produce un cambio en 10en el tanto por ciento.
En todo caso, y para que los futuros lectores de un determinadoestudio o trabajo estadístico tengan la suficiente información debe indicarse el numero de casos sobre los que se calculan los tantos por ciento.En un artículo se puede leer que en la enseñanza secundaria hubo unaumento del 132 por ciento en el número de nuevos profesores deinglés entre un afio y el siguiente, mientras el número de nuevos profesores de francés sólo había aumentado un 16.5 por ciento. Sin embargo,se debería haber advertido en el citado articulo que habían 11,266nuevos profesores de francés y s61065 de ruso.
410
REDONDEO DE NUMEROS
JESUS DE LA ROSA
El redondeo de números hasta el entero o decimal más próximoobedece a los criterios siguientes:
Aproximación a un entero
Aproximación a la décima
Aproximación a la centésima
7.2=77.8 =8
7.17=7.27.11 =7.10.09 = 0.\
7.177 = 7.180.674 = 0.671.098 = 1.10
La regla general es que si el último dígito es menor que 5, se desprecia; si el último dígito es mayor que 5, el anterior aumenta en unaunidad. El caso dudoso aparece cuando los números terminan en 5. Elcriteri? que seguiremos en estas circunstancias es que si el dígito anterior al 5 es impar, se aumenta en una unidad, y si es número par, seconserva. Los ejemplos siguientes explican este criterio.
8.875 = 8.88
8.05 = 8
6.25 = 5.2
66.975 = 66.98
DlGITOS SIGNIFICATIVOS:
Una cuestión que surge con frecuencia es la del número de dígitosque deben aparecer en la solución. Como criterio se puede adoptaren la solución uno o dos dígitos más que enlos datos de partida. Porejemplo, imaginemos una serie de puntuaciones de un test, cada una delas cuales contiene dos dígitos. Carece de sentido hallar los promedioscon cinco o seis cifras decimales cuando los datos de partida sólo tienendos. Dicho de otra manera, con un método de medición cuyos resultados tienen una precisión de dos datos, obtener una promedio con mucha precisión sólo por el hecho de sacar decimales.
ESTADISTI::A PSICO-EDUCAT1VA 411
El criterio, pues, consiste en dar la solución con una cifra significativa más que en los datos originales. A continuación, veremos algunosejemplos del número de dígitos significativos en una serie de números.
78
786
78.2
0.0025
dos dígitos significativos
tres dígitos significativos
tres dígitos significativos
dos dígitos significativos (los dos ceros a continuacióndel punto decimal no son significativos).
A veces los principiantes encuentran dificultades para redondearnúmeros en los problemas. Sin embargo, no tiene por qué suceder.Supongamos que se ha de realizar una operación en seis pasos. El finalde los cálculos parciales no se debe redondear a lo largo de la resolución de un problema, origina un error grande en el resultado final. Si seva a aproximar la solución hasta la décima, lo que conviene es operarhasta las centésimas en todos los cálculos y redondear a la décima en elúltimo paso.
412
EJERCICIOS
A) 1.- Efectuar las sustracciones o restas siguientes:
JESUS DE LA ROSA
a) 26.09- 7.16
d) 14.67-32.53
b) 87.54-22.13
e) 67.87- 7.13
e) 0.0987-0.9987
f) -54.89- 6.76
A) 2.- Efectuar las multiplicaciones siguientes:
a) 45.67 b) 12.345 e) 0.0008x8 x 0.906 x 0.07
d) 456.89 e) -0.777 f) -6.578x -2 x 1.000 x-0.9
A) 3. - Efectuar las divisiones siguientes:
16b)
81e)
- 2.525a) 0.4 0.009 0.5
144e)
- 0.49f)
-16.16d) -0.4 - 0.007 -4
ESTADISTICA PSICQ-EDUCATllfA 413
A) 4. - Hallar la raíz cuadrada de cada uno de los números siguientes:
a) 3249 f) 0.00025
b) 30625 g) 9.0009
e) 306916 h) 1/9
d) 777.89 i) - 0.49
e) 8876.9 j) 76453.678
A) 5.- Redondear hasta la décima cada uno de los números siguien-tes:
a) 14.36 f) • 90.25
b) 24.32 g) 81.95
e) 17.798 h) 56.35
d) 0.098 i) 48.575
e) 1.011 j) 0.125
A) 6.- Decir cuáles dfgitos o Cifras significativas hay en cada uno delos números siguientes:
a) 234.67 e) 5004.009
b) 10.67 f) 0.009
e) 0.67 g) 7.2
d) 0.067 h) 0.01
A) 7.- Simplificar las expresiones siguientes, redondeando las res-puestas hasta la milésima:
a) 1/42 1/71 e) 3/51 11/92 - 10/61
b) 11/41 6/369 f) (1/31 )(2/33)
e) 12/37 17/59-8/31 g) (6/53)-(7/56)
d) 1/14 7/61
APENDICEB
ESCALAS DE MEDICIONES
VARIABLES ESTADISTICAS
TIPOS DE MEDICIONES.
Las variables estadísticas son de dos tipos: contínuas y discontrnuas o discretas. La longitud, la masa y el tiempo son ejemplos de variables contínuas. De dichas variables se pueden hacer mediciones devarios grados de precisión. Por ejemplo, el metro puede subdividirse encentímetros, el centímetro en milímetros y, con instrumentos especiales, es posible hacer mediciones aún más precisas. Este tipo de variablespueden representarse por los puntos de una recta. La cuantía y "la precisión de las mediciones que se pueden hacer a lo largo de esa recta dependen del modo con que se realicen.
1555
156
156.5
157
157.5
158
158.5
159
159.5
160
160.5
LIMITES INFERIOR Y SUPERIOR DE UNA VARIABLE CONTINUA
Para explicarlo, imaginemos que se mide a un muchacho y resultaque mide 157 centímetros. ¿Significa que mide exactamente 157 cms?Probablemente no. Al leer la escala se obtiene simplemente el númerode centímetros al cual se aproxima la estatura del joven.
Esos 157 centímetros están comprendidos en un segmento de recta; dicho segmento comprende desde 156.5 hasta 157.499 centímetros.Podemos redondear el último número y expresar que 157 abarca 156.5hasta 157.5 centímetros.
416 JESUS DE LA ROSA
De manera análoga, una lectura de 158 centímetros comprendedesde 157.5 hasta 158.5 centímetros. Las lecturas de variables continuas tienen un límite inferior y un límite superior como se muestra enla figura 56.
Por otra parte, los datos de las variables discontfnuas o discretasresultan de mediciones que sólo pueden expresarse por números enteros. Al contar personas, por ejemplo, sólo pueden obtenerse enteros, alcontrario de lo que ocurre con el resultado de la medición de una longitud, que puede ser un número real cualquiera. otros ejemplos de variables discretas son el número de palabras de un libro, el de objetos deuna clase y el de automóviles que pasan por un lugar durante un ciertoperíodo de tiempo. Sin embargo, se observará que en los trabajos estadísticos la mayoría de las variables tienden a ser tratadas como continuas, de manera que se puedan establecer proposiciones tales comoésta: el número medio anual de profesores que salen -del país a cursarespecializaciones es de 2.4. Debe uno acostumbrarse a pensar que todonúmero tiene un límite superior y otro inferior.
ESCALA DE MEDIDA. MEDlClüN.
Stevens y Vela han escrito mucho sobre los tipos de escalas que seutlizan en la ciencia. Aún no todos los estadísticos están de acuerdo conStevens y Vela acerca de las mediciones que deberían utilizarse con losdiversos tipos de mediciones según su clasificación, ambos han ideadoun sistema que sirve para enfocar lógicamente la medición. Como se haindicado, si no existiese la medición no habría estadística, y si las mediciones fueran exactas en todos los casos, habría mucha menor demanda de estadísticas.
Stevens y Vela reconocen cuatro tipos de escalas: cardinal o nominal, ordinal, por intervalos y de razones.
Las escalas cardinales se utilizan como medidas de identificación.Los números son como etiquetas que identifican particularidades o clases. En su forma más simple, los números que llevan en la espalda losatletas, representan una escala cardinal.
Otros ejemplos son la clasificación de personas por categorías.
ESTADISTICA PSICO-EDUCATIVA
Concretamente, cuando se estudia una muestra de los habitantes deuna nación, puede hacerse una clasificación respecto de sus ideas religiosas de la manera siguiente: (l ) protestantes, (2) católicos, (3) satánicos, (4) judíos, (5) practicantes del vodú.
Pero también podrían clasificarse respecto del sexo, color de losojos, partido político a que pertenecen, zona urbana o rural, etc.
Las estadísticas simples se realizan con datos cardinales. Por ejemplo, se puede determinar el número, fracción o tanto por ciento decasas en cada clase o categoría.
Si en una medición se emplea una escala ordinal, los números reflejan el orden de las personas u objetos. Las medidas ordinales se disponen de mayor a menor o viceversa. Un ejemplo clásico es el que seemplea al determinar la dureza de los minerales según escala de Mohes.La dureza, desde el punto de vista mineralógico es la resistencia queoponen los minerales a ser rayados. En esta escala, al talco se le asociael valor a 1 y se caracteriza por ser muy blando y rozarse fácilmente.Por el contrario, al extremo opuesto de la escala, al diamante se le asocia el valor 10 y se caracteriza por rozar todos los demás y no serrozado por ninguno, De forma análoga se puede hacer una ordenación de ungrupo de hombres por sus rasgos físicos? mentales. Las medidas ordínales revelan qué persona u objeto es mayor o menor, más brillante o masoscuro, más duro, o más blando, etc... que otro. Pero tales medicionesno dicen cuánto más alto o más fuerte es una que otro.
Estadísticamente no puede hacerse mucho más con las medidasordinales, excepto determinar la mediana y centiles, así como los coefi...cientes de correlación por rangos.
ESCALA POR INTERVALOS
El tercer tipo de escala, la escala por intervalos, proporciona números que reflejan las diferencias entre particularidades. En las escalas porintervalos las unidades de medida son iguales. Ejemplo de dichas escalasse presentan en los termómetros, escala centígrada y Fahrenheit, en eltiempo según se registra en nuestros calendarios, y en las puntuacionessegún los tests de inteligencia. En este último caso se suponen unidadesde medidas iguales. Con los datos, según una escala por intervalos, sepueden realizan mediciones estadísticas como la media aritmétlc;l. ladesviación típica y el coeficiente de correlación de Pearson.
418 JESUS DE LA ROSA
Las escalas por intervalos muestran que una persona o particularidad es tantas veces mayor o menor, más pesada o ligera, más brillanteu oscura, etc., que otra.
ESCALAPORRAZONES
La diferencia fundamental entre la escala de razones y la escala deintervalos es que las escalas de razones tienen un cero absoluto. Es verdad que las escalas de intervalos (por ejemplo, la centígrada) tambiéntiene un cero absoluto, pero tal punto es elegido arbitrariamente. Lasescalas de razones,en general, son medidas de longitud, pesos, capacidad, sonoridad, etc. En las escalas de datos obtenidos, según tales escalas, pueden ser sometidos a cualquier tratamiento estadístico.
Expresando los datos en metros, por ejemplo, se puede afirmarcuando un segmento es mitad o doble que otro. Si las mediciones serealizan según una escala por intervalos, la afirmacíón anterior carece desentido. Por ejemplo, supongamos que la temperatura máxima de hoyes 400 C, y la de este día el afio pasado fue de 200 C. En este caso no sepuede afirmar que el calor de hoyes doble que el del mismo día del afioanterior. ¿Cuál es la diferencia entre las dos condiciones? Cuando setrata de una longitud se utiliza una escala de medida en un cero absoluto, pero en este caso se ha empleado una escala cuyo origen es 00 e,punto de solídíñcación del agua. Cuando las mediciones se realizan según una escala de razones, se pueden hacer comparaciones significativas. En realidad, cuando los datos son de este .tipo, pueden hacerse todas las operaciones matemáticas y estadísticas usuales. Sin embargo, enla práctica, muchas de las mediciones se basan en escalas por intervalosy se emplean casi todas las técnicas estadísticas a estas medidas.
¿Qué se puede decir acerca de las mediciones que se realizan en pedagogía, psicología y otras ciencias sociales? Ante todo, se supone confrecuencia que poseen unidades iguales de medida. Una inspección dealgunos índices utilizados, como el coeficiente de inteligencia, revelaque esta hipótesis no es cierta probablemente. Además, las escalas noposeen un cero absoluto. El físico puede definir un cero absoluto enuna escala de temperaturas. No es difícil tampoco imaginarse una medida de cero centímetros, o de cero gramos. Sin embargo, ¿qué significaun coeficiente de inteligencia igual a cero? ¿Qué quiere decir que unalumno obtiene una puntuación cero en un test de geografía? En reali-
ESTADISTICA PSICO-E DUCATIVA 419
dad, estas puntuaciones nulas no se sabe qué significan. Deaquf se deduce que no existe una base firme para establecer que una persona con uncoeficíente de inteligencia doble que otra es doblemente inteligencia. Nitampoco se puede afirmar que un alumno cuya puntuación en un testde aritmética es doble que otro sabe doble aritmética que éste.
APENOICEC
SIMBOLOSESTADISTICOS
N ~= Población, muestra total, número de individuos en una distribución.
XY = Puntuaciones directas en las variables X, Y.~ = Sumatoria, símbolo que expresa la suma de todos los valores.f = Frecuencia.
fa = Frecuencia acumulada.Fe = Frecuencia empírica u observada.Ft =::; Frecuencia teórica.F ~C Frecuencia acumulada hasta U/la puntuación señalada pero
excluyendo la correspoudieut« a dicha puntuación.Fm cco Frecuencia modal,
'foFa 'Porcentaje de freeur-ncias acumuladas.M, X ' , Media aritmética.
MG 'Media geométrica.M A =::; Media armónica.MC = Media cuadrática.
MCu. = Media cúbica.ME == Media bicuadrática.
Mdn = Mediana.M o =Moda o modo.x, y =::; Desviaciones respecto a la media aritmética de las puntuacio
nes X, Y.x' = Desviación en unidades de intervalo de clase respecto del inter
valo de clas. modal o con respecto a la media aritmética.l~' Magnitud de límite inferior de UII intervalo de clase.
L = Magnitud de límite superior de un intervalo de clase.
421
422 JESUS DE LA ROSA
Ll l == (Delta) diferencia, sin tene-r U1 cuenta los signos entre la fn'cuencia de la clase modal y tI.' la clase superior que la sigue.
Ll, = Diferencia, sin tener en cuenta los signos entre la frecuenciade la clase modal y la de la clase inferior que le sigue.
i = "Intervalo de clase" o puntuaciones incluidas entre el límitesuperior e inferior.
AT = Amplitud total (medida de dispersión).DM == Desviación media (medida de dispersión).
DS, DT, s, 17 = Desviación tipica o estándar.DS', s', 172 = Variancia o varianza.
pm, xm = Punto medio del intervalo de clase.IS = Intervalo superior real.
MS = Media aritmética supuesta.Q. = Cuartil 1,2, 3 o 4.p. = Percentil de n.Z = Media Z o puntuación estándar de x] DS,T = Media T o puntuación normalizada.
bu" ~" Coeficiente de regresión.r == Coeficiente de correlación.
rq := Coeficiente de validez, correlación entre las variables X y Y.P = Coeficiente de correlación ordinal.
rbl. = Coeficiente de correlación biserial.rpb := Coeficiente de correlación punto biserial.e = Coeficiente de contingencia.
Ixl == Valor absoluto de x,rt = Coeficiente de correlación tetracórica.x == x estimada.y = y estimada.
X' == Ji cuadrada.CV == Coeficiente de variación,
Se, e == Error estándar de medida.p == Probabilidad de que un hecho ocurra.q == Probabilidad de que un hecho no ocurra.t == Prueba t de Student,
F == Índice F de Snedecor para análisis de varianza.~ := Coeficiente fi.u == Media de la población.
APENDICED
GLOSARIODE TERMINOSESTADISTICOS
Agrupamiento: Acumulación de todaslas observaciones de algunos valoresde la variable dentro de una claseúnica.
Ajuste: Conformidad de la distribución teórica y un grupo de datosempíricos.
Amplitud total: Media de variabilidad menos exacta resultante de ladiferencia entre la puntuación mayor y menor. Dicho resultado sedenomina índice de dispersión.
Análisis de varianza: Método para determinar si las diferencias encontradas en una variable dependiente,cuando está influenciada por variables experimentales, exceden osobrepasan a lo que se espera porazar.
Análisis factorial: Método estadísticopara interpretar puntuaciones y correlación de los mismos en un número de tests. Los principales exponentes del análisis factorial sonSpearman, basado en las ideas deGalton y Pearson, Thomson, Burty Thurstone. La técnica del análisisfactorial, como nos dice M. Vela,exponente en España de este método, comprende cuatro fases: preparación, Iactorizaclón. rotación einterpreiación.
Auállsls muitivariado: Técnica utilizada para identificar o probar el
efecto de muchas variables cuandoactúan simultáneamente.
Atenuación: Reducción del coeficiente de correlación por el uso de medidas no confiables.
Asimetría: Carencia de simetría entrelas dos mitades separadas por lamedia de una distribución curva.
Azar: Estadísticamente se relacionacon la teoría de las probabilidades.Decimos que concebimos un hechoestadistico al azar, cuando éste esmotivado por un número de factores independientes que individualmente no conocemos pero que susefectos combinados pueden ser predecidas.
Bimodal: Distribución que posee dosmodos y que usualmente se representa gráficamente mediante histogramas.
Binomial: Expresión algebraica quecontiene dos términos.
Binomio de Newton: Referente a lapotencia de un' binomio. El binomiode Newton, es una expresión errada,pues ya era conocido en el siglo XV!
por el matemático italiano Tartaglia. Newton lo generalizó más tarde para exponentes no enteros.
Campo: Diferencia entre los límitessuperior e inferior de una serie depuntuaciones en una distribución.
423
424
Centil: Expresión más castiza paradenominar al "percentil". (Denominación en inglés.)
Centroide: Método del análisis factorial. El principal exponente deeste método es Thurstone. Equivale al significado que da Vela ala rotación en el sentido de girarlos ejes hasta llegar a una posiciónen que cada vector tenga proyecciones significativas en el mismonúmero de ejes.
CIase: Una de las divisiones que resulta de la agrupación y ordenaciónde lag puntuaciones. Las clases contienen siempre un número igual depuntuaciones y a esto se llama intervalo de clase. Las clases recibentambién el nombre de categorías.En otras palabras, clase o categoríaes aquella que contiene una magnitud igual de valores.
Cociente intelectual: Relación de laedad mental y edad cronológica,introducido por William Stern. Esconveniente diferenciar este tipo decociente intelectual del introducidopor Wechsler y denominado "co~ciente intelectual estándar o típico"cuya media es 100 y su desviacióntípica 15.0. (En inglés se denominaDeviation IQs.)
Código: Puntuaciones más convenientes para nuestros prop6sitos resultantes de la transformación de laspuntuaciones obtenidas. El procesoque esto implica se denomina codificación.
~'iciente: Valor que expresa el grado de algunas características o relaciones que se han encontrado encircunstancias específicas.
Coeficiente de alineación: Comparación del errór típico o estándar deestimación con la desviación típicade la var. able e,tiE'a",.
CJeficiente ;le asocíaetón- M~,,;da decorrelación entre «os '\. .tl.i!)le~ ;"s
JESUS DE LA ROSA
cuales son expresadas en dos categorías cada una. También es conocido como coeficiente de correlaciónde Yule.
Coeficiente de coaligación: Medidaruda de relación entre dos variablescualitativas dicotómicas cuyo índicees semejante al coeficiente de asociación.
Coeficiente de concordancia: Medidapropuesta por Kendall y Smith, mediante la fórmula:
w = 128m2(n' - n) ,
donde 8 es igual a la suma de loscuadrados de las desviaciones deltotal de los rangos asignados a cadauno de los m(n + 1) /2 individuos.Esta última cantidad es el valor promedio de los totales de los rangosy S es la suma de cuadrados de lasdesviaciones a partir de la media.El coeficiente de concordancia varía de O a 1.0.
Coeficiente de contingencia: Propuesto por Pearson, por medio del cualpodemos estimar el grado de asociación entre dos característicascuando nuestros datos de observación están clasificados en una tablade contingencia.
Coeficiente de correlación: Es un índice numérico que nos expresa siexiste concomitancia entre dos variables y de ser así, su grado. Unaperfecta correspondencia entre lasdos variables es expresada por +I ;una correspondencia inversa perfecta es indicada por -1 y la independencia o falta de concomitanciase expresa por 0.0.
Coeficiente de correlación bíserial: Lacorrelación biserial es una adaptación del procedimiento para determinar el coeficiente de correlaciónusad. ando una variable es cuantitauva y la otra dicotornizada, por
ESTADISTICA PSICO-EDUCATIVA
tanto este coeficiente indica la dirección de relación entre la variablecuantitativa y la proporción de casos de la distribución.
Coeficiente de correlación de BravaisPearson: Es representado por elcociente de la covarianza entreel producto de las desviaciones típicas de las dos variables.
Coeficiente de correlación no métrica:Propuesto por F. Faverge para medir la reproductibilidad de un ítemde un test.
Coeficiente de correlación tetracórica:Utilizado para medir el grado deasociación lineal entre dos variablesdonde ambas son dicotomizadas ylas verdaderas distribuciones se suponen normales.
Coeficiente de correlación triserial:Llamado también de Burt. Indiccque expresa la correlación entre unavariable continua y la otra supuesta,continua y dividida en tres grupos.
Coeficiente de determinación: Indicala proporción de la varianza de lavariable dependiente determinadadirectamente por una variable independiente específica.
Coeficiente de regresión: Viene representado por la constante en unaecuación de regresión lineal quemide la inclinación de la línea deregresión.
Coeficiente de variación: Viene representado por el porcentaje que resulta expresado al comparar lasdesviaciones media y típica o estándar. El coeficiente de variación sepuede usar como medida representativa de un promedio.
Combinación: Perteneciente al análisis combinatorio matemático. Se entiende por combinaciones de ordenn, de m objetos a los grupos de nobjetos que se pueden formar conellos de tal modo que dos cualesquiera difieran en algún objeto.
425
Comunidad: Término relativo al análisis factorial que indica la proporción de la varianza de una variable,la cual es descrita en términos defactores comunes de las otras variables en el grupo.
ConfiabiJidad: Calidad requerida parala "validez" de un test y representada por el indice de eonfiabilidadque indica la correlación entre laprimera y siguientes aplicacionesde una prueba a un mismo grupo desujetos. Un mayor grado de confiabilidad viene dado cuando obtenemos los mismos resultados en lasdiferentes aplicaciones.
Contingencia: La extensión por lacual los valores de una variable dependen de otra variable o variables.
Corrección de Sheppard: Correcciónaplicada a la varianza y a la desviación típica o estándar obtenidapor la agrupación de los valores dela variable.
Correlación: Grado de concomitanciaentre dos o más variables expresadopor el coeficiente de correlación.
Correlación interclase: Medida queindica el grado de similitud o asociación entre individuos de clases '2grupos. También recibe el nombrede correlación homotípica.
Correlación lineal simple: Denominada también correlación del productomomento o correlación de Pearsony su uso está determinado cuandosus dos variables son cuantitativas.Este tipo de correlación es el másutilizado.
Correlación múltiple: Correlación entre la variable dependiente y dos omás variables independientes.
Correlación ordinal: Denominadatambién correlación por rangos ocorrelación de Spearman por ser sudescubridor. Este método se utilizacuando se tiene en cuenta el ordende clasificación de los pares de ca-
426
sos, sin considerar sus valores. Sucoeficiente de correlación está basado en las diferencias asignadas alos individuos en dos variables.
Correlación parcial: Correlación entre dos variables en un caso demúltiples variables aleatorias, conla indicación de que ha sido eliminada cualquier asociación conalgunas de las variables restanteso con todas.
Covarianza: Media de los productosde las desviaciones igualadas de dosvariables.
Cuartil: Uno de los tres puntos quedivide a una distribución, donde elcuartil 2 es la mediana. Estos trespuntos dividen a su vez a la distribución en cuatro partes, cada unode los cuales comprende el 250/0 delos casos o un % de los mismos.
Curtosis: Anormalidad de la distribución en la que ésta se aparta de lonormal en lo que se refiere a sualtura. Cuando la curva de la distribución es más plana se denominaplaticú,rtica; cuando es más agudaleptocúrtica, y cuando no está enninguno de estos casos se denominamesocúrtica.
Curva normal: Curva simétrica yasintótica, definida por la media,desviación estándar o típica y porel valor de la ordenada máxima.También es llamada curva de unacampana por su forma parecida, ycurva de Gauss.
Decil: Es uno de los nueve puntosque dividen a una distribución de10 divisiones, en que cada una comprende el 10% de los casos.
Desviación: Diferencia existente entreun valor individual y otro de tendencia central.
Desviación cuartilar: Mitad de la distancia entre los cuartiles 1 y 3.
Desviación del cociente intelectualC. l.: Proveniente de las notas del
JESUS Di: LA ROSA
cociente intelectual de Wecluler conuna media de 100 y una desviacióntípica aproximada de 15.0.
Desviación media: Media aritméticade las diferencias de cada valor dela media en una serie.
Desviación típica o estándar: Medidade dispersión resultante de dividirla suma de las diferencias de loscuadrados de cada medida de lamedia aritmética por el númerototal de medidas o elementos y extraerle su raíz cuadrada. Se denomina también, desviación tipo, patrón y desviación media cuadrática.
Dicotomía: Tipo de clasificación sencílla para separar los elementos deuna clase X de otra no X.
Düerencia signüicativa: Diferenciaentre dos "estadísticas" computadassobre muestras separadas con unamagnitud tal que la probabilidadpara que las muestras sean sacadasde los diferentes universos es menorque algún límite definido.
Discrepancia de una distribución: Distribución de forma aproximadamente simétrica proveniente de la inexactitud que resulta del cuadradode la desviación típica.
Distribución: Representación gráficaproveniente de una agrupación sistemática de valores ordenados porclases, de acuerdo con el númerode frecuencias de cada valor sucesivo.
Distribución acumulativa: Relativa ala distribución de las frecuenciasacumulativas, consistente de la suma progresiva de las frecuencias deforma tal que su última frecuenciaacumulativa corresponde naturalmente al número total de valoresde la muestra.
Distribución normal: Distribución queda por resultado la llamada curvanormal o gaussiana.
ESTADISTICA PSICO-EDUCATlVA
Ecuación: Expresión matemática referente a que las igualdades han desatisfacer los números desconocidos.
Ecuaciones equivalentes: Cuando todasolución de cada ecuación satisfacea la otra..
Edad mental: Nivel de desarrollo dela inteligencia introducido por Binet-Simon y en oposición a la edadcronológica.
Edad cronológica: Edad determinadapor la fecha de nacimiento.
Eje: Sinónimo de coordenada cartesiana. Uno de los dos ejes resultantes de dividir un plano en cuatroángulos rectos. Uno de los ejes sesupone horizontal y se llama ejede las abscisas o de las X y el otrode las ordenadas o de las Y quecorta perpendicularmente el eje supuesto horizontal.
Er~or: Es la desviación de una puntuación verdadera.
Error constante: Error que pennanece invariable en todas las medidas.
Error acumulativo: Error que va aumentando en forma progresiva.
Error absoluto: Diferencia entre laestimación y el valor exacto.
Error experimental: Es aquel que manifiesta el fracaso de llegar a resultados idénticos con dos unidadesexperimentales tratadas igual.
Error muestral: Errores derivados detratar con muestras y no con el total del universo. Variación de lasconstantes estadísticas del valor verdadero.
Error probable: Es 0.6744898 vecesel error típico o estándar. Es ladesviación posible de la distribuciónde los errores de la muestra.
Error relativo: Error relativo en unaestimación es igual al cociente delerror absoluto por la estimación.
Error típico o estándar: Desviacióntípica de la distribución de los errores del muestreo.
427
Escala: Este término tiene muchasasignaciones. Elemento de medición numerado de acuerdo a ciertas normas de trabajo para comparar las puntuaciones obtenidas yasignar a éstas un valor matemáticoque represelllen su magnitud.
Escala AGCT: Escala donde el valorde la media es 100 y la desviacióntípica 20.
Escala CEEB: Escala introducida porel College Entrance ExaminationBoard de Estados Unidos cuya media es de 500 y la desviación típica 100.
Escala de Wechsler: Escala proveniente del cociente intelectual y denominada también escala del cocienteintelectual estándar. Su media esde 100 y su desviación típica aproximada "S de 15.
Escala de Guilford: Escala donde eivalor de la media es 5 y su desviación típica es 2.
Escala percentilar: Escala que indicael rango de clasificación de un elemento en relación con 100 elementos del mismo tipo. Los puntos percentiles dividen la distribución en100 partes, conteniendo cada unaell% de los casos y donde la mediaes equivalente al percentil 50.
Escala "Stanine": Esta escala comprende 9 .unidades denominadas"ninas". Su media es de 5.0 y ladesviación típica 2.0.
Escala Sten: Sus unidades son llamadas "stens". Tiene una extensión deI a 10 y proviene del cuestionariode personalidad de Cattell.
Escala T: Esta escala se deriva de laspuntuaciones Z. A cada puntuacióntípica de Z le corresponde 10 unidades T. Esta escala está expresadaen números de 20 a 80.
Escala X: Esta escala no es normalízada porque está representada porlas puntuaciones brutas obtenidas,
428
aunque podemos considerarla semejante a la escala Z, cuando transformamos las puntuaciones brutaspor medio de las desviaciones.
Escala Z: Esta es una escala de puntuaciones típicas que adopta comounidad la desviación típica obtenidaen las puntuaciones. Es por tanto,semejante a la unidad de desviacióntipo.
Estadística: Técnica que computa yenumera los hechos y los individuossusceptibles de enumerarse o medirse y coordina y clasifica los datosobtenidos con el fin de determinarsus causas y tendencias.
Estándar: Palabra de origen inglés,utilizada en castellano para reemplazar "típico". Aunque a nuestromodo consideramos más aceptableeste último.
Estandarización o tipificación: Proceso ambiental diferente al de suorigen.
Estimación: Valor que se utiliza pax3estimar un parámetro del universode la que es extraída la muestra.Recurso muy utilizado en psicologia y educaci6n eJI el método depruebas.
Estructura: Cuadro de 1.. correlaciones entre tests y factores.
Factor: Variable independiente dentro del diseñ'o experimental.
Factoriales: Factorial que se refiere aun modo especial de formar lascombinaciones de tratamientos.
Factor genérát: -Dimensién dentro delanálisis factorial caracterizado porlas notas de abstracci6n y neogénesis y representado por g.
Fidelidad: Sinónimo de confiabilidad.Fineza discriminativa: Sin6nimo de
sensibilidad de un test.Frecuencia: Número de veces que se
repite un fen6meno estadístico.Frecuencia absoluta: Número de casos
de una determinada categoría. Tam-
JESUS DE LA ROSA
bién podemos definirla como e! número de veces que aparece un ele.mento en un colectivo o muestra.
Frecuencia acumulativa: Viene dadapor la suma acumulada de las frecuencias registradas.
Frecuencia empírica 11 observada: Lamisma frecuencia (1) denominadaen esta forma, generalmente, paracalcular ji cuadrada.
Frecuencia relativa: Frecuencia resultante de dividir la frecuencia absoluta por el número total de elementos considerados.
Grados de libertad: Número de comoponentes que son libres para variar.
Grupo de control: Grupo de personasque actúan de testigos de otro grupodenominado experimental el cual essometido a una serie determinadade pruebas para ver la influencia dela variable que se quiere investigar.
Homogeneidad: Sin6nimo del métodoSpllt-half por medio de! cual secorrelacionan las dos mitades de untest para medir e! índice de fideolidad,
lndíce de dispersión: Valor numéricoque indica la amplitud de díspersi6n de los valores centrados enuna medida de tendencia central.
Intercorrdación: Co rre Iacíonea decada variable con todas las otrasvariables de un grupo.
Intervalo de clase: La distancia numérica entre 101 limites superior einferior de una clase o categoría.
Ji cuadrada: Prueba de significaneiaresultante del cociente de dividir lasuma de las diferencias al cuadradode las frecuencias empíricas y te6ricas entre las frecuencias teóricas.También se utiliza para calcular elcoeficiente de contingencia.
Linúte superior: Puntuaci6n mayorde una clase o categoría.
Límite inferior: Puntuación menor deuna clase o categoría.
ESTADISTICA PSICD-EDUCATlVA
Línea de regresión: Línea de ajusterepresentativa. de una ecuación deestimación.
Matriz: Tabla de números en filas ycolumnas.
Media aritmética: Medida de tendencia central definida por el promedio aritmético de todos los valores de la muestra.
Media aritmética ponderada: Medidadonde cada valor se cuenta todaslas veces que se presenta. .
Media geométricas Es la raíz enésimadel producto de los valores dados.
Media armónica: Es la reciproca dela media aritmética calculada paralos recíprocos de los números dados.
Media cuadrática: Resultante de ex~
traer la raíz cuadrada a la mediaaritmética de los datos elevados alcuadrado.
Media cúbica: Resultante de extraerla raíz cúbica a la media aritméticade los datos elevados al cubo.
Media bicuadrática: Resultante de extraer la raíz cuarta a la media aritmética de los datos elevados a lacuarta potencia.
Mediana: Elemento que ocupa el lugar central en la sucesi6n. En otraspalabras, es la puntuaci6n por encima de la cual se encuentra lamitad de las demás puntuaciones,y por debajo la otra mitad.
Método de factorización: Método delanálisis factorial por medio del cualse averiguan los factores comunesque son importantes para interpretar las correlaciones halladas.
Modo o moda: Tendencia dominanteen una distribución; en otras palabras, elemento al que correspondemayor frecuencia.
Muestra: Conjunto finito que separamos de un colectivo, universo opoblación.
Muestra' al azar: Aquella muestradonde el elemento o miembro de la
429
población tuvo las mismas probabilidades de ser elegido, o de pertenecer a la misma.
Muestra estratificada: Muestra. escogida por estratos donde cada unode ellos forma un subuniverso. Denominada también de Poisson.
Muestra de Lexis: Muestra de unode los estratos del universo que lit
quiere investigar.Muestra controlada: Recibe también
el nombre de muestra sistemática yconsiste en dividir la población envarias categorías y tomar de cadauna de ellas al azar un número' deelementos que de ese estrato hayen la población.
Muestra de probabilidad: Aquellamuestra elegida de acuerdo con unmecanismo casual.
Normalizar: Accién para hacer quelos datos se ajusten a las suposiciones usuales. Fundamentalmente seutiliza en el ajuste de la curva.
Parámetro: Es el valor real correspondiente o esperado del universo.
Perfil: Término fundamentalmentepsicométrico representado medianteuna gráfica de los resultados obtenidos por un sujeto o grupo desujetos en una prueba o conjuntode pruebas.
Población: Sinónimo de colectivo yuniverso y se define por el conjuntodel cual se han extraído los númeroso atributos que forman la serie estadística,
Polígonos de frecuencias: Representación gráfica de una distribuci6nresultante de la uni6n de 101 puntosderivados de la intersección de laperpendicular al eje de las X dondele inscriben los límites inferioJ't!l decada intervalo de clase y de la peropendicular al eje de 181 Y donde seinscriben las frecuencias pelr ordenascendente.
430
Prueba de significación: Es aquellapor medio de la cual podernos predecir los límites probables en quenuestros resultados pueden experimentar fluctuaciones a causa de losposibles errores.
Prueba de la jí cuadrada: Prueba designificación 'estadística que permiteestablecer una concordancia entre'los valores empíricos y teóricos.
Prueba t de Student: Prueba de significación que permite comprobarla significancia de las medias de lasmuestras pequeñas.
Psicotecnia: Estudio y aplicaci6n demétodos científicamente experimentales o psícométrícos.
Punto medio: Valor medio entre ellímite superior e inferior de unaclase.
Puntuación: Valor, medida, magnitudo score. Créditos asignados a datosmatemáticos, estadísticos o psicológicos. Así tenemos, puntuaciones estándar' o típicas derivadas de laescala estándar, puntuaciones Z derivadas de la escala Z, etc.
Probabilidad: En términos matemático-estadísticos,probabilidad de realización de un suceso; es el númeroa que tiende la frecuencia relativaal aumentar indefinidamente el número de elementos del colectivo.
ProbabDidad total: Probabilidad deproducirse un sucesoque puede atriobuírse a varias hipótesis o causas.
Razón critica: Cociente resultante entre la constante T y su error típico.También es llamada razón de significación.
Regresión: Método utilizado para determinar la mejor relación funcional entre las variables.
Sigma: Pronunciación de la letra griega ~ o (l. La primera cuando esmayúscula, y significa luma; y la
JESUS DE LA ROSA
segunda corno minúscula es símbolode la desviación típica o estándar.
Tabulación: Condensación de los datos obtenidos mediante un procesode clasificación y agrupamiento de'los mismos.
Test: Vocablo de origen inglés ampliamente introducido en todos losidiomas para caracterizar a las pruebas psicológicas. La Asociación Internacional de Psicología Aplicadalo define de Ia siguiente manera:"Es una prueba definida que implica una tarea que se ha de cumplir, idéntica para todos los sujetosexaminados, con técnica precisapara la apreciación del éxito o delfracaso, o para la valoración numérica del resultado logrado. Latarea puede comprender una actuación, ya sea de conocimientosadquiridos (prueba pedagógica),ya sea de funciones sensoriomotriceso mentales (prueba psicológica)."
Universo: Sinónimo de población.Validez: Cualidad de un test cuando
éste mide lo que pretende medir.La fidelidad y la validez son lascualidades principales que debe tener un test para considerarlo válido.
Variable: Cualidad que varia de magnitud.
Variable aleatoria o casual: Funciónevaluada numéricamente, definidaen un espacio muestra. Puede serdiscreta o continua.
Variable DC! cuantitativa: Una cualidad que no se puede medir valiéndose de unidades, pero que varíaen cantidad.
Varianza: Índice que refleja el gradode variabilidad en un grupo de puntuaciones que ea igual al cuadradode la desviación estándar.
APENOICEE
FORMULARIOESTADISTICO·
Media aritmética:
M = I,lpmN
Mediana:
(N )--fa
Mdn=l+ T i
Media geométrica:
MG =~, oaf,'oaJ;
Amplitud total o rango:
AT=X.-X",
Desviación media:
DM= !.':Deaviación cuartilar:
* Fórmulu bá.sicaa.
I = Frecuencias.pm = Puntos medios de las clases.
N = Total de elemento. o frecuencia s.
l = Límite inferior.la = Frecuencia acumulada de la clase
anterior.[m = Frecuencia modal.
i = Intervalo de clase.
a¡ = Punto medio.,¡ = Exponente o potencia a la que seeleva al'
AT = Amplitud total.X", = Puntuación mayor.X", = Puntuación menor.
I = Frecuencias.Idl= Diferencias absolutas entre punto
medio y media aritmética.
.Q.. = Tercer cuartil.Q¡ = Primer cuarti1.Q = Desviación cuartilar o cuartil.
431
432
Desviación típica o estándar:
u= ~~~
Coeficiente de variación:
v = lOOerM
lodice de sime1ria:
Sk =3(M-Md)u
JESUS DE LA ROSA
f = Frecuencias.d = Diferencia o desviación de la me
dia.u = (Sigma.) Desviación típica.
N = Total de elementos.
u = Desviación típica.M = Media aritmética.
Sk = Indice de simetría.M = Media aritmética.
Md = Mediana.u = Desviación típica.
Corrdación cUAntitativa lineal o de Pearson:
~Xy - NMxMy XY = Producto de las variables.r = -v'=:=(I""x=-'=-==-N;';'M'='=:':")7:(I:=y'':=_==;N~M:=::7=~) Mx = Media de la variable X.
• My = Media de la variable Y.N = Número de elementos.
Correlación ordinal:
6ID·l' =1 - -n-:-(n-=.:-----.,.l-:-)
Correlación biserial:
_Mp -M, pq'bla'- e_
af' y
D = Diferencia numérica entre los números de orden.
n = Número de pare. de observaciones.
p =Coeficiente de correlacién ordinal.
p =Proporción de casos en el gruposuperior o valores más bajos dela variable dicotómica.
q = Valores máa altos de la variabledicotómica.
M p - M q = Medías correspondientes a p y q.y = Ordenada de la curva normal.
Uf' =Desviación típica de la distribución.
Coeficiente experimental de McCaIl:
D.CE = 2.78.»
D=Mt - M~
'D = V.~, + .:ro
ESTADISTICA PSICO-EDUCATlVA
Modelo matemático de la curva de Gauss o normal:
433
" = Ordenada.7/" = Constante matemática, igual a
3.1416.e = Constante matemática, base del
sistema del logaritmo de Napier,igual a 2.71828.
Cálculo de unidades Z:
X-Mzc..:_-
a
Cálculo de unidades T:
T = 50 + IOz
Cálculo de percentiles:
100p ~=Nfa
x = Puntuación bruta.M = Media aritmética.
u = Desviación típica o estándar.
z = Puntuaciones Z.
fa = Frecuencia acumulada..N = Número total de frecuencias.
2_~(fe-ft)2X - ft
V,= N!.d"k - 1
~d"
V'=-k(N_I)
Cálculo de ji cuadrada o cuadrado de contingencia:
X2 = Ji cuadrada.fe = Frecuencias empíricas y oh
servadas.fl = Frecuencias teóricas.
Cálculo de t de Student: [muestras independientes)
MI-M.
MI YM. = Medias aritméticas de gruposy 2.
~ Ya~ = Varianzas de grupos 1 y 2.N, YN. = Poblaciones muestreadas.
Cálculo de las varianzas VI y V.: (análisis de varianza)
'¡.¡t,d2 = Suma de las desviaciones de lamedia al cuadrado por el númerode elementos.
k - l = Grados de libertad.!.d· = Suma de las desviaciones al cua
drado de los elementos de cadagrupo.
k(N - 1) = Grados de libertad.
434
índice F de Snedecor:
F=!-v
JESUS DE LA ROSA
v = Varianza mayor obtenida (intragrupos).
v = Varianza menor obtenida (intergrupos).
Coeficiente de eonfiabilidad de Spearman-Browm
R = Nr _ 2rl+(N-l)r-l+r
índice de discriminación:
Id l • = %A - %B
N= 2.R = Coeficiente de fidelidad o confía
bilidad.r = Correlación entre las dos mitades
de la prueba o test.
%A = Porcentaje de sujetos del grupoalto que contestaron correctamente la pregunta.
%B := Porcentaje de sujetos del grupobajo que contestaron correctamente la pregunta.
Error típico de una correlación lineal:
1 - rae. = ..[Ñ
t, := Error típico de una correlaciónlineal.
r = Coeficiente de correlación al cuadrado.
N = Número de elementos o poblaciónde la muestra.
Error típico del coeficiente de correlaci6n ordinal:
(1 - p').p=1.05---y¡¡=¡
Error típico de una mediana:
UtJU.. = 1.253 YN
p = Coeficiente de correlación ordinalal cuadrado.
N = Número total de elementos.
tlld.. := Error típico de mediana.
Error típico del coeficien te de correlación bi'lerial:
...r¡q 2y.--r...~r... - ~~,--_.- ,fh! ,-~
.r... = Error típico del coeficiente de correlación biserial,
ESTADISTICA PSICO-EDUCATIVA
Error típico de una discrepancia:
2-· 2 ~2e--a _• N
Error típico de una frecuencia:
el = yNFq
Razón crítica o de significación:
RC=~ed
435
e~ = Error típico de una discrepancia.
e¡ = Error típico de una frecuencia.p = Proporción en la categoría de in
terés.q = 1 - p.
d = Diferencia de dos valores.ed = Error típico de d.
Error de la diferencia entre dos medias:
e"1-Jl2 = Error típico de la diferencia entredos medias.
Diferencia entre dos coeficientes de correlación:
1e" = 7N -3
Zl = Error típico del valor z,N = Número total de elementos.
Error típico entre las diferencias de dos medianas:
ej{d .lid = Ye 2 + e' e.lld.¡-Jld'2 = Error típico de las diferencias en-'H- n2 Jld'h Mdn2 tre dos medianas,
Error típico entre las diferencias de dos desviaciones típicas:
eUI-U, = Error típico de las diferencias entre dos desviaciones típicas.
Error típico entre las diferencias de dos coeficientes de correlaci6n lineal:
',,-ro = Error típico de las diferencias entre dos coeficientes de correlaciónlineal,
Correlación tetracórica:
rt = _1_ [1 - .L.íN" - 2hk(bc - ad) ]hk N' HK
, _ V' l x O5 _ 1n rt =C0r.relaci6n tetrac6rica.1I - a or de - en, N H Lo • d d la rd--"- "o = ngítu e o "'._ en •
k = Valor de; en 0.5 - ~ K = Longitud de la ordenada en k.
436
Coeficiente de contingencia:
-~c- ~N+X'
Correlación intercIase:
Ku 2- u'
r= M<J'(K - 1)
Coeficiente de asociación:
ad>- beQ = ad + be
Coeficiente de alineación:
JESUS DE LA ROSA
x' = Ji cuadrada.N = Número de elementos.e = Coeficiente de contingencia.
u = Desviación típica.UIl = Desviación típica de las medias de
las clases.k = Número de individuos por clase.
Q = Coeficiente de asociación.
K = Coeficiente de alineación.
Coeficiente fi:
lf1 = (ad - be)
.,¡ (a + b) (c + d) (a + e) (b + d)
Correlación de Bravais-Pearson:
a, b, e, d = Frecuencias de lascasillas a, b, e, d .
Ix,>n
r=-tTlIf/1~
Coeficiente de concordaoc:ia:
x = Variable x,y = Variable y.x = Desviación típica de x.y = Desviación típica de y.
w= 12Sm2(n8 - n)
Coeficiente de regrc:llÍÓII:
Ye=r!!.x'1""
$.= Suma de los cuadrados de las desviaciones a partir de la media.
m(n - 1) /2 = Valor promedio de los totales delos rangos.
Yc = Coeficiente de regresión.T = Coeficiente de correlación.y = Desviación típica de y.x =Desviación típica de x.
ESTADISTICA PSICO-EDUCATIVA
Error típico de una proporción:
tp= ~~
Error típico de una media aritmética:
aEI/ = "l/N
Error típico de una desviación típica:
aEa = --.-
fi
437
p = Probabilidad real o esperada.q = 1 - p.
N = Número total de elementos.
EJI. = Error típico de una- media aritomética.
a = Desviación típica de la muestra.N = Población de la muestra.
ea = Error típico de la desviación típica.
a = Desviación típica de la muestrasimple.
N = Población de la muestra.
APENOICEF
CON~UNTOS
La palabra conjunto se emplea para referirse a una colección deobjetos. Cada objeto de un conjunto se llama elemento o miembro delconjunto.
Hay varias maneras de designar un conjunto. Frecuentemente, seusarán letras mayúsculas para designarlos. Una manera de designar unconjunto es listar, entre llaves { }, todos sus elementos. Ese método seconoce como método de la lista. Por ejemplo, el conjunto de númerosentre I y 9, inclusive, lo denotaremos por A, y lo escribiremos así:
A ={1,2,3,4,5,6,7,8,9}
Cuando se listan los elementos de un conjunto, el orden no tieneimportancia. El conjunto {a, b les el mismo que {b, a}.
Otra manera de designar al conjunto A es:
A = {x/x es un número natural y O< x < 10 }
Ese se conoce como método de la regla. La expresión anterior selee "el conjunto de todos los x tales que x es un número natural yO< x < 10". Nótese que la línea vertical se lee "tal (es) que".
El conjunto N de todos los números naturales se puede designarpor
N = {x/x es un número natural}
439
440 JESUS DE LA ROSA
Podemos usar, así mismo, tres puntos para indicar que un conjunto de elementos continúa indefinidamente.
N={ 1,2,3,4,5... }
Cuando un conjunto está limitado, se debe listar el último elemento. Así, si S es el conjunto de números naturales entre l y 100, inclusive, entonces:
S={1,2,3,4, ... ,IOO}
La notaci6nde tres puntos se puede usar al principio o al final deuna lista. Luego, el conjunto E de todos los enteros se puede indicarcomo:
E={... ,-2,-1,0, 1,2,3, ... }
El símbolo E significa "es un elemento de", por ejemplo:
a E {a, b, c}
Algunas veces es conveniente hablar del conjunto que carece deelementos. Ese conjunto se llama conjunto vacío o conjunto nulo y sedesigna con el símbolo 1/1.
Dos conjuntos son iguales sí y sólo si tienen los mismos elementos.Si dos conjuntos no tienen los mismos elementos, no son iguales. Así,si A y B son dos conjuntos
A = B si solo sí x E A implica x E BY x E B implica x E A
El conjunto A es un sub-conjunto del conjunto B sí y sólo si cadaelemento de A es también elemento de B. "A sub-conjunto de B" seescribe A e S. Usando símbolos, la definición de subconjunto se puedeestablecer:
A es sí sólo si para toda x, x E A implica x E S
De la definición de sub-conjunto, es evidente que todo conjuntoes un sub-conjunto de sí mismo; es decir, si B es un conjunto, enton-
ESTADISTICA PSICO-EDUCATIVA 441
ces B e B. Es verdad, pero no evidente, que el conjunto vacío es unsub-conjunto de todo conjunto; es decir, si 8 es un conjunto, entonces<peB.
El conjunto A es un sub-conjunto propio de B sí y sólo si hay porlo menos un elemento de B que no es elemento de A; esto es, si A es unsub-conjunto de B y A no es igual a B. Luego, los sub-conjuntos propros de B son todos los sub-conjuntos de B excepto el propio B.
La noción de sub-conjunto permite demostrar la igualdad de dosconjuntos. Basta con demostrar que A e 8 y que BeA para que A y Bsean iguales.
Para cualquier conjunto, existe siempre otro, del cual el primero esun subconjunto. Ese conjunto se \lama Conjunto Universal y generalmente se usa la letra U para designarlo.
Las operaciones binarias importantes en conjuntos son la unióny la intersección. La intersección del conjunto A es el conjunto B serepresenta por el símbolo A n B y se define como el conjunto detodas las x tales que x pertenece a A y x pertenece a B; es decir:
A n B ={ xl« E A y x E B }
Por ejemplo, si A ={1,2, 3,4,5 } y B = { 2, 4, 6 }, entonces,
A n B = { 2,4 }
La unión del conjunto A y el conjunto B se representa por el símbolo A U B y se define como el conjunto de todas las x tales que x pertenece a A o X pertenece a B; es decir
A U B ={xix E A ó x E B }
Note que la "O" es "O" inclusive, lo que quiere decir que x puedepertenecer al conjunto A, al conjunto B o a ambos conjuntos. Por ejemplo, si A= { 1,2,3,4,5 }y B = {2, 4, 6 }, entonces
AUB={ 1,2,3,4,5,6}
442 JESUS DE LA ROSA
Otra operación de conjuntos es la complementacion, Dado un conjunto A y el conjunto universal U, se forma un conjunto A que se lee"complemento de A", y se define como el conjunto de todas las x en el'conjunto universal que no pertenece al conjunto A. Simbólicamente:
A ={x/x E U y x ~ A}
Por ejemplo, si A ={ 1,.3,5 }y U ={1,2,3,4,5 J entonces
A = {2, 4 }
Otro concepto importante es el producto cartesiano; se designapor el símbolo A x B (se lee "A cruz B"), es el producto cartesiano dedos conjuntos A y B se define como el conjunto de todas las parejas ordenadas en las cuales el primer miembro es un elemento de A y el segundo es un elemento de B; es decir,
A x B = {x, y/x E A; Y E B }
Por ejemplo, si A = { 1,2,3,4,5 }y B = { 1,2,3,4,5 }entonces
A x B = { (1, 1),
(1,2),
(1,3),
(1,4),
(1, 5),
(2, 1),
(2,2),
(2,3),
(2,4),
(2, 5),
(3, 1),
(3,2),
(3,3),
(3,4),
(3,5),
(4, 1),
(4,2),
(4,3),
(4,4),
(4,5),
(5, 1)
(5,2)
(5,3)
(5,4)
(5,5)}
APENOICEG
SUMAS
Si tenemos 100 variables, que deseamos estudiar, de las cuales nonecesariamente conocemos sus vaJores, una manera conveniente denombrarlas es la siguiente:
x¡ es la primera variable
X2 es la segunda variable
X3 es la tercera variable
X 100 es la última variable
Se dice que esa notación es con sub- índices y el símbolo XI, selee "X sub-uno". Si se desea discutir una lista cualquiera, sin especificaralgún miembro de la misma, se habla de Xi (se lee sub-i, donde i es unsub- índice o índice inferior). Así Xi puede tomar el lugar de cualquiervariable de nuestro universo. Cualquier letra se puede usar para este propósito pero i, j Yk son las más comúnmente empleadas.
Supongamos que se desea considerar la suma de n variables
La letra griega, sigma mayúscula ~, se emplea para denotar la operación "la suma de". Entonces,
nS=~ Xi
I
443
444 JESUS,DE LA ROSA
Los símbolos que se encuentran debajo y encima de la sigma, indican cuales Xi se van a sumar. La expresión anterior se lec "S igual a lasuma desde i igual a 1 hasta I igual a n, de x sub i". Esto significa quela i, se reemplaza por números enteros. en orden ascendente. empezando con 1 y terminando con n, y se suman los valores de las variables.
Por ejemplo. supongamos que se tienen cinco variables Xi' con valores 9. 8, 11,6 Y 7. Entonces:
5LXi = 9 + 8 + 11 + 6 + 7 =41I
Si se desea sumar sólo las últimas tres variables, se escribe
5L Xi = 11 + 6 + 7 =243
Si se van a sumar todos los datos disponibles, los índices superiores e inferiores del símbolo de suma se simplifican o se omiten, puestoque no puede haber confusión. Entonces, frecuentemente se escribe
o bien,
LX·i 1
LXi
Sin embargo, el sub-índice se omite sólo en expresiones muy simples, donde el conjunto de valores que se va a incluir en la suma esperfectamente claro.
En cualquier momento que haya duda respecto a cómo se debeinterpretar una suma, se puede desarrollar ésta para saberlo. Por ejemplo, si se tiene
10L (x, - 3)1
¿Es igual a
10L x, - 3?1
ESTADiSTICA PSICQ-EDUCATlVA
Desarrollando la primera de las sumas, se tiene
lO
I: (X¡ - 3)=(x I - 3) + (X2 ~ 3) ... + (x I O - 3)l
445
= (XI + X2 ••• + XI o) - (3 + 3 + 3 ... + 3)
en esta expresión el tres aparece diez veces en elsegundo miembro, es decir
10= I: x¡ - 30
l
lO 10Así que I: (x, - 3) no es igual a I: x, - 3
1 l
Consideraremos ahora unos cuántos teoremas básicos en que interviene el símbolo I: y cuya demostración se obtiene de su definición.
Teorema 1: La suma de una constante multiplicada por una variablees igual a la constante multiplicada por la suma de la variable; es decir:
n n7 KX¡ = K 7x,
nDemostración: I: KX¡ = KX I + KXi ... + KXn
I
Teorema 2:
también,
n=K I: x, O
I
La 'suma de la suma (o diferencia) de dos o más variables es igual a la suma (o diferencia) de sus sumas. Así,
n n n
I: (X¡ + Y¡)=I: X¡ + I: Y¡1 1 I
cicio.
446 JESUS DE LA ROSA
Demostración:
n
L (X¡+Y¡) =(X¡ +Yd+(X2 +Y2)",+(xn +Yn)1
n n
=L x, + ~ Y¡ O1 1
La demostración de la suma de una diferencia se deja como ejer-
Teorema '3:
Demostración:
La suma de una constante, desde 1 hasta n, es igual an veces la constante; esto es,
n
L K=nK¡
n
~ K = K + K + K· •• + K (n sumandos)1
=nKD
APENOICEH
TABLASESTADlSTICAS
Representación 1. Cuadrados y raíces cuadradas *
Número Cuadrado Raíz cuadrada INúmero Cuadrado Raíz cuadrada
I---_.-----'-_._-------
I I 1.0000 31 961 S.567H-2 4 1.4142
1\32 102+ 5.6569
3 9 1.7321 'j'!J 1089 5.74464, 16 2.0UOO
I1H 1156 5.8:HO
5 2S 2.2361 1I 35 1225 5.91616 36 2.4495 11 3ii 1296 6.1I11fJO
1I7 4~1 2.6'15U
1I:17 1:1"9 (J.l)1l21l
tl 64- 2.112tl4 31J HH 5.J6H9 tll 3.00(JO I1 39 15~1 h.245lJ
10 100 3.11>23 ,1-JI} 1000 63246
II 121 :1.3166 1,1 fl 166\ 6.40:1112 144 3,4641 q 42 171,4 /,,480713 169 3.60:;¡¡ 1I 4'\ lIlo1!1 6.557-1-14 196 3.7417 il 44 19:H¡ 6.633215 225 3.8730 1
I45 2025 6.70H2
16 256 4.0000
1I
46 2116 6.782317 289 4.1231 47 2209 6.1J55718 324 4.~·J26
1\
'Hl 230f 6928219 361 4.35119 -19 UDI 7.0(]OO20 400 4.4721 50 2500 7.0711
21 4'11 4..'>1126 1, 51 2601 7.141422 484 4.6904 ~ " 2704 7.2111.)~
23 529 4.795/l 53 21109 7.280124 576 4.H'1~0 .5·1 291l¡ 7.HU525 625 5.U(JOO 5;) 3025 7.4lü226 676 5.0990 St, :H3fj 7.483327 729 5.19.;2 :l7 :12-19 7.549tl211 7U4 5 .:~~II 5 ~>a :1:1"4 7.fi1:)8
29 Ufl 5.:'H:J2 59 3411! 7.681130 900 S,41n 60 3600 7.7460
• Preparada por el autor
4~,7
448 JESUS DE LA ROSA
(Continuación)
Número Cuadrado Raíz cuadrada NúmeTo Cuadrado RaS. cu"¿,ada
61 3721 7.8102 111 12321 10.535762 3844 7.8740 112 12544 10.583063 3969 7.9373 113 12769 10.630164 4096 8.0000 114 12996 10.677165 4225 8.0623 115 13225 10.723866 4356 8.1240 116 13456 10.770367 4489 8.1854 117 13689 10.816768 4624 8.2462 118 13924 10.862869 4-761 8.3066 119 14161 10.908770 4900 8.3666 120 14400 10.9545
71 5041 8.4261 121 14641 11.000072 5184 8.4853 122 14684 11.045473 5329 8.54+0 123 15129 11.0905¡.¡. 5476 8.6023 124 15376 11.135575 5625 8.6603 125 15625 11.180376 5776 8.7178 126 15876 11.225077 5929 8.7750 127 16129 11.269478 6084 8.8318
I 128 16384 11.313779 6241 8.8882 129 16641 11.357860 6400 8.9443
\1
130 16900 11.4018
81 6561 9.0000 131 17161 11.4+5582 6724 9.0554 li 132 17424 11.0\89183 6889 9.1104 133 17689 11.5326¡He 7056 9.165~ :\ 134 17956 11.57~885 7225 9.2195
11
135 16225 11.619086 7396 9.n:J6 136 18496 11.661987 7569 9.3274 i¡ 137 18769 11.7047IIU 774+ 9.~1808 136 19044 11.7473!l9 7921 9.4~40
1,139 19321 11.7898
1I
90 81U0 9.4868 ¡i 140 19600 11.83221;
19681 1\.874391 8281 9.5394 l' 14192 8464 9.5917
II 142 20164 11.916493 8649 9.6437 143 20449 11.958394- 8!l% 9.69~4
1I144 20736 12.0000
95 9025 9.746B 145 21025 12.041696 9215 9.7980 '1 146 21316 12.083097 94119 9.H489 1
I147 21609 12.1244-
911 9bU4 9.lJ995 148 21904 12.165599 91101 9.9499 I 149 22201 12.2066
lOO 10000 10.0000 t 150 22500 12.2474101 10201 1O.001!l9
11151 221101 12.2882
IU~. 1(H04 lO'(I'J95ji
152 23104 12.3288un 10609 10.14119 153 23409 12.3693104 I01Jl6 ro.JUliO
1\154 23716 12.4097
\05 J 1025 10.2470 155 24025 12.4499106 1123b 10.2956
11156 24336 12.4900
107 11449 10.3441 157 24649 12.5300JOIl 11664 10.3923
11 156 24964 12.5698
109 11881 10.4403 !I 159 25281 12.6095lID 12100 10.41Wl 160 25600 12.6491
ti
ESTADISTICA PSICQ-EDUCATIVA 449
(Continuación)
Número Cuadrado Raíz cuadrada Número Cuadrado RaIz cuadrada
161 25921 12.6886 211 44-521 14.5258162 26214- 12.7279 212 44914- 14-.5602163 26569 12.7671 213 45369 14.5945164- 26896 12.8062 214 45796 14.6287165 27225 12.8452 215 46225 14.6629166 27556 12.8841 216 46656 14-.6969167 27889 12.9228 217 47089 14.7309168 28224- 12.~615 218 47524 14.7648169 28561 13.0000 219 47961 14.7986170 28900 13.0384 220 48400 14.8324171 29241 1:'.0767 221 48841 . 14.8661172 29584- 13.1149 222 49284- 14.8997173 29929 13.1529 223 49729 14.9332174 30276 13.1909 224 50176 14.9666175 30625 13.2288 225 50625 15.0000176 30976 13.2665 226 51076 15.0333177 31329 13.3041 227 51529 15.0665178 31684 13.3417 228 51984 15.0997179 32041 13.3791 229 52441 15.1327180 32400 13.4164 230 52900 15.1658
181 32761 13.4536 231 53361 15.1987182 33124 13.4907 232 53824- 15.2315183 33489 13.5277 233 54289 15.2643184 33856 13.5647 234 54756 15.2971185 34225 13.6015 235 55225 15.32971B6 34596 13.6382 236 55696 15.3623187 34969 13.6748 237 56169 15.3948188 35344 13.7113 238 56644- 15.4272189 35721 13.7477 239 57121 15.4596190 36100 13.7840 240 57600 15.4919
191 36481 13.8203 241 58081 15.5242192 36864 13.8564 242 58564- 15.5563193 37249 13.8924 243 59040 15.5885194 37636 13.9284 244 59536 15.6205195 38025 13.9642 245 60025 15.6525196 38416 14.0000 246 60516 15.6844197 38809 14.0357 2+7 61009 15.7162198 39204 14.0712 248 61504 15.7480199 39601 14.1067 249 62001 15.7797200 40000 14.1421 250 62500 15.8114
201 40401 14.1774 251 63001 15.8430202 40804 14.2127 252 63504 15.8745203 41209 14.24-78 253 64009 15.9060204 +1616 14.2829 254- 64516 15.9374-205 +2025 14.3178 255 65025 15.9687206 42436 14.3527 256 65536 16.0000207 42849 14.3875 257 66049 16.0312208 43264 14.4222 258 66564- 16.0624-209 43681 14.4568 259 67081 16.0935210 44-100 14.4914 260 67600 16.1245
460 JESUS DE LA ROSA
(Continuación)
N.m.ro C...tl,..o RtIÚ e....'.tl. NÚ"',ro C....,.tlo RtIÚ e....'Gtl.261 68121 16.1555 311 96721 17.6352262 68644- 16.1864 312 97341- 17.6635263 69169 16.2173 313 97969 17.691826+ 69696 16.2+81 31+ 98596 17.7200265 70225 16.2788 315 99225 17.7482266 70756 16.3095 316 99856 17.7764267 71289 16.3401 317 100489 17.8045268 71824 16.3707 318 10112+ 17.8326269 72361 16.4012 319 101761 17.8606270 72900 16.4317 320 102400 17.8885
271 73441 16.4621 321 103041 17.9165272 73984 16.4924 322 10368+ 17.94+1-273 74529 16.5227 323 104329 17.9722274- 75076 16.5529 324- 104976 18.0000275 75625 15':>831 325 10S625 18.0278276 76176 16.6132 326 106276 18.0555277 76729 16.6433 327 106929 18.0831278 7728+ 16.6733 328 107584 18.1108279 77841 16.7033 329 1082+1 18.1384280 78400 16.7332 330 108900 18.1659281 78961 16.7631 331 109561 18.1934282 7952+ 16.7929 332 110224 18.2209283 80089 16.8226 333 110889 18.2+8328+ 80656 16.8523 334 I11S56 18.2757285 81225 16.8819 335 112225 18.3030286 81796 16.9115 336 112896 18.3303287 82369 16.9+11 337 113569 18.3576288 82944 16.9706 338 11+241- 18.3848289 83521 17.0000 339 11+921 18.+120290 84100 17.0294 340 115600 18.4391291 84681 17.0587 341 116281 18.4662292 85264 17.0880 342 116964 18.4932293 85849 17.1172 3'13 117649 18.520329+ 86436 17.146+ 34+ 118336 18.5472295 87025 17.1756 345 119025 18.5742296 87616 17.2047 346 119716 18.6011297 88209 17.2337 347 120409 18.6279298 88804 17.2627 348 121104 18.6548299 89401 17.2916 349 121801 18.6815300 90000 17.3205 350 122500 18.7083301 90601 17.3494 351 123201 18.7350302 91204 17.3781 352 123904 18.7617303 91809 17.4069 353 124609 18.7883304 92216 17.4356 354 125316 18.81+9305 93025 17.4642 355 126025 18.8414306 93636 17.4929 356 126736 18.8680307 9<1-2<1-9 17.5214 357 127++9 18.11944308 94864- 17.5499 358 128164- 18.9209309 9~81 17.578+ 359 128881 18.9473310 96100 17.6068 360 129600 18.9737
ESTADISTICA PSICO-EDUCATIVA 451
(ConlinlUUión)
Núm.,o Cuadrado Raíz elJ4drad4 Número C...drGdo RGÚ euGdrtul.
361 130321 19.0000 411 168921 20.2731362 131044- 19.0263 412 169744 20.2978363 131769 19.0526 413 170569 20.322+364 132496 19.0788 414 171396 20.3470365 133225 19.1050 415 172225 20.3715366 133956 19.1311 416 173056 20.3961367 134689 19.1372 417 173889 20.+206368 135424 19.1833 418 174724 2M·UO369 136161 19.2094 419 175561 20.4695370 136900 19.2354 420 176400 20.+939371 137641 19.261+ 421 177241 20.5183372 138384 19.287.3 422 178084 20.5426373 139129 19.3132 423 178929 20.5670374 139876 19.3391 424 179776 20.5913375 140625 19.3649 425 180625 20.61.55376 141376 19.3907 426 18147:; 20.6398377 142129 19.4165 427 182329 20.6640378 142884 19.40422 426 183184- 20.6882379 143641 19.4679 429 184-041 20.7123380 144400 19.4936 430 184900 20.736+
381 145161 19.5192 431 185761 20.7605382 1+5924- 19.5448 432 186624 20.780!6383 146689 19.5704- 433 187489 20.8087384 147456 19.5959 434 188356 20.8327385 148225 19.6214- 435 189225 20.8567386 148996 19.6469 436 190096 20.8806387 149769 19.6723 437 190969 20.9045388 150544 19.6977 438 191844 20.9284389 151321 19.7231 439 192721 20.9523390 152100 19.7484 4040 193600 20.9762391 152881 19.7737 441 194481 21.0000392 153664 19.7990 442 195364 21.0238393 154449 19.8242 443 196249 21.0+76394 155236 19.8494 444 197136 21.0713395 156025 19.8746 "445 198025 21.0950396 156816 19.8997 446 198916 21.1187397 157609 19.9249 447 199809 21.142+398 158404 19.9499 448 200704 21.1660399 159201 1'9.9750 449 201601 21.1896400 160000 20.0000 450 202500 21.2132
401 160801 20.0250 451 203401 21.2368402 161604 20.0399 452 204304 21.2603403 162409 20.0749 453 205209 21.2838404 163216 20.0998 454 206116 21.3073405 164025 20.1246 455 207025 21.3307406 164836 20.1494 456 207936 21.3542407 165649 20.1742 4-57 208849 21.3776408 166464 20.1990 458 209764 21.4009409 167281 20.2237 4-59 210681 21.4243410 168100 20.2485 460 211600 21.4476
452 JESUS DE LA ROSA
(Continuación)
Núm.,ro Cuadrado Raú cuadrada Número Cuadrado Raí. cuadrada
461 212521 2104709 511 261121 22.6053462 213444 21.4942 512 262144 22.6274463 214369 2l.5174 513 263169 22.6495464 215296 21.5407 514 264196 22.6716465 216225 21.5639 515 265225 22.6936466 217156 21.5870 516 266256 22.7156467 218089 21.6102 517 267289 22.7376468 219024 21.6333 518 268324 22.7596469 219961 21.6564 519 269361 22.7816470 220900 21.6795 520 270400 22.8035
471 221841 21.7025 521 271441 22.8254472 222784 21.7256 522 272484 22.8473473 223729 21.7486 523 273529 22.8692474 224676 21.7715 524 274576 22.8910475 225625 21.7945 525 275665 22.9129476 226576 21.8174 526 276676 22.9347477 227529 21.8403 527 277729 22.9565478 228484 21.8632 528 278784 22.9783479 229441 21.8861 529 279841 23.0000480 230400 21.9089 530 280900 23.0217
481 231361 21.9317 531 281961 23.0434-482 232324 21.9545 532 283024 23.0651483 233289 21.9773 533 284089 23.0868484 234256 22.0000 534 285156 23.1084485 235225 22.0227 535 286225 23.1301486 236196 22.0454 536 287296 23.1517487 237169 22.0681 537 288369 23.1733488 238144 22.0907 538 289444 23.1948489 239121 22.1133 539 290521 23.2164-490 240100 22.1359 540 291600 23.2379
491 241081 22.1585 541 292681 23.2594492 242064- 22.1811 542 293764 23.2809493 243049 22.2036 543 294849 23.3024494 2+4036 22.2261 544 295936 23.3238495 24-5025 22.2486 545 297025 23.3452496 246016 22.2711 546 298116 23.3666497 247009 22.2935 547 299209 23.3880498 24-8004 22.3159 548 300304 23.4094499 249001 22.3383 549 301401 23.4307500 250000 22.3607 550 302500 23.4521
501 251001 22.3830 551 303601 23.4734502 252004 2204054 552 304704 23.4947503 253009 22.4277 553 305809 23.5160504 254016 22.4499 554 306916 23.5372505 255025 22.4722 555 308025 23.5584.506 256036 22.4944 556 309136 23.5797507 257049 22.5167 557 310249 23.6008508 258064 22.5389 558 311364 23.6220509 259081 22.5610 559 3124111 23.6432510 260100 22.5832 560 313600 23.6643
ESTADISTICA PSICO-EDUCATIVA 453
(Continuación)
Número Cuadrado Raíz cuadrada Número Cuadrado R4Íz <liadr""
561 314721 23.6854 611 373321 24.7184562 315844- 23.7065 612 374-544 24.7385563 316969 23.7276 613 375769 24.7588564- 318096 23.7487 614 376996 24.7790565 319225 23.7697 615 378225 24.7992566 320356 23.7908 616 379-t56 24.8193567 321489 23.8118 617 380689 24.8395568 322624 23.8328 618 381924- 24-.8596569 323761 23.8537 619 383161 24.8797570 324900 23.8747 620 3844-00 24.8998
571 326041 23.8956 621 3856401 24.9199572 327184 23.9165 622 386884 24.9399573 328329 23.9374 623 388129 24-.9600574 329476 23.9583 624 389376 24.9800575 330625 23.9792 625 390625 25.0000576 331776 24.0000 626 391876 25.0200577 332929 24.0208 627 293129 25.0400578 334084 24-.0H6 628 394384 25.0599579 335241 24.0624 629 395641 25.0799580 336400 24.0832 630 396900 25.0998
581 337561 24.1039 631 398161 25.1197582 338724 24.1247 632 3994-24 25.1396583 339889 24.1454 633 400689 25.1595584 341056 24.1661 634 401956 25.1794585 342225 24.1868 635 403225 25.1992586 343396 24-.2074 636 4044-96 25.2190587 344569 24.2281 637 405769 25.2389588 34-5744- 24.2487 638 4-07044 25.2587589 3+6921 24.2693 639 408321 25.2784590 348100 24.2899 640 409600 25.2982
591 34-9281 24.3105 611 410881 25.3180592 350161 21.3311 6+2 412164 25.3377593 351649 24.3516 643 413449 25.3574594 352836 24.3721 644 414736 25.3712595 354025 24.3926 645 416025 25.3969596 355216 24.H31 646 41731tó 25.4165597 356409 24.4336 647 418609 25.4362598 357604- 24.4540 6+8 H9904 2M558599 358801 2+.4745 649 421201 2M755600 360000 24.4949 650 4-22500 25.4951.
601 361201 24-.5153 651 423801 25.6147602 3624-04- 24-.5357 652 425104- 25.534-3603 363609 24-.5561 653 4-26409 25.5539604 364816 24.5764- 654 4-27716 25.5734605 366025 24.5967 655 129025 25.5930606 367236 H.6171 656 130336 25.6125607 3684049 24.6374 657 4-3164-9 25.6320608 369661 2+.6577 658 432964 25.6515609 370881 24.6779 659 434281 25.6710610 372100 24.6982 660 435600 25.6905
(Conrinuadón)
JESUS DE LA ROSA
Ninne,o Cucd,tldo RIIÚ &ucd,tld"l Número C..IId,,.do RIIÚ &ucd,,,d,.661 4-36921 25.7099 711 505521 26.6646662 4-3824-4- 25.7294 712 50694-4- 26.6833663 4-39569 25.7488 713 508369 26.7021664 44-0896 25.7682 714 509796 26.7208665 +42225 25.7876 715 511225 26.7395666 4-4-3556 25.8070 716 512656 26.7582667 4-4-4-889 25.8263 717 514-089 26.7769668 446224 25.8457 718 515524 26.7955669 4-4-7561 25.8650 719 516961 26.8142670 4-4-8900 25.884-4- 720 518400 26.8328671 450241 25.9037 721 519841 26.8514-672 451584 25.9230 722 521284- 26.8701615 4529211 25.9422 723 522729 26.8887674 4~276 25.9615 72... 524176 26.9072675 455625 25.9808 7U 525825 26.9258676 456976 26.0000 726 527076 26.94+4-677 458329 26;0192 727 528529 26.9629678 459684 26.03M 728 529984 26.9815679 4610+1 26.0576 729 531441 27.0000680 462400 26.0768 730 532900 27.0185681 463761 26.0960 731 534361 27.0370682 465124 26.1151 732 535824 27.0555683 466489 26.134-3 733 557289 27.0740684 467856 26.1534 734 538756 27.0924685 469225 26.1725 735 540225 27.1109686 470596 26.1916 736 541696 27.1293687 471969 26.2107 737 5...3169 27.1+77688 473344 26.2298 738 54-464+ 27.1662689 474721 26.2488 739 546121 27.1846690 476100 26.2679 7+0 547600 27.2029891 +77481 26.2869 741 549081 27.22136112 4781164 28.9059 7..2 550SM 27.2397893 48024!l 26.92"'9 743 5520+9 27.25806e.. +81636 26.3439 7.... 553556 27.276+695 +8'025 26:'629 745 555025 27.2947696 ...84416 26.3818 746 556516 27.3130697 485809 26.4008 747 558009 27.3313698 487204 26.4197 748 559504 27.3496699 488601 26.4336 749 561001 27.3679700 490000 26.4575 . 750 562500 27.3861701 ...91+01 26.476+ 751 564001 27.+0+4702 492804 26.4953 752 565504 27.4226703 494209 26.5141 753 567009 27.4408704 495616 26.5330 75'" 568516 27.4-591705 497025 26.5518 755 570025 27....773706 498436 26.5707 756 571536 27.4955707 499849 26.5895 757 573049 27.5136708 501264 26.6083 758 574564 27.5318709 502681 26.6271 759 576081 27.5500710 504100 26.6458 760 577600 27.5681
ESTADISTICA PSICD-EDUCATIVA 466
(Continuación)
Número C"sár.áo Rsl: cuatl,ah N"mero Cuatir.áo Raú c,,",ad.
761 579121 27.5862 811 657721 28.4781762 5806+4- 27.6043 812 659344 28.4956763 582169 27.6225 813 660969 28.5132764 583696 27.6405 814 662596 28.5307765 585225 27.6586 815 664225 28.5482766 586756 27.6767 816 665856 28.5657767 588289 27.6948 817 667489 28.5832768 589824 27.7128 818 669124 28.6007769 591361 27.7308 819 670761 28.6~82770 592900 27.7489 820 672400 28.6356771 594441 27.7669 821 674041 28.6531772 595984 27.7849 822 675684 28.6705773 597529 27.8029 823 677329 28.6880774 599076 27.8209 824 678976 28.7054775 600625 27.8388 825 680625 28.7228776 602176 27.8568 826 682276 28.7402777 603729 27.8747 827 683929 28.7576718 605284 27.8927 828 685584 28.7750779 606841 27.9106 829 687241 28.7924780 608400 27.9285 830 688900 28.8097781 609961 27.9464- 831 690561 28.8271782 611524 27.9643 832 692224 28.8440\-783 613089 27.9821 833 693889 28.8617784 614656 28.0000 834 695556 28.8791785 616225 28.0179 835 697225 28.8964786 617796 28.0357 836 698896 28.91S7787 619369 28.0535 857 700569 28.9310788 620944 28.0713 838 702244 28.9482789 622521 28.0891 839 705921 21.9655790 624100 28.1069 840 70S6Oll 21.9821
791 625681 28.1247 841 707281 29.0000792 627264 28.1425 842 70896t 29.0172793 628849 28.1603 843 710649 29.0345794 630436 28.1780 844 7123" 29.0517795 632025 28.1957 845 714025 29.D689796 633616 28.2135 846 715716 29.0861797 635209 28.2312 847 717409 29.1035198 6368001- 28.2489 848 7191001- 29.12Q4799 638401 28.2666 849 720801 29.1376800 640000 28.2843 850 722500 29.1548801 641601 28.3019 851 724201 29.1719802 643204 28.3196 852 725904 29.1890803 644809 28.3373 853 727609 29.2062804 646416 28.3549 854 729316 29.2233805 648025 28.3725 855 731025 29.2404806 649636 28.3901 856 732758 29.2575807 651249 28.4077 857 734449 29.2741808 652864 28.4253 858 73816+ 29.2IU6809 654481 28.4429 859 737881 2",087810 656100 28.4605 860 739600 2",251
456 JESUS DE LA ROSA
(Continuación)
Númf'O Cuad,ado Rais cuad,ada Número Cuad,adD Ralz cuad,tJda
861 741321 29.3428 911 929921 30.1828862 743044 29.3598 912 831744 30.1993863 744769 29.3769 913 833569 30.2159864 746496 29.3939 914 835396 30.2324865 748225 29.4109 915 837225 30.2490866 744956 29.4279 916 839056 30.2655867 751689 29.4449 917 840889 30.2820868 753424 29.4618 918 842724- 30.2985869 755161 29.4788 919 844561 30.3150870 756900 29.4958 920 846400 30.3315
871 758641 29.5127 921 848241 30.3480872 760384 29.5296 922 850084 30.3645873 762129 29.5466 923 851929 30.3809814 763876 29.5635 924 853776 30.3974875 765625 29.5804 925 855625 30.4138876 767376 29.5973 926 857476 30.4302877 769129 29.6142 927 859329 30.4467878 770884 29.6311 928 861184 30.4631879 772641 29.6479 929 863041 30.4795880 774-400 29.6648 930 864900 30.4959
881 176161 29.6816 931 866761 30.5123882 777924 29.6985 932 868624- 30.5287883 179689 29.7153 933 870489 30.5450884 781456 29.7321 934 872356 30.5614885 783225 29.1489 935 874225 30.5778886 784996 29.7658 936 876096 30.5941887 786769 297825 937 871969 30.6105888 788544- 29.7993 938 879844 30.6268889 790321 29.8161 939 881721 30J;43 I890 792100 29.8329 940 883600 30.6594
891 793881 29.8496 941 885481 30.6757892 795664- 29.8664 942 887364 30.6920893 7974+9 29.8831 9+3 889249 30.7083894 799236 29.8998 944 891136 30.7246895 801025 29.9166 945 893025 30.7409896 802816 29.9333 946 894916 30.7571897 804609 29.9500 947 896809 30.7734898 806404 29.9666 948 898704 30.7896899 808201 29.9833 949 900601 30.8058900 810000 30.0000 950 902500 30.8221
901 811801 30.0167 951 904401 30.8383902 813604 30.0333 952 906304 30.8545903 815409 30.0500 953 908209 30.8707904 817216 30.0666 954 910116 30.8869905 819025 30.0832 955 912025 30.9031906 820836 30.0998 956 913936 30.9192907 822649 30.1164 957 915849 30.9354908 824464 30.1330 958 917764 30.9516909 826281 30.1496 959 919681 30.9677910 828100 30.1662 960 921600 30.9839
ESTADISTICA PSICO-EDUCATIVA 457
(Continuación)
Número Cuadrado Rai: cuadrada Número Cuadrado R al: cuadrada
961 923521 31.0000 981 962361 31.3209962 925444 31.0161 982 964324 31.3369963 927369 31.0322 983 966289 31.3528964 929296 31.0483 984 968256 31.3688965 931225 31.0644 985 970225 31.3847966 933156 31.0805 986 972196 31.4006967 935089 31.0966 987 974169 31.+166968 937024 31.1127 988 976144 31.4325969 938961 31.1288 989 978121 31.4484970 940900 31.1448 990 980100 31.4643
971 942841 31.1609 991 982081 31.4802972 9447R4 31.1769 992 984064 31.4960973 946729 31.1929 993 986049 31.5119974 948676 31.2090 994 988036 31.5278975 950625 31.2250 995 990025 31.5436976 952576 31.2410 996 992016 31.5595977 954529 31.2570 997 994-009 31.5753978 9564-84 31.2730 998 996004 31.5911979 958441 31.2890 999 998001 31.6070980 960400 31.3050 1000 1000000 31.6228
458 JESUS DE LA ROSA
Representación 2. Valores del coeficiente de correlación,para distintos niveles de importancia *
~p 0.05 0.01
1 0.996917 0.99987662 0.95000 0.9900003 0.8783 0.958734- 0.8114- 0.917205 0.7545 0.874-5
6 0.7066 0.83437 0.6664- 0.79778 0.6319 0.76469 0.6021 0.7348
lO 0.:>760 0.7079
11 0.5:>29 0.683512 0.:>324 0.661413 0.5139 0.64111-4 0.4973 0.622615 0.4821 0.6055
16 0.4683 0.589717 0.4555 0.575118 0.4-438 0.561419 0.4329 0.548720 0.4227 0.5368
25 0.3809 0.486930 0.3494 0.448735 0.3246 0.418240 0.3044 0.393245 0.2875 0.372150 0.2732 0.3541
60 0.2500 0.324870 0.2319 0.301780 0.2172 0.283090 0.2050 0.2673
100 0.1946 0.2540
• Tomada de FIIHaa R. A.. Sla/il/i,. M"hotl, 'o, R.., ..reh Wo,k",. Edimburgo:Oliver &lid Bord.
ESTADISTICA PSICD-EDUCATlVA 459
(Continuación)
xl" Áre" Orde""d" (y) xl" Áre" O,d.""d" (y)
o.gl 0.3185887 0.2630880 1.36 0.4-130850 0.158224-80.92 0.3212136 0.2612863 1.37 0.4-146565 0.15607970.93 0.3238145 0.2588805 1.38 0.4-177356 0.15183080.94- 0.3263912 0.2564713 1.39 0.4-177356 0.15183080.95 0.3289439 0.254-0591 1.4-0 0.4-192433 0.a97275
0.96 0.3314724- 0.2516443 1.4-1 0.4-207302 0.14763850.97 0.3339768 0.2492277 1.42 0.4-221962 0.145564-10.98 0.3364569 0.24-68095 1.43 0.4-236415 0.14350460.99 0.3389129 0.2443904 1.44 0.4250663 0.14-146001.00 0.3413447 0.24-19707 1.4·5 0.4264707 0.1394306
1.01 0.3437624 0.2395511 1.46 0.4-278550 0.1314-1651.02 0.3461358 0.2311320 1.47 0.4292191 0.13541811.03 0.34-84950 0.2347138 1.48 0.4305634- 0.13H353L04- 0.3508300 0.2322970 1.49 0.4318879 0.13146841.05 0.3531409 0.2298821 1.50 0.4331928 0.1295176
1.06 0.03554217 0.2274696 1.51 0.4344783 0.12758301.07 0.3576903 0.2250559 1.52 0.4357445 0.12566461.08 0.3599289 0.2226535 1.53 0.4369916 0.12376281.09 0.3621434 0.2202508 1.54 0.4382198 0.12181751.10 0.3643339 0.2178522 1.55 0.4394292 0.1200090
1.11 0.3665005 0.2154582 1.51> 0.4406201 0.11815731.12 0.3686431 0.2130691 1.57 0.4417924 0.11632251.13 0.3707619 0.2106856 1.58 0.4429466 0.11450481.14 0.3728568 0.2083078 1.59 0.4440826 0.11270421.15 0.374-9281 0.2059363 1.60 0.4452007 0.1109208
1.16 0.3769756 0.203571+ 1.61 0.4463011 0.10915481.17 0.3789995 0.2012135 1.62 0.4473839 0.10740610.18 0.3809999 0.1988631 1.63 0.4484493 0.10567480.19 0.3829768 0.19652D5 1.64 0.4494974- 0.10396111.20 0.3849303 0.194-1861 1.65 0.+505285 0.1022649
1.21 0.3868606 0.1918602 1.66 0.45154211 0.10058641.22 0.3887676 0.1895432 1.67 0.4-525403 0.09892551.23 0.3906514 0.1872354 1.68 0.4535213 0.09728231.24 0.3925123 0.1849373 1.69 0.4544860 0.09565681.25 0.3943502 0.1826491 1.70 0.4554345 0.0940491
1.26 0.3961653 0.1803313 1.71 0.4563671 0.09245911.27 0.3979517 0.1781038 1.72 0.4572838 0.09088701.28 0.3997274 0.1758474- 1.73 0.4581849 0.08933261.29 0.4014747 0.1736022 1.74 0.4590705 0.08779611.30 0.4031995 0.1713686 1.75 0.045994Q8 0.0862773
1.31 0.4049021 0.1691468 1.76 0.4607961 0.08477641.32 0.4065825 0.1669370 1.77 0.4616364 0.0832932l.S3 0.4082409 0.1647397 1.78 0.4624620 0.06182781.34 0.4098773 0.1625551 1.79 0.4632730 0.0803801l.S5 0.4114920 0.1603833 1.80 0.4640697 0.0789502
460 JESUS DE LA ROSA
(Continuación)
x/a Area Ordenada (y) Ir xl" Area Ordenada (y)
1.81 0.464852 ! 0.0775379 II 2.26 0.4880894 0.03103191.82 0.4656205 0.0761433 2.27 0.4883962 0.03033701.83 0.4363750 0.0747663
I2.28 0.4886962 0.0296546
1.84- 0.4671159 0.0734068 2.29 0.4889893 0.02898471.85 0.4678432 0.0720649
,1
2.30 0.4892759 0.0283270
1.86 0.4685572 0.0707404 2.31 0.4895559 0.01768161.87 0.4692581 0.0694333 2.32 0.4898296 0.02704811.88 0.4699460 0.0681436 1, 2.33 0.4900969 0.26442651.89 0.4706210 0.0668711
11
2.34- 0.4903581 0.02581661.90 0.4712834 0.0656158
I2.35 0.4906133 0.0252182
1.91 0.4719334 0.0643777 2.36 0.4908625 0.02463131.92 0.4725711 0.0631566 2.37 0.4911060 0.02405561.93 0.4731966 0.0619524 1, 2.38 0.4913437 0.02349101.94 0.4738102 0.0607652
11 2.39 0.4915758 0.0229374
1.95 0.4744119 0.0595947 ,1 2.40 0·1918025 0.0223945
'11.96 0.4750021 0.0584409
li2.41 0.4920237 0.0218624
1.97 0.4755808 0.0573038 2.42 0.4922397 0.02134071.98 0.4761482 0.0561831
11
2.43 0.4924506 0.02082941.99 0.4767045 0.0550789 2.44- 0.4926564 0.02032842.00 0.4772·199 0.0539910 ii 2.45 0.4928572 0.0198374
2.01 0.4777844- 0.05291921
1
2,<1·6 0.4930531 0.01935632.02 0.4783083 0.0518636 2.47 0.493244-3 0.01888502.03 0.4788217 0.0508239 2.48 0.4934309 0.01842332.04 0.4793248 O.04980ül 2.49 0.4936128 0.01797112.05 0.4798178 0.0487920
I2.50 0.4937903 0.0175283
2.06 0.4803007 0.0477996 I 2.51 0.4939634 0.01709f72.07 0.4807738 0.0468226
11
2.52 0.4941323 0.01667012.08 0.4812372 0.045B611 2.53 0.4943001 0.01624522.09 0.4816911 0.0449148 2.54 0.4944574 0.015M762.10 0.4'821356 0.04398:16 li 2.55 0.4946139 0.0154493
2.11 0.4825708 0.0430674-1I
2.56 0.4947664 0.01505962.12 0.4829970 0.0421661 2.57 0.4949151 0.01467822.13 0.4834142 0.0412795 li 2.58 0.4950600 0.01430512.14 0.4838226 0.0404076 if 2.59 0.4952012 0.01394012.15 0.4842224 0.0395500
11
2.60 0.4953388 0.0135830
2.16 0.4846137 0.0387069 2.61 0.4954729 0.01323372.17 0.48·19966 0.0378779 11 2.62 0.4956035 0.01289212.18 0.4853713 0.0370629 1 2.63 0.4957308 0.01255812.19 0.4857379 0.0362619
1
1
2.64 0.4958547 0.01223152.20 0.4860966 0.0354746 2.65 0.4959754 0.0119122
2.21 0.4864474- 0.0347009 2.66 0.4960930 0.01160012.22 0.4867906 0.03394008 2.67 0.49620H 0.01129512.23 0.4871263 0.0331939 2.68 0.4963089 0.01099692.24 0.48H545 0.0324630
li2.69 0.4964274- 0.0107056
2.25 0.4877755 0.0317397 2.70 0.4965330 0.0104209
ESTADISTICA PSICQ-EDUCATIVA 461
(Continuación)
x/u Area Ordenada (y) x/o Area Ordenada (y)
2.71 0.4966368 0.01Ol4-28 3.16 0.4992112 0.00270752.72 0.4967359 0.0098712 3.17 0.4992378 0.00262312.73 0.4968333 0.0096058 3.18 0.4992636 0.00254-022.74 0.4969280 0.0093466 3.19 0.4-992886 0.00246152.75 0.4970202 0.0090936 3.20 0.4993129 0.0023841
2.76 0.4971099 0.001;8465 3.21 04993363 0.00230892.77 0.4971972 0.0086052 3.22 0.4-993590 0.00223582.78 0.4972821 0.0083697 3.23 04993810 0.00216492.79 0.497364-6 0.0081398 3.2+ 0.4994024- 0.00209602.80 0.4-974449 0.0079155 3.25 0.4-994-230 0.0020290
2.81 0.4-975229 0.0076965 326 0.4994429 0.00196412.82 0.4975988 0.0074829 3.27 04994-623 0,00190102.83 0.4976726 0.0072744 3.2B 0.4994-810 0.00183972.84 0.4977443 0.0070711 3.29 0.4-994991 0.00178132.85 a.4978140 0,0068728 3.30 0.4995166 0.0017226
2,36 0.4-978818 0.0066793 331 0,4-995335 0.00166662.87 0,4-9794-76 0.0064907 3.32 0.499H99 0.00161222.88 0.4980116 0.0063067 3.33 0.499565lJ 0.00155952.lJ9 0.4980738 0.0061274- 3.34 0.4995811 0.00150842.90 0.4981342 0.0059525 3.35 0.4995959 0.0014-587
2.91 0.04981929 0.0057821 3.36 0.4996103 0.00141062.92 0.4-982498 0.0056160 3.37 0.4996242 0.00136392.93 0.4983052 0.005454>1 3.38 0.4996376 0.0014-1872.94 0.4983589 0.0052963 3.39 0.4996505 0.00127482.95 0.4984111 0.0051426 3.40 0.4996631 0.0012322
2.96 0.4984618 0.0049929 3.41 0.4996752 0.00119102.97 0.4985110 0.0048470 3.4-2 0.4996869 0.00115102.98 0.4985588 0.0047050 3.43 0.4996982 0.00111222.99 0.4986051 0.0045666
11
3.44 0.4997091 0.00107+73.00 0.4986501 0.0044318 3.45 0.4997197 0.0010383
3.01 0.4986938 0.0043007 3.46 0.4-997299 0.00100303.02 0.+987361 0.0041729 l· 3.47 0A997398 0.0009689303 0,4·987772 0.0040486 ¡I 3.48 0.4997493 0.00093583.04 0.4988171 0.0039276 3.49 0.4997585 0.00096373.05 0.4-988558 0.0038098 3.50 0.4997674- 0.0008727
3.06 0.4988933 0.0036951 3.51 0.4997759 0.00084263.07 0.4989297 0.0035836 3.52 0.4997842 0.00081353.08 0.4989650 0.0034751 3.53 0.4997922 0.00078533.09 0.4989992 0.0033695 3.54 0.+997999 0.00075813.10 0.4990324 0.0032668 3.55 0.4998074 0.0007317
3.11 0.4990646 0.0031669 3.56 0.+9981+6 0.00070613.12 M9909~7 0.0030698 3.57 O.499821~ 0.OOOG81i3.13 0.4991260 0.0029H4 3.58 0.4998282 0.00065753.11. 0.49915.53 0.002883.5 3.59 0.+998347 0.00063433.15 0,;1991836 0.0027943 3.60 0.4998409 0.000611-9
462 JESUS DE LA ROSA
(Con'in~Qción)
xl" Area Ordl1lada (y) xl" Area Ordmad" (y)
3.61 0.4998469 0.0005902 4.06 0.4999755 0.00010513.62 0.4998527 0.0005693 4.07 0.4999765 0.00010093.63 0.4998583 0.0005490 4.08 0.4999775 0.00009693.64 0.4998637 0.0005294 4.09 0.4999784 0.00009303.65 0.4998689 0.0005105 4.10 0.4999793 0.0000893
3.66 0.4998739 0.0004921 4.11 0.4999802 0.00008573.67 0.4998787 0.0004744 4.12 0.4999811 0.00008223.68 0.4998834 0.0004573 4.13 0.4999819 0.00007893.69 0.4998879 0.0004408 4.14 0.4999826 0.00007573.70 0.4998922 0.0004248 4.15 0.4999834 0.0000726
3.71 0.4998964 0.0004093 4.16 0.4999841 0.00006973.72 0.4999004 0.0003800 4.17 0.4999848 0.00006683.73 0.4999043 0.0003661 4.18 0.4999854 0.00006413.74 0.4999080 0.0003526 4.19 0.4999861 0.0000615g.75 0.4999116 0.0003286 4.20 0.4999867 0.0000589
3.76 0.4999150 0.0003396 4.21 0.4999872 0.00005653.77 0.4999184 0.0003271 4.22 0.4999878 0.00005423.78 0.4999216 0.0003149 4.23 0.4999883 0.00005193.79 0.4999247 0.0003032 4.24 0.4999888 0.00004983.80 0.4999277 0.0002919 +.25 0.4999893 0.0000487
3.81 0.4999305 0.0002810 +.26 0.4999898 0.00004573.82 0.4999333 0.0002705 +.27 0.4999902 0.00004383.83 o.t999359 0.000260+ 4.28 0.4999907 0.00004203.84 0.4999385 0.0002506 4.29 0.+999911 0.00004023.85 0.4999409 0.0002411 4.30 0.4999915 0.0000385
3.86 0.4999+33 0.0002320 4.31 0.4999918 0.00003693.87 0.4999456 0.0002232 4.32 0.4999922 0.00003543.88 0.4999478 0.0002147 4.33 0.4999925 0.00003393.89 0.4999499 0.0002065 4.34 0.4999929 0.0000324-3.90 0.4999519 0.0001987 4.35 0.4999932 0.0000310
3.91 0.4999539 0.0001910 4.36 0.4999935 0.00002973.92 0.4999557 0.0001837 4.37 0.4999938 0.00002843.93 o.t999575 0.0001766 4.38 0.499994'1 0.00002723.94- 0.4999593 0.0001698 4.39 0.4999929 0.00002643.95 0.4999609 0.0001633 4.40 0.4999946 0.0000249
3.96 0.4999625 0.0001569 4.41 0.49999+8 0.00002393.97 0.4999641 0.0001508 4.42 0.4999951 0.00002283.98 0.4999655 0.00014+9 4.+3 0.4999953 0.~183.99 0.4999670 0.0001393 4.4+ 0.4999955 0.00002094.00 0.4999683 0.0001338 4.45 0.4999957 0.0000200
4.01 0.4999696 0.0001286 4.46 0.4999959 0.00001914.02 0.4999709 0.0001235 4.47 0.4999961 0.00001834.0.3 0.4999721 0.0001186 4.48 0.4999963 0.00001754.04 0.4999733 0.0001140 4.49 0.4999964 0.00001674.05 0.499974+ 0.0001094 4.50 0.4999966 0.0000160
ESTADISTICA PSICD-EDUCATIVA 463
Representación 6. Valores de Z para valores dados de r·
0.000 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009
0.000 0.0000 0.0010 0.0020 0.0030 0.0040 0.0050 0.0060 0.0070 0.0080 0.00900.010 0.0100 0.0110 0.0120 0.0130 0.0140 0.0150 0.0160 0.0170 0.0180 0.01900.020 0.0200 0.0210 0.0220 0.0230 0.0240 0.0250 0.0260 0.0270 0.0280 0.02900.030 0.0300 0.0310 0.0320 0.0330 0.0340 0.0350 0.0360 0.0370 0.0380 0.03900.040 0.0400 0.0410 0.0420 0.0430 0.0+1:0 0.0450 0.0460 0.0470 0.0480 0.04900.050 0.0501 0.0511 0.0521 0.0531 0.0541 0.0551 0.0561 0.0571 0.0581 0.05910.060 0.0601 0.0611 0.0621 0.cJ631 0.0641 0.0651 0.0661 0.0671 0.0681 0.06910.070 0.0701 0.0711 0.0721 0.0731 0.07+1 0.0751 0.0761 0.0771 0.0781 0.07910.080 0.0802 0.0812 0.0822 0.0832 0.08+2 0.0852 0.0862 0.0872 0.0882 0.08920.090 0.0902 0.0912 0.0922 0.0933 0.0943 0.0953 0.0963 0.0973 0.0983 0.09930.100 0.1003 0.1013 0.1024- 0.1034 O.IOH 0.105+ 0.106+ 0.1074- 0.108+ 0.1094-0.110 0.1105 0.1115 0.1125 0.1135 0.1145 0.1155 0.1165 0.1175 0.1185 0.11950.120 0.1206 0.1216 0.1226 0.1236 0.1246 0.1257 0.1267 0.1277 0.1287 0.12970.130 0.1308 0.1318 0.1328 0.1338 0.13+8 0.1358 0.1368 0.1379 0.1389 0.13990.140 0.1409 0.1419 0.1+30 0.14400 0.1450 0.1460 0.1470 0.1481 0.1491 0.1501O.UO 0.1511 0.1522 0.1532 0.1542 0.1552 0.1563 0.1573 0.1583 0.1593 0.16040.160 0.1614 0.1624- 0.1634- 0.1654- 0.1655 0.1665 0.1676 0.1686 0.1696 0.17060.170 0.1717 0.1727 0.1737 0.174:8 0.1758 0.1768 0.1779 0.1789 0.1799 0.18100.180 0.1820 0.1830 0.1841 0.1851 0.1861 0.1872 0.1882 0.1892 .0.1903 0.19130.190 0.1923 0.1934 0.19+4 0.1954 0.1965 0.1975 0.1986 0.1996 0.2007 0.20170.200 0.2027 0.2238 0.2048 0.2059 0.2069 0.2079 0.2090 0.2100 0.2111 0.21210.210 0.2132 0.2142 0.2153 0.2163 0.2174- 0.218+ 0.219+ 0.2205 0.2215 0.22260.220 0.2237 0.22+7 0.2258 0.2268 0.2279 0.2289 0.2300 0.2310 0.2321 0.23310.230 0.2342 0.2353 0.2363 0.2374- 0.238+ 0.2395 0.2405 0.2416 0.2427 0.24370.240 0.2+48 0.2+58 0.2469 0.2480 0.2490 0.2501 0.2511 0.2522 0.2533 0.25430.250 0.2554 0.2565 0.2575 0.2586 0.2597 0.2608 0.2618 0.2629 0.2640 0.26500.260 0.2661 0.2672 0.2682 0.2693 0.2704- 0.2715 0.2726 0.2736 0.2747 0.27580.210 0.2769 0.2779 0.2790 0.2801 0.2812 0.2823 0.2833 0.2844 0.2855 0.28660.280 0.2877 0.2888 0.2898 0.2909 0.2920 0.2931 0.2942 0.2953 0.2964 0.29750.290 0.2986 0.2997 0.3008 0.3019 0.3029 0.3040 0.3051 0.3062 0.3073 0.30840.300 0.3095 0.3106 0.3117 0.3128 0.3139 0.3150 0.3161 0.3172 0.3183 0.31950.310 0.3206 0.3217 0.3228 0.3239 0.3250 0.3261 0.3272 0.3283 0.3294- 0.33050.320 0.3317 0.3328 0.3339 0.3350 0.3361 0.3372 0.3384- 0.3395 0.3406 0.34170.330 0.3428 0.3439 0.3451 0.3462 0.3473 0.3484- 0.3496 0.3507 0.3518 0.35300.340 0.3541 0.35n 0.3564- 0.3575 0.3586 0.3597 0.3609 0.3620 0.3632 0.36430.350 0.3654 0.3666 0.3677 0.3689 0.3700 0.3712 0.3723 0.3734 0.3746 0.37570.360 0.3769 0.3780 0.3792 0.3803 0.3815 0.3826 0.3838 0.3850 0.3861 0.38730.370 0.3884 0.3896 0.3907 0.3919 0.3931 0.394-2 0.3954 0.3966 0.3977 0.39890.380 0.4001 0.4012 0.4024 0.4036 0.4047 0.4059 0.+071 0.4083 0.Kl94 0.41060.390 0.4118 0.4130 0.4142 0.+153 0.4165 0.+177 0.+189 0.+201 0.+213 0.42250.400 0.4236 0.4248 0.4260 0.4272 0.4284 0.4296 0.4308 0.4320 0.4332 0.43H0.410 0.4356 0.4368 0.4380 0.4392 0.440+ 0.4416 0.4429 0.4441 0.+453 0.44650.420 0.4477 0.4489 0.4501 0.4513 0.4526 0.4538 0.4550 0.+562 0.+57,\ 0.45870.430 0.4599 0.4611 0.4623 0.4636 0.4648 0.4660 0.4673 0.4685 0.+697 0.4710D.440 0.4722 0.4735 0.4747 0.4760 0.4772 0.4784 0.4797 0.+809 0.4822 0.48350.450 0.4847 0.4860 0.4872 0.4885 0.4897 0.+910 0.4923 0.4935 0.49+8 0.49610.460 0.4973 0.4986 0.4999 0.5011 0.5024 0.5037 0.504-9 0.5062 0.5075 0.50880.470 0.5101 0.5114 0.5126 0.5139 0.5152 0.5165 0.5178 0.5191 0.5204 0.52170.480 0.5230 0.5243 0.5256 0.5279 0.5282 0.5295 0.5308 0.5321 0.5331- 0.53470.490 0.5361 0.5374- 0.5387 0.5400 0.5413 0.5427 0.5440 0.5453 0.5466 0.5480
• Tomada de WAUOH. A. B.. L"bo,,,'o,,, ·M"nllal Dnd P,oble".. (Dr eleme..'. o(S'GU,"G. Nueva Yodt: McGraw-Hill.
464 JESUS DE LA ROSA
(Continuación)
0.000 0.001 0.002 0.003 0.004 0.005 0.006 0.001 0.008 0.009
0.500 0.5493 0.5506 0.5520 0.5533 0.5541 0.5560 0.5513 0.5581 0.5600 0.56140.510 0.5621 0.5641 0.5654 0.5668 0.5681 ' 0.5695 0.5109 0.5122 0.5136 0.51500.520 0.5163 0.5777 0.5791 0.5805 0.5818 0.5832 0.5646 0.5860 0.5814 0.58880.530 0.5901 0.5915 0.5929 0.5943 0.5951 0.5911 0.5985 0.5999 0.6013 0.60270.540 0.6042 0.6056 0.6010 0.6084 0.6098 0.6112 0.6121 0.6141 0.6155 0.6170
0.550 0.6184 0.6198 0.6213 0.6227 0.6241 0.6256 0.6210 0.6265 0.6299 0.63140.5&0 0.6328 0.6343 0.6368 0.6312 0.6381 0.6401 0.6416 0.6431 0.6446 0.64600.510 0.6415 0.6490 0.6505 0.6520 0.6535 0.6550 0.6565 0.6579 0.6594 0.66100.580 0.6625 0.6640 0.6655 0.6670 0.6685 0.6100 0.6715 0.6731 0.6746 0.67610.590 0.6117 0.6792 0.6807 0.6823 0.6838 0.6654 0.6869 0.6885 0.6900 0.6916
0.600 0.6931 0.6947 0.6963 0.6978 0.6994 0.7010 0.7026 0.7042 0.7057 0.70730.610 0.7089 0.7105 0.7121 0.7137 0.7153 0.7169 0.7165 0.1201 0.7216 0.72340.620 0.1250 0.7266 0.7283 0.7299 0.7315 0.7332 0.7348 0.7364 0.7381 0.73980.630 0.7414 0.1431 0.7441 0.7464 0.74111 0.7497 0.7514 0.7531 0.7548 0.75650.640 0.7582 0.7599 0.7616 0.7633 0.7650 0.7661 0.7664 0.7701 0.7718 0.7736
0.650 0.7753 0.7770 0.7788 0.7805 0.7623 0.7840 0.7858 0.71175 0.7393 0.79100.660 0.7928 0.794é 0.1964 0.7981 0.7999 0,8011 0,8035 0.8053 0.8011 0.80890.610 0.8107 0.8126 0.8144 0.8162 0.8160 0.8199 0.8217 0.8236 0.8254 0.82730.680 0.8291 0.8310 0.8328 0.8347 0.8366 0.8365 0.8404 0.8423 0.8442 0.84610.690 0.8480 0.6499 0.6516 0.8531 0.8556 0.8516 0.6595 0.8614 0.8634 0.86530.100 0.8613 0.6693 0.8712 0.8732 0.8152 0.8772 0.8792 0.8812 0.8832 0.88520.710 0.8872 0.8892 0.8912 0.8933 0.8953 0.8973 0.8994 0.9014 0.9035 0.90560.720 0.9076 0.9097 0.9118 0.9139 0.9160 0.9181 0.9202 0.9223 0.9245 0.92660.730 0.9287 0.9309 0.9330 0.9352 0.9373 0,9395 0.9417 0.9439 0.9461 0.94830.140 0.9505 0.9527 0.9549 0.9571 0.9594 0.9616 0.9639 0.9661 0.9684 0.9707
0.750 0.9730 0.9752 0.9776 0.9799 0.9822 0,9845 0.9868 0.9892 0.9916 0.99390.760 0.9962 0.9986 1.0010 1.0034 1.0058 1.0082 1.0106 1.0130 1.0154 1.01790.770 1.0203 1.0226 1.0253 1.0277 1.0302 1.0327 1.0362 1.0378 1.0403 1.04280.780 1.0454 1.(}179 1.0505 1.0531 1.0557 1.0583 1.0609 1.0635 1.0661 1.06880.790 1.0741 1.0714 1.0766 1.0795 1.0822 1.0849 1.0876 1.0903 1.0931 1.0958
C.600 1.0986 1.10l+ 1.1041 1.1070 1.1098 1.1127 1.1155 1.1184 1.1212 1.12410.810 1.1270 1.1299 1.1329 1.1358 1.1388 1.1417 1.1447 1.1477 1.1507 1.15380.620 1.1568 1.1599 1.1630 1.1660 1.1692 1.1123 1.1754 1.1786 1.1817 1.16490.830 1.1870 1.1913 1.1946 1.1979 1.2011 1.2044 1.2077 1.2111 1.2144 1.21780.840 1.2212 1.2246 1.2260 1.2315 1.2349 1.2384 1.2419 1.2454 1.2490 1.2526
0.850 1.2561 1.2598 1.2634 1.2670 1.2708 1.2744 1.2782 1.2819 1.2857 1.28950.860 1.2934 1.2972 1.3011 1.3050 1.3069 1.3129 1.3168 1.3209 1.3249 1.32900.870 1.3331 1.3312 1.3414 1.3456 1.3498 l.3540 1.3583 l.3626 1.3670 l.37140.880 1.3758 1.3802 1.3847 1.3892 1.3938 1.3984 1.4030 1.4077 1.4124 1.41710.890 1.4219 1.4266 1.4316 1.4366 1.4415 1.4465 1.4516 1,4566 1.4618 1.4670
0.900 1.4722 1.4775 1.4828 1.4883 1.4937 1.4992 1.5047 1.5103 1.5160 1.52170.910 1.5275 1.5334, 1.5393 1.5453 1.5513 1.5574 1.56'36 1.5698 1.5762 1.58250.920 1.5890 1.5956 1.6022 1.6089 1.6157 1.6226 1.6296 1.6366 1.6438 1.65100.930 1.6584 1.6659 1.6734 1.6811 1.6868 1.6967 1.7047 1.7129 1.7211 1.72950.940 1.7380 1.7467 1.7555 1.7645 1.7736 1.7828 1.7923 1.8019 1.8117 1.8216
0.950 1.8318 1.8421 1.8527 1.8635 1.8745 1.8857 1.8972 1.9090 1.9210 1.93330.960 1.9450 1.9588 1.9721 1.9857 1.9996 2.0140 2.0287 2.0439 2.0595 2.07560.970 2.0923 2.1095 2.1273 2.1457 2.1649 2.1647 2.2054 2.2269 2.2494 2.97290.980 2.2976 2.3223 2.3507 2.3796 2.4101 2.4426 2.4774 2.5147 2.5550 2.59880.990 2.6467 2.6996 2.7587 2.6257 2.9031 2.9945 3.1063 3.2504 3.4534 3.8002
ESTADISTICA PSICO-EDUCATIVA 465
Repraentación 7. Coeficientes del binomio nCr *
AQ 2 3 4- 5 6 7 8 9 10 11 12 u 1. 15
1 1 12 1 2 13 1 3 3 14- 1 4- 6 4 15 1 5 10 io 5 16 1 6 15 20 15 6 17 1 7 21 35 35 21 7 18 1 8 28 56 70 56 28 8 19 1 9 36 84 126 126 ~ 36 9 1
10 1 10 45 120 210 252 210 120 45 10 111 1 11 55 165 330 462 462 330 165 55 11 112 1 12 66 220 495 792 924 792 495 220 66 12 113 1 13 78 286 715 1287 1716 1716 1287 715 286 78 1814- 1 14- 91 364 1001 2002 3003 3+32 3003 2002 1001 36+ 91 1+ 115 1 15 105 455 1365 3003 5005 6435 6+35 5005 300S 1365 .55 105 15
• TOIIUIda do D.wJ••N&L.ON. E/em,nl, DIS'lJIis'i~,. ChiCliJo, e.e.a.!.
466JESUS DE LA ROSA
11 F(II) 11 F(II) I z F(z)
1.36 O.91308~O 1.81 0.9648521 2.26 0.9880894-1.37 0.91406565 1.82 0.9656205 2.27 0.98839621.38 0.9162067 1.83 0.9663750 2.28 0.98869621.39 0.9177356 1.84- 0.9671159 2.29 0.98898931.40 0.9192433 1.85 0.96784-32 2.30 0.9892759
0.9207302 1.86 0.9685572 2.31 0.98955591.4-11.87 0.9692581 2.32 0.98982961.42 0.92219621.88 0.96994-60 2.33 0.99009691.4-3 0.92364-151.89 0.9706210 2.34- 0.99035811.44- 0.92506631.90 0.9712834- 2.35 0.99061331.4-5 0.9264-707
2.36 0.99086251.46 0.9278550 1.91 0.9719334- 2.37 0.99110601.47 0.9292191 1.97, 0.9725711 2.38 0.99134-371.4-8 0.9305634- 1.93 0.9731966 2.39 0.99157581.49 0.9318879 1.94- 0.9738102 2.4-0 0.99180251.50 0.9331928 1.95 0.97441192.41 0.99202371.96 0.97500211.51 0.9344783
1.97 0.975~808 2.42 0.99223971.52 0.93574451.98 0.97014082 2.43 0.9924-5061.53 0.93699161.99 0.9767045 2.44- 0.9926564-1.54 0.93821982.00 0.9772499 2.45 0.9928~72
1.5~ 0.9390+292 2.46 0.99305311.56 0.9406201 2.01 0.9777844- 2.47 0.9932443l.57 0.94-17924 2.02 0.9783083 2.48 0.9934-3091.58 0.90+29466 2.03 0.9788217 2.49 0.99361281.59 0.9440826 2.04 0.9793218 2.50 0.99379031.60 0.94-52007 2.05 0.9798178 2.51 0.9939634
0.9463011 2.06 0.9803007 2.52 0.99413231.612.07 0.9807738 2.53 0.99429691.62 0.94-73839 2.08 0.98123i2 2.54 0.99445741.63 0.9484419 2.09 0.981691! 2.55 0.99461391.64 0.94949742.10 0.9821356 2.56 0.9947664-1.65 0.9505285
2.57 0.994-91511.66 0.9515428 2,11 0.9825708 2.58 0.99506001.67 0.9525403 2.12 0.9829970 2.59 0.99520121.68 0.9535213 2.13 0.98341402 2.60 0.99533881.69 0.9~860 2.14 0.98382262.70 0.99653301.70 0.9534345 2.15 0.9842224 2.80 0.9974449
1.71 0.9563671 2.16 0.9846137 2.90 0.99813422.17 0.9849966 3.00 G.99865011.72 0.9572838 2.18 0.98537133.20 0.99931291.73 0.9581849
2.19 0.98573791.74 0.95907052.~0 0.9860966 3.40 0.9996631
1.75 0.9599408 3.60 0.99984091.76 0.9607961 2.21 0.986447. 3.80 0.99992771.77 0.9616364 2.22 0.9867906 4.00 0.99996831.78 0.9624620 2.23 0.9871263 4.50 0.99999661.79 0.9632730
I2.2. 0.9874545 ~.OO 0.99999!l71.80 0.9640697 2.25 0.9877755 5.50 0.9999999
]"
R.epresentación 8. Probabilidades normales *
z F(z) z F(z) z F(z)
0.00 0.5000000 0.46 0.6772419 0.91 0.81858870.01 0.5039894 0.47 0.6808225 0.92 0.82121360.02 0.5079783 0.48 0.6843863 0.93 0.82381450.03 0.5119665 0.49 0.6879331 0.94 0.82639120.04 0.5159534 0.50 0.6914625 0.95 0.82894390.05 0.5199388 0.96 0.83147240.06 0.5239222 0.51 0.6949743 0.97 0.83397680.07 0.5279032 0.52 0.6984682 0.98 0.83645690.08 0.5318814 0.53 0.7019440 M9 0.83891290.09 0.5358564 0.54 0.7054015 1.00 0.84154470.10 0.5398278 0.55 0.7088403
0.56 0.7122603 1.01 0.8487$240.11 0.5437953 0.57 0.71561512 1.02 0.846US80.12 0.!I477584 0.58 0.7190427 1.03 0.84849500.13 0.U11I68 0.59 0.7224047 1.04 0.85085000.14 0.5556700 0.60 0.7257469 1.05 0.85314090.15 0.55961771.06 0.85542770.16 0.5635595 0.61 0.7290691 1.07 0.85769030.17 0.5674949 0.62 0.7323711 1.08 0.85992890.18 0.5714237 0.63 '0.7356527 1.09 0.86214310.19 0.5753454 0.64 Q.7389137 1.10 0.86433390.20 0.5792597 0.65 0.7421539
0.21 0.5831662 0.66 0.7453731 1.11 0.86650050.67 0.7485711 1.12 0.86864310.22 0.58706040.68 0.7517478 1.18 0.87076190.23 0.59093+10.69 0.7549029 1.14 0.87285680.2+ 0.59483490.70 0.7580363 1.15 0.87+92810.25 0.5987063
1.16 0.87697560.26 0.6025681 0.71 0.7611+79 1.17 0.87899950.27 0.6064199 0.72 0.7642375 1.18 0.88099990.28 0.6102612 0.73 0.7673049 1.19 0.88297880.29 0.6140919 0.7+ 0.7703500 1.20 0.8849'030.30 0.6179114 0.75 0.77337260.31 0.6217195 0.76 0.7763727 1.21 0.88686060.32 0.6255158 0.77 0..7793501 1.22 0.88876760.33 0.6293000 0.78 0.7823046 1.23 0.89065140.34 0.6330717 0.79 0.7852361 1.2+ 0.89251250.35 0.6368307 0.80 0.7881446 1.25 0.89435020.36 0.6405764 1.26 0.89616530.37 0.6443088 0.81 0.7910299 1.27 0.89795770.38 0.6480273 0.82 0.7938919 1.28 0.899727+0.39 0.6517317 0.83 0.7967306 1.29 0.901+7470.40 0.6554217 0.84- 0.7995458 1.30 0.90319950.85 0.80233750.+1 0.6590970 0.86 0.8051055 l.31 0.90490210.+2 0.6627573 0.87 0.8078498 l.S2 0.90658250.43 0.6664022 0.88 0.810"03 1.33 0.9032+080.44 0.670031+ 0.89 0.8132671 U! 0.90987150.+5 .0.6738448 0.90 0.8159399 l.S!I 0.911+920
• Condensada por el autor, de P&AJl'ON-H.uTLav. Obra citada. Tabla 18.
467
R.epJacntacióa 10. Tabla de la F de Snedecer•
'>< 2 3 4 5 6 8 12 24 co
2 18.51 19.00 19.16 19.25 19.30 19.33 19.37 19.41 19.45 19.5098.49 99.00 99.17 99.25 99.30 99.33 99.36 99.42 99.46 99.50
3 10.13 9.55 9.28 9.12 9.01 8.94- 8.8+ 8.74- 8.6+ 8.553U2 '30.82 29.46 28.71 28.24 27.91 27.49 27.05 26.60 26.12
4- 7.71 6.94- 6.59 6.39 6.26 6.16 6.04- 5.91 5.77 5.6321.20 18.00 16.69 15.98 15.52 15.21 14.80 14.37 13.95 13.46
5 6.61 5.79 5.~1 5.19 5.05 4.95 4.82 4.68 4.53 4.3616.26 13.27 12.06 11.39 10.97 10.67 10.27 9.89 9.47 9.02
6 5.99 5.14 4.76 +.53 4.39 4.28 U5 4.00 3.84 3.6713.74 10.92 9.78 9.15 8.75 8.47 8.10 7.72 7.31 6.88
7 5.59 4.7" 4.35 4.12 3.97 3.87 3.73 3.57 3.41 3.2312.U 9..55 U5. 7.85 7.+6 7.19 6.84 6.+7 6.07 5.65
8 5.32 +.46 4.07 3.84 3.69 3.58 5.40+ 3.28 3.12 2.931l.26 8.65 7.59 7.01 6.65 6.37 6.03 :1.67 5.28 +.86
• 5.12 ".26 3.86 U3 3.+8 3.57 3.23 3.07 2090 2.7110.56 8.02 6.99 1.42 6.06 5.80 5.47 5.11 4.73 +.31
10 ....1 UD 3.71 9.48 3.53 3.22 3.07 2.91 2.74 2.54-10.0+ 7.56 6.55 5.99 5.64- 5.39 5.06 4.71 4.33 3.91
12 4.75 3.88 3.49 3.26 5.11 3.00 2.85 2.69 2.50 2.309.33 6.93 5.95 5.41 5.06 +.82 4.50 4.16 3.78 3.36
1+ +.60 3.74 5.3+ 5.11 2;96 2.85 2.70 2.53 2.55 2.138.86 6.51 5.56 5.03 +.69 +.46 4.14 3.80 3.43 3.00
11 +.49 3.63 3.2+ MI 2.85 2.7+ 2.59 2.42 2.24- 2.018.53 6.23 5.29 1,.77 4.+4 4.20 3.89 3.55 3.18 2.75
18 ·Ul 3.55 !l.l6 2.93 2.77 2.66 2.51 2.'4 2.15 1.928.28 6.01 5.Oi +.58 ....25 4.01 3.71 3.37 3.01 2.57
20 ....35 U, 3.10 2.87 2.71 2.60 2.45 2.28 2.08 1.848.10 5.85 4094 .....3 ".10 3.87 3056 3.23 2.86 2.42
25 U" 3.18 2.99 2.76 2.60 2.49 2.54 2.l11 1.911 1.717.77 5.57 4068 4.18 3.86 3.63 3.52 2.99 2.62 2.17
30 U7 3.32 2.92 2.69 2.53 2.42 2.27 2.09 1.89 1.627.56 5.39 ".51 4.02 3.70 3.47 3.17 2.84 2.+7 2.01
40 ....08 3.23 2.8+ 2.61 2.+5 2.34 2.18 2.00 1.79 1.517.31 5.18 +.31 3.83 3.51 3.29 2.99 2.66 2.29 1.81
60 ....00 3.15 2.76 2.52 2.37 2.25 2.10 1.92 1;70 1.397.08 4.98 •. 13 3.65 3.3. 3.12 2.82 2.50 2.12 1.60
80 3.96 3.11 2.72 2.19 2.33 2.21 2.06 1.88 I.M 1.326.96 +.88 ....0+ 3.36 S.U 3.0+ 2.71- 2.41 2.03 1.49
• Tomada de SHU>ICJOR. SI.,;'I;,1I1 M_'1lDils. Ameo.l_a: 1__: Slate CoIlese Pro.
461
ESTADISTICA PSICO-EDUCATIVA 469
Ao t
Rcpracutaci6D 9. Tabla de la t de Student.
;:::: 0.10 0.05 0.02 0.01
1 6.34 12.71 31.82 8U'2 2.92 4,30 6.96 9.92:5 2.35 3.18 4.54 5.844 2.13 2.78 3.75 UO·5 2.02 2.57 !l.36 4.056 1.94 2.45 3.14 3.717 1.90 2.36 3.00 UO8 1.86 2.31 2.90 S,569 1.83 2.26 2.82 3.25
10 1.81 2.23 ".76 5.1711 1.80 2.20 .72 5.1112 1.78 2.18 2.68 5.0613 1.77 2.16 2.65 5.0114 1.76 2.14 2.62 2.9815 1.75 2.13 2.60 2.9516 1.75 2.12 2.58 2.9217 1.74 2.11 2,57 2.9018 1.73 2.10 2.55 2.8819 1.73 2.09 2.54 2.8620 1.72 2.09 2.53 2.8421 1.72 2.08 2.52 2.$322 1.72 2.07 2.51 2.8223 1.71 2.07 2.50 2.8124 1.71 2.06 2.49 2.8025 1.71 2.06 2.+8 2.7926 1.71 2.06 2.+8 2.7827 1.70 2.05 2.+7 2.7728 1.70 2.05 2.+7 '2.7629 1.70 2.04 2,46 U.30 1.70 2.().f 2,46 2.75S5 1.69 2.0S 2.4+ 2.7240 1.68 2.02 2.+2 2.7145 1.68 2.02 UI 2.6950 1.68 2.01 UO 2.6860 1.67 2.00 2.39 2.6600 1.64 1.96 2.55 2.58
• TIIIIIada de FIl." Il. 11.. Obr. ,¡'.d••
Representación 5. Areas y ordenadas do la WNa ncrmal s Ax/~ A.,.. O,d,n..d.. (,,) x/a Á" .. O,d,n..d.. (,,)
--------0.00 0.0000000 0.3989423 0.46 0.1772419 0.35889030.01 0.0039894 0.3989223 0.47 0.1808225 0.35722530.02 0.0079783 0.3988625 0.48 0.1843863 0.35553250.03 0.0119665 0.3987628 0.49 0.1879331 0.353812+0.04 0.0159534- 0.0986233 0.50 0.1914625 0.35206530.05 0.0199388 0.3984439
0.51 0.1949743 0.35029190.06 0.0239222 0.3982248 0.52 0.1984682 0.34849250.07 0.0279032 0.3979661 0.53 0.2019440 0.34666770.08 0.0318814 0.3976677 0.54 0.2054015 0.34481800.09 0.0358564- 0.3973298 0.55 0.2088403 0.34294390.10 0.0398278 0.3969525
0.56 0.2122603 0.34104580.11 0.0437953 0.3965360 0.57 0.2156612 0.33912430.12 0.0+77584 0.3960802 0.58 0.2190427 0.33717990.13 0.0517168 0.3955854 0.59 0.2224047 0.33521320.14 0.0556700 Oj950517 0.60 0.2257+69 0.33322460.15 0.0596177 0.3944793
0.16 0.0635595 0.3938684 0.61 ' 0.2290691 0.33121470.62 0.2323711 0.32918400.17 0.067+949 0.39321900.63 0.2356527 0.32713300.18 0.0714237 0.3925315 0.64 0.2389137 0.32506230.19 0.0753454 0.39180600.6.5 0.2421539 0.322972+0.20 0.0792597 0.3910+27
0.21 0.0831662 0.3902419 0.66 0.2453731 0.32086380.22 0.08706.... 0.3894038 0.67 0.2485711 0.31873710.23 0.0909541 0.3885286 0.68 0.2417+78 0.31659290.24 0.0948549 0.3876166 0.69 0.2549029 0.31443170.25 0.0987063 0.3866681 0.70 0.2580363 0.3122539
0.26 0.1025081 0.3856834 0.71 0.2611+79 0.31006030.27 0.1064199 0.3846627 0.72 0.2642375 0.30785130.28 0.1102612 0.3836063 0:73 0.26730+9 0.30562740.29 0.1140919 0.3825146 0.74- 0.2703500 0.30338930.30 0.1179114 0.3813878 0.75 0.2733726 0.3011374
0.31 0.1217195 0.3802264- 0.76 0.2763727 0.29887240.32 0.1254158 0.3790305 0.77 0.2793501 0.29659480.33 0.1293000 0.3778007 0.78 0.2823046 0.29+30500.34 0.1330717 0.3765372 0.79 0.2852361 0.29200380.:15 0.1368307 0.3752403 0.80 0.2881446 0.2896916
0.36 0.1405764 0.37311106 0.81 0.2910299 0.28736890.37 0.1+45088 0.3725483 0.82 0.2938919 0.28503640.38 0.1480273 0.3711539 0.83 0.2967306 0.28269450.39 0.1517317 0.3697277 0.84 0.2995+58 0.2803+380.4{) 0.1555417 0.3682707 0.85 0.3023375 0.27798+9
0.41 0.1590970 0.3667817 0.86 0.3051055 0.27561820.+2 0.1627573 0.3652627 0.87 0.3078498 0.2732.......0.43 0.1664022 0.3637136 0.88 0.3105703 0.27086400.+4- 0.1700314 0.36213+9 0.89 0.3132671 0.26t!'t7740.45 0.17'6448 0.3605270 0.90 0.3159399 0.26(i0852
• CoDden.da. TA• •'-••t. 01 St"¡'ti~s, de KJlNT.
470
472 JESUS DE LA ROSA
B.epresentae:i60 3 (condensada). Áreq bajo la curva normal entrela media y un valor típico dado en Z *
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0000 0040 0080 0120 0160 0199 0239 0279 0319 03590.1 0398 ·0438 0478 0517 0557 0596 0636 0675 0714 07530.2 0793 0832 0871 0910 0948 0987 1026 1064 1103 11410.3 1179 1217 1255 1293 1331 1368 1406 1443 1480 15170.4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879
0.5 1915 1950 1985 2019 2054 208ft 2123 2157 2190 22240.6 2257 2291 2324 2357 2389 2422 2454 2486 2517 25490.7 2580 2611 2642 2673 2704 2734 2764 2794 8223 28520.8 2881 2910 2939 2967 2995 3023 3051 3078 3106 31330.9 3159 3186 3212 3238 3264 3290 3315 3340 3365 3389
1.0 3413 3438 3461 3485 3508 3531 3554 3577 3599 36211.1 3643 3665 3686 3708 3729 3749 3770 3790 3810 38301.2 3849 3869 3888 3907 3925 3944 3962 3980 3997 40151.3 4032 4049 4066 4082 4049 4115 4131 4147 4162 41771.4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1.5 4332 4345 4357 4370 4383 4394 4406 4418 4429 44411.6 4452 4463 4474 4484- 4495 4505 4515 4525 4535 45451.7 4554 4564 4573 '4582 4591 4599 4608 4616 4625 46331.8 4641 4649 4656 4664- 4671 4678 4686 4693 4699 4706U 4713 4719 4726 4152 4738 4744- 4750 4756 4761 4767
2.0 4772 4778 4783 4788 4793 4798 4803 4808 4812 48172.1 4821 4826 4830 48H 4838 4842 4846 4850 4854 48572.2 4861 4864 4868 4871 4875 4878 4881 4884 4887 48902.3 4893 4896 4898 4901 4904 4906 4909 4911 4913 49162.4 4918 4920 4922 4925 4927 4929 4931 4932 49H 4936
2.5 4938 4940 4941 4943 4945 4946 4948 4949 4951 49522.6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964-2.7 4965 4966 4967 4968 4969 4970 4971 4972 4973 49742.8 4974 4975 4976 4977 4977 4978 4979 4979 4980 49812.9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
3.0 4986.5 4986.9 4987.4 4987.8 4988.2 4988.6 4988.9 4989.3 4989.7 4990.(3.1 4990.3 4990.6 4991.0 4991.3 4991.6 4991.8 4992.1 4992.4 4992.6 4992.S3.2 4993.1293.3' 4995.166U 4996.631U 4997.674
3.8 4998.409s.7 4998.922
A3.8 4999.277U 4999.519+.04tH.eas4.5 +991.9865.0 4999.097173
* OoIIdllll..da de h.ulaox-H.u'I'L&Y. Bio_"ik" T,,"'.~ 1MS~ 'CuD-bridp: UJÚvenity ...... 1954, vol. 1, tabla 12.
REFERENCIASBIBLIOGRAFICAS
La siguiente lista de libros aunque no es, ni mucho menos, exhaustiva, ofrece al lector interesado la oportunidad de encontrar mucha lectura suplementaria y complementaria sobre diversos temas presentados en el texto. Ello, para beneficio del estudiante y del lector en general que quiera investigar algunos de los temas tratados eneste libro, y en especial, en relación con algunas áreas particulares.
Alcaide Inchausti, A.: Estadística aplicada a las Ciencias Sociales. Ediciones Piran,Madrid. 1976.
Amón, J.: Multidimensionalidad de la religiosidad utilitaria a través de la afinidad entrelas cuestiones intrínsecas y las extrínsecas. «Rev. de Psicol. Gen. y Aplic.», 196H.vol. XXIII, núm. 95, págs. 983-9118.
Amón, J.: Prejuicio antiprotestante y religiosidad utilitaria; AguiJar, Madrid, 1969.Amón. J.: La construcción de escalas psicológicas en funcián del método elegido. «Rev.
de Psicol. Gen. y Aplic.• , 1972, vol. XXVII, núms. 116-117, págs. 423-431.Atkinson, R. C., Bower, O. H. y Crothers, E. J.: An lntroduction to Mathematical
Learning Theory, John Wiley, Nueva York, 1965.Bailey, N. T. J.: The Malhematieul Approach lo Biology and Medicine. John WiJey,
Nueva York, 1967.Baíow, B., Eulton, H. y Peploe, E.: Reading Comprehension Skll/s Among Hearlng
Impalred Adolescents, «VoUa Revíew •• 1971,73. págs. 113·119.Berman, P. W.• Waisman, H. A. YOraham, F. K.: lntelltgence in Treated Pheny/kelo,
nuric Children: A Deoelopmental Study. «Child Development», 1966, 37, páginas731-747.
Bingham, W. Wd., Moore, B. V. Y Gustad, J. W.: How to Interview, Harper & Row,Nueva York, 1959.
Bisset, B. M. Y Rieber, M.: The Effects 01 Age and Incentive Yalue on DiscnminaüonLearning, «J. Exp. Child Psych .•• 1966, 3, págs. 199-206.
Blommers, P. y Lindquist, E. F.: Elementary Statistical Methods in Psychology andEducation, University of London Press, Londres. 1965.
Burt, C.: Is Intellígence Distributed Normal/y?, «Brit, J. Statist. Psychol.», 1963, 16.págs. 175-90.
Calot, G.: Cours de Statistique descnptlve, Dunod , París, 1%9. (Traducida al castellanocon el titulo de Curso de estad(stica descriptiva, edítllda por Paraninfo, J970.)
Casa Aruta, E.: 200 problemas de Estadtstlca descriptiva, Vicens Vives, Barcelona, 1969.Coliman, R. D. Y Stoller, A.: A Survey of Mong%id Births in Victoria, Australia.
1942-1957, «Amer. J. Public Heanh», 1962, 52, págs. 813.829.Conde, V. y Domenech, D.: Considerations on tne J. Q. Wilh the WAYS iJlaSample 01
Scñlzophrenics in Relaüon Wlth the Sex, Age. Cullurai Level, Orig/n, Residenct andCivil State, «Rev, de Neurol., Neuroch. y Psich .• , Oviedo, 1976.27, págs. 258-291.
Coombs, C. H., Dawes, R. M. Y Tverski, A.: Mathematieal Psyehology.· An Elementarylnlroduction. En¡lewood ClitIs, N. J.: Prentice-Hall, 1970.
473
474 JESUS DE LA ROSA
. Cravioto, J. y Robles, B.: Evolution of Adaptive and Molar Behavior During R ..habilitation from Kwushiorkor, «Amer , J. of Orthopsych.», 1965, 35, págs. 449-464.
Croxton, F. E., Cowden, D. J. Y Klein, S.: Applied General Statistics, Pitman, Londres,1968. (Traducida al castellano con el título Estadistica general aplicada. editada porFondo de Cultura Económica, México).
Chesire, L., Saffir, M. Y Thurstone, L. L.: Computing Diagrams for the TetracboricCoefficient. The University of Chicago, Chicago, 1933.
Dement, W. y Kleitman, N.: Cyclic Yariutions in EEG during Sleep and Their Relationlo Eye Movements, Body MolililY and Dreuming, «Electroenc. Clin. Neurophys.»,1957, 9. págs. 673-690.
Downie, N. M. Y Heath, R. W.: Basie Statistical Methods, Harper & Row, Nueva York,1970. (Traducida al castellano con el título Métodos estadisticos aplicados. editadapor Ediciones del Castillo, Madrid, 1971.)
Edwards, A. L.: Stotisüco! Methods, Holt, Rinehart & Winston, Nueva York. 1973.Engelrnan, S.: The Effectiveness of Direct Verbal lnstruction on l. Q.. Performance and
Achievement in Reading and Arithmetic, en G. Hullmuth (Ed.) «DisadvantagedChild», vol. 3. Compensatory Education: A National Debate, Brunner/Mazel, Publishers, 1970, págs. 339·361.
Felsinger , J. M., Gladslone, A. r.. Yarnaguchi, H. G. y Hull. C. L.: Reaction Latency ~I,)
as' a Function of the Number of Reinforcements • •J. Exper. Psychol, •• 1947.37, págs.214-288.
Ferguson, G. A.: Statistical Analysis in Psyehology and Education, McGraw-HiII. NuevaYork. 1976.
Freernan, H.: lntroduction lo Statistical Inference, Addison-Wesley, Reading, Mass.,1963.
Freeman, L. C.: Elementary Applied Statistics, John Wiley, Nueva York. 1968.Freund, J. E.: Statistics, a First Course, Englewood ClilTs. N. J.: Preuuce-Hall, 1970.Games, P. A. Y Klare, G. R.: Elementary Statistlcs: Dala Analysis for the Behavioral
Sciences, McGraw-Hill. Nueva York. 1967.Getzels y Jackson: Creatlvity and Intetiigence, Bxptorations wllh Gifted Students. John
Wiley. Nueva York, 1968.Glass, G. V. Y Stanley, J. C.: Statistical Methods in Psyehology and Education,
Englewood Cliffs, N. J.: Prentice-Hall, 1970. (Traducida al castellano con el título deMétodos estadisticos aplicados a las Ciencias Sociales. editada por Prentice-Hall,1974.)
Goodman, L. A. Y Kruskal, W. H.: Measures 01 Association for Cross-Classificatlons,«Journal J. Amer. Slat. Assoc.», 1954,49. págs. 732.764.
Guilford, J. P. Y Fruchter , B.: Fundamental Statistics In Psyehology and Education,McGraw-Hill, Nueva York. 1973.
Haber, A. y Runyon, R. P.: General Statistics, Addison-Wesley, Readinll. Mass., 1973.(Traducida al castellano. con el título de Estadistica General. editada por FondoEducativo Interamericano, 1973.)
Harrower, M.: Psychodiagnostic Te8tlng: An Emplrleal Approach Based In 11 Folio'W-up01 U)(JO Cases, Charles C. Thomas, Spríngfield. 111., 1973.
Hays, W. L.: Statlsttcs for the Social Sciences, Holt, Rinehart & Wlnston. Nueva York,1973.
Horowitz , L. M.: Elemenls of Stallslles for Psye'holof/Y and Bducaüo«, McGraw·HiII.Nueva York, 1974,
Horst, P.: Psvcñological Measurement and Predictian, Wadsworth. Belmont, Cal., 1966.
ESTADISTICA PSICO-EDUCATIVA 475
HuI!, C. L., Felsínger, J. M., Gladstone , A. I. Y Yamaguchi, H. G.: A Propo sedQuanlificalion of Hubit Strength, «Psychol, Rev.», 1947. 54, págs. 237-254.
Jáñez, L.: Efectos de la comunidad de asociados en el aprendizaje verbal. tesis doctoralno publicada. Universidad Complutense de Madrid. 1976.
Kendall, M. G.: Rank Correlation Methods, Ch. Griffin, Londres, 1970.Kitterle, F. L. Y Helson, H.: On the lnhibitory Effect of a Second Stimulus Following the
Primary Stimulus to React: A Successfull Replication, ,d. Exp. Psychol. » , 1972. %,págs. 138-141.
Kohuot, F. J.: Stutistics for Social Scientists: A Coordinated Learning System, JohnWiley, Nueva York. 1974.
Korin, B. P.: Stutistical Concepts for the Social Sciences. Cambridge Mass. Winthrop ,1975.
Kuo, Z. Y.: The Genesis of the Ca"s Response lo the Ralo «J. Comp. Psychol .... 1930,11, págs. 1-30.
Labrousse, Ch.: Statistique. Exercices corriges, tomo 1, Dunod , París, 1970. <Traducidaal castellano con el título Estudistica. Ejercicios resueltos. editada por Paraninfo,1973.)
Levenstein, P. y Sunley, R.: Stimulation of Yerbal Interuction Beuoeen DisadoantagedMothers andChildren, «Arner. J. of Orthopsych .... 1968,38. págs. 116-121.
l.ewis, D.: Quantitative Methods in Psychology, McGraw-Hill. Nueva York. 1960.Lord, F. M. Y Novick , M. R.: Staüstlcal Theories of Mental Test Scores, Addisun
Wesley, Reading, Mass .• 1968.Lorge, L: The Fundamental Nuture of Measurement. en D. N. Jacksun y S. Messick
(Eds.), Problems in Human As·se.lSment, McGraw-HiII, Nueva York, 1967, páginas43·56.
Magnussun, D.: Test Theory, Addison-Wesley, Reading, Mass., 1967.MeCall, R. B.: Fundamental Statistics [or Psychology, Harcourt, Brace Jovanovich,
Nueva York, 1975.McNemar. Q.: Psychological Statistics, John Wiley, Nueva York, 1969.Míller, G. A.: Mathemaücs and Psychology , John Wiley, Nueva York, 1964.Nunnally, J. C.: Psychometric Theory; McGraw-Hill, Nueva York, 1967.Nunnally, J. C.: lntroduction 10 Statistics for Psyehology and Education, McGraw-HiII,
Nueva York, 1975.Osgood , C. E.: Method and Theory in Experimental Psychology, Oxford University
Press, Londres, 1953.Pavlov, 1. P.: Conditioned Reflexes (Selected Experiments}, Oxford University Press,
Londres.Pfanzagl, J.: Theory of Measurement, Physica-Verlag, Würzburg-Viena, 1971.Rachman, S. y Hodson, R. J.: Expertmentalty lnduced • Sexual Fetlchism»: Repticutto«
and Development, ..The Psychol. Record .• , 1%8, 18, págs. 25-27.Runyon, R. P: y Haber, R,: Fundamentuls of Behavioral Stutistics, Addison-Wesley,
Cambridge, Mass., 1976.Savage , 1. R.: Nonparametric Stutistics, «J. Amer. Statist. Ass .• , 1957, .52, págs.
331·344.Sender, V. L,: Measurement and Statistics, Oxford University Press, 1958.Siegcl, S.: Non-parametric Statistlcs, McGraw-Híll, Nueva York, 1956.Sokolov, A. N.: lnner Speech and Thought, Plenum Press, Nueva York. 1972.Stevens, S. S.: On the Theory 01 Scales of Measurement, «Scieece», 1946, vol. 103, núm.
2.684, págs. 677-680.
476 JESUS DE LA ROSA
Stevens, S. S.: Mathematics, Measurement and Psychophysics, en S. S. Stevens (Ed.),Handbook of Experimental Psychology , John Wiley, Nueva York, 1951, págs. 1-49.
Stevens, S. S.: Measurement, Psyehophysies and Utility, en C. W. Churchman y Ph.Ratoosh (Eds), Measurement : Definitions and Theories , John Wiley, Nueva York,1959, págs. 18-63.
Stevens , S. S.: A Metric for the Social Consensus, «Science», 1966, 151, págs. 530-541.Stevens, S. S.: Ratio Scales of Opinion, en D. K. Whitla (Ed.), Handbook of Meilsure
mera and Assessment in Behaoioral Sciences, Addison-Wesley, Reading, Mass.,I968a, págs. 171-199.
Stevens, S. S.: Measurement Statistics and the Schemapiric View, «Science.., 1968b;161, págs. 843-856.
Stevens, S. S.: Psvchophysics, John Wiley, Nueva York, 1975.Suppes, P. y Zinnes, J. L.: Basie Measurement Theory, en R. D. Luce, R. R. .Bush y
E. Galanter (Eds.), Handbook ofMathematical Psychology, vol. 1, John Wiley, NuevaYork, 1963, págs. 1-76.'
Thurstone, L. L.: The Measurement of Yalues, University of Chicago Press, Chicago,1959.
Torgerson, W. S.: Theory and Methods of Scaling , John Wiley, Nueva York, 1958.Wadsworth, H. G.: A Motivational Approacb Toward the Remediation 'of Learning of
Disabled Boys. Exceptional Chlldren, 1971, 38, págs. 3342.Walker, H. M. Y Lev , J.: Elementary Stattstical Methods, Holt, Rinehart & Winslon,
Nueva York, 1969.Wallis, W. A. y Roberts, H. Y.: Statistics: A New Approach, The Free Press Glencoe,
11I., 1956.Warren, R. E.: Norms of Restricted Color Association • • Bull. of the Psychon. Soc.»,
1974, 4, págs. 37·38.Woudwoith, R. S.: Heredity and Envlronment, Nueva York. SlX:ill1 Scien¡;e Research
Council, 1941.Yule, G. U. Y Kendaü, M. G.: An lntroduction to the Theof')' of Stati,licl. Orlff'in,
Londres, 1968.Zelditch, M. Jr.: A Basie Course in Sociologieul Statlltics. Holt, Rlnehart & Winslon,
Nueva York, 1966.
lndictDedicatoria , 5Presentación . . . • . . . . . . . . . . . . . . . . . . ., 11Del Autor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . • 13
PRIMERA PARTE
ESTADISTICA DESCRIPTIVA
CAPITULO 1¿QUE ES LA ESTADISTICA? 17Conceptos Previos. Población, elementos y caracteres 17Muestra 19Parámetro , 19Estadístico . . . . . . . . . . . . . . ., 20Definición de la Estadística 21Breve Reseña Histórica 21Historia de la Estadística en la República Dominicana . . . . .. 28
CAPITULO IIMEDIDA EN PEDAGOGIA y PSICOLOGIA . . . . . . . . . . . . . . . . . . . . . .. 35Introducción , 35Características y modalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 35Definición de Medida 35La Medida Pedagógica: su posibilidad y alcance 36El Instrumento de Medida en Pedagogía . . . . . . . . . . . . . . . . .. 37La Estadística en Pedagogía , 38Las Medidas Estadrstícas en la Pedagogía Experimental . . . . . . .. 38Expresión de las Medidas Estadísticas en Pedagogía , 39La Medida Psicológica: su posibilidad y alcance 39Definición de Escala de Medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. , 40Tipos de Escalas de Medida , 42Escala Nominal 42Escala Ordinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. , 43
477
478 JESUS DE LA ROSA
Escala de Intervalos " 44Escala de Razón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . " 46
CAPITULO 1IlORGANIZACION DE DATOS 49-Definiciones previas _ . . . . . _ . . _ _ _ 49Constante " _ . _ . . _ . _ .. _ .. _ .. __ .. _ . . __ . _ _ _ _ . . . " 49Variable _ . _ . . . . . . . . . . . . . . . .. 49Variable Cualitativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 49Variable Cuasi Cuanritativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 49Variable Cuantitativa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 50Variable Cuantitativa Discreta '.' . . . . . . . . . . .. 50Variable Cuantitativa Continua. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 50Modalidades y Clases _ _ . . . . . . . . . . . . . .. 50Frecuencia, Proporción, Porcentaje _ __ .. _ . _ . _ _.. __ , 5O
Organización de Datos. Variables Cualitativas , 51Variables Cuasi Cuantitativas 52Variables Cuantitativas Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 53Variables Cuantitativas Continuas.Interpretación Continua de los Valores Discretos 54Intervalos Elementales y Compuestos . . . . . . . . . . . . . . . . . . . . . . . , 55Límites Exactos y Límites Aparentes .. _.. _ . . . . . . . . . . . . . . . . . . . . .. 56Amplitud y Punto Medio de los Intervalos. Amplitud Total .. _ .. _.. __ . _ _ 56Número y Amplitud de Intervalos ... . . . . . . . . . . . . . . . . . . . . . . . . . .. 56Distribución de Frecuencias " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 57Ejercicios ". 61
CAPITULO IVPRESENTACION DE DATOS 63Representaciones Gráficas.Consideraciones Preliminares 63Polígono de Frecuencias 66Histograma _.. _ .. _ _ __ . . . . . . . . . . . . . . . . . . . . .. 67Curva de las Frecuencias Acumuladas _ _ _ . _ _ __ . .. 67Curva del Porcentaje de las Frecuencias Acumuladas _ _ 67Ejercicios 75
CAPITULO VMEDIDAS DE TENDENCIA CENTRAL _ . .. 77Media Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 77Propiedades Matemáticas de la Media Aritmética ... .'................ 80Mediana __ . __ _ _ . . . . . . . . . . . . . . . . . . . . .. 82Moda o Modo __ _ _.. __ . _ .. _ . _ __ . _ 83Media Geométrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . _ . _ 84Media Armónica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 85Media Cuadrática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 86Resumen de las Principales Características delos Tres Promedios Comunes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8'1
ESTADISTICA PSICO-EDUCATlVA 479
Ejercicios ... o • o o o o •••• o • o o o • o o o o' o o o • o • o • o o o o • o • o o o o o o o 88
CAPITULO VIMEDIDAS DE VARIABILIDAD O DISPERSION o o o o o o • o • o o o o o o o o o o o 91La Amplitud Total o Rango .. o o o o •• ' o o • , •••• o • o •••••••• _ 92Desviación Semi-- Intercuartil o •• o • o ••• o • o o ••••• o • o • o o • o o o o •• " 93Desviación Media . o o • o • o •• o • o o • o ••• o • o • o o o o o •• o o • o o o o • o • •• 95D~svia~?n Típica o •••••• o • o • o o ••• o o • o • o • o •• o • o •• o o o o 98Dispersión Relativa .. o •••• o o •••••••• o • o o o o o o o o •• o o o o o o • o • o • 102Comparación de Desviaciones Típicas en Valores Absolutos o. o o •• o o o o o o o 103Características y Usos de las Medidas de Variabilidad o o • o o o o o o o o o •• o o o 0104Ejercicios o o •• o •••• o ••••••• "0 .. o o, ••• o o • o o o •• o • o • o o o o o • o 105
CAPITULO VIIMEDIDAS DE ASIMETRIA y APUNTAMIENTO .. o • o o o o , o o • o • o o ••• 109Distribución Simétrica o o o __ o o o • o o • o • o o • o •• o • o •••• o • o o o •••••• 109Indices de Asimetría Basado en los Tres Cuartiles .. o • o o o o o ••• o • o o • o o o 111Apuntamiento o Curtosis . o o • • o o • o o o. o • o o • o o o • o o • o • • • o o • o • o o o • 113Medidas de Apuntamiento o' o o o •• o •• o •• o o o • o • o o • o •• o •• o •• o • o o 114Ejercicios o ••••••••• o •••• o o o o • o • o •• o •••• o • o • o • o • o o ••• o o o 115
SEGUNDA PARTE
ELEMENTOS DE PROBABILIDADESY FUNCIONES PROBABILISTICAS
CAPITULO VIIIELEMENTOS DE PROBABILIDADES o • o •• o o •• o o • o o o • o •• o o o o • o o • 119Una Primera Mirada a la Probabilidad .... o •• o o o o • o •• o o • o o o o • o •• o • 119Concepto de Probabilidad ..... o •• o • o o o ••• o o •• o o o o ••••• o o ••• 0119Dos Definiciones de Probabilidad .. _ o ••••• o •• o o o o o •••• o •• o •••• o o 119Modelos Matemáticos y Probabilidad . o o •• o o o o • o o • o o • o o o •• o o o o o • o 121Espacios Muestrales y Probabilidades . o ••• o o o • o o o •• o o o • o • o • o • o o • o 122Probabilidad Axiomática _ o o o • o o • o o ••• o •• o o o o o o o • o o o o o • o • o o o • 125Eventos Complementarios . o o •• o ••• o o o o • o o o •• o o o • o •• o o o • o .'. o _ 127La Probabilidad de la Unión de Eventos . o o o •• o _ o • o •••• o o • o •••••• o 128Probabilidad para Eventos Sucesivos o •• o •• o o o ••••••• o _ •• o •• o o • o • o 130Eventos Independientes ... o o •• o o •• o • o •••• o •• o o •• o • o ••• o o o o •• 13 3Teorema de Bayes . o o • o o •• o ••• o • o • o o o o ••• _ o o ••• o • o • o •••• o • o 134Variables Aleatorias ... o • • • • • • o • • •••• o • o o • o • o •• _ •• _ • o • o 138Esperanza Matemática o •••• o • o o •• o • o • o o •• o ••• o • o ••• o •• o •• 141Propiedades Principales de la Esperanza Matemática o o o • o o • o • o •• o • o o • o 142La Esperanza Matemática y los Juegos de Azar. o o, ••• o o, o o •• o o ••• o • o • 142Sobre la Teoría de la Ruina de los Jugadores o •• o •• o o ••• o • o _ •••••• o o 143Momentos de una Variable Aleatoria o o o • o o •••• o o o - o • o • o •••••• o o _ 145La Desigualdad de Tchebycheff o o _ • o o o ••• _ o o o •• o ••••••••••• o • 0._ 145Ejercicios • o o •••••••••••• o ••• o o o • o o _ o ••• o o •••••••• o • o o •• 147
480 JESUS DE LA ROSA
CAPITULO IXDISTRIBUCION NORMAL DE PROBABILIDADES 149Distribuciones de Probabilidad 149Distribución Normal de Probabilidad 150Observaciones de la Curva NonnaI de Probabilidades 151Propie,dades d.e l~ Cur::a Normal 151Función de Distribución 152Distribución Normal General 156Ejercicios 158
CAPITULO XDISTRIBUCIONES BINOMIALES DE PROBABILIDADES 159Experimento Binomial 159Esperanza Matemática y Varianza de una Variable Binomial 161Teorema de Bemoulli 161Leyes de los Grandes Números 162Cadenas de Markov 164Función de Probabilidad de Poisson 165Ejercicios 169
TERCERA PARTE
ANAUSIS DE REGRESION y CORRELACION
CAPITULO XlREGRESION y CORRELACION 173Regresión .... . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . 173¿Cómo se encuentra la línea de ajuste? 175Normas para hallar la línea de ajuste o regresión 175Correlación 179Significado de Términos 181Correlación Cuantitativa Lineal Simple ; 183Correlación Ordinal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 190Correlación No cuantitativa 192Cálculos de la Correlación Tetrac6rica 197Ejercicios 202
CAPITULO XIIANALlSIS DE CORRELACION PARCIAL y MULTlPLE 205Generalidades .. 205Córrelación Múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208Interpretación del Coeficiente de Relación Múltiple R 209Ejercicios ......................................••...... 210
ESTADISTICA PSICO-EDUCATIVA
CUARTA PARTE
ESTADISTICA INFERENCIAL
481
CAPITULO XIIIMUESTRAS Y MUESTREO 2ISEstadistica Descriptiva y Estadística Muestra! 215Población y Muestra 216Ventajas y Desventajas del Uso del Muestreo 216Ventajas 217Desventajas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217La Técnica del Muestreo ' 217Tipos de Muestreo '. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217Muestreo Aleatorio o Muestreo al Azar. CEn qué Consiste? íIsMétodos Mecánicos 218Métodos de las Tabla.s de Números al Azar 219Muestreo Estratificado. . . . . . . . . . . . . . . . .. ,. . . . . . . . . . . . . . . . . . .. 220Muestreo por Area 220Muestreo por Conglomerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 221Muestreo Sistemático 221Etapas Principales de una Encuesta por Muestra . . . . . . . . . . . . . . . . . . . .. 222Objetivo de la.Encuesta , . . . . . . . . . . . . . . . . . . . . . . . • . . . . . . . . 222Población Bajo la Muestra 222Datos que Deben ser Obtenidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 223Nivel de Precisibn Deseado 223Métodos de Medición 223El Marco de la Muestra 223Selección de la Muestra .,. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 224Prueba del Cuestionario . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .... 224Organización del Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224Resumen y Análisis de los Datos 224Muestreo Estratificado 225Tamaño de los Estratos 226La Estimacibn del Tamaño de la Muestra.Planeamiento de la.Muestra 227La Fórmula. para (n) en el Muestreo para Medías 228La Fórmula para (n) en el Muestreo para Proporciones 229Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
CAPITULO XIVINFERENCIA ESTADISTICATEORIA DEL ERROR MUESTRAL 233Error Muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 233Precisión y Fiabilidad .. 233Errores MuestraleS: Errores de Sesgo y Errores Aleatorios ' 234La Distribución Muestra! 236Niveles de Confianza y Coeficientes de Riesgo 237Intervalos Confidenciales . . . . . . . . . . . . . . . . . . . . . . . . 240
482 ''''sus DE LA ROSA
Comprobación de Hipótesis Acerca de Parámetros 241Límites Fiduciales 242E' ..Jerclclos .. , 243
CAPITULO XVSIGNIFICACIQN y FIABILIDAD DE LOS PRINCIPALESVALORES ESTADISTICOS 245Significación y Fiabilidad de la Media 245Significación de la Media 246Fiabilidad de la Media . . . . . . . . . . . . . . .. . 251Significación de las Diferencias entre Medias de Muestras Independientes 252
\Significación de las Diferencias entre Medias Relacionadas 256Observaciones '" 258Significación y Fiabilidad de la Mediana 259Significación y Fiabilidad de las Proporciones 260Inconvenientes del Uso del Método Descrito para Determinar IntervaloConfidencial en el Caso de Proporciones 262Diferencias entre Proporciones 265Significación y Fiabilidad del Coeficiente de Correlación de Pearson 266Hipótesis Estadísticas: Toma de Decisiones 270Errores de la Verificación de Hipótesis 273Ensayos Bilaterales y Unilaterales 274Nivel de Significación 275Teoría de las Muestras Pequeñas 278Significación y Fiabilidad de la Media de una Muestra Pequeña 282Significación de la Diferencia entre las Medias deDos Muestras Pequeñas e Independientes 284Significación de la Diferencia entre Medias de MuestrasPequeñas Relacionadas 285Significación y Fiabilidad del Coeficiente de Correlación(r) con Muestras Pequeñas 288Diferencia entre Coeficientes de Correlación Obtenidos en MuestrasRelacionadas o en la Misma Muestra 289Significación de la Diferencia entre la Variabilidad deDos Muestras Pequeñas. Prueba de "F" 290X2 ("Chi "Cuadrado) 292Grados de Libertad 294Pruebas de Independencia 297Pruebas de Homogeneidad 301Observaciones para el Uso de X2 ("Chi "Cuadrado) 305Ejercicios 307
QUINTA PARTE
METODOS DE EXPERlMENTACION ESTADISTICOS
CAPITULO XVIANALlSIS DE LA VARIANZA 3lJ
ES'TADISTICA PSICO-EDUCATIVA 483
Análisis de la Varianza, Significación 313La Lógica del Análisis de Varianza 314El Desarrollo Matemático del Análisis de Varianza 315Media Cuadrática Intragrupo 317La Media Cuadrática Intergrupo 320Análisis de Varianza en los Componentes .•....................... 322Cálculo de las Sumas de Cuadrados 322Ordenación Práctica de los Cálculos 323Aplicación de un Ejemplo Concreto 325El Uso de "t" como Consecuencia de un Análisis de Varianza 327Otro Ejemplo de Análisis de Varianza en Dos Componentes 330
CAPITULO XVIIDISEID EXPERIMENTAL 333Introducción •........................................... 333Variables ..........•.....•.............................. 334Variables Independientes y Variables Dependientes 334Variables Organicistas y Variables Interventoras 335Variables Discretas y Variables Continuas 335Variables Externas o Extrañas 336Pruebas de Hip6tesis ..•.................................... 336Hip6tesis: Nula o Alterna e Hipótesis de Investigación . . . . . . 337Significaci6n Estadística •.................... 33 7Prueba de Hipótesis Estadísticas 340Lógica delos Diseños Experimentales 346Validez Interna 347Historia 347Maduración . . . . . . . . . . . . 348Coinprobación O Proceso de Aplicación de Pruebas, "Testing" 348Instrumentación . . . . . . . . . . • . . . . . . . . . . . . . . . . . . . 348Regresión Estadística ......•................... .......•.... 348Selecci6n ...•..................................... 349Mortalidad Experimental . . . • . . . . . . . . . . . . . . . . . . . . . . 349Interacci6n de las variables: Selección-Maduración, etc 349Reactividad o Efecto de Hawthorne ........................•.... 350Contaminaci6n 350Inestabilidad ' ....••... 350Validez Externa 350Efectos delnteracci6n de "Testing" 351Interacción de Selección y Tratamiento Experimental 351Efecto Reactivo del Convenio Experimental 351Interferencia de Tratamientos Múltiples ......................•... 351Artificialidad del Experimento •...................... ,......••. 352Capacidad de Respuestas Irrelevantes de las Medidas .................• 352Replicabilidad Irrelevante de los Tratamientos 352Efectos del Experimentador 352.Tipos del Diseño Experimental 352
484 JESUS DE LA ROSA
Diseños Preexperimentales 353Diseño 1: Estudio de Casos en "una dirección" 353Diseño 2: Un Grupo "Pretest-spostest" 354Diseño 3: Comparación de "Grupo Estático" 355Diseños Experimentales (realmente experimentales) 355Diseño 4: "Grupo Control, Prctest-Postest" 356Diseño S: "Cuatro Grupos "de Solomon .•........................ 357Diseño 6: "Grupo Control-Solamente- "Postest " 357Diseños Cuasiexperimentales 358Diseño7:"SeriesdeTiempo"(númerodeveces) 359Diseño 8, "Muestras de Tiempo Equivalente" 359Diseño 9: "Muestras de Materiales Equivalentes" 360Diseño 10: "Grupo Control No Equivalente" 361Diseño 11: Diseños Contrabalanceados 361Diseño 11 b: Contrabalanceado al Azar. 364Diseño 12: "Muestras Separadas, Pretest-Postest" 364Diseño 13: "Muestras Separadas- Grupo Control Pre y Postest" 365Diseño 14:"Series de Tiempos Múltiples" 365Diseño 15: "Ciclo Institucional" 366Diseño 16: "Discontinuidad de Regresión" 367Diseño Factorial ..•.•..................................... 368Ejercicios 371
CAPITULO XVIIIFUNDAMENTOS DE COMPUTACION 373Generalidades sobre la Computadora 373Nociones Preliminares •....•.......•........................ 373Sistemas : .. 374Elementos en el Proceso de Programación 381Lenguaje Fortran , . 387Esquema General 388Instrucciones de Entrada y Salida 393Instrucciones de Transferencia de Control . . . . . . . . . . . .. . 394
TABLAS Y APENDlCES
APENDICEAAPENDICE MATEMATICO 401Repaso de Conceptos Fundamentales de la Aritmética y el A1gebra 401Decimales 401Fracciones 402Números Negativos ......•................................. 403Empleo del Cero '.' . 404Raíz Cuadrada 405Potenciaci6n '.' . . . . . . . . . 408Fracciones y Tantos por Ciento 408Redondeo de Números 410
ESTADISTICA PSICO-EDUCATlVA 485
Dígitos Significativos " 410Ejercicios 412
APENDlCE BESCALAS DE MEDICIONES 415Variables Estadísticas. Tipos de Mediciones 415Límites Inferior y Superior de una Variable Contínua .....•........... 415Escala de Medida. Medición ' 416Esca.1a por Intervalos . . . ; . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417Escala por Razones 418
APENDlCECSIMBOLOS ESTADlSTICOS 421
APENDlCE DGLOSARIO DE TERMINOS ESTADlSTICOS 423
APENDlCE EFORMULARIO ESTADISTlCO 431Media Aritmética 431Mediana 431Media Geométrica. . . . . . . . . . . . . . . . 431Amplitud Total o Rango 431Desviación Media . . . . : . . . . . . . . . . . 431Desviación Cuartilar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431Desviación Típica o Standar 432Coeficiente de Variación 432Indiee de Simetría 432Correlación Cuantitativa Lineal o de Pearson 432Correlación Ordinal 432Correlación Biserial 432Coeficiente Experimental de McCall . . . '.' . . . . . . . . . . . . . . . . . . . . . . .. 432Modelo Matemático de la Curva de Gauss o Normal. . . . . . . . . . . . . . . .... 433Cálculo de Unidades Z s- , •••••• 433Cálculo de Unidades T . . . . . . . . . ". . . . . . '. . . . . 43 3Cálculo de ji Cuadrada o Cuadrado de Contingencia 433Cálculo de t de Student 433Cálculo de las Varianzas 433Indice F de Snedecor , . . . . • . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434Coeficiente de Confiabilidad de Spearrnan-Brown 434Indice de Discriminación . . . . . . . . . . . . . . . . . . . . . . . . 434ErrorTípico de una Correlación Lineal 434Error Típico de Coeficiente de Correlación Ordinal 434Erro!' Típico de una Mediana 434Error Típico del Coeficiente de Correlación Biserial 434Error Típico de una Discrepancia 435Error Típico de una Frecuencia Oo, •••••••••••••••••••••• 435Raz6n Crítica o de Significación 435
486 JESUS DE LA ROSA
Error de la Diferencia entre dos Medias ...................•....... 435~ncia entre Dos Diferencias de dos Medianas : 435Error Típico entre las Diferencias de dos Desviaciones Típicas 435Error Típico entre las Diferencias de dos Coeficientesde Correlación Lineal .•.................................... 435Condición Tetraeórica 435Coeficiente deContingencia .•................................ 436Correlación Interc:lase ..•..•.•.............................. 436Coeficiente de Asoc:iac:ión ...........•....................... 436Coeficiente deAlineación . . . . . • • . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436Correlación de Bravais-Pearson 436Coeficiente de Concordancia . '. . , , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436C~~tedeR~ón 436Error Típico de una Proporción 437Error Típico de una Media Aritmética 437Error Típico de una Desviación Típica 437
APENDICE FCONJUNTOS ....•...................................... 439
APENDICEGSUMAS 443
APENDICEHTABLAS ESTADISTICAS , , 447Cuadrados y Ralces Cuadradas : 447Valores de Coeficiente de Correlac:ión paraDistintosN'weles de Importancia ., 458Valores de Z para Valores Dados de r , , . . . . . . . . . . . . 463CoefiCientes del Binomio nCr •................................ 465ProbabiIidades Normales , 467Tibia de la F deSnedecor .468Tibia de la t de Student 469Areas y Ordenadas de la Curva Normal 470~nuci6nJiCuadrada , '" '" .471Areas Bajo la Curva Normal entre la Media y unValor Típico Dado en Z , , . . . . • . . . . . . . . . . . . . . . . . . . .472
~~nciasB~tficas, , 473
Indice ....• ,; , 477
Esta obra se terminé de imprimir en el mes de abril de 1982en los talleres gráficos de la Universidad Autónoma de Santo
Domingo con una tirada de 1000 ejemp~$.
VOL. CCT IX
COllCCION CIENCIA Y TEC:\OLOGI.·\ :"0. 15