Pruebas y Evaluación Psicológicas

Pruebas y evaluacin psicolgicas

Captulo 1: Pruebas y evaluacin psicolgicaPruebas y evaluacinA manera de introduccin, se describe un poco la historia del surgimiento de las pruebas psicolgicas, cmo es que en 1905 Alfred Binet y un colega suyo, publican una prueba diseada para asignar el grado escolar apropiado para nios parisinos. Esta prueba lleg a ser tan importante que se utiliz una versin en ingls para el estudiantado norteamericano.Posteriormente, en 1917, tras el inicio de la primera guerra mundial, surgi la necesidad de evaluar rpidamente reclutas para descartar problemas intelectuales y emocionales. Son las pruebas psicolgicas las que aportan la metodologa necesaria para lograr esos objetivos.DefinicinHay una seria distincin entre los conceptos Evaluacin psicolgica y Pruebas psicolgicas. Evaluacin psicolgica se define como la recoleccin e integracin de datos relacionados con la psique individual con el propsito de hacer una evaluacin psicolgica, concretada mediante el uso de herramientas como pruebas, entrevistas, estudio de caso, observacin conductual, as como equipo y procedimientos diseados especficamente para la medicin de esta. Pruebas psicolgicas se define como el proceso para medir variables relacionadas con la psique mediante instrumentos o procedimientos diseados para obtener rasgos de comportamientos definidos como conductas.Para poder comenzar con el proceso de evaluacin, debe haber una sugerencia previa proveniente de profesores, psiclogos escolares, consejeros, jueces, mdicos o analistas de R.H. Posteriormente se reunir con el evaluado o aquellos involucrados con l, para indagar los motivos para elaborar la evaluacin. La evaluacin se apoyar por los datos recolectados previamente (historia clnica o de desarrollo), las entrevistas y las herramientas a utilizar como son las pruebas.La relacin que se establece entre evaluador y evaluado, puede verse de 3 maneras diferentes segn distintos autores. Evaluacin psicolgica colaborativa: Propuesta por Constance Fischer (1978) El evaluador y evaluado, pueden trabajar como socios desde el contacto inicial hasta la retroalimentacin final. En este enfoque se considera al evaluado como un experto en sus perspectivas actuales y los eventos que recuerda de su vida (Fischer,2014) Stephen Finn y sus colegas, Describen la Evaluacin psicolgica teraputica, que consiste en promover un autodescubrimiento teraputico y lograr una mayor comprensin de determinados aspectos de la conducta a travs del proceso de evaluacin. Evaluacin psicolgica dinmica: que es un modelo y filosofa que implica diversos tipos de intervencin por parte del evaluador durante el proceso de la evaluacin. intervenciones como son sugerencias, retroalimentacin o consejos explcitos, esto se utiliza para acercar al evaluado hacia el problema por lo cual fue referido. Debido a las enmiendas hechas a la declaracin de los individuos con discapacidades educativas (IDEA), se introduce el trmino evaluaciones alternativas, el cual menciona que se deben elaborar guas para la participacin de nios con capacidades diferentes en evaluaciones alternativas. Se define a este concepto como un proceso o procedimiento de evaluacin o de diagnstico que vara en la forma de aplicacin usual, normativa o estandarizada para obtener una medicin, ya sea en virtud de una adecuacin determinada hecha para el evaluado, o con mtodos alternativos diseados para medir las mismas variables. Herramientas de la evaluacin psicolgicaLa prueba: Instrumento o procedimiento de medicin. Cuando la palabra prueba est acompaada por un modificador, se refiere a un instrumento o procedimiento diseado para medir una variable relacionada con ese modificador. Prueba psicolgica: instrumento o procedimiento diseado para medir variables relacionadas con la psicologa, por ejemplo: inteligencia, personalidad, aptitudes, intereses, actitudes y valores. Las pruebas psicolgicas y otras herramientas de evaluacin pueden diferir en un gran nmero de variables como contenido, forma, procedimientos de aplicacin, puntuacin, contextos de interpretacin y calidad de tems. La entrevista: Una entrevista psicolgica, va ms all de una simple pltica y tiende a ahondar mucho ms en el entrevistado. Es una relacin directa entre dos o ms personas, que pretende establecer los requerimientos de la interaccin personal. Las entrevistas difieren con respecto a muchas variables como son su propsito, extensin y otras restricciones bajo las cuales son conducidas, as como la disposicin por parte del entrevistado de proporcionar informacin de una manera abierta y directa. Las entrevistas pueden ser usadas por psiclogos y otros especialistas en escenarios clnicos, de consejera, forenses y neuropsicolgicos para ayudar a la toma de decisiones sobre lo apropiado que resultaran las intervenciones educativas; en R.H ayudan a la recomendacin sobre la contratacin, el despido y el desarrollo organizacional del personal. El portafolio: consiste en una muestra de trabajo, recopilacin de actividades realizadas por el evaluado concernientes al rea a evaluar. Datos de historia de caso: Se refiere a registros, transcripciones y otros instrumentos escritos, pictricos o de otra forma y en cualquier medio, que preserve la informacin de archivos, registros formales e informados y otros datos y documentos importantes en relacin al evaluado. Estos datos pueden incluir archivos o extractos de archivos que se conservan en instituciones y agencias tales como escuelas, hospitales, empleos, instituciones religiosas y agencias de justicia criminal, entre otros. Estos datos pueden ser una herramienta de gran utilidad en una amplia variedad de contextos de evaluacin. Observacin conductual: para saber cmo se comporta alguien en una situacin particular, es necesario observar su comportamiento en esta situacin. Se puede definir como el monitoreo de las acciones de otros y de uno mismo a travs de medios electrnicos y visuales, mientras se registrar la informacin cuantitativa y/o cualitativa con respecto a dichas acciones. Se utiliza para disear intervenciones teraputicas. Pruebas de representacin de papeles: que consiste en actuacin de un papel improvisado o en parte improvisado en una situacin simulada. Las computadoras como herramientas: Evaluacin psicolgica asistida por computadora (CAPA) se refiere a la convivencia y economa de tiempo al administrar, calificar e interpretar pruebas. Partes involucradasEl desarrollador de pruebas: Quienes, junto con los editores, crean pruebas y otros mtodos de evaluacin.El usuario de las pruebas: Son utilizadas por un amplio rango de profesionales, incluidos los profesionales clnicos, los consejeros, el personal de R.H profesores y personal escolar.El evaluado: los evaluados tienen diferentes aproximaciones a la situacin de evaluacin, y los usuarios o aplicadores, deben ser sensibles ante la diversidad de respuestas posibles ante dicha evaluacin. Cualquier persona puede ocupar el papel de evaluado, incluso un individuo que ha fallecido. En este caso, se utiliza el trmino autopsia psicolgica, que se define como una reconstruccin del perfil psicolgico del individuo fallecido con base en registros de archivos, artefactos y entrevistas conducidas con anterioridad con el evaluado o con gente que conoci.EscenariosEscenarios educativos: en este escenario se ayudar al estudiante, por medio de pruebas, a identificar quien necesita un nuevo o diferente grado escolar o adecuaciones curriculares.Escenarios Geritricos: las pruebas se aplican para establecer el funcionamiento cognitivo, psicolgico, adaptativo y algn otro, relacionado con su desempeo general.Escenarios de consejera: Ocurre en ambientes tan diversos como escuelas, prisiones o instituciones de carcter privado o pblico. El objetivo de esas evaluaciones es el mejor desempeo del evaluado, en trminos de adaptacin, productividad, calidad de vida o alguna variable relacionada.Escenarios clnicos: las pruebas y muchas otras herramientas de evaluacin son usadas en escenarios clnicos como hospitales pblicos privados y militares, clnicas de pacientes internos y externos, consultorios de practica privadas, escuelas y otras instituciones. Escenarios militares y de negocios: en los negocios as como en el ejrcito, a las pruebas psicolgicas se les conceden diversos usos, tal vez de manera ms notable es aquel para la toma de decisiones sobre las carreras del personal. Otra aplicacin de las pruebas psicolgicas implica la ingeniera y el diseo de productos y ambientes.Credencializacin gubernamental u organizacional: En este caso, una de las aplicaciones de la medicin se encuentra en la obtencin de licencias y permisos gubernamentales, la certificacin o la credencializacin general de los profesionales.Captulo 2: Consideraciones histricas, culturales y tico/legalesPerspectiva histricaDe la antigedad al siglo XIXUna forma primitiva de pruebas de destreza existi en China en el ao 2200 a.C. en donde el emperador chino conduca un programa de pruebas que implicaban alguna forma de examen para los funcionarios pblicos cada tercer ao.Hasta el Renacimiento comenz a surgir la medicin en las ciencias conductuales, tal y como la reconocemos en la actualidad. Para el siglo XVIII, Christian von Wolff haba anticipado que la psicologa pudiese ser una ciencia, y concibi a la medicin psicolgica como un rea de especializacin dentro de esa ciencia. El significado histrico del programa de pruebas en la antigua China es que hace miles de aos existi una civilizacin que mostro evidencias de una preocupacin por algunos de los mismos principios de la psicometra que interesan y se manejan en la actualidad.El siglo XIXLa evaluacin fue una actividad importante en el primer laboratorio de psicologa experimental, fundado en la universidad de Leipzig en Alemania por Wilhem Max Wund. Uno de los estudiantes de Wund llamado James McKeen Cattel se puso en contacto con Francis Galton y despus de su contacto se inspir y acu el trmino prueba mental en una publicacin de 1890.Otros estudiantes de Wund incluyen a Spearman (creador del concepto psicomtrico de la confiabilidad de la prueba y la construccin de marco para el anlisis de factores), Henri (colabor con Binet), Kraepelin (uno de los primeros en experimentar con la tcnica de la libre asociacin de palabras), Titchener, Stanley Hall y Witmer (conocido como el fundador no muy conocido de la psicologa clnica; fundLa primera clnica psicolgica en USA en la Universidad de Pensilvania; y en 1907, fund la revista Psychological Clinic con el primer artculo titulado Clinical Psychology)El siglo XXLa medicin de la inteligenciaBinet y Henri publican varios artculos en los que abogan por la medicin de capacidades. Diez aos ms tarde Theodore Simon publican una escala de medicin de inteligencia de 30 reactivos para identificar a nios en edad escolar con deficiencia mental.En 1939, David Wechsler introdujo la prueba WAIS, diseada para medir la inteligencia de los adultos.Las pruebas de inteligencia grupales aparecieron en USA, en respuesta a la necesidad del ejrcito de explorar la capacidad intelectual de los reclutas.La medicin de la personalidadAl Comit sobre Salud Emocional del gobierno, presidido por el psiclogo Robert S. Woodworth, se le asign la tarea de elaborar una medida de adaptacin y estabilidad emocional que pudiera administrarse de manera rpida y eficaz a grupos de reclutas. El cuestionario fue denominado Hoja de datos personales, donde se les peda que indicaran s o no a una serie de preguntas.Despus de la guerra, Woodworth elabor una prueba de personalidad para uso civil basada en la Hoja de datos personales y la llam Inventario psiconeurtico de Woodworth. Fue la primera prueba de personalidad basada en un informe personal, usada en forma extensa.Otro mtodo para evaluar se describi como de naturaleza proyectiva. La prueba proyectiva es aquella en la que se asume que un Individuo proyecta en algn estmulo ambiguo sus propias e individuales necesidades, temores, esperanzas y motivaciones. Quiz la prueba proyectiva ms conocida es la de Rorschach, que consiste en una serie de manchas de tinta, elaborada por el psiquiatra suizo Herman Rorschach. Cultura y evaluacinLa comunicacin entre evaluado y el evaluador es una de las partes fundamentales de la evaluacin. Los evaluadores deben ser sensibles a cualquier diferencia entre el vocabulario o el idioma que le sean familiares a los evaluados y el lenguaje en que se conduce la evaluacin. Los evaluadores tambin deben ser sensibles al grado en que los evaluados hayan sido expuestos a la cultura dominante y el grado en que hayan elegido conscientemente ser parte de sta. Comunicacin verbal: El lenguaje, el medio por el cual se comunica informacin es una variable clave, aunque a veces se ha pasado por alto en el proceso de evaluacin. Es obvio que el examinador y el examinado deben hablar el mismo idioma.Comunicacin no verbal y conducta: Expresiones faciales, seas con los dedos y las manos adems de cambios en la posicin o postura corporal del individuo pueden transmitir mensajes. Los mensajes transmitidos por este medio, pueden variar de una cultura a otra.Consideraciones legales y ticasEn la medida en que es reconocido y aceptado un cdigo de tica profesional por los miembros de una profesin, se definen las normas de cuidado esperadas por los miembros de esa profesin.Las preocupaciones del pblicoAnticipndose a los estndares de la actualidad, Ruch propuso varias normas y lineamientos para el desarrollo de pruebas. Tambin escribi sobre la necesidad urgente de crear un organismo de investigacin que emprendera evaluaciones imparciales, experimentales y estadsticas de las pruebas.LegislacinEl objetivo principal de la legislacin sobre la verdad en las pruebas es proporcionar a quienes responden las pruebas un medio para conocer los criterios contra los que se les est comparando.La preocupacin de la profesinEn 1954, la APA public sus Technical Recommendations for Psychological Test and Diagnostic Test, un documento que enunciaba normas de pruebas y recomendaciones tcnicas.Caractersticas de usuario de pruebas: En 1950 el Comit sobre Normas ticas para la Psicologa de la APA public un reporte llamado Ethical Standards for the Psychological Test and Diagnistic Aids, que defini 3 niveles de pruebas en funcin del grado en el que su uso y aplicacin requiere conocimiento de las tcnicas de aplicacin especficas para cada una, as como de materias relacionadas con la psicologa.En 1993, se fund el Consejo Estadounidense de Psicologa de la Evaluacin (ABAP) con el objetivo de identificar a los psiclogos de la evaluacin ms competentes.Evaluando a personas con discapacidades se pueden presentar dificultades como transformar la prueba, transformar las respuestas e interpretar de manera significativa los datos de las pruebas.Administracin, calificacin e interpretacin de pruebas por medio de computadora: Un nmero cada vez mayor de pruebas psicolgicas pueden adquirirse en disco y su administracin, calificacin e interpretacin son tan simples como oprimir un teclado.Algunos aspectos importantes respecto a CAPA son: Acceso al software de la administracin, calificacin e interpretacin de la prueba Comparacin de la versin escrita y computarizada de la prueba. El valor de las interpretaciones de las pruebas por computadora Pruebas psicolgicas poco profesionales, irregulares y el lnea.Los derechos de los evaluadosComo lo prescriben las normas, y en algunos casos las leyes, algunos de los derechos que los administradores de pruebas conceden a quienes responden son el derecho a dar su consentimiento informado para la prueba, el derecho a ser informado de los resultados, el derecho a su privacidad y confidencialidad y el derecho a la clasificacin menos estigmatizadora.Captulo 3: Un repaso de estadsticaEscalas de medicinMedicin: se define como el acto de asignar nmeros o smbolos a caractersticas de los objetos (personas, eventos o lo que sea) de acuerdo a ciertas reglas. Las reglas usadas al asignar nmeros son lineamientos para representar la magnitud (o alguna otra caracterstica) del objeto que se mide. Ejemplo: asignar el nmero 30 a todas las longitudes que tienen exactamente el mismo largo que una regla de 30 cm.

Escala: es un conjunto de nmeros (u otros smbolos) cuyas propiedades modelan propiedades empricas de los objetos a los que se asignan los nmeros. Una forma de asignar una categora a una escala es de acuerdo al tipo de variable que se mide. Por lo tanto, una escala utilizada para medir una variable continua se categoriza como una escala continua, mientras que una escala usada para medir una variable discreta se denomina escala discreta.

La medicin siempre implica error, esto se refiere a la influencia total de los factores en la calificacin de una prueba, o en cualquier medicin, mas all de los que se miden en forma especfica por esta prueba o medicin.

La parte de error en la calificacin de la prueba puede deberse a muchos factores diferentes. Una fuente de error puede haber sido la distraccin ocasionada por distintos eventos ocurridos durante la aplicacin de la prueba.

Escalas nominalesLas escalas nominales son la forma ms simple de medicin. Estas escalas implican la clasificacin o asignacin de categoras basada en una o ms caractersticas distintivas donde deben colocarse todos los objetos medidos en categoras mutuamente excluyentes y exhaustivas. Ejemplo: en un estudio, todos los hombres podran ser denominados hombres, 1, B o algn otro smbolo, y todas las mujeres podran ser denominadas mujeres, 2 o A.

Escalas ordinales Las escalas ordinales permiten la clasificacin. Sin embargo, adems de la clasificacin, tambin es permisible un ordenamiento por rangos con base en alguna caracterstica. Ejemplo, la encuesta de valores de Rokeach (Rokeat Value Surcey) usa un enfoque as con quienes aceptan responder la prueba al colocar una lista de valores personales (como libertad, felicidad y sabidura) en orden de acuerdo con la importancia percibida por quien responde la prueba. Si una serie de diez valores es ordenada en rangos, quien responde la prueba puede asignar un valor de 1 al ms importante y 10 al menos importante.

Escalas de intervaloLas escalas de intervalo contienen intervalos iguales entre nmeros; cada unidad en la escala es exactamente igual a cualquier otra unidad de escala. Pero, al igual que las escalas ordinales, estas escalas no contienen un punto cero absoluto. Como estas escalas no contienen cero absoluto, una suposicin inherente en su utilizacin es que ningn evaluado posee cero capacidad o cualidad (o caracterstica) que se mida.

Escalas de raznAdems de tener las propiedades de las escalas nominales, ordinales y de intervalo, la escala de razn tiene un punto cero verdadero. Todas las operaciones matemticas pueden realizarse de manera significativa en este tipo de escala porque existen intervalos iguales entre los nmeros en ella, as como un punto cero verdadero o absoluto.

En psicologa, la medicin en el nivel de razn se emplea en algunos tipos de prueba y reactivos, quiz de manera ms notable en aquellas que tienen que ver con la evaluacin del funcionamiento neurolgico. Un ejemplo es la prueba de la capacidad perceptomotriz, cronometrada, la cual requiere que el evaluado ensamble un rompecabezas.

Escalas de medicin en psicologaEl nivel ordinal de medicin es el que se usa con mayor frecuencia en psicologa. Como ha sealado Kerlinger (1973): las puntuaciones de las pruebas de inteligencia, aptitud y personalidad son, ordinales. Indican con ms o menos precisin no la cantidad de inteligencia, aptitud y rasgos de personalidad de los individuos, sino ms bien las posiciones ordenadas en categoras de individuos., admita que la mayora de las escalas psicolgicas y educativas se aproximan bastante a un nivel de intervalo, aunque adverta que si las mediciones ordinales eran tratadas como si fueran mediciones de intervalo, el usuario de la prueba deba estar alerta en forma constante ante la posibilidad de una desigualdad gruesa de los intervalos

Descripcin de los datosEn la descripcin de los datos, se encuentran los siguientes conceptos: Distribucin: que se define como un conjunto de puntuaciones de prueba ordenadas para su registro o su estudio. Puntuacin cruda: es una cuantificacin directa del desempeo, sin modificaciones, usualmente numrica. Una puntuacin cruda puede reflejar una simple cuenta, como el nmero de reactivos respondidos de forma correcta en una prueba de resultados.

El ejemplo del libro dice que: suponga que por arte de magia ha cambiado de lugar con el profesor que ensea este curso y que acaba de aplicar un examen que consta de 100 reactivos de opcin mltiple (donde se concede un punto por cada respuesta correcta). La distribucin de las puntuaciones para los 25 estudiantes inscritos puede oscilar en un rango terico de 0 (ninguna correcta) a 100 (todas correctas)

Distribuciones de frecuenciaLos datos de la prueba se pueden organizar en una distribucin de las puntuaciones crudas. Una forma en que podran distribuirse es por la frecuencia con que ocurren. En una distribucin de frecuencia, todas las puntuaciones se enlistan al lado del nmero de veces que ocurri cada puntuacin. Las puntuaciones podran enlistarse de forma tabular o grfica.

En una distribucin de frecuencia agrupada, los intervalos de las puntuaciones de una prueba, tambin llamados intervalos de clase, reemplazan a las puntuaciones de prueba reales. El nmero de intervalos de clase usados y el tamao o amplitud de cada uno de ellos.

La distribucin de frecuencia de las puntuaciones de prueba tambin puede ilustrarse en forma grfica. Una grfica es un diagrama o esquema compuesto por lneas, puntos, barras u otros smbolos que describen e ilustran los datos.

Tipos de grficas Grafica de barrasHistograma

Polgono de frecuencia

Medidas de tendencia centralLa medida de tendencia central, es un estadstico que indica el promedio o el punto medio entre las puntuaciones extremas de una distribucin.

La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos.

Dondef = frecuencia absolutaM = Marca de clase- punto intermedio de cada intervalon = total de datos

Mediana: Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor.La mediana se representa por La mediana se puede hallar slo para variables cuantitativas.

Moda: Es el valor que tiene mayor frecuencia absoluta.Se representa por Se puede hallar la moda para variables cualitativas y cuantitativas.

Medidas de variabilidadLa variabilidad es un indicador de la forma en que las puntuaciones en una distribucin estn esparcidas o dispersas. Las diferencias en el comportamiento de todo fenmeno observable que se repite bajo las mismas condiciones. El rango: el rango de una distribucin es igual a la diferencia entre las puntuaciones mayor y menor.

La desviacin media: se utiliza para describir la cantidad de variabilidad en una distribucin. Su frmula es:

Desviacin estndar o Tpica: Esta medida permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza.

La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica.

Asimetra o sesgo

Las distribuciones se pueden caracterizar por su asimetra o sesgo, es decir, la naturaleza y grado en que est ausente la simetra. La asimetra es un indicador de la forma en que estn distribuidas las mediciones en una distribucin.

Asimetra positiva: se da cuando relativamente pocas de las puntuaciones caen en el extremo positivo de la distribucin. Por ejemplo, los resultados de un examen con asimetra positiva pueden indicar que la prueba fue demasiado difcil; en este caso, habra sido deseable tener ms reactivos que fueran ms fciles para discriminar mejor los datos del extremo inferior de la distribucin de las puntuaciones de la prueba. Asimetra negativa: cuando relativamente pocas de las puntuaciones caen en el extremo negativo de la distribucin. Por ejemplo, los resultados de un examen con asimetra negativa pueden indicar que la prueba fue demasiado fcil; en este caso, habra sido deseable tener ms reactivos que fueran ms difciles de modo que pudiera hacerse una mejor discriminacin entre las puntuaciones con respecto al extremo superior de la distribucin de puntuaciones.

La curva normalLa curva normal es una curva en forma de campana, uniforme, definida en forma matemtica con su mxima altura en el centro. A partir del centro disminuye en forma gradual hacia ambos lados aproximadamente al eje X de manera asinttica (lo que significa que se acerca al eje pero no lo toca) En teora, la distribucin de la curva normal va desde el infinito negativo hasta el infinito positivo.

Puntuaciones estndarUna puntuacin estndar es una puntuacin cruda que ha sido convertida de una escala a otra, siendo la ultima la que tiene una media y una desviacin estndar estable de manera arbitraria.

Puntuaciones Z: Es la puntuacin tpica o resultado estndar individual ms utilizada. Gracias a la puntuacin z se pueden comparar los resultados de un individuo (o de varios) en distintas pruebas en las que las distribuciones de los resultados de los otros miembros de la poblacin sean distintas. La frmula es:

Puntuaciones T: procedimiento para expresar la posicin de las puntuaciones directas en relacin al grupo. Se expresa como:

Captulo 4: Supuestos sobre pruebas y evaluacin psicolgica

Qu es una buena prueba?Una buena prueba es aquella que cumple con los criterios de validez y confiabilidad, adems de instrucciones claras para su aplicacin, calificacin e interpretacin. Otra consideracin es que el tiempo utilizado para la prueba sea economizado con respecto a administrar, calificar e interpretar la misma.

Normas

La evaluacin con normas de referencia consiste en un mtodo de evaluacin y una manera de derivar significado de las puntuaciones de las pruebas a evaluar la puntuacin individual de un evaluado y compararla con las puntuaciones de un grupo de evaluados. En este enfoque, el significado de una puntuacin individual en una prueba se entiende al relacionarla con otras puntuaciones en la misma prueba. Un objetivo comn de las pruebas con normas de referencia es proporcionar informacin acerca de la posicin o el rango que ocupa un evaluado con respecto a un grupo de comparacin.

Estandarizacin, muestreo y normalizacin

Estandarizacin: el proceso de aplicar una prueba a una muestra representativa de personas que la responden con el propsito de establecer normas se conoce como estandarizacin, Se dice que una prueba cumple con este criterio cuando tiene procedimientos definidos en forma clara para su administracin y calificacin, lo que incluye datos normativos.

Muestreo: En el proceso de desarrollo de las pruebas, quien las elabora ha especificado algn grupo como la poblacin para la cual se ha diseado la prueba. Esta poblacin es el universos completo o conjunto de individuos con al menos una caracterstica observable.

Normas para una prueba estandarizada: despus de obtener una muestra, quien elabora la prueba la administra de acuerdo con el conjunto estndar de instrucciones con las que ser utilizado posteriormente. Tipos de normasPercentiles: es una expresin del porcentaje de personas cuya puntuacin se encuentra `pr debajo de la puntuacin cruda particular. Normas de edad: tambin conocidas como puntuaciones equivalentes de edad, indican el desempeo promedio en diferentes muestras de quienes responden la prueba que tenan diversas edades en el momento en que se aplic la pruebaNormas de grado: diseadas para indicar el desempeo promedio de los evaluados en un grado escolar determinado, son desarrolladas cuando se aplica la prueba a muestras representativas de nios de rango de niveles de grados consecutivos (de primero a sexto por ejemplo). Normas nacionales: se derivan de una muestra normativa que fue representativa de la poblacin a nivel nacional durante el tiempo en que el estudio de normalizacin fue realizado.Normas nacionales ancladas: del mismo modo que un ancla proporciona alguna estabilidad a un barco, as las normas nacionales ancladas proporcionan alguna estabilidad a las puntuaciones de prueba al anclarlas con otras puntuaciones de prueba.Normas de subgrupo: una muestra normativa puede dividirse en segmentos mediante cualquiera de los criterios utilizados inicialmente para seleccionar sujetos de la muestra.Normas locales: elaboradas generalmente por los mismos administradores de la prueba, estas normas proporcionan informacin normativa respecto al desempeo de la poblacin local en alguna prueba. Por ejemplo, escuelas primarias, secundarias o preparatorias del sector privado.

Correlacin e inferencia

Correlacin: es una expresin del grado y direccin de correspondencia entre dos cosas. Un coeficiente de correlacin (r) expresa una relacin lineal entre dos (y solo dos) variables. Refleja el grado de variacin relacionado entre la variable X y la variable Y.

r de Pearson: Es un ndice estadstico que mide la relacin lineal entre dos variables cuantitativas. Dado dos variables, la correlacin permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable.

La Rho de Spearman: es una medida de la correlacin (la asociacin o interdependencia) entre dos variables aleatorias continuas

Regresin: se define como el anlisis de las relaciones entre variables con el propsito de entender como una variable puede predecir otra. La regresin simple, implica una variable independiente (X), referida de manera tpica como variable predictora, y una variable dependiente (Y), llamada comnmente variable resultante. El anlisis de regresin simple da como resultado una ecuacin para una recta o lnea de regresin. La lnea o recta de regresin es la lnea de mejor ajuste, la lnea que en un sentido se acerca ms a la mayor cantidad de puntos en la grfica de dispersin de X y Y.

Inferencia a partir de la medicin

La correlacin, la regresin y la regresin mltiple son todas herramientas estadsticas usadas para ayudar a asegurarse de que las predicciones o inferencias extradas de los datos de una prueba son razonables y, en medida en que sea posible desde el punto de vista tcnico, precisos. Otra herramienta estadstica que puede ser til para lograr los objetivos es el metaanlisis.

Metaanlisis: es combinar estadsticamente la informacin a travs de varios estudios. El metaanlisis produce una sola estimacin de la estadstica que est en estudio.

Captulo 5: Confiabilidad

En este captulo se profundiza en el concepto de la confiabilidad en una prueba, que comienza desde la planeacin de la misma, hasta los procesos de estandarizacin, as como en el de normatividad. Como se pudo observar en un capitulo anterior a este, es necesario determinar si una prueba es lo suficientemente confiable como para medir lo que fue diseada para medir. Al determinar la confiabilidad, se asume que la prueba mide una caracterstica relativamente estable. Fuentes de varianza de errorLas fuentes de error de varianza incluyen la construccin, administracin, calificacin y/o interpretacin de la prueba.

Construccin de prueba: una fuente de varianza durante la construccin de pruebas es el muestreo de reactivos o muestreo de contenido trminos que se refieren a la variacin entre reactivos contenidos en una prueba, as como a la variacin entre los reactivos de diversas pruebas.

Administracin de pruebas: las fuentes de varianza de error que ocurren durante la aplicacin de la prueba pueden influir en la atencin o motivacin de quien responde la prueba; por tanto, sus reacciones ante estas influencias son la fuente de una clase de varianza de error. Estas influencias pueden ser ambientales o personales.

Calificacin e interpretacin de pruebas: el advenimiento de la calificacin computarizada y una creciente dependencia de reactivos objetivos calificables por computadoras han eliminado la varianza de error causada por diferencias de los evaluadores en muchas pruebas. Elementos como la subjetividad al calificar por parte del evaluador, influye bastante a la hora de la interpretacin de las pruebas y puede mostrar un resultado diferente o inconveniente.

Estimaciones de confiabilidadEstimaciones de confiabilidad test-retest: Se calcula para determinar si un instrumento mide de manera consistente de una ocasin a otra. Este coeficiente se encuentra correlacionado con las calificaciones obtenidas por un grupo de personas en una aplicacin con sus puntuaciones en la segunda aplicacin dela prueba.

Estimaciones de confiabilidad de formas paralelas y formas alternas: cuando el intervalo entre la aplicacin inicial y el retest es cortos, los examinados recuerdan muchas de las preguntas y respuestas de la prueba inicial. Esto afecta sus respuestas en la segunda aplicacin, por lo regular algunas personas recuerdan ms del material de la prueba que otras, ocasionando que la correlacin entre el test y el retest sea menos que perfecta. Se necesita entonces, una forma paralela del instrumento, que conste de reactivos similares pero no de los mismos reactivos.

Confiabilidad de dividir por mitades: se obtiene correlacionando dos pares de puntuaciones obtenidas de mitades equivalentes de una sola prueba aplicada una sola vez. Es una til medida de confiabilidad cuando es poco prctico o indeseable evaluar la confiabilidad con dos pruebas o hacer dos aplicaciones de una misma prueba (debido a factores como tiempo y costo).

El clculo de un coeficiente de confiabilidad de dividir en mitades por lo general implica 3 pasos:

1. Dividir la prueba en mitades equivalentes2. Calcular una r de Pearson entre las puntuaciones en las dos mitades de la prueba3. Ajustar la confiabilidad de una mitad de la prueba usando la formula Spearman-Brown.

Formula Spearman-Brown: esta frmula permite a quien elabora la prueba o al usuario de la misma, estimar la confiabilidad de su consistencia interna a partir de la correlacin de las dos mitades.

La frmula general de Spearman-Brown es:

Donde:Confiabilidad ajustada por la formula Spearman-Brown.= la r de Pearson en la prueba con la longitud original n = nmero de reactivos de la versin revisada dividido entre el nmero de reactivos de la versin original.

Formula Kuder-Richardson: Se utiliza en caso de que los reactivos de una prueba sean demasiado homogneos, la KR-20 (nombrada as ya que fue la vigsima formula desarrollada en una serie) y la estimacin de la confiabilidad de dividir en mitades sern similares. Sin embargo esta frmula es la estadstica a elegir para determinar la consistencia entre reactivos de tipo dicotmicos, sobre todo aquellos que pueden der calificados como correctos o incorrectos. La frmula es:

Donde: = el coeficiente de confiabilidad de la frmula 20k= nmero de reactivos de la prueba= es la varianza del total de las puntuaciones de la pruebap= es la proporcin de evaluados que aprobaron el examenq = es la proporcin de reprobados = es la suma de los productos pq de todos los reactivos.

Coeficiente alfa: desarrollado por Cronbach (1951), puede considerarse como la media de todas las correlaciones posibles al dividir en mitades, corregida con la frmula de Spearman-Brown. En contraste con la KR-20, el coeficiente alfa tambin puede utilizarse en pruebas con reactivos no dicotmicos. La frmula es:

Donde:= coeficiente alfak = es el nmero de reactivos = es la varianza de un reactivo = es la suma de las varianzas de cada reactivo = es la varianza total de las puntuaciones de la prueba.

Confiabilidad entre evaluadores: es el grado de acuerdo o consistencia que existe entre dos o ms evaluadores (o jueces o calificadores)

Uso e interpretacin de un coeficiente de confiabilidad: si se disea una prueba especfica que ser usada varias veces en el trascurso del periodo laboral de una persona con el fin de evaluar su desempeo, ser razonable esperar que muestre confiabilidad a lo largo del tiempo. Sera deseable tener una estimacin de la confiabilidad de la prueba y la postprueba del instrumento. En una prueba diseada para una sola aplicacin, una estimacin de la consistencia interna seria la medida de confiabilidad a elegir. Si el propsito de determinar la confiabilidad es analizar la varianza de error en sus partes, entonces tendrn que calcularse varios coeficientes confiabilidad.

La naturaleza de la pruebaRelacionada en forma muy estrecha con las consideraciones relativas al propsito y usa de un coeficiente de confiabilidad estn las consideraciones relacionadas con la naturaleza de la prueba en s. Aqu se incluyen consideraciones acerca de si:

1) Los reactivos de prueba son de naturaleza homognea o heterognea. 2) La caracterstica o capacidad o rasgo que se est midiendo se considera como dinmica o esttica. 3) El rango de puntuaciones de la prueba est restringido o no4) La prueba es de velocidad o poder5) La prueba es o no con referencia a un criterio.

Captulo 6: Validez

La validez aplicada a una prueba, es un juicio o una estimacin acerca de que tan bien una prueba mide lo que pretende medir en un determinado contexto. De manera ms especfica, es la elaboracin de un juicio en base a la evidencia sobre lo apropiado de las inferencias realizadas a partir de las puntuaciones de una prueba. Una inferencia es un resultado o deduccin lgicos.

Una manera en que los especialistas der la medicin tradicionalmente han conceptualizado la validez es de acuerdo con 3 categoras:

Validez de contenido: Describe un juicio de cuan adecuadamente una prueba es una muestra de la conducta representativa dentro del universo de conductas que la prueba fue diseada para ejemplificar. Para validar una prueba, es necesario calcular la razn de validez de contenido, la frmula es:

Donde:= razn de validez de contenido= nmero de expertos que indican esencial.N= nmero total de expertos.

Validez relacionada con el criterio: Es un juicio de cuan adecuadamente puede ser utilizada la puntuacin de una prueba para inferir la posicin ms probable de un individuo con respecto a cierta medida de inters, siendo el criterio, la medida de inters. Dos tipos de evidencias de validez se encuentran asumidas bajo el rubro de este concepto:

Validez concurrente: es un ndice del grado en que se relaciona la puntuacin de una prueba con alguna medida de criterio obtenida al mismo tiempo que la puntuacin.Validez predictiva: es un ndice del grado en que se relaciona la puntuacin de una prueba predice alguna medida de criterio. Un Criterio es definido en forma amplia como el modelo contra el cual se compara y evala una prueba o la puntuacin de una prueba. Desde un punto de vista operativo, un criterio puede ser cualquier cosa. Un criterio debe ser vlido para el propsito para el que est siendo usado.

Validez de constructo: es un juicio acerca de lo apropiado de las inferencias realizadas a partir de las puntuaciones o calificaciones obtenidas en la prueba, respecto a posiciones individuales en una variable llamada constructo, un constructo es una idea informada, cientfica, desarrollada como una hiptesis para describir o explicar un comportamiento, como por ejemplo: inteligencia, ansiedad, satisfaccin laboral, personalidad, depresin, etc.

Validez, sesgo e imparcialidad de la prueba

Sesgo: es un factor inherente a una prueba que de manera sistemtica impide la medicin absolutamente precisa e imparcial. Imparcialidad de la prueba: una prueba es imparcial cuando implican juicios de valor. De esta manera, mientras que las cuestiones de sesgo de la prueba algunas veces pueden responderse con precisin y determinacin matemtica, la imparcialidad puede intentar ser resuelto por infinidad de personas bien intencionadas que sostienen puntos de vista contrarios.

Captulo 7: Desarrollo de pruebas

No todas las pruebas son creadas de la misma forma. La creacin de una buena prueba no es una cuestin fortuita, sino el producto de la aplicacin concienzuda y slida de los principios establecidos para su elaboracin. El proceso de elaboracin de una prueba contempla cinco etapas:1. Conceptualizacin de la prueba: como una cuestin preliminar, la elaboracin de una nueva prueba puede surgir como respuesta a una necesidad de evaluar el dominio en una ocupacin o profesin recin creada. Sin importar cul sea el estmulo para la elaboracin de una nueva prueba, el futuro constructor de pruebas enfrenta de inmediato diversas interrogantes: Qu es lo que va a medir la prueba segn el diseo?, Cul es el objetivo de la prueba?, existe una necesidad para esta prueba?, Quin usar esta prueba?, Quin tomara esta prueba?, Qu contenido cubrir la prueba?, Cmo se aplicara la prueba?, Cul ser el formato ideal de la prueba?, debera elaborarse ms de una forma de la prueba?, se requerir capacitacin especial para los aplicadores?.

2. 3. Construccin de la prueba: que comienza desde la elaboracin de las escalas que se utilizarn para establecer reglas y con ello lograr la asignacin numrica en la medicin realizada con base en el constructo. Se contina con la redaccin de reactivos y el formato de reactivos y el formato de seleccin de respuestas. Actualmente se debe considerar la redaccin de reactivos para ser administrados por computadora si es necesario.

4. Ensayo de la prueba: Habiendo creado una reserva de reactivos a partir de la cual se elaborar la versin final de la prueba y un formato amigable y entendible para el evaluado, el elaborador la pondr a prueba. La prueba debe ser probada con personas similares en aspectos crticos a la gente para la que fue diseada. De esta manera, por ejemplo, si una prueba est diseada para medir autoestima en adolescentes, debera aplicarse entonces a una poblacin adolescente. 5. Anlisis de reactivos: Entre las herramientas que podran emplear los elaboradores de pruebas para analizar y seleccionar reactivos se encuentran: ndice de dificultad del reactivo ndice de confiabilidad del reactivo: esto proporciona un indicio de la consistencia interna de una prueba, entre mayor sea este ndice, mayor ser la consistencia interna. ndice de validez del reactivo: indica el grado en el que una prueba mide lo que se supone debe medir ndice de la diferenciacin de un reactivo: indica que tan adecuadamente separa o diferencia un reactivo entre quienes obtienen puntuaciones altas y quienes tienen puntuaciones bajas en una prueba completa.6. Revisin de la prueba: como ltimo paso, queda revisar los datos obtenidos de manera juiciosa para proceder a moldear la prueba. Con base en toda la informacin obtenida, algunos reactivos de la reserva original sern eliminados y otros redactados de nuevo. Quienes elaboran las pruebas tal vez se encuentren con que se deben equilibrar los puntos fuertes y dbiles a lo largo de los reactivos. Captulo 8: La inteligencia y su medicin Qu es inteligencia?La inteligencia se define como una capacidad multifactica que se manifiesta de diferentes maneras a lo largo del ciclo vital, la inteligencia incluye estas habilidades: Adquirir y aplicar el conocimiento Razonar de manera lgica Planear de modo afectivo Hacer inferencias a partir de la percepcin Realizar juicio slidos y resolver problemas Comprender y visualizar conceptos Poner atencin Ser intuitivo Encontrar con facilidad las palabras y pensamientos correctos Enfrentar, ajustarse y aprovechar situaciones nuevasDefinicin de inteligencia: puntos de vista de expertos y profesionales.Francis Galton: es recordado como la primera persona que public algo sobre la heredabilidad de la inteligencia, enmarcando as el debate contemporneo entre la naturaleza y crianza, crea que las personas ms inteligentes eran aquellas equipadas con las mejores capacidades sensoriales. Alfred Binet: aunque su prueba, a principios del siglo XX, tuvo el efecto de iniciar el movimiento de evaluacin psicolgica, tanto sobre inteligencia como sobre otras materias, escribi que los componentes de la inteligencia incluyen razonamiento, juicio, memoria y abstraccin.David Weschler: Lo que define acerca de inteligencia es: La inteligencia, definida en forma operacional, es la capacidad integral o global del individuo para actuar con determinacin; de pensar en forma racional y de tratar de manera efectiva con su medio ambiente.Jean Piaget: La investigacin de Piaget est enfocada en el desarrollo de la cognicin en los nios: cmo piensan, como se entienden a s mismos y al mundo que los rodea, y como razonan y solucionan problemas. Para Piaget, la inteligencia puede concebirse como un tipo de capacidad biolgica evolutiva de adaptacin al mundo exterior; conforme se desarrollan las habilidades cognoscitivas, la adaptacin se incrementa y el ensayo y error mental reemplazan al ensayo y error fsico real. Medicin de la inteligenciaLa medicin de la inteligencia implica hacer un muestreo del rendimiento de un examinado en diferentes tipos de pruebas y tareas como una funcin del nivel de desarrollo. En todos los niveles de desarrollo, el proceso de evaluacin intelectual tambin proporciona una situacin estandarizada desde la cual puede observarse de cerca el enfoque de un examinado haca varias tareas. Por consiguiente, ofrece la oportunidad para una evaluacin que en si misma puede tener gran utilidad clnica.

Para la medicin de la inteligencia en distintas etapas de desarrollo, se toma en cuenta la edad y como se trabajar con el evaluado.

Existen algunos puntos de discusin (como se plantean en este captulo) que exponen las diferencias que existen en cuanto a los determinantes de la inteligencia.

La primera se maneja como naturaleza vs. Crianza, en esta parte se comienza explicando que, aunque, en la actualidad la mayora de los cientficos de la conducta cree que la capacidad intelectual medida representa una interaccin entre 1) la capacidad innata y 2) las influencias ambientales, esta creencia no siempre fue bien aceptada. Menciona el preformacionismo que sostiene que todos los organismos vivos estn preformados al nacer. Todas las estructuras de un organismo, incluida la inteligencia, estn preformadas al nacer, y, por lo tanto, no es posible hacer mejoras al respecto. En general, se concluye, que los proponentes del lado de la crianza en esta controversia, enfatizan la importancia crucial de factores como el ambiente prenatal y postnatal, la posicin socioeconmica, las oportunidades educativas y el moldeamiento parental en relacin con el desarrollo intelectual.

Se menciona tambin herencia e interaccionismo: las personas difieren en los niveles de inteligencia del mismo modo en que difieren en los niveles de presin sangunea, en los niveles de lquido cefalorraqudeo, en la sensibilidad del dolor (Sheffield, 2000) y en muchas otras caractersticas. De acuerdo con el interaccionismo, las personas heredan un determinado potencial intelectual. Exactamente cunto de este potencial gentico es desarrollado depende en parte de la naturaleza del ambiente en el que se han criado.

En cuanto a la estabilidad de la inteligencia, la inteligencia parece ser estable durante gran parte de la vida adulta del individuo. A partir de los 75 aos de edad, se observa que comienza una declinacin en las capacidades cognoscitivas. Otros factores que afectan en mayor o menor grado son la personalidad, genero ambiente familiar y cultura.

Captulo 9: pruebas de inteligenciaLas escalas de inteligencia de Stanford-binetEscalas de WechslerOtras medidas de inteligencia

Pruebas y Evaluación Psicológicas

Documents

Transcript of Pruebas y Evaluación Psicológicas