FELMAN- Enseñar a Evaluar
-
Upload
pabloracca -
Category
Documents
-
view
154 -
download
4
Transcript of FELMAN- Enseñar a Evaluar
1
EENNSSEEÑÑAANNZZAA YY EEVVAALLUUAACCIIÓÓNN
PPOORR DDAANNIIEELL FFEELLDDMMAANN
Seminario dictado on line en el Post-grado Constructivismo y Educación de FLACSO, 2005
¿Para qué cree usted que está la enseñanza?
La evaluación como parte de la acción
Tipos funcionales de evaluación
La evaluación formativa: evaluar para enseñar, evaluar para aprender
Al final, ¿a qué cosa se llama “evaluar”?
Los instrumentos para obtener información
Los criterios para valorar
La calificación
Posibles sesgos en la evaluación
Relaciones entre programación, enseñanza y evaluación
¿Qué hacer con las prácticas de evaluación?
Bibliografía
2
Presentación
La evaluación puede ser tratada en diversas escalas. Algunas de las discusiones que hoy
resultan más álgidas están relacionadas con la existencia de grandes sistemas de evaluación. Esto
puede entenderse si se tiene en cuenta el impacto político, social y financiero de las evaluaciones
estandarizadas y generalizadas. En algunos países, esas evaluaciones actúan como indicador de la
eficacia de la inversión en educación. Los establecimientos pueden ser rankeados y el sistema
educativo es ponderado según los resultados que obtienen los alumnos. Esta importancia dada a la
evaluación estandarizada suele coincidir con la aceptación de prácticas institucionalizadas de
selección y clasificación de recorridos educativos. La evaluación estandarizada adquiere cada vez
más importancia, inclusive en un país como la Argentina, que no desarrolló una particular cultura
de evaluación educativa, en comparación con otros países, como Inglaterra, los Estados Unidos y
Francia.
Muchas cosas pueden ser evaluadas en las actividades educativas: el aprendizaje de los
alumnos, los dispositivos, los métodos o las técnicas de enseñanza, el plan de estudios, materiales,
programas o proyectos, los rendimientos cuantitativos de un sistema, la tarea de los profesores, la
calidad de la gestión institucional. Esas cosas pueden ser evaluadas con distintos propósitos, por
distintas personas y mediante diferentes métodos.
PROFUNDIZACIÓN: En el siguiente cuadro, estructurado en torno de las preguntas por qué, qué
y cómo evaluar, así como quién evalúa, Jean-Marie De Ketele sintetiza rasgos diferenciales de la
evaluación:
3
¿Quién evalúa? De Ketele, 1984.
Auto-evaluación
Hétero-evaluación
● Subordinados
● Iguales
● Autoridades
internas
● Personas
independientes
● Autoridades
externas ¿Qué? (sujeto-objeto)
● Certificar (objetivos terminales globales) ● Alumnos ● Enseñanza ● Objetivos ● Técnicas ● Materiales ● Métodos...
● Clasificar en el interior de una población
(objetivos de perfeccionamiento)
● Examen escrito
Evaluación clásica puntual empírica
● Hacer un balance (objetivos intermedios) ● Entrevista libre (oral clásica)
● Diagnosticar (errores, producto, proceso) ● Test centrado en los objetivos
Evaluación puntual centrada en los
objetivos ● Clasificar en subgrupos ● Entrevista centrada en los objetivos
● Seleccionar ● Análisis de contenido
● Predecir el éxito ● Observación libre
Evaluación durante el proceso ● Descubrir factores ● Observación sistemática
● Orientar (prevenir) ● Observación provocada
¿Por qué? (función: decisión a tomar)
¿Cómo? (técnica)
4
En esta clase, se tratará la evaluación desde un punto de vista más bien restrictivo. Se
priorizará la reflexión sobre la evaluación del aprendizaje en la sala de clases. No quiere decir
que no aparezcan cruzadas las demás dimensiones, sino que el lector notará que, en general,
se estará enfocando el tema desde la mirada del que enseña.
La evaluación siempre fue un tema delicado, ligado con ideas de control y de selección.
En ella se expresa el ejercicio de la autoridad de la escuela y del profesor, y, mirando desde el
otro lado, la presión que reciben los alumnos. La evaluación revela la asimetría del
dispositivo escolar y muestra su carácter, muchas veces arbitrario.
La evaluación tiene, además, varios usos non sanctos, alejados de su función originaria.
Se la usa, por ejemplo, para imponer ritmo de trabajo, mantener el orden, sancionar o mostrar
“quién manda”.
Para el profesor, la evaluación tampoco suele ser uno de los momentos más gratos de la
tarea. Indudablemente, los alumnos no lo ven así; sin embargo, cualquiera con experiencia en
la enseñanza formal recuerda la fatiga de las largas correcciones, el cansancio de leer, una y
otra vez, versiones de lo mismo, la dificultad de avanzar en textos no siempre claros y de
indicar a cada uno lo necesario, de ponderar los aciertos y los errores a la hora de calificar, de
procurar que las notas correspondan al nivel de producción y de no cometer demasiadas
arbitrariedades.
Desde el punto de vista de la vida cotidiana en las aulas y en las escuelas, la evaluación,
salvo raras excepciones, no es el gran momento de la educación ni para los profesores ni para
los alumnos. Incluso, pocas pedagogías asientan la nobleza de sus propósitos en la dimensión
evaluativa.
Dicho todo lo cual, no tendríamos más que remover tan odioso elemento, clarificar las
relaciones escolares y permitir que profesores y alumnos vivan en un mundo de serena
felicidad y comunión. ¿Está usted dispuesto a proponer tal cosa? No será el primero al que se
le ocurra ni estará solo en el intento. Tampoco dejará de tener opiniones en contrario ni de ser
severamente criticado ¿Dirá usted, acaso, que podemos retirar, sin más, la evaluación de las
prácticas educativas sistemáticas? ¿Cualquier resultado le daría a usted igual? ¿Está
proponiendo que firmemos un millonario cheque en blanco y que suceda lo que suceda?
El problema es buscar algún punto a partir del cual tratar la cuestión sin caer en
demasiados prejuicios.
5
1. Digo “‘demasiados’ prejuicios”, porque es imposible abordar estos temas sin imágenes y
construcciones previas: todos tenemos una valoración positiva o negativa de la evaluación.
¿Cuáles son las suyas? ¿Con qué tiene asociada la idea de evaluar? Le sugerimos apuntar esto
como notas.
Desde ahora le adelanto que mi visión no es imparcial y equidistante. No pienso hacer
aquí un repaso de argumentos –aunque me parece una tarea muy valorable. Probablemente
porque me dedico a la didáctica, consideraré la evaluación como una variable importante de
las actividades de enseñanza. Ya conoce mi opinión. Debería dar las razones ahora. Allí
vamos. Mi punto de partida es una pregunta:
¿Para qué cree usted que está la enseñanza?
Propondré algunas posibles respuestas de las que puede haber en circulación: para que
los alumnos obtengan determinados aprendizajes, desarrollen ciertas capacidades, adquieran
ciertos modos de apreciar o de valorar. Solemos expresar este tipo de intenciones en planes de
estudio y en programas. Asumimos, en general, que el mundo adulto tiene algún derecho para
decidir cosas que los jóvenes deberán adquirir para su ingreso en la sociedad.
Éste no es sólo un problema de las escuelas. Toda sociedad conocida estableció
conocimientos, destrezas y disposiciones que los jóvenes debían adquirir durante su
preparación para, luego, formar parte del mundo adulto. Nuestra sociedad realiza esta
preparación en sistemas de gran tamaño. Esto ocurre debido a la complejidad de nuestra vida,
al cúmulo enorme de conocimiento y tecnologías disponibles y a la cantidad creciente de
personas que se incorporan a la vida adulta a partir de esa preparación especializada.
La expresión de nuestras intenciones educativas tiene un sencillo correlato. Si esto es lo
que pretendemos ¿en qué medida lo estamos logrando? Pregúntelo de otra manera:
¿deberíamos tener algún medio al alcance para saber si las importantes intenciones educativas
de las escuelas son realizadas? Si se considera que estas intenciones educativas están
directamente ligadas con el desarrollo del mundo en que vivimos y que no resultan
accidentales, sino centrales para su existencia y mejora, parece casi inevitable dar una
respuesta positiva. Tendríamos así un primer motivo: las acciones de enseñanza tienen tal
importancia social que el hecho de evaluar está vinculado a la importancia otorgada. Pero no
es el único motivo.
6
Podemos tomar las intenciones educativas y considerarlas, ahora, en una escala más
cercana: la de la tarea en la sala de clases. Todo profesor planifica ciertas realizaciones.
Organiza un sistema para que los alumnos puedan producir algo: resolver una tarea, analizar
un problema, organizar información, diseñar un proyecto, comprobar una idea, debatir un
conflicto, establecer relación entre dos series de hechos, comparar casos para buscar
elementos comunes, conocer una teoría, inventar un concepto, obtener datos de libros o
material informativo, organizar un grupo pequeño, realizar obras en diferentes lenguajes. La
lista puede continuar. En cualquier concepción constructivista se aceptará que estas
actividades y producciones permiten, dicho en términos muy generales, que los alumnos
“aprendan algo”.
Tanto desde el punto de vista del profesor como desde el del alumno, es necesario tener
algún conocimiento acerca de la eficacia, el éxito o la pertinencia de las actividades
emprendidas. Como sucede en cualquier proceso de producción. En el caso del profesor, para
organizar su intervención, planificar los cambios y modular la ayuda que preste. En el caso de
la integración del sistema, para asegurarse el cumplimiento de requisitos que el propio
sistema de enseñanza fija y que permiten el paso de los alumnos en los distintos niveles. En el
caso de los alumnos, es necesario porque el conocimiento acerca de la pertinencia y la
dirección de los propios esfuerzos es un elemento de enorme importancia para mantener la
tarea en marcha y realizar las adecuaciones necesarias.
Desde este punto de vista, las actividades de aprendizaje y las de enseñanza forman parte
de acciones productivas. Suelen, en la mayoría de los casos, tener propósitos bastante
definidos y parte de sus resultados puede ser prevista. Si, a veces, no puede ser previsto el
contenido de ese resultado (en el caso de una investigación, un trabajo artístico o un debate),
sí pueden ser establecidos los criterios mediante los cuales puede ser analizado, juzgado y a
partir de los cuales pueden tomarse decisiones a futuro: podría ser que las conclusiones deban
ser revisadas o que la información no sea suficiente para apoyar el análisis o que los
argumentos utilizados no se consideren válidos o que la solución adoptada no contemple
todos los intereses comprometidos. Podría decirse, en resumen, que el resultado puede ser
previsto o que los criterios para analizarlo pueden serlo. En definitiva, que contamos con
algún medio para evaluar las actividades emprendidas.
7
La evaluación como parte de la acción
“¿‘Evaluar’ dijo? ¿Ya volvemos con lo mismo?”, estarán pensando los de la posición
crítica. Acepto que sí. Pero advierta que amplié el contexto. Estoy considerando la evaluación
como un elemento integrante de la acción. Si no, piense cuando decimos: “Ese actuó a tontas
y a locas”, “Se mandó un acting” (si nos ponemos más técnicos y sofisticados) o “No aprende
más: siempre repite lo mismo”. ¿No está en todo esto la idea de que las acciones presentes y
pasadas no son suficientemente ponderadas para poder tomar mejores decisiones en relación
con las acciones futuras?
La consideración del resultado de nuestras acciones forma parte integrante de la propia
acción. Es el elemento que nos permite darles dirección y, si se permite el término, eficacia.
Entre los pedagogos la idea de eficacia quedó muy relacionada con algunas tendencias
pedagógicas, más bien vinculadas a lo que se conoce como “tecnología instruccional”, que, en
nuestros pagos, es identificado como “tecnicismo”. Dicho rápidamente, a mucha gente no le
gusta que le hablen de eficacia. Le resulta un concepto poco educativo. Yo no estoy muy
seguro de que sea así. Los seres humanos procuramos y necesitamos conducir con eficacia
nuestras acciones, simplemente, porque somos seres intencionales. Llamamos “competente”
al que sabe conseguir o resolver los problemas que enfrenta de una manera adecuada y con
una inversión razonable de recursos, energía y tiempo. O sea, al que los resuelve con eficacia.
Por supuesto, hablar de eficacia siempre requiere algún criterio o parámetro sobre la base
del cual juzgar los logros de la acción. Esos parámetros pueden perfectamente ser debatidos y
acordados. Pueden ser establecidos por el propio sujeto, en acuerdo con otros, o aceptados de
otras fuentes a las que se les reconoce legitimidad. En cualquier caso, una vez establecidos,
nos ofrecen una manera de juzgar nuestras acciones y las de otros.
Gran parte de nuestra vida consiste en producir, lograr cosas o alcanzar ciertas metas.
Evaluamos nuestras acciones, entonces, para juzgar su capacidad de alcanzar las metas
propuestas y, de manera muy importante, evaluamos nuestros desempeños para poder dirigir,
modificar o mantener nuestros esfuerzos o, en caso necesario, para volver a planificarlos.
Somos, por esencia, evaluadores: mientras actuamos, obtenemos información, la comparamos
con algunos criterios establecidos, vamos juzgando y tomamos decisiones en consecuencia.
Evaluar es comparable al hecho de fijar nuestra posición en el mapa, cotejarla con la hoja de
ruta y definir los próximos pasos a tomar.
Si lo miramos de esa manera, ¿evaluar sigue siendo un terrible evento educativo?
“Bueno”, me dirá. “Está presentando la cara linda. Me viene usted con el argumento de las
8
funciones y su lugar en las acciones intencionales, y suerte que no me echó encima las teorías
cognitivas con todos los mecanismos de planificación y regulación de la acción. Pero ¿no se
está olvidando usted de las calificaciones y de las aprobaciones y de las desaprobaciones y de
las promociones y de las repeticiones y de todo eso?”
No, no me olvido. Pero tengo mi argumento preparado, como se podrá imaginar. ¿Acaso
no estábamos conversando sobre evaluación?
“Oiga”, pensará, “se conversa entre muchos y yo estaba aquí, lo más tranquilo, y usted
me vino con todo el fárrago ese de la evaluación”.
Bueno, concedido, yo traje el tema. Pero, no me dirá usted que es un tema sin
importancia. Hasta los niños de primer grado hablan ahora del asunto. Pero ésa no es la
cuestión. Le quería decir yo que, si estábamos hablando de evaluación, no veía por qué
comenzaba a disparar con esa cuestión de exámenes, notas y reprobados.
“¿Me está tomado el pelo? ¿No es lo que se hace con la evaluación?”
Ahora veo por dónde va. Esa es una de las cosas que se hacen. Pero está lejos de ser la
única. Técnicamente llamamos a eso “función de certificación”. Si toma en cuenta lo que
expliqué hasta ahora, verá que la evaluación tiene como función principal permitir la toma
fundamentada de decisiones. Para eso, se recurre a información, lo más sistemática posible, y
se realizan ponderaciones o juicios basados en criterios. Una decisión posible puede ser
calificar, aprobar o certificar el cumplimiento de requisitos. Pero otras decisiones, no menos
importantes, pueden consistir en el ajuste de la planificación, la ubicación del grupo antes de
comenzar un curso o la dirección de la actividad de alumnos y profesores durante la tarea. Se
suele llamar a la primera función “diagnóstica” y, a la segunda, “formativa” o “de
regulación”.
Como verá, puede ser que buena parte del problema que aparece con la evaluación tenga
que ver con que el término quedó ligado a una de sus funciones y con algunos de sus métodos
posibles. Vamos a ampliar esa cuestión.
9
Tipos funcionales de evaluación
Permítame una brevísima referencia histórica. El inicio del siglo XX marcó en
educación, como en otras áreas, una fuerte impronta de los enfoques científicos, asociados, en
ese momento, con la medición y la administración racional sobre la base del modelo industrial
imperante. El desarrollo de metodologías de medición social ofreció los instrumentos que
primarán para el análisis del aprendizaje. Se suponía que el rendimiento escolar podía y debía
ser medido. Amiguens y Zerbato-Poudou lo denominan “el período de testing” (Amiguens y
Zerbato-Poudou, 1999, p. 173).
Después veremos algunas cuestiones relacionadas con la medición. El hecho es que, hacia los
años cincuenta, se propone una concepción diferente: la evaluación comienza a ser entendida,
básicamente, como la operación continua de comparar el estado de avance de los alumnos en
relación con los objetivos educacionales convenientemente operativizados. Esta manera de
entender las cosas, basada en la obra de Ralph Tyler, marcó el modo más generalizado de
considerar la evaluación hasta la fecha.
PROFUNDIZACIÓN: Ralph Tyler fue un educador norteamericano de enorme influencia en
el pensamiento educativo de la segunda mitad del siglo XX. Estableció las bases conceptuales
para los modelos de planificación dominantes durante los años 1960 y 1970. Parte de la
capacidad de difusión de su planteo residió en su carácter de mediación y síntesis entre las
ideas de los progresistas y de los eficientistas. Además, su trabajo ofreció un lenguaje claro y
práctico, basado en un esquema de pensamiento razonable y plausible para los profesores y
gestores educativos. Su libro Principios básicos para la elaboración del currículum,
publicado por primera vez en 1949, tuvo un enorme éxito, aunque años después fue
duramente atacado por los reconceptualistas críticos de los setenta. Tyler nunca respondió a
las críticas, argumentando que el propósito de su trabajo era práctico y que solo discutiría con
alternativas prácticas diferentes de la suya.
Hacia los años sesenta, comenzaron a reelaborarse, sofisticarse y, en algunos casos,
criticarse las ideas de evaluación como comparación con objetivos. Se incorporaron nuevas e
importantes ideas sobre tipos y funciones de la evaluación. En ese punto nos quedamos en el
apartado anterior y a él quiero volver.
Lo que aparece en esos años es la distinción entre tipos de evaluación, entre lo que se
denominó “evaluación sumativa” (o “compendiada”) y “evaluación formativa”.
10
Evaluación sumativa Evaluación formativa
Destinada a determinar el resultado total y
final de un curso.
Tiene como propósito mejorar el desarrollo de
las tareas durante el propio curso.
Amiguens y Zerbato-Poudou indican que, para muchos autores, la evaluación formativa
constituía la “parte dinámica de la pedagogía de dominio, desde el momento en que
contribuye activamente para que el mayor número de alumnos logre dominar los objetivos
pedagógicos predeterminados” (Amiguens y Zerbato-Poudou, p.184).
La pedagogía compendiada o sumativa es una evaluación de balance al finalizar una
secuencia de enseñanza. Claro que la duración de esa secuencia es variable y depende del
programa educativo que se considere.
La evaluación sumativa puede ser interna o externa:
Evaluación sumativa interna Evaluación sumativa externa
Consiste en actividades de evaluación
diseñadas y administradas por el profesor
para su clase; es la forma habitual de
evaluación (pruebas o exámenes al finalizar
una unidad o un período escolar)
Es decidida y diseñada por organismos
exteriores al establecimiento y la clase escolar
(con independencia de que los administre el
profesor); los operativos nacionales de
evaluación de la Argentina son un ejemplo.
En ocasiones, la evaluación sumativa externa tiene carácter certificativo y permite
alcanzar alguna credencial o derecho de acceso a niveles superiores de estudio (por ejemplo,
el General Certificate of Education, O level o A level, en Inglaterra; el Baccalauréat, en
Francia y el Vestibular, en el Brasil).
La distinción entre “externo” e “interno” es de la mayor importancia, porque buena parte
de las reflexiones y las críticas sobre el papel de la evaluación en el proceso escolar provienen
de académicos y profesionales que desempeñan sus tareas en países que sostienen fuertes
sistemas de evaluación externa. Como es bien sabido, los sistemas de evaluación externa
tienen influencia directa en los procesos de selección y distribución diferencial de la matrícula
escolar. Expresan, por lo tanto, el poder de asignar de modo desigual recursos sociales. Para
algunos críticos, esta asignación desigual legitima la desigualdad estructural de nuestras
11
sociedades al adjudicarla a categorías, neutrales, de “excelencia”. Además, los sistemas
externos de evaluación tienen un impacto muy apreciable sobre el proceso y las oportunidades
formativas de los alumnos. Esto sucede porque los contenidos y la enseñanza de las escuelas
tienden a acomodarse a los parámetros, requisitos, exigencias y contenidos de los exámenes
externos, con independencia del currículum vigente.
La evaluación certificativa es la que se suele tener en mente cuando despotricamos
contra la evaluación o cuando se realizan importantes críticas a su impacto social y al
ejercicio arbitrario de poder que, para algunos, representa. Todas esas reflexiones pueden ser
razonables. Igualmente, parece necesario reconocer que ésta no deja de ser una función
escolarmente necesaria y habrá que ver cómo arreglarse con ella. Las escuelas, tal como
existen, califican y aprueban. Básicamente, se utiliza la evaluación en el cumplimiento de las
siguientes funciones:
Funciones de la evaluación
● Formativa Regula la acción pedagógica.
● Pronóstica Fundamenta una orientación.
● Diagnóstica Adecua el dispositivo de enseñanza a las capacidades del
grupo o ubica a un grupo o persona según sus capacidades
actuales en el nivel adecuado para un proceso educativo.
● Sumativa o compendiada Realiza un balance final.
● Certificativa Incorpora al balance final un sistema de calificaciones y un
régimen de aprobación y promoción que sostiene la obtención
de certificados (de aprobación de un año escolar, de un curso o
nivel o de un título). Es la forma que mayoritariamente adopta
en los sistemas escolarizados la evaluación sumativa.
● Informativa Provee datos a la comunidad, los padres, organismos
fiscalizadores y demás.
Adaptado de Perrenoud, 1999ª, pp. 56-57.
12
La evaluación formativa: evaluar para enseñar, evaluar para
aprender
De los tipos funcionales de evaluación, la evaluación formativa es la que se encuentra
más estrechamente ligada al desarrollo de las actividades de aprendizaje.
Dicho sea de paso, notará usted, estimado lector, que utilizo la idea de “actividades de
aprendizaje” más que la de “procesos de aprendizaje”. La razón es simple: la enseñanza
promueve determinado tipo de actividad por parte de los alumnos. Esas actividades
constituyen el factor explicativo del aprendizaje. Los alumnos aprenden en función de las
tareas que desarrollan, más allá de si esas tareas tienen manifestación conductual evidente, no
la tienen o ésta es poco perceptible. Tal es el caso, por ejemplo, de un grupo de alumnos que
sigue con atención una charla.
Desde este punto de vista, el conjunto de las acciones de enseñanza tiende a influir en las
actividades de los alumnos. Digamos que las relaciones entre enseñanza y aprendizaje, toman,
desde esta perspectiva, la forma de relaciones entre actividades del profesor y actividades de
los alumnos. Una de las maneras de influir en las tareas de aprender consiste en ofrecer
información y valoración sobre la marcha de esas tareas. Ese modo de influencia en las
actividades de aprendizaje es la evaluación formativa y su función principal es la regulación.
Desde el punto de vista del constructivismo pedagógico, es, evidentemente, la evaluación
formativa la que ha recibido un mayor grado de atención. Claro que sólo es posible cumplir
esta función cabalmente en el marco de una restricción que vale la pena anotar: la evaluación
formativa cumple su rol de reguladora del aprendizaje si se inscribe en el marco de una
pedagogía diferenciada. O sea, de una ayuda pedagógica que se diversifica para adecuarse a la
individualidad del proceso de aprendizaje.
Se puede discutir la escala y el grado de la individualización, pero es indiscutible el
factor personal en la construcción del aprendizaje. También la existencia de distintos estilos,
enfoques o tiempos. Si no se quiere aceptar ninguna diferencia en la calidad de los abordajes
personales para aprender, sí se reconocerán, al menos, la existencia de diferentes necesidades
y ayudas en el proceso de aprender por parte de distintos individuos. Si, en última instancia, el
aprendizaje es individual, la regulación que promueve la evaluación formativa sólo puede
actuar en la medida en que cada aprendiz reciba ayuda adecuada a su necesidad. Éste es el
principio general. La manera de concretarse depende de multitud de factores.
13
Por supuesto, hablar de evaluación formativa es una cosa y asociarla con una pedagogía
diferenciada es otra. Las condiciones del trabajo escolar no son, precisamente, una ayuda en
ese sentido. Veamos un poco más esta cuestión.
Perrenoud propone considerar formativa una práctica de evaluación continua, si el
profesor tiene la intención de contribuir con las tareas de aprendizaje en curso y mejorarlas,
cualquiera sea el grado en que diferencie la enseñanza (Perrenoud, 1999a, p. 78. La cursiva
es mía). El carácter formativo de la evaluación queda, entonces, según Perrenoud, asociado
con el propósito de participar en la regulación del aprendizaje o, dicho más simplemente, de
cooperar con los alumnos en sus actividades de aprendizaje.
Esta cooperación se efectiviza de dos maneras. La primera, adaptando el ritmo y el tipo
de ayuda. La segunda, ofreciendo información a los alumnos acerca de sus tareas, de sus
progresos y de sus dificultades, lo que, en términos sistémicos, se denominaría
“retroalimentación informativa”. La evaluación formativa interviene de manera constante, y
no segmentada, en el aprendizaje. No consiste, sólo, en cortes evaluativos en el proceso de
enseñanza a efectos de utilizar secuencias didácticas de recuperación o remediales.
Se estableció una relación estrecha entre evaluación formativa e intervención
pedagógica; este par es el que actúa en la regulación del aprendizaje. Pero ¿qué tipo de
intervención pedagógica? Quedó claro que alguna que mantenga una tendencia de
diferenciación sin que esto implique, necesariamente, la individualización de la enseñanza. En
mi opinión, debe entenderse como una adecuación de la ayuda a necesidades que no serán
homogéneas pero tampoco totalmente diversas.
Bien, una tendencia a adecuar el tipo de ayuda. ¿Eso es todo? Probablemente sí. Según
Perrenoud, lo formativo reside en su capacidad de ayudar a los alumnos a aprender y no en la
modalidad de evaluación (Perrenoud, 1999a, p. 103). Tampoco cree que se deba asociar con
un tipo especial de intervención pedagógica. Se puede ayudar de muchas maneras a los
alumnos y lo que se debe procurar es una ampliación de las intervenciones.
Al final, ¿a qué cosa se llama “evaluar”?
Ya es tiempo de sistematizar el concepto. Se sostuvo, hace un rato, que la evaluación era
consustancial de toda acción intencional y, por lo tanto, de las tareas de enseñanza. Desde un
punto de vista general, la evaluación forma parte de cualquier actividad de enseñanza. Forma
parte de la pregunta: “¿Cómo van las cosas? ¿Están comprendiendo?” O de las reflexiones:
“Hoy la clase fue buena, pudo notarse en el nivel de las preguntas y en la discusión final, pero
14
¿los que no participaron?” O de las preocupaciones: “Creo que debería disminuir el ritmo”,
“Me parece que este tema precisa más ejercitación”, “Hoy noté muchos errores en la tarea
individual”. O de las “calificaciones”: “Marta mejoró mucho en su rendimiento, se esfuerza y
parece más animada, habría que apoyarla un poco más porque, de seguir así, puede aprobar la
materia”. En todos esos casos, y en muchos más, es posible hablar de “evaluaciones” que
cada docente realiza de forma permanente y de manera informal.
Pero, normalmente, la referencia a la evaluación alude a una dimensión más formalizada.
Nos referimos a evaluación para denominar momentos especiales en los que el propósito
fundamental consiste en realizar “eso”.
Pero, se estará preguntando usted, “¿este sujeto piensa seguir hablando del tema sin
definirlo?”
Creo que hasta ahora nos entendíamos bien sin tanta necesidad de andar definiendo.
Pero, ya que me lo reclama, veamos si podemos ponernos de acuerdo en los siguientes tres
rasgos:
Rasgos de la evaluación
● Incluye obtener información del modo más sistemático posible.
● Supone la valoración de un estado de cosas en relación con criterios establecidos, o sea,
supone algún tipo de juicio basado en la información disponible.
● Su propósito es la toma de decisiones.
La evaluación se diferencia de una actividad descriptiva, porque su propósito principal
no reside en la búsqueda y la organización de información. Su propósito fundamental es la
acción posterior. La información, en sí, no es base para la toma de decisiones. Las decisiones
son tomadas sobre la base de los juicios que se elaboran. Esos juicios o valoraciones se
fundamentan en el análisis de la información disponible con ciertos criterios: objetivos, pautas
de desarrollo, modelos, reglas de procedimiento, principios. En resumen, como señala
Perrenoud, siempre se evalúa para actuar (Perrenoud, 1999a, p. 53). Es necesario considerar
las acciones y decisiones que la evaluación fundamenta y que alcanzan a personas bien
definidas.
Como el propósito de la evaluación es tomar decisiones de distinto nivel, la información
que se utilice, los instrumentos para obtenerla, los criterios y las pautas de valoración
dependen, fundamentalmente, del propósito que se quiera cumplir o, dicho de otra manera, de
15
la decisión que se quiera tomar. No hay, por lo tanto, nada de universal en una práctica de
evaluación. En primer lugar, porque las decisiones que se pueden tomar son variables. En
segundo lugar, porque, aunque se pueda establecer una tipología de decisiones posibles, cada
decisión que realmente se toma está definida por el contexto en el que se la toma. Por la
situación específica, los puntos de partida reales, los participantes, etcétera. Con esto se
enfatiza que el problema que resuelve cada proceso de evaluación es singular y requiere una
definición propia. Lo mismo sucede, por otra parte, con los problemas relativos a la
planificación o a la enseñanza interactiva.
PROFUNDIZACIÓN: Jean-Marie De Ketele plantea que, para tomar decisiones
pedagógicas, es importante saber para que se evalúa. Desde esta perspectiva, propone una
tipología de posibles propósitos o funciones de una evaluación o, en otros términos, un
inventario de decisiones pedagógicas al respecto:
Evaluar para certificar: En este caso, se trata de decidir si la persona que evaluamos
posee los conocimientos suficientes para pasar al curso o al ciclo siguientes, o a la vida
profesional, según corresponda. La evaluación debería referirse no a micro-objetivos
intermedios, sino a objetivos globales terminales, es decir, a macro-objetivos que integren
un número importante de objetivos intermedios. Como la certificación es una decisión
dicotómica –el alumno tiene o no tiene la competencia mínima–, es fundamental definir
bien los criterios en los que la decisión se fundará.
Evaluar para clasificar la población: La decisión –explícita o implícita- consiste en
situar a los sujetos unos en relación con los otros: quién es el primero, el segundo, el
último; o qué nota puede atribuirse a cada uno de ellos: sobresaliente, diez, bueno,
suficiente.
Evaluar para hacer el balance de los objetivos intermedios: Es necesario distinguir
dos tipos de evaluación-balance referidas a los objetivos intermedios; en el primer caso,
se trata de decidir si el alumno ha alcanzado los objetivos intermedios requeridos para
poder continuar la secuencia de aprendizaje; en el segundo, de ver en qué medida dio
buenos resultados el aprendizaje concerniente a los objetivos intermedios de
perfeccionamiento. Estos dos tipos de evaluación-balance condicionan las decisiones
correctivas.
16
Evaluar para diagnosticar: Este tipo de evaluación permite tomar un gran número de
decisiones de ajuste o “de regulación”. Se utiliza cuando el balance se ha revelado
insatisfactorio. Puede referirse a producciones, a procedimientos utilizados o a procesos
mentales no directamente observables.
Evaluar para clasificar en subgrupos: Esta decisión implica la determinación de
subgrupos, homogéneos o heterogéneos, según los casos y las necesidades que se hayan
detectado en los alumnos.
Evaluar para seleccionar: Se trata de ordenar los resultados por orden de importancia,
para tomar decisiones sobre ingreso o diferenciación de las personas evaluadas; esto
supone establecer los niveles para establecer la aceptación o derivación.
Evaluar para predecir el éxito: Se trata de una evaluación basada en una investigación
anterior que ha establecido una relación entre predictores y criterios de éxito (por
ejemplo, que los niños que tienen un cociente intelectual superior a 120 en un test
determinado aprenden a leer aun cuando el medio escolar y familiar sean muy
desfavorables); supone la estabilidad de las condiciones en las que se ha observado esa
relación; entonces, debe emplearse el mismo test, en las mismas condiciones de
evaluación, para sujetos con características similares a las de los evaluados (De Ketele,
1984; pp. 30-32).
“¿Quiere usted decir que cada evaluación, cada una, es singular y tiene su forma
propia?”, se preguntará, tal vez, usted. No. Estoy tratando de afirmar que el problema que
resuelve cada evaluación es singular y debe ser encarado de esa manera. Los instrumentos, los
principios y las reglas de procedimiento de las que disponemos son, afortunadamente,
generales. Pueden utilizarse en las situaciones apropiadas y existen instrumentos apropiados
para muchísimas situaciones. Pero, como en tantas otras cuestiones educativas, el problema
básico no está en los instrumentos, sino en definir la ocasión de su utilización. Esto no es
menor en la enseñanza en general, pero sobre todo, cobra importancia en el tema evaluación,
donde la recurrencia a cierto instrumental oscureció, a veces, la deliberación en torno a los
propósitos y a los valores implicados.
Como me preocupa que lo que acabo de decir parezca una crítica al uso de instrumentos
adecuados, trataré de evitar esa interpretación. Se ha desarrollado una buena cantidad de
instrumental probado y efectivo para utilizar en las prácticas evaluativas. El instrumento no
17
resuelve el problema. El problema es el uso que hacemos de él. Ahora bien, los problemas
relativos a evaluación no se resuelven sin el uso del instrumental adecuado. Ya mismo, vamos
a referirnos a eso.
Los instrumentos para obtener información
La obtención de información constituye el aspecto visible de la evaluación para los
alumnos y para el público en general. Es a lo que habitualmente llamamos “evaluación”: un
cuestionario, problemas para resolver, la elaboración de una monografía, un proyecto o un
diseño, un examen escrito de preguntas o de selección múltiple, un examen oral, una
demostración o cualquier otra acción que los alumnos deban realizar. Son maneras que
tenemos para obtener datos. Esos datos nos son necesarios para apreciar algún aspecto del
aprendizaje.
Cualquiera coincidirá en que es necesario que la información represente lo que queremos
evaluar y no otra cosa. Llamamos a eso “validez”. También tendríamos derecho a pretender
que la información tenga algún grado de exactitud o consistencia dentro de los límites del tipo
de información buscada. O sea, que resulte un elemento de cierta constancia para el análisis,
que aprecie bien el tipo de cosas sobre la que queremos información y que varíe lo menos
posible según sean los ojos que observen o los oídos que escuchen. Se llama a esto
“confiabilidad”.
PROFUNDIZACIÓN. Para tratar de modo más claro y detallado los conceptos de validez y
confiabilidad, es aconsejable la lectura de Camilloni, A., “La calidad de los programas de
evaluación y de los instrumentos que los componen”, en Camilloni, Alicia R.W. de, Celman,
Susana, Litwin, Edith y Palou de Maté, María del Carmen. La evaluación de los aprendizajes
en el debate didáctico contemporáneo. Buenos Aires, Paidós, 1998; pp. 76-89.
Para que la información sea adecuada y de buena calidad, es necesario utilizar
instrumentos que reúnan requisitos de validez y de confiabilidad. No cualquier instrumento da
cualquier tipo de información. El tipo de conocimientos y de capacidades que un alumno pone
en juego no es el mismo cuando escribe una monografía que cuando responde a una serie de
preguntas cortas o es entrevistado. Los instrumentos para obtener información sobre el
aprendizaje de los alumnos son como cualquier otro instrumento: sirven para algunas cosas,
pero no para todas y, dentro de las cosas para las que sirven, sirven mejor para algunas que
para otras.
18
“¡Vaya con la novedad!”, estará diciendo usted. Tiene razón. Claro que la tiene. Pero
cuando se observa la variedad de propósitos escolares y la relativa uniformidad de los
instrumentos de evaluación sistemática realmente utilizados, se tiene la impresión de que algo
no está del todo bien. O se evalúan pocas cosas de todo lo que se propone la enseñanza o se
está utilizando información insuficiente.
Concluyo. Es imposible evaluar algo si el instrumental que utilizamos no sirve o es
insuficiente para obtener la información necesaria. También, si el instrumento que utilizamos
es poco confiable. O sea, un instrumento debería reunir los dos atributos. ¿En igual medida?
Como desideratum, sí. Sin embargo, en situaciones reales, esto sucede pocas veces. No
siempre los instrumentos válidos para cierto tipo de propósitos tienen un alto grado de
confiabilidad.
Por ejemplo, una entrevista no estructurada descansa en la atención del entrevistador, en
su capacidad de seguir el curso de la conversación, seleccionar la información relevante,
incluir nuevas preguntas o promover nuevos comentarios. No cuenta, en el momento, con un
registro objetivado (aunque pueda consultarlo después) y su ponderación está sujeta a una
serie muy grande de matices. La posibilidad de que exista constancia en la apreciación de
distintos entrevistadores no es demasiado alta. Sin embargo, en muchas situaciones, la
entrevista puede ser considerada el mejor instrumento para conocer ciertas opiniones,
actitudes o capacidades por parte de una persona. Es válida para eso.
En caso de tensión entre validez y confiabilidad, no dude. Opte por la validez. La razón
es muy sencilla: ¿de qué sirve tener información muy confiable si no es la información
necesaria según los propósitos de esa evaluación? En ese caso, la fórmula sería: es necesario
utilizar los instrumentos con el mayor grado posible de validez y procurar, en ellos, la mayor
confiabilidad posible.
El uso del instrumento adecuado y eficiente para cumplir con los propósitos que tenemos
en mente debería realizarse con dos prevenciones. (Parece que la cosa no termina nunca: una
vuelta para aquí, otra vuelta para allá).
La primera es con respecto a qué se obtiene mediante la utilización de instrumentos para
recolección y análisis de información sobre el aprendizaje. A primera vista, podría decirse que
se obtiene una medida. “¿Una medida? ¿Porqué dice eso?”. Bueno, si ubico la posición actual
de un alumno o grupo de alumnos y la comparo con los objetivos, puede decirse que se está
midiendo: se establece la distancia entre el punto actual y el de llegada. En el caso del balance
final, se mide la diferencia entre lo obtenido y lo propuesto. Y así.
19
Pero la evaluación es más que eso, porque consiste en una apreciación que no se deduce
directamente de la comparación entre información y criterios. La evaluación se inscribe en
una relación social y, como toda relación social, incluye juegos de intereses.
PROFUNDIZACIÓN: Perrenoud sostiene que la evaluación es siempre una representación
construida por alguien. Implica una valoración inscripta en la relación que une a evaluador y
evaluados en el marco de organizaciones complejas incluidas en entornos sociales
específicos. No es posible, según Perrenoud, considerar la evaluación sin tener en cuenta el
conjunto de los vínculos que se establecen entre profesores y alumnos y, a través de ellos,
entre los respectivos grupos de pertenencia. Por otra parte, reconocer el rasgo de relación
social que comporta la evaluación, lleva a aceptar que expresa un juego estratégico de
intereses diferentes (Perrenoud, 1999ª).
Otra de las cuestiones necesarias para elegir instrumentos o definir información necesaria
es lo que Perrenoud denomina “la ilusión de la transferencia”. La transferencia es algo así
como la piedra filosofal en la enseñanza. Si pudiéramos garantizar la transferencia de
conocimientos y competencias, muchos problemas educativos estarían solucionados. Los
conocimientos aprendidos en una situación serían aplicados en diferentes contextos y las
cosas aprendidas de una manera podrían ser utilizadas en otras situaciones con características
diferentes. Pero, hasta ahora, eso no se demostró posible fuera de cierto rango limitado. La
ilusión de la transferencia se verifica muy fuertemente en las prácticas evaluativas: se supone
que los rendimientos en un determinado tipo de prueba muestran una capacidad de otro tipo o
utilizable en otras situaciones. Con información fragmentaria y que toma sólo algunas
dimensiones del aprendizaje, se pretende reconstruir un cuadro completo.
El tipo de información que se necesita y, por lo tanto, el tipo de instrumentos que debería
utilizarse tienen que estar, necesariamente, en función de los propósitos de cada práctica
evaluativa. Ya lo tenía claro Tyler cuando sostenía a fines de los años cuarenta: “Puesto que
la evaluación supone reunir elementos que certifiquen los cambios de conducta de los
estudiantes, todo testimonio válido acerca de las pautas que procuran los objetivos de la
educación constituye un método idóneo de evaluación” (Tyler, 1998/1949, p. 110). O “El
proceso de evaluación comienza con los objetivos del currículo educacional. Dado que el
propósito fundamental consiste en comprobar en qué medida estos objetivos realmente se
cumplen, será necesario contar con procedimientos de evaluación que permitan verificar
todos los tipos de conductas implícitos en cada uno de los objetivos principales de la
educación” (Tyler, 1998/1949, p. 112).
20
La información requerida es sumamente variable y, por lo tanto, debería serlo el
instrumental a utilizar. Con lo dicho hasta aquí, debería alcanzar para sostener esta
afirmación. Pero la realidad es que en las prácticas de enseñanza muchas veces se utiliza el
mismo tipo de información para diferentes momentos y propósitos
PROFUNDIZACIÓN: Grondlund plantea una serie de preguntas que el profesor se formula
y que pueden requerir información adecuada. Todas ellas están, por supuesto conectadas con
decisiones que deben ser tomadas y complementan los tipos de decisiones que se reseñaron en
la página 12. Algunas de esas preguntas son las siguientes: ¿Es realista mi programación para
este grupo de alumnos? ¿Cómo agruparlos para hacer más efectiva la actividad? ¿Están los
alumnos preparados para la siguiente unidad? ¿Dominan los elementos esenciales del curso?
¿Avanzaron más allá de los objetivos mínimos? ¿Cuánto? ¿Qué tipo de dificultades de
aprendizaje tiene estos alumnos? ¿Cuántos alumnos no pueden aprovechar el curso? ¿A que
alumno, o alumnos, debería enviar a orientación? ¿Qué calificación debería dar a cada uno?
¿Fue eficaz mi trabajo? Grondlund, 1973.
Sin embargo, se cuenta con amplia variedad de instrumentos para la obtención de
información sobre el aprendizaje. Este instrumental puede agruparse en tres grandes familias
que se definen por la técnica principal utilizada. Grondlund, en un trabajo clásico, propuso
tres tipos de procedimiento: de prueba, de información sobre las personas y de observación
(Grondlund, 1973).
● Los procedimientos de prueba consisten en tareas que los alumnos deben realizar. Es lo que
usualmente llamamos “prueba” o “examen”.
PROFUNDIZACIÓN: Todos los tipos de consigna de una prueba podrían clasificarse en una
matriz. Por un lado, tenemos las respuestas admitidas. Pueden ser objetivas, si se admite una
respuesta unívoca, como en el caso de elección múltiple y puede ser que las respuestas
posibles sean variables y el análisis admita el juicio subjetivo del profesor, como en el caso de
un ensayo, una pregunta tradicional de respuesta larga o una lección oral. Por otro lado,
tenemos el tipo principal de actividad de los alumnos. Puede ser de producción, cuando la
respuesta debe ser elaborada por el alumno, o pueden ser de selección, cuando éste elige la
respuesta que cree correcta de una serie que le ofrece la propia prueba. Es el caso mencionado
de la selección múltiple, del verdadero o falso o del unir con flechas.
Una prueba puede ser homogénea y recurrir a un solo tipo de ítem de prueba o puede ser
armada de modo heterogéneo y recurrir a consignas de distinto tipo. El lector curioso por el
21
tema encontrará buena bibliografía con descripción de distintos ítems de prueba, de sus
criterios de construcción y de sus utilizaciones recomendadas. Puede verse el completo
trabajo de Jean-Marie De Ketele, Observar para Educar, punto 4 del capítulo 3, “Los
principales tipos de ítems”, páginas 52-80.
● Las entrevistas son instrumentos utilizados en muchas áreas de actividad. En la tarea
escolar, la entrevista puede utilizarse, por ejemplo, cuando se requiere información sobre
actitudes o intereses, ubicación o percepción de un individuo en el grupo (cuando se trata, por
ejemplo de formar equipos de trabajo), nivel general de conocimiento y también en prácticas
de evaluación conjunta de trabajos entre profesor y alumno. Las entrevistas pueden ser
abiertas o recurrir a formatos preestablecidos.
● La observación se utiliza cuando se requiere información sobre un desempeño.
Curiosamente, en nuestras escuelas, se utiliza con más frecuencia en los niveles de la
educación inicial y en los segmentos profesionalizados de la educación, cuando se trata de
evaluar desempeños profesionales. (Esto, sin incluir a la educación deportiva o artística).
2. ¿Usted qué opina? ¿Por qué cree que sucede eso? ¿Entre los propósitos de la escuela básica
y de la escuela media no debería incluirse la capacidad de realizar algunas cosas? ¿No
deberían ser evaluados esos desempeños? Quizás usted podría confeccionar una lista de tareas
que un alumno tendría que saber resolver y que deberían ser evaluadas, observando cómo las
hace. (Desde ya que no se deberían considerar aquí las actividades de “lápiz y papel”).
Por último, queda una importante pregunta: ¿La evaluación constituye una actividad de
tipo diferente o un énfasis diferente en el continuo de la actividad? Seguramente, la respuesta
varíe según sea la función que se enfatice. Por ejemplo, desde el punto de vista de la función
de regulación, su función formativa, la evaluación es un momento de la actividad escolar que
se distingue más por la dramatización de la situación que por las tareas realizadas (Perrenoud,
1999a, p. 41).
Seguramente, las funciones sumativa o certificativa requieran momentos diferenciados. No
es una cuestión de solemnidad. Hace, entre otras cosas, a la mayor transparencia del proceso
cuando se ponen en juego decisiones de orden social.
22
3. Le ofrecimos alguna información sobre instrumentos. Como a Galileo, apenas se los
mostramos. A él le alcanzó para abjurar, pero ése no es el caso en esta ocasión. La variedad es
grande y los grados de sofisticación técnica también lo son. Es cuestión de analizarlos,
experimentar con ellos y ver qué tal funcionan y para qué resultarían adecuados. Pero, sólo de
curiosos, un par de preguntas:
● ¿Usted se verá requerido de realizar evaluaciones en su tarea?
● ¿Qué tipo de instrumentos utilizaría?
● ¿Por qué? ¿Con qué criterios los elige? (Vale decir que son los que tiene más a mano).
● ¿Qué ventajas y desventajas les encuentra,?
● ¿Incorporaría instrumentos que habitualmente no utiliza? ¿Por qué?
Los criterios para valorar
Los instrumentos son el aspecto más visible. Nos permiten obtener información
relevante. Hasta allí el proceso parece encaminarse hacia una descripción del estado de cosas.
En el caso que estamos tratando, consistiría en una descripción del aprendizaje de los
alumnos. Ahora bien, describir no es equivalente a evaluar. Ya sé que lo dije. Pero quiero
enfatizarlo una vez más. Cuando se evalúa no sólo se describe un estado de cosas.
Principalmente, se aprecia, se valora un estado de cosas. Se lo valora en función de un estado
posible o esperado, de un propósito trazado o de un principio de acción. Se lo valora en
función de algún criterio que el evaluador o el sistema de evaluación fijaron. El
establecimiento claro de los propósitos de la evaluación está ligado de manera fundamental
con el establecimiento de los criterios que se utilizarán para valorar la información obtenida y
proponer la base para la toma de decisiones.
Bien, utilizamos criterios para valorar ¿Cuáles? En la tradición sobre evaluación asentada
a partir de los años cincuenta, fueron los objetivos los que se utilizaron como criterio de
evaluación de los aprendizajes. La polémica sobre la formulación y utilización de objetos es
larga y no se entrará aquí en ella. Baste decir que los objetivos son entendidos como
afirmaciones sobre posibles resultados de aprendizaje. Afirmaciones acerca de lo que los
alumnos podrán saber o serán capaces de hacer. La utilización de objetivos como criterios de
evaluación proviene de la clásica obra de Ralph Tyler, Principios Básicos del Currículo.
Para Tyler, la escuela es una institución finalista. Por lo tanto, la evaluación debería
consistir en una comparación permanente entre el punto de partida, la situación de un alumno
23
o grupo de alumnos en un momento del proceso educativo y los puntos esperados de llegada.
El enfoque de la evaluación por objetivos, quedó, luego, estrechamente ligado con la
pedagogía de dominio. Según Tyler, “El proceso de evaluación significa, fundamentalmente,
determinar en qué medida el currículo y la enseñanza satisfacen realmente los objetivos de la
educación. Puesto que los fines educativos consisten esencialmente en cambios que se operan
en los seres humanos, es decir, transformaciones positivas en las formas de conducta del
estudiante, la evaluación es el proceso de determinar en qué medida se consiguieron esos
cambios” (Tyler, 1998/1949, p. 109).
PROFUNDIZACIÓN: La pedagogía de dominio, propuesta a partir de los años cincuenta,
procuraba la individualización para el avance de cada alumno y se basaba en la combinación
de varios elementos. Primero, una adecuada planificación, sistemática y jerarquizada, de los
objetivos de aprendizaje. Segundo, la graduación del nivel de dificultad, provista
principalmente por material instruccional. Por último, una adecuación del ritmo de trabajo y
del tiempo disponible a las capacidades individuales. Se suponía que, de esta manera, la
mayoría de los alumnos estaría en condiciones de alcanzar un nivel aceptable de
cumplimiento de los objetivos.
Al establecer posibles puntos de llegada, los objetivos ofrecen un criterio para apreciar
avances, logros y problemas. Indican una dirección. También ofrecen un medio de comunicar
a los estudiantes y a la comunidad las aspiraciones de un proceso educativo. Podría decirse
que agregan claridad y transparencia.
Me dirá usted que hay importantes aspectos de las actividades educativas que no pueden
establecerse por medio de objetivos, ya que su esencia consiste en que los estudiantes
desarrollen prácticas y alcancen resultados que no pueden ser previstos. Para algunos, como
Stenhouse, precisamente en eso consiste el mayor éxito de un proceso educativo: la
utilización del conocimiento como instrumento de producción (Stenhouse, 1991). Desde ese
punto de vista las actividades educativas más valiosas son las de “final abierto”. Creo que no
hay una contradicción absoluta.
PROFUNDIZACIÓN: Para Stenhouse, la educación cumple cuatro funciones básicas. Lo
dice así: “La educación, tal como la conocemos a partir de las escuelas, incluye,
necesariamente, al menos cuatro procesos distintos. Los designaré como entrenamiento,
instrucción, iniciación e inducción” (Stenhouse, 1991; p.122). El entrenamiento está referido
a la adquisición de capacidades que permitan un desempeño eficaz, como escribir a máquina,
hablar un idioma extranjero o manipular aparatos de laboratorio. La instrucción permite la
24
retención y dominio de información. La iniciación se ocupa de la familiarización con valores
y normas sociales y permite la interpretación de la interacción humana. La inducción permite
la adquisición personal de los sistemas de pensamiento. Da lugar a la comprensión y al uso
productivo de conocimientos.
Digamos que, en general, orientamos las acciones de dos maneras. Una de ellas
corresponde a la realización de un modelo previamente establecido. Su eficacia puede
analizarse por el ajuste del resultado final a ese modelo. Lo utilizamos, habitualmente en la
producción. Otro tipo de acción se orienta, más bien, por un principio de acción. Un
interrogatorio clínico, un juicio, la escritura literaria y la investigación se orientan de esta
manera. En esos casos, contamos con un modelo para actuar más que con un resultado
predefinido para conseguir.
Supongamos que, como profesor, debo seleccionar actividades para mis alumnos y
pienso en criterios como éstos:
● Son preferibles las actividades que permiten a los alumnos interactuar con objetos y
materiales reales.
● Son mejores las actividades que pueden ser cumplidas con éxito por alumnos con
diversos niveles.
● Las actividades elegidas deberían permitir que los estudiantes apliquen principios y
reglas ya aprendidos para la resolución de sus tareas.
● Son preferibles las actividades que... (Usted puede ampliar la lista según su criterio. Yo
adapté algunos del mencionadísimo listado de Raths (tomado de Stenhouse, 1991, p.130).
Si usted analiza la lista, verá que no estoy diciendo qué actividades se deberían elegir.
Sólo estoy dando unos principios para elegirlas. No importa las que sean, es decir, el
resultado final de mi tarea, deberían ajustarse a esos principios. Digamos que esos principios
constituyen, también, los criterios para evaluar la eficacia de mi tarea de selección de
actividades.
Pedimos a los estudiantes que realicen muchas tareas cuyo final puede ser abierto pero
que se ajustan a ciertos principios de procedimiento. Esto es muy evidente en trabajos de
investigación. Las conclusiones pueden ser propias, pero se debe respetar la evidencia
disponible, hay que demostrar que se consideraron conclusiones alternativas, es necesario
mostrar que la información es pertinente, que se analizaron informaciones discrepantes, etc.
Lo mismo puede decirse de tareas de escritura, de producción artística, de análisis, de debates
sobre problemas éticos o sociales. Y la lista puede continuar. Digamos, en este caso, que la
clara definición de los principios de actuación ofrece los criterios.
25
Si se pretende unificar el lenguaje, por supuesto que estos criterios pueden ser
considerados un tipo de objetivos: los alumnos serán capaces de realizar experimentos
sencillos utilizando las reglas del control de variables, por ejemplo.
Pero prefiero no entrar en la polémica. Digamos que los criterios de valoración pueden
estar constituidos por objetivos o por principios sobre el tipo de acción. O, en realidad, por
ambos para distintas cosas. Mi interés es señalar que los criterios tienen que estar claros.
También, que deberían ser comunicables.
Por último, quisiera marcar que, con independencia de los criterios desarrollados, hay
distintas maneras de apreciar la situación de cada alumno en relación con esos criterios. La
misma situación puede ser valorada según diferentes parámetros. Dos de los más usuales son
los que pueden resumirse así: ¿Valorar el rendimiento de un alumno o valorar su esfuerzo?
¿Valorar el nivel alcanzado o valorar el crecimiento en relación con su punto de partida? La
definición de estos parámetros es importante. En cada caso, hay decisiones pedagógicas
implicadas. Yo sólo quería, como en otros casos, dejar planteado el asunto.
4. ¿Qué cree usted? ¿Qué deberíamos valorar más? ¿El rendimiento o el esfuerzo? ¿El nivel
alcanzado o el progreso en relación con un punto de partida?
● ¿Cree que se deberían usar distintos parámetros para distintas situaciones, propósitos o
funciones de la evaluación? Si es así, ¿a qué parámetro recurriría en cada caso y cómo lo
justificaría?
● ¿Se pueden utilizar distintos parámetros para distintos alumnos o para distintos grupos?
¿Por qué?
Bien, espero que la realización de las actividades anteriores dé para pensar. Sólo quiero
agregar que se arma un pequeño lío cuando la valoración se expresa en calificación. Como se
verá en el apartado siguiente, la calificación sintetiza muchas cosas en un solo valor
numérico, alfabético o conceptual ¿Deberían llevar notas equivalentes alumnos cuya
producción fue juzgada con parámetros diferentes?
“¿Por qué hace esta pregunta acá? ¿No es que después venía el tema de la calificación?”,
se dirá usted. Es que me pareció que venía a cuento. Ya está planteada. Ahora vamos por el
resto, que, igualmente, será breve.
26
La calificación
La calificación es la decisión más frecuente que se toma mediante evaluación escolar.
También es una de las decisiones de más importancia en la vida de profesores y de alumnos.
Todos coincidirán en que la calificación es la expresión de una valoración del desempeño de
un alumno. Pero ¿qué expresa exactamente la calificación?
Contra la extendida y temprana pretensión de considerar la calificación como una
medida, hoy es difícil aceptar que las prácticas de evaluación escolar constituyen actos de
medición, si las equipara con otros tipos de medición.
PROFUNDIZACIÓN: Sobre el tema, puede verse en Amiguens y Zerbato-Poudou (1999) el
capítulo VII: “Medir, calificar, evaluar ¿es lo mismo?”.
Las tendencias al rigor metodológico procuraron sistematizar prácticas intuitivas y
subjetivas. Desarrollaron sistemas y dispositivos con la intención de que el resultado
expresado en calificaciones fuera un indicador objetivado de “algo”: una medida precisa de
aprendizaje, desarrollo, inteligencia, capacidad o lo que fuera.
Sin embargo, múltiples investigaciones mostraron la dificultad de la pretensión. Las
calificaciones variaban; las variaciones eran, con mucho, superiores a los márgenes aceptables
de error estadístico; la cantidad de “mediciones” necesarias para utilizar la media como valor
“real” y compensar los márgenes de variabilidad resultaron tan grandes que se volvía
imposible cualquier intento serio de utilizar este método (Amiguens y Zerbato-Poudou, 1999,
pp. 162-163). En conclusión, el modelo de medición difundido en los años treinta y cuarenta,
y utilizado contra las prácticas intuitivas anteriores, no mostró viabilidad ni parecía pertinente
para identificar el tipo de cosa que se hacía al calificar una prueba.
La calificación, a diferencia de una medida, no expresa una dimensión sino un conjunto
variable de dimensiones. Un examen, en ese sentido puede ser evaluado, pero no “(...) en el
sentido de medirlo, sino de apreciarlo en referencia con una escala de valor. (...) La
calificación sería un medio para resumir apreciaciones de naturaleza diferente a fin de
comunicarlas a un alumno” (Amiguens y Zerbato-Poudou, 1999, p. 163).
La calificación es una síntesis de la diversidad de dimensiones que componen un
producto o una actuación. Es un promedio. Por lo tanto, no es demasiado informativa, ya que
poco dice acerca de cómo se compuso ese promedio. Es justamente esa composición la que
expresa las reales capacidades presuntamente evaluadas. En el peor de los casos, la
27
calificación expresa una impresión general, poco apoyada en información fiable y en análisis
sistemático. En el mejor, la calificación expresa la asignación de un valor promedio en un
conjunto posible y, en ese sentido, ofrece una parte, no completa, del análisis que la
evaluación representa.
La calificación, entonces, es una expresión limitada de un rendimiento educativo. Sin
embargo, nos resulta útil, dentro de sus límites, y necesaria. Fundamentalmente, en relación
con la función certificadora de la evaluación. Y esta función mantiene su vigencia en todos
los niveles del sistema de educación escolarizada.
La evaluación educativa y sus resultados no son hechos privados. Forman parte de
prácticas públicas que implican acreditación y comunicación: a los estudiantes, a los padres, a
la comunidad, a autoridades o a instituciones con los cuáles los estudiantes interactuarán en el
futuro.
Con independencia de la discusión sobre su carácter de medida, puede concordarse en
que la calificación expresa valores que se distribuyen según algún tipo de escala. No es lo
mismo un “aprobado-desaprobado”, que una escala conceptual, por letras o numérica. Todo
sistema de calificación recurre a un tipo de escala. Es importante conocer sus fundamentos,
porque las escalas permiten, o impiden, distinto tipo de operaciones entre sus valores. Por
ejemplo, la habitual realización de promedios que forma parte de los requerimientos
administrativos y, en ocasiones, fuerza las escalas en las que están expresadas las
calificaciones (el bien +, por citar un caso). También dejan en evidencia que, cuando se
utilizan escalas ordinales numéricas, el promedio no puede ser interpretado de manera literal:
“4” no quiere decir que el alumno sepa la mitad de “8”. Sobre sistemas de calificación el
lector interesado encontrará trabajos muy informados y no insistiré aquí en ello.
PROFUNDIZACIÓN: Respecto de este tema, puede consultarse, por ejemplo, el claro y
completo trabajo de Alicia Camilloni “Sistemas de calificación y regímenes de promoción”,
En Camilloni, A., Celman, S., Litwin, E. y Palou de Maté, M., La evaluación de los
aprendizajes en el debate didáctico contemporáneo, Buenos Aires, Paidós, 1998.
28
Posibles sesgos en la evaluación
Se constataron una cantidad de efectos sistemáticos que influyen o sesgan la ponderación
de la información que dan las pruebas de los alumnos.
El primer efecto puede llamarse de “normalización”. Parece existir, entre los profesores,
una tendencia a distribuir las notas según una curva normal (el típico “sombrero de Gauss”).
O sea, siempre existe una proporción más o menos pareja de notas buenas, regulares y malas,
sean cuales fueren las características de los exámenes. También parece influir el orden en el
que se corrigen los exámenes: los primeros suelen obtener mejores notas que los últimos en
ser corregidos. Está bastante constatada la existencia de un efecto de “contraste”. Por este
efecto, la calificación otorgada a un trabajo depende, en alguna medida, de la impresión
acerca de los trabajos anteriores. Un trabajo que obtendría una nota mediana en un lote de
trabajos de calidad superior, puede obtener una nota buena si es corregido junto con trabajos
de calidad inferior (Amiguens y Zerbato-Poudou, 1999, pp. 164-165).
De lo anterior se pueden extraer dos conclusiones. La primera es que buena parte de la
actividad de evaluación involucra una comparación entre exámenes o casos que se realiza en
cada práctica de corrección. Esto lleva a una conclusión aun más importante: la evaluación
del trabajo de los alumnos no se realiza mediante la comparación genérica entre conjuntos
de información y criterios objetivos. La evaluación se realiza sobre la base de un modelo de
referencia que el profesor desarrolla.
El modelo de referencia que actúa como patrón personal de evaluación no es
absolutamente fijo. Se reactualiza y estabiliza en cada momento específico de evaluación. En
el inicio de cada tarea evaluativa, algunas informaciones actúan como “anclas” (Amiguens y
Zerbato-Poudou, 1999, p. 165) o puntos de referencia en función de los cuales se activa el
modelo de referencia del profesor. Podría agregarse que este modelo de referencia estaría
conformado tanto por las anclas constituidas durante el primer lote de trabajos corregidos o de
los primeros alumnos entrevistados como por lo que Alicia Camilloni denominó “las
apreciaciones personales del profesor”. Estas apreciaciones constituyen “sesgos” o
desviaciones sistemáticas, influidas por algún tipo de creencia o juicio previo, que actúan
sobre el tipo de información priorizada y sobre la valoración que cada profesor realiza de esa
información.
PROFUNDIZACIÓN: Alicia Camilloni describe distintos sesgos que pueden influir en la
apreciación del profesor. El “efecto de halo” consiste en evaluar un aspecto en función de la
29
impresión personal general sobre el individuo. A la inversa, “la hipótesis de la personalidad
implícita” se basa en algún rasgo que se generaliza a los demás desempeños. También se
verifica como causa de distorsión en las apreciaciones la primacía de la primera impresión o
su contraria, la primacía de la última impresión. También se releva lo que se dio en llamar “la
ecuación personal del profesor”, que sintetiza una tendencia valorativa general personal que
impulsa a ser riguroso o benevolente. Su interesante texto “Las apreciaciones personales del
profesor” no fue publicado y circuló como mimeo.
La función que tenga una práctica evaluativa también modifica los modos de valorar. Lo
jerarquizado cambia. Como señalan Amigues y Zerbato-Poudou, “El trabajo del maestro que
evalúa tareas en su clase no corresponde al del mismo maestro que las califica después de un
examen” (Amiguens y Zerbato-Poudou, 1999, p. 216). Es muy probable que en un examen
con propósitos de certificación se pondere más el nivel. En las calificaciones otorgadas en el
curso de la clase es posible que el esfuerzo o el avance de un alumno sean tenidos en cuenta
con independencia del nivel alcanzado en ese momento.
Hasta ahora se mencionaron sesgos introducidos en la apreciación del evaluador como
efecto de diferentes factores: serie de corrección, tendencia a la normalización, propósitos,
creencias. Es necesario señalar también que el uso de instrumentos también influye en la
producción de los alumnos y, si esto no se tiene en cuenta, se puede distorsionar la
interpretación de los resultados. La cosa es como sigue.
El resultado que se obtiene no es el mismo con independencia de la tarea propuesta. No
es igual redactar un trabajo analizando la emergencia de los procesos conocidos como
Revolución Industrial que seleccionar de una lista cuatro factores que determinaron la
Revolución Industrial, unir con flechas causas y consecuencias o exponer un punto de vista en
un debate sobre esos mismos procesos. Las tareas implicadas en cada caso son diferentes. Lo
que se produce también, aunque se trata del mismo tema.
Los resultados arrojados por distintos instrumentos no pueden ser interpretados como
equivalentes sin más. Primero, por lo ya dicho. Segundo, porque la familiaridad o el
conocimiento del uso del instrumento influye en la capacidad de respuesta de los alumnos. Es
muy sencillo de entender por lo anterior. No es lo mismo si un estudiante está familiarizado
con el tipo de tarea o no. La expresión o el uso del conocimiento no es independiente del
soporte o del contexto. En resumen, el propio instrumento y su dominio introducen un sesgo
que debe ser considerado a la hora de ponderar la información.
Hasta ahora se marcaron algunos sesgos que pueden influir en la apreciación de la
información. ¿Puede eliminarse su influencia? Probablemente, no.
30
PROFUNDIZACIÓN: Se desarrollaron intentos por “objetivizar” de un modo absoluto la
evaluación. O sea, por utilizar recursos que independizaran de la apreciación del profesor la
obtención de información, su análisis y la calificación correspondiente. Estos intentos se
basaron en una combinación de pruebas objetivas y calificación “por norma”. En la
calificación por norma, la calificación correspondiente a cada alumno proviene de la
comparación de su posición en una curva estadística en relación con su grupo de clase. De
esta manera, los resultados controlaban el “factor profesor”, simplemente, por el recurso de
utilizar una distribución como criterio para la asignación de notas. Según sea la franja que
cada individuo ocupe en una curva normal de acuerdo con su puntaje bruto –resultado de los
test objetivos- recibirá una nota –puntaje elaborado.
Este extendido modo de calificar, utilizado en los Estados Unidos, fue criticado por diversos
motivos. No dice nada acerca del cumplimiento de objetivos pedagógicos por parte de los
alumnos. Esto es así porque los contenidos de enseñanza deben ser desagregados para su
medición por métodos objetivos y su ponderación posterior es estadística. Siempre puede
tener en cuenta el memorable caso del alumno que respondió bien todos los ítems de biología
menos los referidos a la célula. Aprobó, aunque desconocía buena parte del fundamento de la
materia. Amiguens y Zerbato-Poudou mencionan el ejemplo de Mager: un alumno que debe
demostrar el procedimiento para preparar café. Realiza bien 9 pasos sobre 10. Pero omite
colocar el filtro. Obtendría un puntaje bruto de 9/10. Pero si se utilizara un criterio
especificado en términos de objetivos la apreciación sería otra: el hecho es que el alumno no
puede resolver la tarea y debería ser calificado en consecuencia (Amiguens y Zerbato-
Poudou, 1999, p.188). La segunda e importante crítica es que, en este método para asignar
calificaciones, se supone que la distribución normal es normal. O sea, que siempre habrá
alumnos que merecen sobresaliente y otros reprobado, y que sus proporciones son
relativamente fijas. O sea, incurre, pese a su “objetividad” en el sesgo de la normalización.
Desde el punto de vista pedagógico no deja de ser cuestionable un criterio de este tipo: se
supone que la intervención pedagógica hace algo que no depende tan intrínsecamente de dotes
de otro tipo. Al menos, pocas pedagogías actualmente importantes lo aceptan. Pero, claro, se
abre otra discusión y esta clase no es el lugar. Tercero, la asignación de calificaciones por
norma estadística alienta procesos competitivos de escaso valor educativo. También
desalienta motivos propios para el desempeño personal: el valor de la producción de un
alumno nunca dependerá de su propio esfuerzo, sino de lo que hagan los demás. Baste, por
ahora.
Quien desee encontrar una clara exposición y crítica de este manera de calificar puede recurrir
al trabajo de Alicia Camilloni, “Sistemas de calificación y regímenes de promoción”, páginas
168 a 172. En el clásico manual de Robert Ebel Fundamentos de la medición educacional,
31
quien se interese en el tema podrá encontrar un sostén de esta manera de calificar. Véase el
capítulo 12, “Calificaciones y sistemas de calificación”.
¿Entonces? ¿Tenemos que asumir que, inevitablemente, distintos sesgos perturbarán
nuestra capacidad de apreciar los resultados de nuestros alumnos? Diría que sí y que no.
Influirán, pero pueden ser controlados y su efecto, minimizado.
Es posible hacerlo por varias vías. La primera es, simplemente, conocerlos. Por lo tanto,
hacerlos pasibles de reflexión cuando se analizan críticamente las propias prácticas
evaluativas. No es ninguna garantía, pero siempre ayuda. Como sucede con el esclarecimiento
de nuestras creencias y valores sobre cualquier asunto. El conocimiento de los supuestos que
actúan sobre nuestras apreciaciones siempre puede ser un factor de importancia para corregir
desviaciones.
También pueden utilizarse recursos técnicos. El primero, y más importante quizás, es la
clarificación de los criterios. Verá que vuelvo una y otra vez sobre el asunto. Como señala De
Ketele: “En principio, la corrección supone que los criterios de corrección estén bien
precisados y, entre ellos, los criterios de dominio mínimo y los criterios de dominio óptimo
total. Los criterios no deben establecerse en el momento de la corrección, sino en el momento
de la determinación de los objetivos y de los ítems de evaluación. No obstante, en el momento
de la corrección pueden aparecer ciertas precisiones suplementarias, sobre todo para los ítems
de producción en los que aparecen muchas formulaciones correctas posibles” (De Ketele,
1984, p. 80).
También pueden controlarse los efectos de orden y contraste modificando el orden en el
que se corrige y se revisa. Por ejemplo, cuando uno trata de constatar si dos pruebas de “seis”
o tres de “ocho” son más o menos equivalentes entre sí. Se puede corregir una pregunta de
cada prueba en un orden y, luego, otra en otro orden. Claro, se necesita realizar al final una
lectura completa de cada examen para tener una imagen de conjunto. La recurrencia a pautas
de corrección o cuadros de corrección, ayuda a revisar cada prueba con un esquema
relativamente equivalente y a sistematizar también la información proveniente del análisis. La
elaboración de estas pautas se basa en una desagregación de los elementos principales que
debería contener la respuesta o de los criterios a los que debería atenerse. Y siempre está el
recurso de la lectura y el comentario por más de un evaluador. Se trata de un mecanismo
difícil de utilizar en las condiciones normales de desempeño docente; sin embargo, es uno de
los recursos más importantes para el esclarecimiento de pautas y el control de posibles sesgos.
Permite, además, una progresiva mejora en las apreciaciones y un incremento de las variables
consideradas, aunque sólo sea por la convergencia de distintas miradas. En muchas ocasiones,
alcanza con el comentario y el debate sobre algunos casos bien elegidos. La discusión sobre
32
esos casos suele sistematizar elementos de importancia y valor para el resto del trabajo y de
otros procesos de evaluación.
PROFUNDIZACIÓN: Jean-Marie De Ketele sugiere el empleo de pautas de corrección que
permitan establecer claramente niveles de dominio e iniciar un diálogo entre el educando y el
educador. Las pautas deben aportar el máximo posible de informaciones pedagógicas, para
facilitar el análisis y la posterior toma de decisiones. A continuación transcribimos una pauta
propuesta por este autor:
Pedro Juan Ana María Etc.
Pregunta 1 (objetivo
15)
M P M: dominio mínimo
P: Dominio de perfeccionamiento
(por ej., 3 criterios/5)
El problema está
planteado
X X X X
X: Criterio aprendido
correctamente
–: Criterio presente pero incorrecto
Blanco: Criterio ausente
Revisión crítica de la
literatura
X X –
Parte metodológica X X –
Definición X X –
Hipótesis X X X –
Ejemplos de encuestas
Estructuración de la
respuesta
– X – –
Pregunta 2 (objetivo
15)
33
Relaciones entre programación, enseñanza y evaluación
Seré breve en esto. Según los manuales, la programación tendría que especificar lo que
debe ser enseñado y la evaluación debería relacionarse con el programa para verificar los
ajustes del resultado de la tarea a lo previsto. Cuando se toma la tradición sucede algo
parecido. Recuerdo una anécdota personal que aconteció durante mi primer año de trabajo
como maestro de escuela primaria. El vicedirector de la escuela me llamó una tarde para tratar
de encarrilarme en el cumplimiento de mis funciones, que, por lo visto, no se encaminaban
como era esperable. Me señaló que él se preciaba de la coincidencia que podía constatarse
entre su planificación anual, la mensual, la semanal, la diaria y el cuaderno de un alumno.
Casi, podría decirse, las pruebas de evaluación se planificaban a partir del programa anual.
Pero el funcionamiento real de los sistemas de enseñanza y de aprendizaje resulta, siempre,
más complejo.
Fijamos nuestras intenciones para la enseñanza en planes de estudio y en programas de
trabajo. El plan de estudios forma parte de las normas legales que organizan la enseñanza en
las escuelas. Ahora bien, nuestros planes suelen adolecer de un defecto. Según Perrenoud,
dicen lo que se debe enseñar, pero no lo que los alumnos deben aprender (Perrenoud, 1999a,
p. 30). Por otra parte, no todo lo que se programa se enseña y no todo lo que se enseña se
evalúa (Perrenoud, 1999a, p. 21). Esto puede ser parte de prácticas mal realizadas. Y también,
una consecuencia de la estructura de la enseñanza y del programa.
Cuando el currículum no define lo que se debe evaluar puede suceder que, como señala
Perrenoud, en muchas ocasiones la evaluación no se ordene en función de objetivos bien
definidos (Perrenoud, 1999a, p. 55). De hecho, quien analice los programas oficiales en
nuestro país, sean del nivel que sean, probablemente encontrará dificultades para saber con
claridad cuáles son las pautas que deberán cumplir los alumnos: ¿Deben dominar todo el
programa? ¿Deben dominar todas las partes por igual? ¿Cuál es el nivel con el que se espera
que dominen eso? ¿Qué tipos de cosas deben saber o qué desempeño deben tener?
Por otra parte, ¿todo lo que se programa para la enseñanza es pasible de ser evaluado? Y
si lo es, ¿para tomar cualquier tipo de decisión? Un caso de este problema es el de los
contenidos que la reforma de los años noventa en la Argentina dio en llamar “actitudinales”.
Identificar este tipo de contenidos tenía, en su origen en la reforma española de los años
ochenta, el sentido de designarlos como objeto de enseñanza y, por lo tanto, incluirlos en la
planificación y en las actividades de la clase. En un curso de capacitación, hace pocos días, un
profesor-alumno preguntó: “¿Deberíamos evaluar los contenidos actitudinales? ¿Cómo lo
haríamos?” Buenas preguntas. Dejo las respuestas a criterio del lector. Las preguntas
34
ejemplifican una zona gris en relación con la evaluación que es bueno dejar señalada: la de su
extensión y la de su relación con la enseñanza y el aprendizaje.
Para algunos, “la evaluación es más determinante que los programas en el desarrollo de
una enseñanza” (Perrenoud, 1999b, p. 101). La afirmación es un poco fuerte pero, seguro,
tiene algo de cierto, porque la evaluación se relaciona con la enseñanza de un modo íntimo.
No solo “comprueba” el alcance. La evaluación forma parte del programa de enseñanza
escrito o no escrito. Normalmente, adquieren prioridad aquellas enseñanzas que promueven
aprendizajes-requisitos para el grado o nivel siguiente. Muchas veces se construye entre los
profesores un contrato tácito de mayor importancia que lo programado. Son los colegas los
que actúan, muchas veces, como una voz y una mirada sobre el propio trabajo. El profesor
anterior es evaluado por la capacidad y el conocimiento de los alumnos que salen de sus
manos. Para los alumnos, las prácticas de evaluación suelen convertirse en el “verdadero
mensaje”, tanto sobre los contenidos como sobre los énfasis en el esfuerzo: establecen una
jerarquía en la tarea de la clase. Es evidente que evaluación y programa forman parte de un
mismo sistema de enmarcamiento y regulación de la enseñanza. Por eso, “más vale reformar
simultáneamente programas y procedimientos de evaluación” (Perrenoud, 1999b, p. 102).
Un último comentario sobre el tema. Se puede constatar una estrecha relación entre
evaluación y currículum en los países que cuentan con fuertes sistemas de exámenes externos.
En esos casos, el examen externo “tira” del contenido del currículum y de las formas de
enseñanza, que tienden a adaptarse a las exigencias por venir. Esta relación está marcada por
la autonomía que estos exámenes alcanzan y por la reducción que, en general, operan sobre
las dimensiones evaluadas.
Dicho esto, debemos reconocer que, en cualquier circunstancia, la evaluación modula el
currículum. No se sugiere que lo reemplaza o que constituye un currículum paralelo. Pero sí
que genera un sistema de jerarquías y énfasis que da forma especial al contenido de la
enseñanza. Se convierten en más importantes los temas evaluados, se vuelven más relevantes
los tipos de producción exigidas. Podría decirse que, así como el profesor crea un modelo
mental de referencia a la hora de evaluar a sus alumnos, los estudiantes crean modelos de
referencia sobre lo que es considerado importante en la clase. Los propios profesores se ven
influidos, en la enseñanza y el énfasis en ciertos contenidos, por las formas de evaluar y por
los temas evaluados que la tradición del establecimiento, el departamento o la cátedra fueron
asentando. Puede agregarse que, cuánto más afirmada está la función de certificación de la
evaluación, más actúa como moduladora del currículum.
La influencia de la evaluación como moduladora del currículum puede ser valorada
como una indeseable desviación de las normas oficiales sobre el contenido escolar. También,
35
como un dispositivo complementario que actualiza esas normas, en la medida en que el
sistema procede de un modo más o menos coherente al respecto. En ese caso, “Los criterios
de evaluación proporcionan a los alumnos, cuando se dan al mismo tiempo que las
instrucciones, informaciones suplementarias acerca de los comportamientos esperados, que
deben permitirles evaluar mejor sus resultados, pero que posteriormente podrán ser utilizados
como señales que les permitan guiar la realización de la tarea y, por consiguiente, tener
mejores resultados” (Amiguens y Zerbato-Poudou, p. 207).
¿Qué hacer con las prácticas de evaluación?
Aunque ya casi llegamos al final, es difícil decirlo en abstracto, porque cada respuesta
depende del problema que se formule. La realidad es que nuestro país no viene de una
tradición evaluadora basada en la medición, la defensa a ultranza de las pruebas objetivas y la
utilización de normas estadísticas para la adjudicación de calificaciones. Tampoco tenemos
sistemas externos de examen que otorguen certificaciones en momentos intermedios o finales
de la educación general o media superior. Sin embargo, lo que leemos sobre evaluación suele
tener origen en países con esas características. También, por supuesto, las críticas.
En principio, no es tanto lo que se conoce sistemáticamente sobre las prácticas de
evaluación escolares. No parece ser un fenómeno local. Los estudios sobre este tema no
fueron desarrollados hasta hace poco tiempo. También es cierto que los nuevos enfoques
didácticos dedicaron a la evaluación muy poco desde el punto de vista propositivo. Quizás,
“porque en la mente de los reformuladores, la evaluación quedó del lado de las obligaciones,
la institución y la tradición de la que querían desembarazarse” (Amiguens y Zerbato-Poudou,
p. 108). Claro que, desde el punto de vista de la mejora de las prácticas educativas, esto no
deja de ser un inconveniente. Sobre todo, cuando cuesta aceptar dimensiones de esas prácticas
como parte de las pedagogías que uno abraza o admira.
Puedo imaginarme este intercambio:
–Creo –afirma el autor de esta clase– que la evaluación refleja, en buena medida, el
aspecto sistémico de la cuestión educativa.
Ya lo escucho decirme:
-Oiga usted, ¡yo no soy sistémico! Soy, para que lo sepa, constructivista. Lo demás, corre
por su cuenta.
36
Entiendo sus aprensiones. Mírelo de esta manera. Digamos que la evaluación por
objetivos refleja la dimensión en la cual el dispositivo puede ser considerado un sistema de
producción dirigido hacia objetivos relativamente definidos, al menos en sus aspectos
generales y aunque admitan diversidad de realizaciones específicas. Y esto, según los niveles
educativos y los propósitos de la educación. Usted y yo coincidiremos en que, cuando se trata
del aprendizaje de actividades bien regladas utilizadas en tareas de importancia social, la
variedad de realizaciones admitidas se reduce en función de la eficacia de la acción, el
cuidado de los usuarios y el cumplimiento del interés social que debe ser servido. Sería muy
claro el ejemplo de cirujanos, pilotos de avión, conductores, enfermeros o técnicos mecánicos
de nivel medio. Si analizamos la educación, también encontramos ejemplos: el dominio de la
lecto-escritura, la capacidad de resolución de problemas matemáticos, el dominio de
información científica, el conocimiento de las reglas de práctica republicana y muchos otros.
Me dirá usted (verá que lo considero un opositor incansable):
-No son esos los propósitos importantes de la educación.
Bueno, normalmente los consideramos bastante importantes. Y, aunque solo sean
instrumentales para el desarrollo de capacidades de orden más general, para el ejercicio de
aptitudes personales o para la promoción del desarrollo individual y colectivo, ¿no es
adecuado saber si estos instrumentos necesarios forman parte del equipaje que nuestra
sociedad, por medio de la escuela, tiene la obligación de proveer a cada nuevo miembro?
¡Ríndase de una vez! Acépteme que hay objetivos especificables y valiosos en toda tarea
educativa y que toda tarea educativa puede ser considerada desde un punto de vista sistémico,
aunque éste no sea el único punto de vista posible. Conceda, al menos, que la tarea educativa
merece ser analizada desde puntos de vista variados, ya que esa es la única manera de lidiar
con la variedad de dimensiones cruzadas en esa práctica.
¿Puede aceptarlo? ¿Diría usted que la evaluación juega un papel importante en la
dimensión sistémica de las prácticas de enseñanza?
Si aceptó eso, continúo. (Vio cómo soy. Desconfíe de las buenas intenciones). Parece
que, también, la evaluación juega un papel de importancia en la regulación del aprendizaje y
de la intervención pedagógica. ¿Qué opina de eso?
Cuando termine de pensar su respuesta, estaremos en condiciones de pasarle la posta.
No sé cómo veía la cuestión al inicio. Pero, ahora:
37
6. ¿Considera que las prácticas evaluativas juegan un rol educativamente valioso en la
enseñanza?
● Si la respuesta es afirmativa, ¿en qué aspectos de la enseñanza resultan importantes?
● ¿Qué requisitos se deberían tener en cuenta para que estas funciones puedan ser cumplidas?
● Las funciones que usted establece ¿son funciones teóricas o realmente pueden llevarse
adelante en situaciones reales de enseñanza?
● ¿Qué límites establecería al cumplimiento de esas funciones y cómo cree que deberían
acomodarse las cosas para que se concrete lo que contestó en los dos primeros puntos?
Bibliografía
Amiguens, R. y Zerbato-Poudou, M., Las prácticas escolares de aprendizaje y evaluación, México,
Fondo de Cultura Económica, 1999.
Camilloni, A., “Sistemas de calificación y regímenes de promoción”, en Camilloni, A., Celman, S.,
Litwin, E. y Palou de Maté, M., La evaluación de los aprendizajes en el debate didáctico
contemporáneo, Buenos Aires, Paidós, 1998.
Camilloni, A., “La calidad de los programas de evaluación y de los instrumentos que los componen”,
en Camilloni, A., Celman, S., Litwin, E. y Palou de Maté, M., La evaluación de los aprendizajes en el
debate didáctico contemporáneo, Buenos Aires, Paidós, 1998. pp. 76-89.
De Ketele, J.-M., Observar para Educar, Madrid, Visor, 1984.
Ebel, R., Fundamentos de la medición educacional, Buenos Aires, Guadalupe, 1977.
Grondlund, N., Medición y evaluación de la enseñanza, México, Pax, 1973.
House, E., “Los enfoques principales”, “Premisas en que se basan los enfoques”, “Crítica de los
enfoques”, en Evaluación, ética y poder, Madrid, Morata, 2000. Reseña Recomendada
Perrenoud, P., Avaliacao. Da Excelencia a Regulaçao das Aprendizagens. Entre duas lógicas, Porto
Alegre, Artes Médicas, 1999ª.
Perrenoud, P., Construir competencias desde la escuela, Santiago de Chile, Dolmen, 1999b.
Perrenoud, Ph., “La evaluación formal de la excelencia escolar” y “De la evaluación intuitiva a la
evaluación formal”, en La construcción del éxito y del fracaso escolar, Madrid, Morata, 1996.
Reseña Recomendada
Stenhouse, L., Investigación y desarrollo del currículum, Madrid, Morata, 1991.
Tyler, R., Principios Básicos del Currículo, Buenos Aires, Troquel, 1998.
Zabalza, M. A., “La evaluación”, en Diseño y desarrollo curricular, Madrid, Narcea, 1997.