FELMAN- Enseñar a Evaluar

1

EENNSSEEÑÑAANNZZAA YY EEVVAALLUUAACCIIÓÓNN

PPOORR DDAANNIIEELL FFEELLDDMMAANN

Seminario dictado on line en el Post-grado Constructivismo y Educación de FLACSO, 2005

¿Para qué cree usted que está la enseñanza?

La evaluación como parte de la acción

Tipos funcionales de evaluación

La evaluación formativa: evaluar para enseñar, evaluar para aprender

Al final, ¿a qué cosa se llama “evaluar”?

Los instrumentos para obtener información

Los criterios para valorar

La calificación

Posibles sesgos en la evaluación

Relaciones entre programación, enseñanza y evaluación

¿Qué hacer con las prácticas de evaluación?

Bibliografía

2

Presentación

La evaluación puede ser tratada en diversas escalas. Algunas de las discusiones que hoy

resultan más álgidas están relacionadas con la existencia de grandes sistemas de evaluación. Esto

puede entenderse si se tiene en cuenta el impacto político, social y financiero de las evaluaciones

estandarizadas y generalizadas. En algunos países, esas evaluaciones actúan como indicador de la

eficacia de la inversión en educación. Los establecimientos pueden ser rankeados y el sistema

educativo es ponderado según los resultados que obtienen los alumnos. Esta importancia dada a la

evaluación estandarizada suele coincidir con la aceptación de prácticas institucionalizadas de

selección y clasificación de recorridos educativos. La evaluación estandarizada adquiere cada vez

más importancia, inclusive en un país como la Argentina, que no desarrolló una particular cultura

de evaluación educativa, en comparación con otros países, como Inglaterra, los Estados Unidos y

Francia.

Muchas cosas pueden ser evaluadas en las actividades educativas: el aprendizaje de los

alumnos, los dispositivos, los métodos o las técnicas de enseñanza, el plan de estudios, materiales,

programas o proyectos, los rendimientos cuantitativos de un sistema, la tarea de los profesores, la

calidad de la gestión institucional. Esas cosas pueden ser evaluadas con distintos propósitos, por

distintas personas y mediante diferentes métodos.

PROFUNDIZACIÓN: En el siguiente cuadro, estructurado en torno de las preguntas por qué, qué

y cómo evaluar, así como quién evalúa, Jean-Marie De Ketele sintetiza rasgos diferenciales de la

evaluación:

3

¿Quién evalúa? De Ketele, 1984.

Auto-evaluación

Hétero-evaluación

● Subordinados

● Iguales

● Autoridades

internas

● Personas

independientes

● Autoridades

externas ¿Qué? (sujeto-objeto)

● Certificar (objetivos terminales globales) ● Alumnos ● Enseñanza ● Objetivos ● Técnicas ● Materiales ● Métodos...

● Clasificar en el interior de una población

(objetivos de perfeccionamiento)

● Examen escrito

Evaluación clásica puntual empírica

● Hacer un balance (objetivos intermedios) ● Entrevista libre (oral clásica)

● Diagnosticar (errores, producto, proceso) ● Test centrado en los objetivos

Evaluación puntual centrada en los

objetivos ● Clasificar en subgrupos ● Entrevista centrada en los objetivos

● Seleccionar ● Análisis de contenido

● Predecir el éxito ● Observación libre

Evaluación durante el proceso ● Descubrir factores ● Observación sistemática

● Orientar (prevenir) ● Observación provocada

¿Por qué? (función: decisión a tomar)

¿Cómo? (técnica)

4

En esta clase, se tratará la evaluación desde un punto de vista más bien restrictivo. Se

priorizará la reflexión sobre la evaluación del aprendizaje en la sala de clases. No quiere decir

que no aparezcan cruzadas las demás dimensiones, sino que el lector notará que, en general,

se estará enfocando el tema desde la mirada del que enseña.

La evaluación siempre fue un tema delicado, ligado con ideas de control y de selección.

En ella se expresa el ejercicio de la autoridad de la escuela y del profesor, y, mirando desde el

otro lado, la presión que reciben los alumnos. La evaluación revela la asimetría del

dispositivo escolar y muestra su carácter, muchas veces arbitrario.

La evaluación tiene, además, varios usos non sanctos, alejados de su función originaria.

Se la usa, por ejemplo, para imponer ritmo de trabajo, mantener el orden, sancionar o mostrar

“quién manda”.

Para el profesor, la evaluación tampoco suele ser uno de los momentos más gratos de la

tarea. Indudablemente, los alumnos no lo ven así; sin embargo, cualquiera con experiencia en

la enseñanza formal recuerda la fatiga de las largas correcciones, el cansancio de leer, una y

otra vez, versiones de lo mismo, la dificultad de avanzar en textos no siempre claros y de

indicar a cada uno lo necesario, de ponderar los aciertos y los errores a la hora de calificar, de

procurar que las notas correspondan al nivel de producción y de no cometer demasiadas

arbitrariedades.

Desde el punto de vista de la vida cotidiana en las aulas y en las escuelas, la evaluación,

salvo raras excepciones, no es el gran momento de la educación ni para los profesores ni para

los alumnos. Incluso, pocas pedagogías asientan la nobleza de sus propósitos en la dimensión

evaluativa.

Dicho todo lo cual, no tendríamos más que remover tan odioso elemento, clarificar las

relaciones escolares y permitir que profesores y alumnos vivan en un mundo de serena

felicidad y comunión. ¿Está usted dispuesto a proponer tal cosa? No será el primero al que se

le ocurra ni estará solo en el intento. Tampoco dejará de tener opiniones en contrario ni de ser

severamente criticado ¿Dirá usted, acaso, que podemos retirar, sin más, la evaluación de las

prácticas educativas sistemáticas? ¿Cualquier resultado le daría a usted igual? ¿Está

proponiendo que firmemos un millonario cheque en blanco y que suceda lo que suceda?

El problema es buscar algún punto a partir del cual tratar la cuestión sin caer en

demasiados prejuicios.

5

1. Digo “‘demasiados’ prejuicios”, porque es imposible abordar estos temas sin imágenes y

construcciones previas: todos tenemos una valoración positiva o negativa de la evaluación.

¿Cuáles son las suyas? ¿Con qué tiene asociada la idea de evaluar? Le sugerimos apuntar esto

como notas.

Desde ahora le adelanto que mi visión no es imparcial y equidistante. No pienso hacer

aquí un repaso de argumentos –aunque me parece una tarea muy valorable. Probablemente

porque me dedico a la didáctica, consideraré la evaluación como una variable importante de

las actividades de enseñanza. Ya conoce mi opinión. Debería dar las razones ahora. Allí

vamos. Mi punto de partida es una pregunta:

¿Para qué cree usted que está la enseñanza?

Propondré algunas posibles respuestas de las que puede haber en circulación: para que

los alumnos obtengan determinados aprendizajes, desarrollen ciertas capacidades, adquieran

ciertos modos de apreciar o de valorar. Solemos expresar este tipo de intenciones en planes de

estudio y en programas. Asumimos, en general, que el mundo adulto tiene algún derecho para

decidir cosas que los jóvenes deberán adquirir para su ingreso en la sociedad.

Éste no es sólo un problema de las escuelas. Toda sociedad conocida estableció

conocimientos, destrezas y disposiciones que los jóvenes debían adquirir durante su

preparación para, luego, formar parte del mundo adulto. Nuestra sociedad realiza esta

preparación en sistemas de gran tamaño. Esto ocurre debido a la complejidad de nuestra vida,

al cúmulo enorme de conocimiento y tecnologías disponibles y a la cantidad creciente de

personas que se incorporan a la vida adulta a partir de esa preparación especializada.

La expresión de nuestras intenciones educativas tiene un sencillo correlato. Si esto es lo

que pretendemos ¿en qué medida lo estamos logrando? Pregúntelo de otra manera:

¿deberíamos tener algún medio al alcance para saber si las importantes intenciones educativas

de las escuelas son realizadas? Si se considera que estas intenciones educativas están

directamente ligadas con el desarrollo del mundo en que vivimos y que no resultan

accidentales, sino centrales para su existencia y mejora, parece casi inevitable dar una

respuesta positiva. Tendríamos así un primer motivo: las acciones de enseñanza tienen tal

importancia social que el hecho de evaluar está vinculado a la importancia otorgada. Pero no

es el único motivo.

6

Podemos tomar las intenciones educativas y considerarlas, ahora, en una escala más

cercana: la de la tarea en la sala de clases. Todo profesor planifica ciertas realizaciones.

Organiza un sistema para que los alumnos puedan producir algo: resolver una tarea, analizar

un problema, organizar información, diseñar un proyecto, comprobar una idea, debatir un

conflicto, establecer relación entre dos series de hechos, comparar casos para buscar

elementos comunes, conocer una teoría, inventar un concepto, obtener datos de libros o

material informativo, organizar un grupo pequeño, realizar obras en diferentes lenguajes. La

lista puede continuar. En cualquier concepción constructivista se aceptará que estas

actividades y producciones permiten, dicho en términos muy generales, que los alumnos

“aprendan algo”.

Tanto desde el punto de vista del profesor como desde el del alumno, es necesario tener

algún conocimiento acerca de la eficacia, el éxito o la pertinencia de las actividades

emprendidas. Como sucede en cualquier proceso de producción. En el caso del profesor, para

organizar su intervención, planificar los cambios y modular la ayuda que preste. En el caso de

la integración del sistema, para asegurarse el cumplimiento de requisitos que el propio

sistema de enseñanza fija y que permiten el paso de los alumnos en los distintos niveles. En el

caso de los alumnos, es necesario porque el conocimiento acerca de la pertinencia y la

dirección de los propios esfuerzos es un elemento de enorme importancia para mantener la

tarea en marcha y realizar las adecuaciones necesarias.

Desde este punto de vista, las actividades de aprendizaje y las de enseñanza forman parte

de acciones productivas. Suelen, en la mayoría de los casos, tener propósitos bastante

definidos y parte de sus resultados puede ser prevista. Si, a veces, no puede ser previsto el

contenido de ese resultado (en el caso de una investigación, un trabajo artístico o un debate),

sí pueden ser establecidos los criterios mediante los cuales puede ser analizado, juzgado y a

partir de los cuales pueden tomarse decisiones a futuro: podría ser que las conclusiones deban

ser revisadas o que la información no sea suficiente para apoyar el análisis o que los

argumentos utilizados no se consideren válidos o que la solución adoptada no contemple

todos los intereses comprometidos. Podría decirse, en resumen, que el resultado puede ser

previsto o que los criterios para analizarlo pueden serlo. En definitiva, que contamos con

algún medio para evaluar las actividades emprendidas.

7

La evaluación como parte de la acción

“¿‘Evaluar’ dijo? ¿Ya volvemos con lo mismo?”, estarán pensando los de la posición

crítica. Acepto que sí. Pero advierta que amplié el contexto. Estoy considerando la evaluación

como un elemento integrante de la acción. Si no, piense cuando decimos: “Ese actuó a tontas

y a locas”, “Se mandó un acting” (si nos ponemos más técnicos y sofisticados) o “No aprende

más: siempre repite lo mismo”. ¿No está en todo esto la idea de que las acciones presentes y

pasadas no son suficientemente ponderadas para poder tomar mejores decisiones en relación

con las acciones futuras?

La consideración del resultado de nuestras acciones forma parte integrante de la propia

acción. Es el elemento que nos permite darles dirección y, si se permite el término, eficacia.

Entre los pedagogos la idea de eficacia quedó muy relacionada con algunas tendencias

pedagógicas, más bien vinculadas a lo que se conoce como “tecnología instruccional”, que, en

nuestros pagos, es identificado como “tecnicismo”. Dicho rápidamente, a mucha gente no le

gusta que le hablen de eficacia. Le resulta un concepto poco educativo. Yo no estoy muy

seguro de que sea así. Los seres humanos procuramos y necesitamos conducir con eficacia

nuestras acciones, simplemente, porque somos seres intencionales. Llamamos “competente”

al que sabe conseguir o resolver los problemas que enfrenta de una manera adecuada y con

una inversión razonable de recursos, energía y tiempo. O sea, al que los resuelve con eficacia.

Por supuesto, hablar de eficacia siempre requiere algún criterio o parámetro sobre la base

del cual juzgar los logros de la acción. Esos parámetros pueden perfectamente ser debatidos y

acordados. Pueden ser establecidos por el propio sujeto, en acuerdo con otros, o aceptados de

otras fuentes a las que se les reconoce legitimidad. En cualquier caso, una vez establecidos,

nos ofrecen una manera de juzgar nuestras acciones y las de otros.

Gran parte de nuestra vida consiste en producir, lograr cosas o alcanzar ciertas metas.

Evaluamos nuestras acciones, entonces, para juzgar su capacidad de alcanzar las metas

propuestas y, de manera muy importante, evaluamos nuestros desempeños para poder dirigir,

modificar o mantener nuestros esfuerzos o, en caso necesario, para volver a planificarlos.

Somos, por esencia, evaluadores: mientras actuamos, obtenemos información, la comparamos

con algunos criterios establecidos, vamos juzgando y tomamos decisiones en consecuencia.

Evaluar es comparable al hecho de fijar nuestra posición en el mapa, cotejarla con la hoja de

ruta y definir los próximos pasos a tomar.

Si lo miramos de esa manera, ¿evaluar sigue siendo un terrible evento educativo?

“Bueno”, me dirá. “Está presentando la cara linda. Me viene usted con el argumento de las

8

funciones y su lugar en las acciones intencionales, y suerte que no me echó encima las teorías

cognitivas con todos los mecanismos de planificación y regulación de la acción. Pero ¿no se

está olvidando usted de las calificaciones y de las aprobaciones y de las desaprobaciones y de

las promociones y de las repeticiones y de todo eso?”

No, no me olvido. Pero tengo mi argumento preparado, como se podrá imaginar. ¿Acaso

no estábamos conversando sobre evaluación?

“Oiga”, pensará, “se conversa entre muchos y yo estaba aquí, lo más tranquilo, y usted

me vino con todo el fárrago ese de la evaluación”.

Bueno, concedido, yo traje el tema. Pero, no me dirá usted que es un tema sin

importancia. Hasta los niños de primer grado hablan ahora del asunto. Pero ésa no es la

cuestión. Le quería decir yo que, si estábamos hablando de evaluación, no veía por qué

comenzaba a disparar con esa cuestión de exámenes, notas y reprobados.

“¿Me está tomado el pelo? ¿No es lo que se hace con la evaluación?”

Ahora veo por dónde va. Esa es una de las cosas que se hacen. Pero está lejos de ser la

única. Técnicamente llamamos a eso “función de certificación”. Si toma en cuenta lo que

expliqué hasta ahora, verá que la evaluación tiene como función principal permitir la toma

fundamentada de decisiones. Para eso, se recurre a información, lo más sistemática posible, y

se realizan ponderaciones o juicios basados en criterios. Una decisión posible puede ser

calificar, aprobar o certificar el cumplimiento de requisitos. Pero otras decisiones, no menos

importantes, pueden consistir en el ajuste de la planificación, la ubicación del grupo antes de

comenzar un curso o la dirección de la actividad de alumnos y profesores durante la tarea. Se

suele llamar a la primera función “diagnóstica” y, a la segunda, “formativa” o “de

regulación”.

Como verá, puede ser que buena parte del problema que aparece con la evaluación tenga

que ver con que el término quedó ligado a una de sus funciones y con algunos de sus métodos

posibles. Vamos a ampliar esa cuestión.

9

Tipos funcionales de evaluación

Permítame una brevísima referencia histórica. El inicio del siglo XX marcó en

educación, como en otras áreas, una fuerte impronta de los enfoques científicos, asociados, en

ese momento, con la medición y la administración racional sobre la base del modelo industrial

imperante. El desarrollo de metodologías de medición social ofreció los instrumentos que

primarán para el análisis del aprendizaje. Se suponía que el rendimiento escolar podía y debía

ser medido. Amiguens y Zerbato-Poudou lo denominan “el período de testing” (Amiguens y

Zerbato-Poudou, 1999, p. 173).

Después veremos algunas cuestiones relacionadas con la medición. El hecho es que, hacia los

años cincuenta, se propone una concepción diferente: la evaluación comienza a ser entendida,

básicamente, como la operación continua de comparar el estado de avance de los alumnos en

relación con los objetivos educacionales convenientemente operativizados. Esta manera de

entender las cosas, basada en la obra de Ralph Tyler, marcó el modo más generalizado de

considerar la evaluación hasta la fecha.

PROFUNDIZACIÓN: Ralph Tyler fue un educador norteamericano de enorme influencia en

el pensamiento educativo de la segunda mitad del siglo XX. Estableció las bases conceptuales

para los modelos de planificación dominantes durante los años 1960 y 1970. Parte de la

capacidad de difusión de su planteo residió en su carácter de mediación y síntesis entre las

ideas de los progresistas y de los eficientistas. Además, su trabajo ofreció un lenguaje claro y

práctico, basado en un esquema de pensamiento razonable y plausible para los profesores y

gestores educativos. Su libro Principios básicos para la elaboración del currículum,

publicado por primera vez en 1949, tuvo un enorme éxito, aunque años después fue

duramente atacado por los reconceptualistas críticos de los setenta. Tyler nunca respondió a

las críticas, argumentando que el propósito de su trabajo era práctico y que solo discutiría con

alternativas prácticas diferentes de la suya.

Hacia los años sesenta, comenzaron a reelaborarse, sofisticarse y, en algunos casos,

criticarse las ideas de evaluación como comparación con objetivos. Se incorporaron nuevas e

importantes ideas sobre tipos y funciones de la evaluación. En ese punto nos quedamos en el

apartado anterior y a él quiero volver.

Lo que aparece en esos años es la distinción entre tipos de evaluación, entre lo que se

denominó “evaluación sumativa” (o “compendiada”) y “evaluación formativa”.

10

Evaluación sumativa Evaluación formativa

Destinada a determinar el resultado total y

final de un curso.

Tiene como propósito mejorar el desarrollo de

las tareas durante el propio curso.

Amiguens y Zerbato-Poudou indican que, para muchos autores, la evaluación formativa

constituía la “parte dinámica de la pedagogía de dominio, desde el momento en que

contribuye activamente para que el mayor número de alumnos logre dominar los objetivos

pedagógicos predeterminados” (Amiguens y Zerbato-Poudou, p.184).

La pedagogía compendiada o sumativa es una evaluación de balance al finalizar una

secuencia de enseñanza. Claro que la duración de esa secuencia es variable y depende del

programa educativo que se considere.

La evaluación sumativa puede ser interna o externa:

Evaluación sumativa interna Evaluación sumativa externa

Consiste en actividades de evaluación

diseñadas y administradas por el profesor

para su clase; es la forma habitual de

evaluación (pruebas o exámenes al finalizar

una unidad o un período escolar)

Es decidida y diseñada por organismos

exteriores al establecimiento y la clase escolar

(con independencia de que los administre el

profesor); los operativos nacionales de

evaluación de la Argentina son un ejemplo.

En ocasiones, la evaluación sumativa externa tiene carácter certificativo y permite

alcanzar alguna credencial o derecho de acceso a niveles superiores de estudio (por ejemplo,

el General Certificate of Education, O level o A level, en Inglaterra; el Baccalauréat, en

Francia y el Vestibular, en el Brasil).

La distinción entre “externo” e “interno” es de la mayor importancia, porque buena parte

de las reflexiones y las críticas sobre el papel de la evaluación en el proceso escolar provienen

de académicos y profesionales que desempeñan sus tareas en países que sostienen fuertes

sistemas de evaluación externa. Como es bien sabido, los sistemas de evaluación externa

tienen influencia directa en los procesos de selección y distribución diferencial de la matrícula

escolar. Expresan, por lo tanto, el poder de asignar de modo desigual recursos sociales. Para

algunos críticos, esta asignación desigual legitima la desigualdad estructural de nuestras

11

sociedades al adjudicarla a categorías, neutrales, de “excelencia”. Además, los sistemas

externos de evaluación tienen un impacto muy apreciable sobre el proceso y las oportunidades

formativas de los alumnos. Esto sucede porque los contenidos y la enseñanza de las escuelas

tienden a acomodarse a los parámetros, requisitos, exigencias y contenidos de los exámenes

externos, con independencia del currículum vigente.

La evaluación certificativa es la que se suele tener en mente cuando despotricamos

contra la evaluación o cuando se realizan importantes críticas a su impacto social y al

ejercicio arbitrario de poder que, para algunos, representa. Todas esas reflexiones pueden ser

razonables. Igualmente, parece necesario reconocer que ésta no deja de ser una función

escolarmente necesaria y habrá que ver cómo arreglarse con ella. Las escuelas, tal como

existen, califican y aprueban. Básicamente, se utiliza la evaluación en el cumplimiento de las

siguientes funciones:

Funciones de la evaluación

● Formativa Regula la acción pedagógica.

● Pronóstica Fundamenta una orientación.

● Diagnóstica Adecua el dispositivo de enseñanza a las capacidades del

grupo o ubica a un grupo o persona según sus capacidades

actuales en el nivel adecuado para un proceso educativo.

● Sumativa o compendiada Realiza un balance final.

● Certificativa Incorpora al balance final un sistema de calificaciones y un

régimen de aprobación y promoción que sostiene la obtención

de certificados (de aprobación de un año escolar, de un curso o

nivel o de un título). Es la forma que mayoritariamente adopta

en los sistemas escolarizados la evaluación sumativa.

● Informativa Provee datos a la comunidad, los padres, organismos

fiscalizadores y demás.

Adaptado de Perrenoud, 1999ª, pp. 56-57.

12

La evaluación formativa: evaluar para enseñar, evaluar para

aprender

De los tipos funcionales de evaluación, la evaluación formativa es la que se encuentra

más estrechamente ligada al desarrollo de las actividades de aprendizaje.

Dicho sea de paso, notará usted, estimado lector, que utilizo la idea de “actividades de

aprendizaje” más que la de “procesos de aprendizaje”. La razón es simple: la enseñanza

promueve determinado tipo de actividad por parte de los alumnos. Esas actividades

constituyen el factor explicativo del aprendizaje. Los alumnos aprenden en función de las

tareas que desarrollan, más allá de si esas tareas tienen manifestación conductual evidente, no

la tienen o ésta es poco perceptible. Tal es el caso, por ejemplo, de un grupo de alumnos que

sigue con atención una charla.

Desde este punto de vista, el conjunto de las acciones de enseñanza tiende a influir en las

actividades de los alumnos. Digamos que las relaciones entre enseñanza y aprendizaje, toman,

desde esta perspectiva, la forma de relaciones entre actividades del profesor y actividades de

los alumnos. Una de las maneras de influir en las tareas de aprender consiste en ofrecer

información y valoración sobre la marcha de esas tareas. Ese modo de influencia en las

actividades de aprendizaje es la evaluación formativa y su función principal es la regulación.

Desde el punto de vista del constructivismo pedagógico, es, evidentemente, la evaluación

formativa la que ha recibido un mayor grado de atención. Claro que sólo es posible cumplir

esta función cabalmente en el marco de una restricción que vale la pena anotar: la evaluación

formativa cumple su rol de reguladora del aprendizaje si se inscribe en el marco de una

pedagogía diferenciada. O sea, de una ayuda pedagógica que se diversifica para adecuarse a la

individualidad del proceso de aprendizaje.

Se puede discutir la escala y el grado de la individualización, pero es indiscutible el

factor personal en la construcción del aprendizaje. También la existencia de distintos estilos,

enfoques o tiempos. Si no se quiere aceptar ninguna diferencia en la calidad de los abordajes

personales para aprender, sí se reconocerán, al menos, la existencia de diferentes necesidades

y ayudas en el proceso de aprender por parte de distintos individuos. Si, en última instancia, el

aprendizaje es individual, la regulación que promueve la evaluación formativa sólo puede

actuar en la medida en que cada aprendiz reciba ayuda adecuada a su necesidad. Éste es el

principio general. La manera de concretarse depende de multitud de factores.

13

Por supuesto, hablar de evaluación formativa es una cosa y asociarla con una pedagogía

diferenciada es otra. Las condiciones del trabajo escolar no son, precisamente, una ayuda en

ese sentido. Veamos un poco más esta cuestión.

Perrenoud propone considerar formativa una práctica de evaluación continua, si el

profesor tiene la intención de contribuir con las tareas de aprendizaje en curso y mejorarlas,

cualquiera sea el grado en que diferencie la enseñanza (Perrenoud, 1999a, p. 78. La cursiva

es mía). El carácter formativo de la evaluación queda, entonces, según Perrenoud, asociado

con el propósito de participar en la regulación del aprendizaje o, dicho más simplemente, de

cooperar con los alumnos en sus actividades de aprendizaje.

Esta cooperación se efectiviza de dos maneras. La primera, adaptando el ritmo y el tipo

de ayuda. La segunda, ofreciendo información a los alumnos acerca de sus tareas, de sus

progresos y de sus dificultades, lo que, en términos sistémicos, se denominaría

“retroalimentación informativa”. La evaluación formativa interviene de manera constante, y

no segmentada, en el aprendizaje. No consiste, sólo, en cortes evaluativos en el proceso de

enseñanza a efectos de utilizar secuencias didácticas de recuperación o remediales.

Se estableció una relación estrecha entre evaluación formativa e intervención

pedagógica; este par es el que actúa en la regulación del aprendizaje. Pero ¿qué tipo de

intervención pedagógica? Quedó claro que alguna que mantenga una tendencia de

diferenciación sin que esto implique, necesariamente, la individualización de la enseñanza. En

mi opinión, debe entenderse como una adecuación de la ayuda a necesidades que no serán

homogéneas pero tampoco totalmente diversas.

Bien, una tendencia a adecuar el tipo de ayuda. ¿Eso es todo? Probablemente sí. Según

Perrenoud, lo formativo reside en su capacidad de ayudar a los alumnos a aprender y no en la

modalidad de evaluación (Perrenoud, 1999a, p. 103). Tampoco cree que se deba asociar con

un tipo especial de intervención pedagógica. Se puede ayudar de muchas maneras a los

alumnos y lo que se debe procurar es una ampliación de las intervenciones.

Al final, ¿a qué cosa se llama “evaluar”?

Ya es tiempo de sistematizar el concepto. Se sostuvo, hace un rato, que la evaluación era

consustancial de toda acción intencional y, por lo tanto, de las tareas de enseñanza. Desde un

punto de vista general, la evaluación forma parte de cualquier actividad de enseñanza. Forma

parte de la pregunta: “¿Cómo van las cosas? ¿Están comprendiendo?” O de las reflexiones:

“Hoy la clase fue buena, pudo notarse en el nivel de las preguntas y en la discusión final, pero

14

¿los que no participaron?” O de las preocupaciones: “Creo que debería disminuir el ritmo”,

“Me parece que este tema precisa más ejercitación”, “Hoy noté muchos errores en la tarea

individual”. O de las “calificaciones”: “Marta mejoró mucho en su rendimiento, se esfuerza y

parece más animada, habría que apoyarla un poco más porque, de seguir así, puede aprobar la

materia”. En todos esos casos, y en muchos más, es posible hablar de “evaluaciones” que

cada docente realiza de forma permanente y de manera informal.

Pero, normalmente, la referencia a la evaluación alude a una dimensión más formalizada.

Nos referimos a evaluación para denominar momentos especiales en los que el propósito

fundamental consiste en realizar “eso”.

Pero, se estará preguntando usted, “¿este sujeto piensa seguir hablando del tema sin

definirlo?”

Creo que hasta ahora nos entendíamos bien sin tanta necesidad de andar definiendo.

Pero, ya que me lo reclama, veamos si podemos ponernos de acuerdo en los siguientes tres

rasgos:

Rasgos de la evaluación

● Incluye obtener información del modo más sistemático posible.

● Supone la valoración de un estado de cosas en relación con criterios establecidos, o sea,

supone algún tipo de juicio basado en la información disponible.

● Su propósito es la toma de decisiones.

La evaluación se diferencia de una actividad descriptiva, porque su propósito principal

no reside en la búsqueda y la organización de información. Su propósito fundamental es la

acción posterior. La información, en sí, no es base para la toma de decisiones. Las decisiones

son tomadas sobre la base de los juicios que se elaboran. Esos juicios o valoraciones se

fundamentan en el análisis de la información disponible con ciertos criterios: objetivos, pautas

de desarrollo, modelos, reglas de procedimiento, principios. En resumen, como señala

Perrenoud, siempre se evalúa para actuar (Perrenoud, 1999a, p. 53). Es necesario considerar

las acciones y decisiones que la evaluación fundamenta y que alcanzan a personas bien

definidas.

Como el propósito de la evaluación es tomar decisiones de distinto nivel, la información

que se utilice, los instrumentos para obtenerla, los criterios y las pautas de valoración

dependen, fundamentalmente, del propósito que se quiera cumplir o, dicho de otra manera, de

15

la decisión que se quiera tomar. No hay, por lo tanto, nada de universal en una práctica de

evaluación. En primer lugar, porque las decisiones que se pueden tomar son variables. En

segundo lugar, porque, aunque se pueda establecer una tipología de decisiones posibles, cada

decisión que realmente se toma está definida por el contexto en el que se la toma. Por la

situación específica, los puntos de partida reales, los participantes, etcétera. Con esto se

enfatiza que el problema que resuelve cada proceso de evaluación es singular y requiere una

definición propia. Lo mismo sucede, por otra parte, con los problemas relativos a la

planificación o a la enseñanza interactiva.

PROFUNDIZACIÓN: Jean-Marie De Ketele plantea que, para tomar decisiones

pedagógicas, es importante saber para que se evalúa. Desde esta perspectiva, propone una

tipología de posibles propósitos o funciones de una evaluación o, en otros términos, un

inventario de decisiones pedagógicas al respecto:

Evaluar para certificar: En este caso, se trata de decidir si la persona que evaluamos

posee los conocimientos suficientes para pasar al curso o al ciclo siguientes, o a la vida

profesional, según corresponda. La evaluación debería referirse no a micro-objetivos

intermedios, sino a objetivos globales terminales, es decir, a macro-objetivos que integren

un número importante de objetivos intermedios. Como la certificación es una decisión

dicotómica –el alumno tiene o no tiene la competencia mínima–, es fundamental definir

bien los criterios en los que la decisión se fundará.

Evaluar para clasificar la población: La decisión –explícita o implícita- consiste en

situar a los sujetos unos en relación con los otros: quién es el primero, el segundo, el

último; o qué nota puede atribuirse a cada uno de ellos: sobresaliente, diez, bueno,

suficiente.

Evaluar para hacer el balance de los objetivos intermedios: Es necesario distinguir

dos tipos de evaluación-balance referidas a los objetivos intermedios; en el primer caso,

se trata de decidir si el alumno ha alcanzado los objetivos intermedios requeridos para

poder continuar la secuencia de aprendizaje; en el segundo, de ver en qué medida dio

buenos resultados el aprendizaje concerniente a los objetivos intermedios de

perfeccionamiento. Estos dos tipos de evaluación-balance condicionan las decisiones

correctivas.

16

Evaluar para diagnosticar: Este tipo de evaluación permite tomar un gran número de

decisiones de ajuste o “de regulación”. Se utiliza cuando el balance se ha revelado

insatisfactorio. Puede referirse a producciones, a procedimientos utilizados o a procesos

mentales no directamente observables.

Evaluar para clasificar en subgrupos: Esta decisión implica la determinación de

subgrupos, homogéneos o heterogéneos, según los casos y las necesidades que se hayan

detectado en los alumnos.

Evaluar para seleccionar: Se trata de ordenar los resultados por orden de importancia,

para tomar decisiones sobre ingreso o diferenciación de las personas evaluadas; esto

supone establecer los niveles para establecer la aceptación o derivación.

Evaluar para predecir el éxito: Se trata de una evaluación basada en una investigación

anterior que ha establecido una relación entre predictores y criterios de éxito (por

ejemplo, que los niños que tienen un cociente intelectual superior a 120 en un test

determinado aprenden a leer aun cuando el medio escolar y familiar sean muy

desfavorables); supone la estabilidad de las condiciones en las que se ha observado esa

relación; entonces, debe emplearse el mismo test, en las mismas condiciones de

evaluación, para sujetos con características similares a las de los evaluados (De Ketele,

1984; pp. 30-32).

“¿Quiere usted decir que cada evaluación, cada una, es singular y tiene su forma

propia?”, se preguntará, tal vez, usted. No. Estoy tratando de afirmar que el problema que

resuelve cada evaluación es singular y debe ser encarado de esa manera. Los instrumentos, los

principios y las reglas de procedimiento de las que disponemos son, afortunadamente,

generales. Pueden utilizarse en las situaciones apropiadas y existen instrumentos apropiados

para muchísimas situaciones. Pero, como en tantas otras cuestiones educativas, el problema

básico no está en los instrumentos, sino en definir la ocasión de su utilización. Esto no es

menor en la enseñanza en general, pero sobre todo, cobra importancia en el tema evaluación,

donde la recurrencia a cierto instrumental oscureció, a veces, la deliberación en torno a los

propósitos y a los valores implicados.

Como me preocupa que lo que acabo de decir parezca una crítica al uso de instrumentos

adecuados, trataré de evitar esa interpretación. Se ha desarrollado una buena cantidad de

instrumental probado y efectivo para utilizar en las prácticas evaluativas. El instrumento no

17

resuelve el problema. El problema es el uso que hacemos de él. Ahora bien, los problemas

relativos a evaluación no se resuelven sin el uso del instrumental adecuado. Ya mismo, vamos

a referirnos a eso.

Los instrumentos para obtener información

La obtención de información constituye el aspecto visible de la evaluación para los

alumnos y para el público en general. Es a lo que habitualmente llamamos “evaluación”: un

cuestionario, problemas para resolver, la elaboración de una monografía, un proyecto o un

diseño, un examen escrito de preguntas o de selección múltiple, un examen oral, una

demostración o cualquier otra acción que los alumnos deban realizar. Son maneras que

tenemos para obtener datos. Esos datos nos son necesarios para apreciar algún aspecto del

aprendizaje.

Cualquiera coincidirá en que es necesario que la información represente lo que queremos

evaluar y no otra cosa. Llamamos a eso “validez”. También tendríamos derecho a pretender

que la información tenga algún grado de exactitud o consistencia dentro de los límites del tipo

de información buscada. O sea, que resulte un elemento de cierta constancia para el análisis,

que aprecie bien el tipo de cosas sobre la que queremos información y que varíe lo menos

posible según sean los ojos que observen o los oídos que escuchen. Se llama a esto

“confiabilidad”.

PROFUNDIZACIÓN. Para tratar de modo más claro y detallado los conceptos de validez y

confiabilidad, es aconsejable la lectura de Camilloni, A., “La calidad de los programas de

evaluación y de los instrumentos que los componen”, en Camilloni, Alicia R.W. de, Celman,

Susana, Litwin, Edith y Palou de Maté, María del Carmen. La evaluación de los aprendizajes

en el debate didáctico contemporáneo. Buenos Aires, Paidós, 1998; pp. 76-89.

Para que la información sea adecuada y de buena calidad, es necesario utilizar

instrumentos que reúnan requisitos de validez y de confiabilidad. No cualquier instrumento da

cualquier tipo de información. El tipo de conocimientos y de capacidades que un alumno pone

en juego no es el mismo cuando escribe una monografía que cuando responde a una serie de

preguntas cortas o es entrevistado. Los instrumentos para obtener información sobre el

aprendizaje de los alumnos son como cualquier otro instrumento: sirven para algunas cosas,

pero no para todas y, dentro de las cosas para las que sirven, sirven mejor para algunas que

para otras.

18

“¡Vaya con la novedad!”, estará diciendo usted. Tiene razón. Claro que la tiene. Pero

cuando se observa la variedad de propósitos escolares y la relativa uniformidad de los

instrumentos de evaluación sistemática realmente utilizados, se tiene la impresión de que algo

no está del todo bien. O se evalúan pocas cosas de todo lo que se propone la enseñanza o se

está utilizando información insuficiente.

Concluyo. Es imposible evaluar algo si el instrumental que utilizamos no sirve o es

insuficiente para obtener la información necesaria. También, si el instrumento que utilizamos

es poco confiable. O sea, un instrumento debería reunir los dos atributos. ¿En igual medida?

Como desideratum, sí. Sin embargo, en situaciones reales, esto sucede pocas veces. No

siempre los instrumentos válidos para cierto tipo de propósitos tienen un alto grado de

confiabilidad.

Por ejemplo, una entrevista no estructurada descansa en la atención del entrevistador, en

su capacidad de seguir el curso de la conversación, seleccionar la información relevante,

incluir nuevas preguntas o promover nuevos comentarios. No cuenta, en el momento, con un

registro objetivado (aunque pueda consultarlo después) y su ponderación está sujeta a una

serie muy grande de matices. La posibilidad de que exista constancia en la apreciación de

distintos entrevistadores no es demasiado alta. Sin embargo, en muchas situaciones, la

entrevista puede ser considerada el mejor instrumento para conocer ciertas opiniones,

actitudes o capacidades por parte de una persona. Es válida para eso.

En caso de tensión entre validez y confiabilidad, no dude. Opte por la validez. La razón

es muy sencilla: ¿de qué sirve tener información muy confiable si no es la información

necesaria según los propósitos de esa evaluación? En ese caso, la fórmula sería: es necesario

utilizar los instrumentos con el mayor grado posible de validez y procurar, en ellos, la mayor

confiabilidad posible.

El uso del instrumento adecuado y eficiente para cumplir con los propósitos que tenemos

en mente debería realizarse con dos prevenciones. (Parece que la cosa no termina nunca: una

vuelta para aquí, otra vuelta para allá).

La primera es con respecto a qué se obtiene mediante la utilización de instrumentos para

recolección y análisis de información sobre el aprendizaje. A primera vista, podría decirse que

se obtiene una medida. “¿Una medida? ¿Porqué dice eso?”. Bueno, si ubico la posición actual

de un alumno o grupo de alumnos y la comparo con los objetivos, puede decirse que se está

midiendo: se establece la distancia entre el punto actual y el de llegada. En el caso del balance

final, se mide la diferencia entre lo obtenido y lo propuesto. Y así.

19

Pero la evaluación es más que eso, porque consiste en una apreciación que no se deduce

directamente de la comparación entre información y criterios. La evaluación se inscribe en

una relación social y, como toda relación social, incluye juegos de intereses.

PROFUNDIZACIÓN: Perrenoud sostiene que la evaluación es siempre una representación

construida por alguien. Implica una valoración inscripta en la relación que une a evaluador y

evaluados en el marco de organizaciones complejas incluidas en entornos sociales

específicos. No es posible, según Perrenoud, considerar la evaluación sin tener en cuenta el

conjunto de los vínculos que se establecen entre profesores y alumnos y, a través de ellos,

entre los respectivos grupos de pertenencia. Por otra parte, reconocer el rasgo de relación

social que comporta la evaluación, lleva a aceptar que expresa un juego estratégico de

intereses diferentes (Perrenoud, 1999ª).

Otra de las cuestiones necesarias para elegir instrumentos o definir información necesaria

es lo que Perrenoud denomina “la ilusión de la transferencia”. La transferencia es algo así

como la piedra filosofal en la enseñanza. Si pudiéramos garantizar la transferencia de

conocimientos y competencias, muchos problemas educativos estarían solucionados. Los

conocimientos aprendidos en una situación serían aplicados en diferentes contextos y las

cosas aprendidas de una manera podrían ser utilizadas en otras situaciones con características

diferentes. Pero, hasta ahora, eso no se demostró posible fuera de cierto rango limitado. La

ilusión de la transferencia se verifica muy fuertemente en las prácticas evaluativas: se supone

que los rendimientos en un determinado tipo de prueba muestran una capacidad de otro tipo o

utilizable en otras situaciones. Con información fragmentaria y que toma sólo algunas

dimensiones del aprendizaje, se pretende reconstruir un cuadro completo.

El tipo de información que se necesita y, por lo tanto, el tipo de instrumentos que debería

utilizarse tienen que estar, necesariamente, en función de los propósitos de cada práctica

evaluativa. Ya lo tenía claro Tyler cuando sostenía a fines de los años cuarenta: “Puesto que

la evaluación supone reunir elementos que certifiquen los cambios de conducta de los

estudiantes, todo testimonio válido acerca de las pautas que procuran los objetivos de la

educación constituye un método idóneo de evaluación” (Tyler, 1998/1949, p. 110). O “El

proceso de evaluación comienza con los objetivos del currículo educacional. Dado que el

propósito fundamental consiste en comprobar en qué medida estos objetivos realmente se

cumplen, será necesario contar con procedimientos de evaluación que permitan verificar

todos los tipos de conductas implícitos en cada uno de los objetivos principales de la

educación” (Tyler, 1998/1949, p. 112).

20

La información requerida es sumamente variable y, por lo tanto, debería serlo el

instrumental a utilizar. Con lo dicho hasta aquí, debería alcanzar para sostener esta

afirmación. Pero la realidad es que en las prácticas de enseñanza muchas veces se utiliza el

mismo tipo de información para diferentes momentos y propósitos

PROFUNDIZACIÓN: Grondlund plantea una serie de preguntas que el profesor se formula

y que pueden requerir información adecuada. Todas ellas están, por supuesto conectadas con

decisiones que deben ser tomadas y complementan los tipos de decisiones que se reseñaron en

la página 12. Algunas de esas preguntas son las siguientes: ¿Es realista mi programación para

este grupo de alumnos? ¿Cómo agruparlos para hacer más efectiva la actividad? ¿Están los

alumnos preparados para la siguiente unidad? ¿Dominan los elementos esenciales del curso?

¿Avanzaron más allá de los objetivos mínimos? ¿Cuánto? ¿Qué tipo de dificultades de

aprendizaje tiene estos alumnos? ¿Cuántos alumnos no pueden aprovechar el curso? ¿A que

alumno, o alumnos, debería enviar a orientación? ¿Qué calificación debería dar a cada uno?

¿Fue eficaz mi trabajo? Grondlund, 1973.

Sin embargo, se cuenta con amplia variedad de instrumentos para la obtención de

información sobre el aprendizaje. Este instrumental puede agruparse en tres grandes familias

que se definen por la técnica principal utilizada. Grondlund, en un trabajo clásico, propuso

tres tipos de procedimiento: de prueba, de información sobre las personas y de observación

(Grondlund, 1973).

● Los procedimientos de prueba consisten en tareas que los alumnos deben realizar. Es lo que

usualmente llamamos “prueba” o “examen”.

PROFUNDIZACIÓN: Todos los tipos de consigna de una prueba podrían clasificarse en una

matriz. Por un lado, tenemos las respuestas admitidas. Pueden ser objetivas, si se admite una

respuesta unívoca, como en el caso de elección múltiple y puede ser que las respuestas

posibles sean variables y el análisis admita el juicio subjetivo del profesor, como en el caso de

un ensayo, una pregunta tradicional de respuesta larga o una lección oral. Por otro lado,

tenemos el tipo principal de actividad de los alumnos. Puede ser de producción, cuando la

respuesta debe ser elaborada por el alumno, o pueden ser de selección, cuando éste elige la

respuesta que cree correcta de una serie que le ofrece la propia prueba. Es el caso mencionado

de la selección múltiple, del verdadero o falso o del unir con flechas.

Una prueba puede ser homogénea y recurrir a un solo tipo de ítem de prueba o puede ser

armada de modo heterogéneo y recurrir a consignas de distinto tipo. El lector curioso por el

21

tema encontrará buena bibliografía con descripción de distintos ítems de prueba, de sus

criterios de construcción y de sus utilizaciones recomendadas. Puede verse el completo

trabajo de Jean-Marie De Ketele, Observar para Educar, punto 4 del capítulo 3, “Los

principales tipos de ítems”, páginas 52-80.

● Las entrevistas son instrumentos utilizados en muchas áreas de actividad. En la tarea

escolar, la entrevista puede utilizarse, por ejemplo, cuando se requiere información sobre

actitudes o intereses, ubicación o percepción de un individuo en el grupo (cuando se trata, por

ejemplo de formar equipos de trabajo), nivel general de conocimiento y también en prácticas

de evaluación conjunta de trabajos entre profesor y alumno. Las entrevistas pueden ser

abiertas o recurrir a formatos preestablecidos.

● La observación se utiliza cuando se requiere información sobre un desempeño.

Curiosamente, en nuestras escuelas, se utiliza con más frecuencia en los niveles de la

educación inicial y en los segmentos profesionalizados de la educación, cuando se trata de

evaluar desempeños profesionales. (Esto, sin incluir a la educación deportiva o artística).

2. ¿Usted qué opina? ¿Por qué cree que sucede eso? ¿Entre los propósitos de la escuela básica

y de la escuela media no debería incluirse la capacidad de realizar algunas cosas? ¿No

deberían ser evaluados esos desempeños? Quizás usted podría confeccionar una lista de tareas

que un alumno tendría que saber resolver y que deberían ser evaluadas, observando cómo las

hace. (Desde ya que no se deberían considerar aquí las actividades de “lápiz y papel”).

Por último, queda una importante pregunta: ¿La evaluación constituye una actividad de

tipo diferente o un énfasis diferente en el continuo de la actividad? Seguramente, la respuesta

varíe según sea la función que se enfatice. Por ejemplo, desde el punto de vista de la función

de regulación, su función formativa, la evaluación es un momento de la actividad escolar que

se distingue más por la dramatización de la situación que por las tareas realizadas (Perrenoud,

1999a, p. 41).

Seguramente, las funciones sumativa o certificativa requieran momentos diferenciados. No

es una cuestión de solemnidad. Hace, entre otras cosas, a la mayor transparencia del proceso

cuando se ponen en juego decisiones de orden social.

22

3. Le ofrecimos alguna información sobre instrumentos. Como a Galileo, apenas se los

mostramos. A él le alcanzó para abjurar, pero ése no es el caso en esta ocasión. La variedad es

grande y los grados de sofisticación técnica también lo son. Es cuestión de analizarlos,

experimentar con ellos y ver qué tal funcionan y para qué resultarían adecuados. Pero, sólo de

curiosos, un par de preguntas:

● ¿Usted se verá requerido de realizar evaluaciones en su tarea?

● ¿Qué tipo de instrumentos utilizaría?

● ¿Por qué? ¿Con qué criterios los elige? (Vale decir que son los que tiene más a mano).

● ¿Qué ventajas y desventajas les encuentra,?

● ¿Incorporaría instrumentos que habitualmente no utiliza? ¿Por qué?

Los criterios para valorar

Los instrumentos son el aspecto más visible. Nos permiten obtener información

relevante. Hasta allí el proceso parece encaminarse hacia una descripción del estado de cosas.

En el caso que estamos tratando, consistiría en una descripción del aprendizaje de los

alumnos. Ahora bien, describir no es equivalente a evaluar. Ya sé que lo dije. Pero quiero

enfatizarlo una vez más. Cuando se evalúa no sólo se describe un estado de cosas.

Principalmente, se aprecia, se valora un estado de cosas. Se lo valora en función de un estado

posible o esperado, de un propósito trazado o de un principio de acción. Se lo valora en

función de algún criterio que el evaluador o el sistema de evaluación fijaron. El

establecimiento claro de los propósitos de la evaluación está ligado de manera fundamental

con el establecimiento de los criterios que se utilizarán para valorar la información obtenida y

proponer la base para la toma de decisiones.

Bien, utilizamos criterios para valorar ¿Cuáles? En la tradición sobre evaluación asentada

a partir de los años cincuenta, fueron los objetivos los que se utilizaron como criterio de

evaluación de los aprendizajes. La polémica sobre la formulación y utilización de objetos es

larga y no se entrará aquí en ella. Baste decir que los objetivos son entendidos como

afirmaciones sobre posibles resultados de aprendizaje. Afirmaciones acerca de lo que los

alumnos podrán saber o serán capaces de hacer. La utilización de objetivos como criterios de

evaluación proviene de la clásica obra de Ralph Tyler, Principios Básicos del Currículo.

Para Tyler, la escuela es una institución finalista. Por lo tanto, la evaluación debería

consistir en una comparación permanente entre el punto de partida, la situación de un alumno

23

o grupo de alumnos en un momento del proceso educativo y los puntos esperados de llegada.

El enfoque de la evaluación por objetivos, quedó, luego, estrechamente ligado con la

pedagogía de dominio. Según Tyler, “El proceso de evaluación significa, fundamentalmente,

determinar en qué medida el currículo y la enseñanza satisfacen realmente los objetivos de la

educación. Puesto que los fines educativos consisten esencialmente en cambios que se operan

en los seres humanos, es decir, transformaciones positivas en las formas de conducta del

estudiante, la evaluación es el proceso de determinar en qué medida se consiguieron esos

cambios” (Tyler, 1998/1949, p. 109).

PROFUNDIZACIÓN: La pedagogía de dominio, propuesta a partir de los años cincuenta,

procuraba la individualización para el avance de cada alumno y se basaba en la combinación

de varios elementos. Primero, una adecuada planificación, sistemática y jerarquizada, de los

objetivos de aprendizaje. Segundo, la graduación del nivel de dificultad, provista

principalmente por material instruccional. Por último, una adecuación del ritmo de trabajo y

del tiempo disponible a las capacidades individuales. Se suponía que, de esta manera, la

mayoría de los alumnos estaría en condiciones de alcanzar un nivel aceptable de

cumplimiento de los objetivos.

Al establecer posibles puntos de llegada, los objetivos ofrecen un criterio para apreciar

avances, logros y problemas. Indican una dirección. También ofrecen un medio de comunicar

a los estudiantes y a la comunidad las aspiraciones de un proceso educativo. Podría decirse

que agregan claridad y transparencia.

Me dirá usted que hay importantes aspectos de las actividades educativas que no pueden

establecerse por medio de objetivos, ya que su esencia consiste en que los estudiantes

desarrollen prácticas y alcancen resultados que no pueden ser previstos. Para algunos, como

Stenhouse, precisamente en eso consiste el mayor éxito de un proceso educativo: la

utilización del conocimiento como instrumento de producción (Stenhouse, 1991). Desde ese

punto de vista las actividades educativas más valiosas son las de “final abierto”. Creo que no

hay una contradicción absoluta.

PROFUNDIZACIÓN: Para Stenhouse, la educación cumple cuatro funciones básicas. Lo

dice así: “La educación, tal como la conocemos a partir de las escuelas, incluye,

necesariamente, al menos cuatro procesos distintos. Los designaré como entrenamiento,

instrucción, iniciación e inducción” (Stenhouse, 1991; p.122). El entrenamiento está referido

a la adquisición de capacidades que permitan un desempeño eficaz, como escribir a máquina,

hablar un idioma extranjero o manipular aparatos de laboratorio. La instrucción permite la

24

retención y dominio de información. La iniciación se ocupa de la familiarización con valores

y normas sociales y permite la interpretación de la interacción humana. La inducción permite

la adquisición personal de los sistemas de pensamiento. Da lugar a la comprensión y al uso

productivo de conocimientos.

Digamos que, en general, orientamos las acciones de dos maneras. Una de ellas

corresponde a la realización de un modelo previamente establecido. Su eficacia puede

analizarse por el ajuste del resultado final a ese modelo. Lo utilizamos, habitualmente en la

producción. Otro tipo de acción se orienta, más bien, por un principio de acción. Un

interrogatorio clínico, un juicio, la escritura literaria y la investigación se orientan de esta

manera. En esos casos, contamos con un modelo para actuar más que con un resultado

predefinido para conseguir.

Supongamos que, como profesor, debo seleccionar actividades para mis alumnos y

pienso en criterios como éstos:

● Son preferibles las actividades que permiten a los alumnos interactuar con objetos y

materiales reales.

● Son mejores las actividades que pueden ser cumplidas con éxito por alumnos con

diversos niveles.

● Las actividades elegidas deberían permitir que los estudiantes apliquen principios y

reglas ya aprendidos para la resolución de sus tareas.

● Son preferibles las actividades que... (Usted puede ampliar la lista según su criterio. Yo

adapté algunos del mencionadísimo listado de Raths (tomado de Stenhouse, 1991, p.130).

Si usted analiza la lista, verá que no estoy diciendo qué actividades se deberían elegir.

Sólo estoy dando unos principios para elegirlas. No importa las que sean, es decir, el

resultado final de mi tarea, deberían ajustarse a esos principios. Digamos que esos principios

constituyen, también, los criterios para evaluar la eficacia de mi tarea de selección de

actividades.

Pedimos a los estudiantes que realicen muchas tareas cuyo final puede ser abierto pero

que se ajustan a ciertos principios de procedimiento. Esto es muy evidente en trabajos de

investigación. Las conclusiones pueden ser propias, pero se debe respetar la evidencia

disponible, hay que demostrar que se consideraron conclusiones alternativas, es necesario

mostrar que la información es pertinente, que se analizaron informaciones discrepantes, etc.

Lo mismo puede decirse de tareas de escritura, de producción artística, de análisis, de debates

sobre problemas éticos o sociales. Y la lista puede continuar. Digamos, en este caso, que la

clara definición de los principios de actuación ofrece los criterios.

25

Si se pretende unificar el lenguaje, por supuesto que estos criterios pueden ser

considerados un tipo de objetivos: los alumnos serán capaces de realizar experimentos

sencillos utilizando las reglas del control de variables, por ejemplo.

Pero prefiero no entrar en la polémica. Digamos que los criterios de valoración pueden

estar constituidos por objetivos o por principios sobre el tipo de acción. O, en realidad, por

ambos para distintas cosas. Mi interés es señalar que los criterios tienen que estar claros.

También, que deberían ser comunicables.

Por último, quisiera marcar que, con independencia de los criterios desarrollados, hay

distintas maneras de apreciar la situación de cada alumno en relación con esos criterios. La

misma situación puede ser valorada según diferentes parámetros. Dos de los más usuales son

los que pueden resumirse así: ¿Valorar el rendimiento de un alumno o valorar su esfuerzo?

¿Valorar el nivel alcanzado o valorar el crecimiento en relación con su punto de partida? La

definición de estos parámetros es importante. En cada caso, hay decisiones pedagógicas

implicadas. Yo sólo quería, como en otros casos, dejar planteado el asunto.

4. ¿Qué cree usted? ¿Qué deberíamos valorar más? ¿El rendimiento o el esfuerzo? ¿El nivel

alcanzado o el progreso en relación con un punto de partida?

● ¿Cree que se deberían usar distintos parámetros para distintas situaciones, propósitos o

funciones de la evaluación? Si es así, ¿a qué parámetro recurriría en cada caso y cómo lo

justificaría?

● ¿Se pueden utilizar distintos parámetros para distintos alumnos o para distintos grupos?

¿Por qué?

Bien, espero que la realización de las actividades anteriores dé para pensar. Sólo quiero

agregar que se arma un pequeño lío cuando la valoración se expresa en calificación. Como se

verá en el apartado siguiente, la calificación sintetiza muchas cosas en un solo valor

numérico, alfabético o conceptual ¿Deberían llevar notas equivalentes alumnos cuya

producción fue juzgada con parámetros diferentes?

“¿Por qué hace esta pregunta acá? ¿No es que después venía el tema de la calificación?”,

se dirá usted. Es que me pareció que venía a cuento. Ya está planteada. Ahora vamos por el

resto, que, igualmente, será breve.

26

La calificación

La calificación es la decisión más frecuente que se toma mediante evaluación escolar.

También es una de las decisiones de más importancia en la vida de profesores y de alumnos.

Todos coincidirán en que la calificación es la expresión de una valoración del desempeño de

un alumno. Pero ¿qué expresa exactamente la calificación?

Contra la extendida y temprana pretensión de considerar la calificación como una

medida, hoy es difícil aceptar que las prácticas de evaluación escolar constituyen actos de

medición, si las equipara con otros tipos de medición.

PROFUNDIZACIÓN: Sobre el tema, puede verse en Amiguens y Zerbato-Poudou (1999) el

capítulo VII: “Medir, calificar, evaluar ¿es lo mismo?”.

Las tendencias al rigor metodológico procuraron sistematizar prácticas intuitivas y

subjetivas. Desarrollaron sistemas y dispositivos con la intención de que el resultado

expresado en calificaciones fuera un indicador objetivado de “algo”: una medida precisa de

aprendizaje, desarrollo, inteligencia, capacidad o lo que fuera.

Sin embargo, múltiples investigaciones mostraron la dificultad de la pretensión. Las

calificaciones variaban; las variaciones eran, con mucho, superiores a los márgenes aceptables

de error estadístico; la cantidad de “mediciones” necesarias para utilizar la media como valor

“real” y compensar los márgenes de variabilidad resultaron tan grandes que se volvía

imposible cualquier intento serio de utilizar este método (Amiguens y Zerbato-Poudou, 1999,

pp. 162-163). En conclusión, el modelo de medición difundido en los años treinta y cuarenta,

y utilizado contra las prácticas intuitivas anteriores, no mostró viabilidad ni parecía pertinente

para identificar el tipo de cosa que se hacía al calificar una prueba.

La calificación, a diferencia de una medida, no expresa una dimensión sino un conjunto

variable de dimensiones. Un examen, en ese sentido puede ser evaluado, pero no “(...) en el

sentido de medirlo, sino de apreciarlo en referencia con una escala de valor. (...) La

calificación sería un medio para resumir apreciaciones de naturaleza diferente a fin de

comunicarlas a un alumno” (Amiguens y Zerbato-Poudou, 1999, p. 163).

La calificación es una síntesis de la diversidad de dimensiones que componen un

producto o una actuación. Es un promedio. Por lo tanto, no es demasiado informativa, ya que

poco dice acerca de cómo se compuso ese promedio. Es justamente esa composición la que

expresa las reales capacidades presuntamente evaluadas. En el peor de los casos, la

27

calificación expresa una impresión general, poco apoyada en información fiable y en análisis

sistemático. En el mejor, la calificación expresa la asignación de un valor promedio en un

conjunto posible y, en ese sentido, ofrece una parte, no completa, del análisis que la

evaluación representa.

La calificación, entonces, es una expresión limitada de un rendimiento educativo. Sin

embargo, nos resulta útil, dentro de sus límites, y necesaria. Fundamentalmente, en relación

con la función certificadora de la evaluación. Y esta función mantiene su vigencia en todos

los niveles del sistema de educación escolarizada.

La evaluación educativa y sus resultados no son hechos privados. Forman parte de

prácticas públicas que implican acreditación y comunicación: a los estudiantes, a los padres, a

la comunidad, a autoridades o a instituciones con los cuáles los estudiantes interactuarán en el

futuro.

Con independencia de la discusión sobre su carácter de medida, puede concordarse en

que la calificación expresa valores que se distribuyen según algún tipo de escala. No es lo

mismo un “aprobado-desaprobado”, que una escala conceptual, por letras o numérica. Todo

sistema de calificación recurre a un tipo de escala. Es importante conocer sus fundamentos,

porque las escalas permiten, o impiden, distinto tipo de operaciones entre sus valores. Por

ejemplo, la habitual realización de promedios que forma parte de los requerimientos

administrativos y, en ocasiones, fuerza las escalas en las que están expresadas las

calificaciones (el bien +, por citar un caso). También dejan en evidencia que, cuando se

utilizan escalas ordinales numéricas, el promedio no puede ser interpretado de manera literal:

“4” no quiere decir que el alumno sepa la mitad de “8”. Sobre sistemas de calificación el

lector interesado encontrará trabajos muy informados y no insistiré aquí en ello.

PROFUNDIZACIÓN: Respecto de este tema, puede consultarse, por ejemplo, el claro y

completo trabajo de Alicia Camilloni “Sistemas de calificación y regímenes de promoción”,

En Camilloni, A., Celman, S., Litwin, E. y Palou de Maté, M., La evaluación de los

aprendizajes en el debate didáctico contemporáneo, Buenos Aires, Paidós, 1998.

28

Posibles sesgos en la evaluación

Se constataron una cantidad de efectos sistemáticos que influyen o sesgan la ponderación

de la información que dan las pruebas de los alumnos.

El primer efecto puede llamarse de “normalización”. Parece existir, entre los profesores,

una tendencia a distribuir las notas según una curva normal (el típico “sombrero de Gauss”).

O sea, siempre existe una proporción más o menos pareja de notas buenas, regulares y malas,

sean cuales fueren las características de los exámenes. También parece influir el orden en el

que se corrigen los exámenes: los primeros suelen obtener mejores notas que los últimos en

ser corregidos. Está bastante constatada la existencia de un efecto de “contraste”. Por este

efecto, la calificación otorgada a un trabajo depende, en alguna medida, de la impresión

acerca de los trabajos anteriores. Un trabajo que obtendría una nota mediana en un lote de

trabajos de calidad superior, puede obtener una nota buena si es corregido junto con trabajos

de calidad inferior (Amiguens y Zerbato-Poudou, 1999, pp. 164-165).

De lo anterior se pueden extraer dos conclusiones. La primera es que buena parte de la

actividad de evaluación involucra una comparación entre exámenes o casos que se realiza en

cada práctica de corrección. Esto lleva a una conclusión aun más importante: la evaluación

del trabajo de los alumnos no se realiza mediante la comparación genérica entre conjuntos

de información y criterios objetivos. La evaluación se realiza sobre la base de un modelo de

referencia que el profesor desarrolla.

El modelo de referencia que actúa como patrón personal de evaluación no es

absolutamente fijo. Se reactualiza y estabiliza en cada momento específico de evaluación. En

el inicio de cada tarea evaluativa, algunas informaciones actúan como “anclas” (Amiguens y

Zerbato-Poudou, 1999, p. 165) o puntos de referencia en función de los cuales se activa el

modelo de referencia del profesor. Podría agregarse que este modelo de referencia estaría

conformado tanto por las anclas constituidas durante el primer lote de trabajos corregidos o de

los primeros alumnos entrevistados como por lo que Alicia Camilloni denominó “las

apreciaciones personales del profesor”. Estas apreciaciones constituyen “sesgos” o

desviaciones sistemáticas, influidas por algún tipo de creencia o juicio previo, que actúan

sobre el tipo de información priorizada y sobre la valoración que cada profesor realiza de esa

información.

PROFUNDIZACIÓN: Alicia Camilloni describe distintos sesgos que pueden influir en la

apreciación del profesor. El “efecto de halo” consiste en evaluar un aspecto en función de la

29

impresión personal general sobre el individuo. A la inversa, “la hipótesis de la personalidad

implícita” se basa en algún rasgo que se generaliza a los demás desempeños. También se

verifica como causa de distorsión en las apreciaciones la primacía de la primera impresión o

su contraria, la primacía de la última impresión. También se releva lo que se dio en llamar “la

ecuación personal del profesor”, que sintetiza una tendencia valorativa general personal que

impulsa a ser riguroso o benevolente. Su interesante texto “Las apreciaciones personales del

profesor” no fue publicado y circuló como mimeo.

La función que tenga una práctica evaluativa también modifica los modos de valorar. Lo

jerarquizado cambia. Como señalan Amigues y Zerbato-Poudou, “El trabajo del maestro que

evalúa tareas en su clase no corresponde al del mismo maestro que las califica después de un

examen” (Amiguens y Zerbato-Poudou, 1999, p. 216). Es muy probable que en un examen

con propósitos de certificación se pondere más el nivel. En las calificaciones otorgadas en el

curso de la clase es posible que el esfuerzo o el avance de un alumno sean tenidos en cuenta

con independencia del nivel alcanzado en ese momento.

Hasta ahora se mencionaron sesgos introducidos en la apreciación del evaluador como

efecto de diferentes factores: serie de corrección, tendencia a la normalización, propósitos,

creencias. Es necesario señalar también que el uso de instrumentos también influye en la

producción de los alumnos y, si esto no se tiene en cuenta, se puede distorsionar la

interpretación de los resultados. La cosa es como sigue.

El resultado que se obtiene no es el mismo con independencia de la tarea propuesta. No

es igual redactar un trabajo analizando la emergencia de los procesos conocidos como

Revolución Industrial que seleccionar de una lista cuatro factores que determinaron la

Revolución Industrial, unir con flechas causas y consecuencias o exponer un punto de vista en

un debate sobre esos mismos procesos. Las tareas implicadas en cada caso son diferentes. Lo

que se produce también, aunque se trata del mismo tema.

Los resultados arrojados por distintos instrumentos no pueden ser interpretados como

equivalentes sin más. Primero, por lo ya dicho. Segundo, porque la familiaridad o el

conocimiento del uso del instrumento influye en la capacidad de respuesta de los alumnos. Es

muy sencillo de entender por lo anterior. No es lo mismo si un estudiante está familiarizado

con el tipo de tarea o no. La expresión o el uso del conocimiento no es independiente del

soporte o del contexto. En resumen, el propio instrumento y su dominio introducen un sesgo

que debe ser considerado a la hora de ponderar la información.

Hasta ahora se marcaron algunos sesgos que pueden influir en la apreciación de la

información. ¿Puede eliminarse su influencia? Probablemente, no.

30

PROFUNDIZACIÓN: Se desarrollaron intentos por “objetivizar” de un modo absoluto la

evaluación. O sea, por utilizar recursos que independizaran de la apreciación del profesor la

obtención de información, su análisis y la calificación correspondiente. Estos intentos se

basaron en una combinación de pruebas objetivas y calificación “por norma”. En la

calificación por norma, la calificación correspondiente a cada alumno proviene de la

comparación de su posición en una curva estadística en relación con su grupo de clase. De

esta manera, los resultados controlaban el “factor profesor”, simplemente, por el recurso de

utilizar una distribución como criterio para la asignación de notas. Según sea la franja que

cada individuo ocupe en una curva normal de acuerdo con su puntaje bruto –resultado de los

test objetivos- recibirá una nota –puntaje elaborado.

Este extendido modo de calificar, utilizado en los Estados Unidos, fue criticado por diversos

motivos. No dice nada acerca del cumplimiento de objetivos pedagógicos por parte de los

alumnos. Esto es así porque los contenidos de enseñanza deben ser desagregados para su

medición por métodos objetivos y su ponderación posterior es estadística. Siempre puede

tener en cuenta el memorable caso del alumno que respondió bien todos los ítems de biología

menos los referidos a la célula. Aprobó, aunque desconocía buena parte del fundamento de la

materia. Amiguens y Zerbato-Poudou mencionan el ejemplo de Mager: un alumno que debe

demostrar el procedimiento para preparar café. Realiza bien 9 pasos sobre 10. Pero omite

colocar el filtro. Obtendría un puntaje bruto de 9/10. Pero si se utilizara un criterio

especificado en términos de objetivos la apreciación sería otra: el hecho es que el alumno no

puede resolver la tarea y debería ser calificado en consecuencia (Amiguens y Zerbato-

Poudou, 1999, p.188). La segunda e importante crítica es que, en este método para asignar

calificaciones, se supone que la distribución normal es normal. O sea, que siempre habrá

alumnos que merecen sobresaliente y otros reprobado, y que sus proporciones son

relativamente fijas. O sea, incurre, pese a su “objetividad” en el sesgo de la normalización.

Desde el punto de vista pedagógico no deja de ser cuestionable un criterio de este tipo: se

supone que la intervención pedagógica hace algo que no depende tan intrínsecamente de dotes

de otro tipo. Al menos, pocas pedagogías actualmente importantes lo aceptan. Pero, claro, se

abre otra discusión y esta clase no es el lugar. Tercero, la asignación de calificaciones por

norma estadística alienta procesos competitivos de escaso valor educativo. También

desalienta motivos propios para el desempeño personal: el valor de la producción de un

alumno nunca dependerá de su propio esfuerzo, sino de lo que hagan los demás. Baste, por

ahora.

Quien desee encontrar una clara exposición y crítica de este manera de calificar puede recurrir

al trabajo de Alicia Camilloni, “Sistemas de calificación y regímenes de promoción”, páginas

168 a 172. En el clásico manual de Robert Ebel Fundamentos de la medición educacional,

31

quien se interese en el tema podrá encontrar un sostén de esta manera de calificar. Véase el

capítulo 12, “Calificaciones y sistemas de calificación”.

¿Entonces? ¿Tenemos que asumir que, inevitablemente, distintos sesgos perturbarán

nuestra capacidad de apreciar los resultados de nuestros alumnos? Diría que sí y que no.

Influirán, pero pueden ser controlados y su efecto, minimizado.

Es posible hacerlo por varias vías. La primera es, simplemente, conocerlos. Por lo tanto,

hacerlos pasibles de reflexión cuando se analizan críticamente las propias prácticas

evaluativas. No es ninguna garantía, pero siempre ayuda. Como sucede con el esclarecimiento

de nuestras creencias y valores sobre cualquier asunto. El conocimiento de los supuestos que

actúan sobre nuestras apreciaciones siempre puede ser un factor de importancia para corregir

desviaciones.

También pueden utilizarse recursos técnicos. El primero, y más importante quizás, es la

clarificación de los criterios. Verá que vuelvo una y otra vez sobre el asunto. Como señala De

Ketele: “En principio, la corrección supone que los criterios de corrección estén bien

precisados y, entre ellos, los criterios de dominio mínimo y los criterios de dominio óptimo

total. Los criterios no deben establecerse en el momento de la corrección, sino en el momento

de la determinación de los objetivos y de los ítems de evaluación. No obstante, en el momento

de la corrección pueden aparecer ciertas precisiones suplementarias, sobre todo para los ítems

de producción en los que aparecen muchas formulaciones correctas posibles” (De Ketele,

1984, p. 80).

También pueden controlarse los efectos de orden y contraste modificando el orden en el

que se corrige y se revisa. Por ejemplo, cuando uno trata de constatar si dos pruebas de “seis”

o tres de “ocho” son más o menos equivalentes entre sí. Se puede corregir una pregunta de

cada prueba en un orden y, luego, otra en otro orden. Claro, se necesita realizar al final una

lectura completa de cada examen para tener una imagen de conjunto. La recurrencia a pautas

de corrección o cuadros de corrección, ayuda a revisar cada prueba con un esquema

relativamente equivalente y a sistematizar también la información proveniente del análisis. La

elaboración de estas pautas se basa en una desagregación de los elementos principales que

debería contener la respuesta o de los criterios a los que debería atenerse. Y siempre está el

recurso de la lectura y el comentario por más de un evaluador. Se trata de un mecanismo

difícil de utilizar en las condiciones normales de desempeño docente; sin embargo, es uno de

los recursos más importantes para el esclarecimiento de pautas y el control de posibles sesgos.

Permite, además, una progresiva mejora en las apreciaciones y un incremento de las variables

consideradas, aunque sólo sea por la convergencia de distintas miradas. En muchas ocasiones,

alcanza con el comentario y el debate sobre algunos casos bien elegidos. La discusión sobre

32

esos casos suele sistematizar elementos de importancia y valor para el resto del trabajo y de

otros procesos de evaluación.

PROFUNDIZACIÓN: Jean-Marie De Ketele sugiere el empleo de pautas de corrección que

permitan establecer claramente niveles de dominio e iniciar un diálogo entre el educando y el

educador. Las pautas deben aportar el máximo posible de informaciones pedagógicas, para

facilitar el análisis y la posterior toma de decisiones. A continuación transcribimos una pauta

propuesta por este autor:

Pedro Juan Ana María Etc.

Pregunta 1 (objetivo

15)

M P M: dominio mínimo

P: Dominio de perfeccionamiento

(por ej., 3 criterios/5)

El problema está

planteado

X X X X

X: Criterio aprendido

correctamente

–: Criterio presente pero incorrecto

Blanco: Criterio ausente

Revisión crítica de la

literatura

X X –

Parte metodológica X X –

Definición X X –

Hipótesis X X X –

Ejemplos de encuestas

Estructuración de la

respuesta

– X – –

Pregunta 2 (objetivo

15)

33

Relaciones entre programación, enseñanza y evaluación

Seré breve en esto. Según los manuales, la programación tendría que especificar lo que

debe ser enseñado y la evaluación debería relacionarse con el programa para verificar los

ajustes del resultado de la tarea a lo previsto. Cuando se toma la tradición sucede algo

parecido. Recuerdo una anécdota personal que aconteció durante mi primer año de trabajo

como maestro de escuela primaria. El vicedirector de la escuela me llamó una tarde para tratar

de encarrilarme en el cumplimiento de mis funciones, que, por lo visto, no se encaminaban

como era esperable. Me señaló que él se preciaba de la coincidencia que podía constatarse

entre su planificación anual, la mensual, la semanal, la diaria y el cuaderno de un alumno.

Casi, podría decirse, las pruebas de evaluación se planificaban a partir del programa anual.

Pero el funcionamiento real de los sistemas de enseñanza y de aprendizaje resulta, siempre,

más complejo.

Fijamos nuestras intenciones para la enseñanza en planes de estudio y en programas de

trabajo. El plan de estudios forma parte de las normas legales que organizan la enseñanza en

las escuelas. Ahora bien, nuestros planes suelen adolecer de un defecto. Según Perrenoud,

dicen lo que se debe enseñar, pero no lo que los alumnos deben aprender (Perrenoud, 1999a,

p. 30). Por otra parte, no todo lo que se programa se enseña y no todo lo que se enseña se

evalúa (Perrenoud, 1999a, p. 21). Esto puede ser parte de prácticas mal realizadas. Y también,

una consecuencia de la estructura de la enseñanza y del programa.

Cuando el currículum no define lo que se debe evaluar puede suceder que, como señala

Perrenoud, en muchas ocasiones la evaluación no se ordene en función de objetivos bien

definidos (Perrenoud, 1999a, p. 55). De hecho, quien analice los programas oficiales en

nuestro país, sean del nivel que sean, probablemente encontrará dificultades para saber con

claridad cuáles son las pautas que deberán cumplir los alumnos: ¿Deben dominar todo el

programa? ¿Deben dominar todas las partes por igual? ¿Cuál es el nivel con el que se espera

que dominen eso? ¿Qué tipos de cosas deben saber o qué desempeño deben tener?

Por otra parte, ¿todo lo que se programa para la enseñanza es pasible de ser evaluado? Y

si lo es, ¿para tomar cualquier tipo de decisión? Un caso de este problema es el de los

contenidos que la reforma de los años noventa en la Argentina dio en llamar “actitudinales”.

Identificar este tipo de contenidos tenía, en su origen en la reforma española de los años

ochenta, el sentido de designarlos como objeto de enseñanza y, por lo tanto, incluirlos en la

planificación y en las actividades de la clase. En un curso de capacitación, hace pocos días, un

profesor-alumno preguntó: “¿Deberíamos evaluar los contenidos actitudinales? ¿Cómo lo

haríamos?” Buenas preguntas. Dejo las respuestas a criterio del lector. Las preguntas

34

ejemplifican una zona gris en relación con la evaluación que es bueno dejar señalada: la de su

extensión y la de su relación con la enseñanza y el aprendizaje.

Para algunos, “la evaluación es más determinante que los programas en el desarrollo de

una enseñanza” (Perrenoud, 1999b, p. 101). La afirmación es un poco fuerte pero, seguro,

tiene algo de cierto, porque la evaluación se relaciona con la enseñanza de un modo íntimo.

No solo “comprueba” el alcance. La evaluación forma parte del programa de enseñanza

escrito o no escrito. Normalmente, adquieren prioridad aquellas enseñanzas que promueven

aprendizajes-requisitos para el grado o nivel siguiente. Muchas veces se construye entre los

profesores un contrato tácito de mayor importancia que lo programado. Son los colegas los

que actúan, muchas veces, como una voz y una mirada sobre el propio trabajo. El profesor

anterior es evaluado por la capacidad y el conocimiento de los alumnos que salen de sus

manos. Para los alumnos, las prácticas de evaluación suelen convertirse en el “verdadero

mensaje”, tanto sobre los contenidos como sobre los énfasis en el esfuerzo: establecen una

jerarquía en la tarea de la clase. Es evidente que evaluación y programa forman parte de un

mismo sistema de enmarcamiento y regulación de la enseñanza. Por eso, “más vale reformar

simultáneamente programas y procedimientos de evaluación” (Perrenoud, 1999b, p. 102).

Un último comentario sobre el tema. Se puede constatar una estrecha relación entre

evaluación y currículum en los países que cuentan con fuertes sistemas de exámenes externos.

En esos casos, el examen externo “tira” del contenido del currículum y de las formas de

enseñanza, que tienden a adaptarse a las exigencias por venir. Esta relación está marcada por

la autonomía que estos exámenes alcanzan y por la reducción que, en general, operan sobre

las dimensiones evaluadas.

Dicho esto, debemos reconocer que, en cualquier circunstancia, la evaluación modula el

currículum. No se sugiere que lo reemplaza o que constituye un currículum paralelo. Pero sí

que genera un sistema de jerarquías y énfasis que da forma especial al contenido de la

enseñanza. Se convierten en más importantes los temas evaluados, se vuelven más relevantes

los tipos de producción exigidas. Podría decirse que, así como el profesor crea un modelo

mental de referencia a la hora de evaluar a sus alumnos, los estudiantes crean modelos de

referencia sobre lo que es considerado importante en la clase. Los propios profesores se ven

influidos, en la enseñanza y el énfasis en ciertos contenidos, por las formas de evaluar y por

los temas evaluados que la tradición del establecimiento, el departamento o la cátedra fueron

asentando. Puede agregarse que, cuánto más afirmada está la función de certificación de la

evaluación, más actúa como moduladora del currículum.

La influencia de la evaluación como moduladora del currículum puede ser valorada

como una indeseable desviación de las normas oficiales sobre el contenido escolar. También,

35

como un dispositivo complementario que actualiza esas normas, en la medida en que el

sistema procede de un modo más o menos coherente al respecto. En ese caso, “Los criterios

de evaluación proporcionan a los alumnos, cuando se dan al mismo tiempo que las

instrucciones, informaciones suplementarias acerca de los comportamientos esperados, que

deben permitirles evaluar mejor sus resultados, pero que posteriormente podrán ser utilizados

como señales que les permitan guiar la realización de la tarea y, por consiguiente, tener

mejores resultados” (Amiguens y Zerbato-Poudou, p. 207).

¿Qué hacer con las prácticas de evaluación?

Aunque ya casi llegamos al final, es difícil decirlo en abstracto, porque cada respuesta

depende del problema que se formule. La realidad es que nuestro país no viene de una

tradición evaluadora basada en la medición, la defensa a ultranza de las pruebas objetivas y la

utilización de normas estadísticas para la adjudicación de calificaciones. Tampoco tenemos

sistemas externos de examen que otorguen certificaciones en momentos intermedios o finales

de la educación general o media superior. Sin embargo, lo que leemos sobre evaluación suele

tener origen en países con esas características. También, por supuesto, las críticas.

En principio, no es tanto lo que se conoce sistemáticamente sobre las prácticas de

evaluación escolares. No parece ser un fenómeno local. Los estudios sobre este tema no

fueron desarrollados hasta hace poco tiempo. También es cierto que los nuevos enfoques

didácticos dedicaron a la evaluación muy poco desde el punto de vista propositivo. Quizás,

“porque en la mente de los reformuladores, la evaluación quedó del lado de las obligaciones,

la institución y la tradición de la que querían desembarazarse” (Amiguens y Zerbato-Poudou,

p. 108). Claro que, desde el punto de vista de la mejora de las prácticas educativas, esto no

deja de ser un inconveniente. Sobre todo, cuando cuesta aceptar dimensiones de esas prácticas

como parte de las pedagogías que uno abraza o admira.

Puedo imaginarme este intercambio:

–Creo –afirma el autor de esta clase– que la evaluación refleja, en buena medida, el

aspecto sistémico de la cuestión educativa.

Ya lo escucho decirme:

-Oiga usted, ¡yo no soy sistémico! Soy, para que lo sepa, constructivista. Lo demás, corre

por su cuenta.

36

Entiendo sus aprensiones. Mírelo de esta manera. Digamos que la evaluación por

objetivos refleja la dimensión en la cual el dispositivo puede ser considerado un sistema de

producción dirigido hacia objetivos relativamente definidos, al menos en sus aspectos

generales y aunque admitan diversidad de realizaciones específicas. Y esto, según los niveles

educativos y los propósitos de la educación. Usted y yo coincidiremos en que, cuando se trata

del aprendizaje de actividades bien regladas utilizadas en tareas de importancia social, la

variedad de realizaciones admitidas se reduce en función de la eficacia de la acción, el

cuidado de los usuarios y el cumplimiento del interés social que debe ser servido. Sería muy

claro el ejemplo de cirujanos, pilotos de avión, conductores, enfermeros o técnicos mecánicos

de nivel medio. Si analizamos la educación, también encontramos ejemplos: el dominio de la

lecto-escritura, la capacidad de resolución de problemas matemáticos, el dominio de

información científica, el conocimiento de las reglas de práctica republicana y muchos otros.

Me dirá usted (verá que lo considero un opositor incansable):

-No son esos los propósitos importantes de la educación.

Bueno, normalmente los consideramos bastante importantes. Y, aunque solo sean

instrumentales para el desarrollo de capacidades de orden más general, para el ejercicio de

aptitudes personales o para la promoción del desarrollo individual y colectivo, ¿no es

adecuado saber si estos instrumentos necesarios forman parte del equipaje que nuestra

sociedad, por medio de la escuela, tiene la obligación de proveer a cada nuevo miembro?

¡Ríndase de una vez! Acépteme que hay objetivos especificables y valiosos en toda tarea

educativa y que toda tarea educativa puede ser considerada desde un punto de vista sistémico,

aunque éste no sea el único punto de vista posible. Conceda, al menos, que la tarea educativa

merece ser analizada desde puntos de vista variados, ya que esa es la única manera de lidiar

con la variedad de dimensiones cruzadas en esa práctica.

¿Puede aceptarlo? ¿Diría usted que la evaluación juega un papel importante en la

dimensión sistémica de las prácticas de enseñanza?

Si aceptó eso, continúo. (Vio cómo soy. Desconfíe de las buenas intenciones). Parece

que, también, la evaluación juega un papel de importancia en la regulación del aprendizaje y

de la intervención pedagógica. ¿Qué opina de eso?

Cuando termine de pensar su respuesta, estaremos en condiciones de pasarle la posta.

No sé cómo veía la cuestión al inicio. Pero, ahora:

37

6. ¿Considera que las prácticas evaluativas juegan un rol educativamente valioso en la

enseñanza?

● Si la respuesta es afirmativa, ¿en qué aspectos de la enseñanza resultan importantes?

● ¿Qué requisitos se deberían tener en cuenta para que estas funciones puedan ser cumplidas?

● Las funciones que usted establece ¿son funciones teóricas o realmente pueden llevarse

adelante en situaciones reales de enseñanza?

● ¿Qué límites establecería al cumplimiento de esas funciones y cómo cree que deberían

acomodarse las cosas para que se concrete lo que contestó en los dos primeros puntos?

Bibliografía

Amiguens, R. y Zerbato-Poudou, M., Las prácticas escolares de aprendizaje y evaluación, México,

Fondo de Cultura Económica, 1999.

Camilloni, A., “Sistemas de calificación y regímenes de promoción”, en Camilloni, A., Celman, S.,

Litwin, E. y Palou de Maté, M., La evaluación de los aprendizajes en el debate didáctico

contemporáneo, Buenos Aires, Paidós, 1998.

Camilloni, A., “La calidad de los programas de evaluación y de los instrumentos que los componen”,

en Camilloni, A., Celman, S., Litwin, E. y Palou de Maté, M., La evaluación de los aprendizajes en el

debate didáctico contemporáneo, Buenos Aires, Paidós, 1998. pp. 76-89.

De Ketele, J.-M., Observar para Educar, Madrid, Visor, 1984.

Ebel, R., Fundamentos de la medición educacional, Buenos Aires, Guadalupe, 1977.

Grondlund, N., Medición y evaluación de la enseñanza, México, Pax, 1973.

House, E., “Los enfoques principales”, “Premisas en que se basan los enfoques”, “Crítica de los

enfoques”, en Evaluación, ética y poder, Madrid, Morata, 2000. Reseña Recomendada

Perrenoud, P., Avaliacao. Da Excelencia a Regulaçao das Aprendizagens. Entre duas lógicas, Porto

Alegre, Artes Médicas, 1999ª.

Perrenoud, P., Construir competencias desde la escuela, Santiago de Chile, Dolmen, 1999b.

Perrenoud, Ph., “La evaluación formal de la excelencia escolar” y “De la evaluación intuitiva a la

evaluación formal”, en La construcción del éxito y del fracaso escolar, Madrid, Morata, 1996.

Reseña Recomendada

Stenhouse, L., Investigación y desarrollo del currículum, Madrid, Morata, 1991.

Tyler, R., Principios Básicos del Currículo, Buenos Aires, Troquel, 1998.

Zabalza, M. A., “La evaluación”, en Diseño y desarrollo curricular, Madrid, Narcea, 1997.

FELMAN- Enseñar a Evaluar

Documents

Transcript of FELMAN- Enseñar a Evaluar