Horing - Capítulo 9 - Castigo

78
 CAPITULO CASTIGO  N . H . A zrin  y W. C. H o l z  NTRODUCC ÓN Pocos D E nosotros ,  psicólo gos o legos, enfocaríamos el problema dei castigo en términos neutrales. Más bien, nuestra reacción ante el uso dei castigo muchas vecès parece estar determinada por opiniones pre- científicas. En cierta época, el uso dei castigo fue ampliamente sancio nado. Por ejemplo, antiguamente, en los Estados Unidos el sistema educativo y las prácticas penales dependían enormemente de la elimina- ción de la conducta por medio dei castigo. Actualmente, la opinión  p ú b li ca p ar ec e es ta r en co n tr a dei u so dei casti go. Se h a n p la n te a d o m úl- tiples tipos de pre gun tas evaluativas acerca dei cast igo, como: “,;Debe emplearse el castigo? ,;Es efectivo el castigo? ,;Produce el castigo sola- mente câmbios temporales en la conducta? jEs el castigo menos efectivo que el reforzamiento?” El neutralismo científico exige que no formulemos ningún juicio, sino hasta que la evidencia experimental sea completa mente definitiva. Es con este espíritu que analizamos el problema dei castigo: ,:qué papel desempena el castigo en la conducta? Primero examinaremos la metodologia en que se han basado los experimentos sobre castigo, pues la validez de los datos experimentales no puede sobrepasar lo adecuado de los procedimientos empleados para obtener los datos. Nuestro examen de la metodologia no consistirá en una simple enumeración de los diferentes procedimientos utilizados; más bien, se evaluarán criticamente los procedimientos en términos de la  p r o b a -  b il id ad q ue te n g a n de ser ad ec u ados p a r a aislar los efe ctos dei  p r o ce s o dei castigo. Uno de los propósitos primordiales de este tratamiento meto- * La mayor parte de la investigación original que aqui se inform a fue finan ciada por el Fondo de Salud M ental dei Estado de» Illinois, po r las subvenciones dei N IM H 4925 y 4926 y  p o r la subvención dei NSF G16357R. Expresamos nuestro agradecimiento a los doctores D. F. Hake, K. Miller, R. R. Hutchinson y T. AyH°n h b le íd in io el it

description

Punição 1969 - Horing

Transcript of Horing - Capítulo 9 - Castigo

  • CAPITULO CASTIGO

    N. H . A z r i n y W. C. H o l z

    INTRODUCCIN

    Pocos D E n o s o t r o s , psiclogos o legos, enfocaramos el problema dei castigo en trminos neutrales. Ms bien, nuestra reaccin ante el uso dei castigo muchas vecs parece estar determinada por opiniones pre- cientficas. En cierta poca, el uso dei castigo fue ampliamente sancionado. Por ejemplo, antiguamente, en los Estados Unidos el sistema educativo y las prcticas penales dependan enormemente de la elimina- cin de la conducta por medio dei castigo. Actualmente, la opinin pblica parece estar en contra dei uso dei castigo. Se han planteado ml- tiples tipos de preguntas evaluativas acerca dei castigo, como: ,;Debe emplearse el castigo? ,;Es efectivo el castigo? ,;Produce el castigo sola- mente cmbios temporales en la conducta? jEs el castigo menos efectivo que el reforzamiento? El neutralismo cientfico exige que no formulemos ningn juicio, sino hasta que la evidencia experimental sea completamente definitiva. Es con este espritu que analizamos el problema dei castigo: ,:qu papel desempena el castigo en la conducta?Primero examinaremos la metodologia en que se han basado los experimentos sobre castigo, pues la validez de los datos experimentales no puede sobrepasar lo adecuado de los procedimientos empleados para obtener los datos. Nuestro examen de la metodologia no consistir en una simple enumeracin de los diferentes procedimientos utilizados; ms bien, se evaluarn criticamente los procedimientos en trminos de la p r o b a - bilidad que tengan de ser adecuados para aislar los efectos dei p ro c e s o dei castigo. Uno de los propsitos primordiales de este tratamiento m e to -* L a m ayor p a rte de la investigacin original que aqu i se i n f o r m a f u e financiada po r el Fondo de Salud M ental dei Estado de Illinois, po r las s u b v e n c i o n e s dei N IM H 4925 y 4926 y p o r la subvencin dei N SF G 16357R. E x p r e s a m o s nuestro agradecim iento a los doctores D . F. H ake, K . M iller, R . R . H utchinson y T . AyHn por haber ledo m inuciosam ente el m anuscrito.

    455

  • 456 CAP. 9 CASTIGO

    dolgico es dar una direccin y proporcionar incentivos para el desarrollo ulterior de una metodologia perfeccionada. Luego examinaremos diversas variables relacionadas con la administracin dei castigo (como la inten- sidad dei castigo) y con otras variables relacionadas con aspectos que determinan la efectividad de un estmulo punitivo en particular, como el estado motivacional dei sujeto. Nuestra atencin se enfocar despus en un examen detallado de los tipos de cmbios conductuales que, por lo que se ha visto, se derivan dei uso dei castigo, como la recuperacin que se produce durante el castigo y los aumentos de la emisin de respuestas que se producen despus dei castigo. Slo despus de llevar a cabo este examen de los hallazgos experimentales especficos acerca de los determinantes y los resultados dei castigo, trataremos de responder a preguntas tan generales como: ^Es efectivo el castigo? Finalmente, nos ocuparemos dei problema de determinar si el castigo es deseable. La respuesta a este problema exigir que se tengan en consideracin hallazgos hechos en varias reas que emplean la estimulacin aversiva.METODOLOGIA

    Definicin de castigoHay un gran nmero de definiciones informales dei castigo. En un extremo se encuentra el tipo de definicin subjetiva en la que el castigo se refiere a un estado desagradable subjetivo, como en el posfecto molesto de Thorndike (1911). Sin embargo, las dificultades que plantea la medicin de los estados subjetivos nos obligan a buscar otro camino. U n segundo tipo de definicin de castigo implica designar al castigo como una variable de pulsin, tal como han hecho Dollard y Miller (1950). Puesto que este tipo de definicin se basa en inferencias acerca de la conducta, seria preferible, como paso inicial, buscar en la propia con- ducta una definicin mnima. Un aspecto inequvoco dei castigo parece ser el que esto reduce la emisin de una conducta cuando se dispone como consecuencia de dicha conducta. Por tanto, la definicin mnima ser' que el castigo es una consecuencia de la conducta que reduce la probabilidad futura de dicha conducta. Enunciada de un modo ms completo, el castigo es una reduccin de la probabilidad futura de una respuesta especfica, como resultado de la administracin inmediata de un estmulo ante esa respuesta. El estmulo se designa con el nombre de estmulo punitivo, y todo el proceso se denomina castigo.Hay varios aspectos de esta definicin que deben comentarse. Pri- mero, la definicin no se efecta en trminos de un sentimiento subjetivo o de un estado dei ser. Por tanto, ser incorrecto llamar punitivo a un

  • m e t o d o l o g a 4 5 7

    estmulo, slo porque ese estmulo lleve a una expresin de infelicidado de un estado emocional. Segundo, para que un evento especfico sea considerado estmulo punitivo, el evento debe ser producido por una respuesta especfica. U na simple disminucin de las respuestas no es razn suficiente para considerar punitivo a un procedimiento. Tambin la sa- ciedad, la extincin, las drogas, una enfermedad, un cambio de estmulo, etctera, pueden reducir las respuestas. Estos procedimientos se diferencian claramente dei castigo en que no producen una reduccin de respuestas que sean atribuibles a la produccin de un estmulo especfico (el estmulo punitivo) por parte de la respuesta. Solamente designamos al proceso con el nombre de castigo cuando se produce una reduccin de respuestas como resultado de que las respuestas producen un estmulo especfico. U n corolrio de esta definicin es que resulta contradictorio hablar de castigo por no responder, pues no hay ninguna respuesta especificable que produzca al estmulo punitivo. Un procedimiento de este tipo se designa mejor con el nombre de escape o euitacin (Sidman, 1953). Un tercer aspecto fundamental de esta definicin es que especifica la proba- bilidad futura de una respuesta. La reduccin de las respuestas durante la presentacin real de un estmulo no indica que haya castigo. Si se administra un choque intenso a las patas de un animal despus de una respuesta, el choque puede producir reacciones, como la de saltar, que son fisicamente incompatibles con la respuesta; pero esto no es suficiente para dar al choque la categoria de estmulo punitivo. Asimismo, la admi- nistracin de comida produce como resultado una conducta consumatoria que generalmente es incompatible con la respuesta. El cambio de la frecuencia de respuesta que se produce de manera subsecuente a un estmulo define las propiedades reforzantes o punitivas de ese estmulo. Por esta razn, nuestra definicin dei castigo se hace en trminos de una reduccin de la probabilidad futura de la respuesta castigada.La presente definicin de castigo se diferencia en varios aspectos de las definiciones anteriores dei castigo. U na definicin (Dinsmoor, 1954; Keller y Schoenfeld, 1950; Skinner, 1953) se rcfiere al castigo, en trminos de procedimientos, como la administracin de un estmulo aversivo despus de una respuesta. Entonces, se define al estmulo aversivo como un estmulo que aumenta la probabilidad de las respuestas que hacen terminar ese estmulo. Esta definicin de aversividad requiere una demos- tracin de que puede emplearse la terminacin dei estmulo para reforzar la conducta de escape. Cualquier reduccin que sea producto dei proce dimiento de castigo se atribuye a la existencia de respuestas de escape que interfieren o compiten de alguna manera con la respuesta castiga a (Dinsmoor, 1954; Skinner, 1953). En esta definicin, el castigo es un proceso secundrio en trminos dei procedimiento, pues para d e s ig n a r o

  • 458 CAP. 9 CASTIGO

    se debe hacer un condicionamiento de escape previo. Asimismo, el efecto conductual dei castigo se considera un resultado secundrio o indirecto de las respuestas de escape competitivas. La presente definicin considera al castigo como un proceso primrio porque: a ) no se requiere ninguna evidencia independiente de que el estmulo mantendr a la conducta de escape, y b) la caracterstica que define al castigo es medible directa- mente en trminos de la existencia de una reduccin de las respuestas.Esta definicin parece tener varias ventajas. Virtualmente, ninguno de los estdios dei castigo ha determinado inicialmente que la termina- cin dei estimulo punitivo refuerce la conducta de escape. En ausncia de esta determinacin, el estmulo no podra considerarse aversivo y la definicin de procedimiento dei castigo no podra aplicarse a la mayo- ra de los estdios que han implicado esta designacin. La presente definicin slo requiere que se obtenga una reduccin de la respuesta cuando produce el estmulo. La segunda ventaja de definir al castigo en trminos de una reduccin de la respuesta es que no se requiere ningn registro u observacin de las respuestas de escape hipotticas, pero hasta ahora no registradas, que se supone producen la reduccin de la respuesta. La tercera ventaja de esta definicin es que dirige la atencin de investigador a las variables independientes ms que a un conjunto interventor de con- ductas competitivas, a las que con frecuencia se les da un status de exploratorios .La presente definicin de un estmulo punitivo es similar a la definicin de un estmulo reforzante en que requiere un cambio de la probabilidad futura de una respuesta, como resultado de que la respuesta produce ese estmulo. Las definiciones difieren solamente con respecto a la direccin dei cambio de la probabilidad de la respuesta: un aumento de la probabilidad de obtener reforzamiento positivo, una disminu- cin de la dei castigo. Ningn proceso es secundrio con respecto al otro.Desarrollo de una tecnologia dei reforzamiento como prerrequisito

    De acuerdo con nuestra definicin, el proceso punitivo se caracteriza por una reduccin de la tasa de respuestas. De ah se deduce que para poder iniciar un estdio dei castigo debe haber un nivel de respuestas preexistente. El procedimiento comn ha consistido en emplear reforzamiento positivo para condicionar la respuesta y mantenerla a una frecuencia que sea lo suficientemente alta para permitir observar que el procedimiento de castigo reduce la emisin de respuestas. Rara vez se ha utilizado el nivel operante de una respuesta (Baron y Antonitis, 1961). La estabilidad y el orden de la tasa de respuestas reforzadas determinar

  • M E T O D O L O G IA 459

    el grado en que cualquier cambio que se produzca en las respuestas pueda ser atribudo definitivamente al castigo. Si la medida de la respuesta es variable o impredecible antes de aplicar el castigo, no es posible llegar a muchas conclusiones al agregar este ltimo.I No fue sino hasta hace poco (Ferster y Skinner, 1957) que la tecnologia dei reforzamiento lleg a un grado tal de desarrollo que ahora se puede especificar la ocurrencia momento a momento de las respuestas operantes condicionadas que emite un organismo particular. Historicamente, el orden de los datos sobre las respuestas se ha obtenido mediante promedios de grupo y de procedimientos de ensayos discretos (Muenzinger, 1934). Los primeros trabajos operantes de Skinner (1938) hicieron posible que Estes (1944) usara promedios de grupo que incluan slo a cuatro sujetos, y prescindiera completamente de un procedimiento de ensayos limitado que interrumpa constantemente el flujo de la conducta con un intervalo entre los ensayos. Ahora, los procedimientos de reforzamiento de Ferster y Skinner (1957) hacen posible prescindir de los promedios de respuestas, tanto dentro de los sujetos como entre ellos, y ocuparse directamente de la ocurrencia de las respuestas de momento a momento. Estos progresos hacen posible valorar con ms exactitud los efectos dei castigo y permiten observar que los cmbios conductuales son regidos por regias, sin tener que recurrir a artefactos estadsticos ni a grandes grupos de sujetos.El estmulo punitivo

    REQUISITOS DEL ESTMULO PUNITIVO IDEAL"

    Idealmente, un estmulo punitivo debe tener propiedades que permi- tan valorar el proceso dei castigo sin dejar penetrar factores extranos al procedimiento. Primero, el estmulo punitivo debe tener una especifica- cin fsica precisa. Si las dimensiones pertinentes dei estmulo no pueden medirse con exactitud y en unidades fsicas, estamos limitando desde el principio los estdios, en trminos de su replicabilidad y su confiabilidad.La segunda caracterstica deseable que debe tener un estmulo punitivo es la consecuencia dei estmulo en trminos dei contacto real que tiene con el sujeto. U n estmulo puede ser especificado precisamente en su fuente y, sin embargo, su impacto sobre el sujeto puede ser muy variable. Por ejemplo, un choque administrado a las patas de la rata a travs de una rejilla puede especificarse exactamente en trminos de la diferencia de potencial que hay en el estimulador; pero las variacio- nes de humedad dei aire tienen como resultado una gran v a r i a b i l i d a d de la intensidad que acta realmente sobre el organismo.

  • 460 CAP. 9 CASTIGO

    La tercera caracterstica dei estmulo punitivo ideal se refiere a la capacidad que tiene el sujeto para escapar o para reducir al mnimo la estimulacin por medio de alguna conducta no autorizada. En este apartado no nos referimos a la uniformidad fsica dei estmulo punitivo, excepto en la medida en que el sujeto puede controlaria. Por ejemplo, la uniformidad dei choque administrado a las patas de la rata depende dei grado de contacto de la piei con el piso de rejilla. Este contacto se halla siempre bajo el control de la conducta dei sujeto. Incluso, si se han electrificado la barra de respuestas, las paredes, el techo y el piso de rejilla, la rata puede cambiar de postura, y lo hace; salta, corre, baila, trata de pararse en una barra, y usa las partes pilosas de su cuerpo para responder. Todas estas conductas van a alterar la intensidad efectiva de la estimulacin, a pesar de la constancia que tenga el choque al ser medido en el piso de rejilla. Los problemas que origina este control no autorizado van ms all de cualquier inters purista por la constancia fsica. Supuestamente, el castigo logra su efecto en la conducta, primordialmente por medio de un aumento de la cantidad de estimulacin que acta sobre el organismo. Si el sujeto puede hacer disminuir esta estimulacin gracias a medios no autorizados o inidentificables, en- tonces los conteos de las respuestas carecen de significado, como se puede notar en un estdio de Dinsmoor y Campbell (1956). Por otra parte, puede parecer que no hay ninguna reduccin de las respuestas, como lo evidencia el caso extremo que se representa en la figura 1, titulado el Desayuno en la cama, en el cual una rata aprendi a presionar una palanca de respuestas con su pata mientras yaca sobre su espalda, y eliminaba as la posibilidad de recibir choques al mismo tiempo que seguia produciendo bolas de comida. Asimismo, la reduccin de las respuestas puede ser resultado de posturas desmanadas, pero que reducen los choques, como la de poner solamente una pata en la rejilla. La postura desmanada puede producir una reduccin de respuestas que es slo una consecuencia indirecta dei estmulo punitivo. En un estdio de Azrin, Hake, Holz y Hutchinson (1965) se estudi este problema proporcionando experimentalmente una respuesta de escape especfica. Se encontro que los efectos reductivos totales dei castigo eran nulificados por la disponibilidad de la respuesta de escape.La cuarta caracterstica dei estmulo punitivo ideal es que deben haber pocas reacciones esquelticas ante ese estmulo. Al estudiar el castigo, nos ocupamos de la reduccin de la probabilidad futura de una respuesta. Si el estmulo punitivo produce reacciones esquelticas fuertes y duraderas, entonces la produccin de estas reacciones per se puede hacer disminuir la frecuencia de la respuesta. En tal caso, las reduccio- nes de la respuesta se producirn debido a la simple incompatibilidad

  • M ETODOLOG IA 461

    F IG U R A 1. D esayuno en la cam a . La rata ha aprend ido a evitar el choque de la rejilla echndose sobre su espa lda, m ientras presiona la pa lanca de las respuestas con su pata trasera p a ra producir b o la s de com ida. (Tom ado de Azrin y Holz, datos no publicados.)

    de las reacciones provocadas con la respuesta castigada, y no necesaria- mente debido a la aversividad dei estmulo punitivo. Pueden ilustrar este problema los estdios que han utilizado choques aplicados a las patas, en los que una observacin simple revela que a menudo las altas intensidades dei choque, que interfieren fisicamente con la emisin de la respuesta medida, producen la inmovilizacin parcial dei sujeto.La quinta caracterstica dei estmulo punitivo ideal es que pueda hacerse variar por una amplia gama de valores y que pueda producir grados de reduccin de la respuesta que vayan desde ningn efecto, en los valores ms bajos, hasta la reduccin completa de la respuesta, en los valores ms altos. En ausncia de tal variacin, es imposible averiguar cul es toda la gama de efectividad dei castigo.Ya que hemos visto algunos de los critrios que se espera que llene un estmulo punitivo, vamos a evaluar algunos de los estmulos utilizados. El choque a las patas ha sido, con mucho, el estmulo ms usado. La principal ventaja dei choque es que puede hacerse variar por toda la gama de efectividad para reducir la respuesta. Pareceria ser que otra ventaja de usar el choque es que ste puede especificarse con precision

  • 462 CAP. 9 CASTIGO

    en unidades de medida fsicas (es decir, elctricas). Sin embargo, esta especificidad aparente es ilusria, como puede verse en los ejemplos anteriores que consideraban el choque a las patas en trminos de su contacto real con el sujeto. Se han creado varios artefactos para disminuir al mnimo la variabilidad dei choque administrado a las patas. Dinsmoor (1958) ha usado rejillas tubulares grandes, a fin de reducir al mnimo los corto circuitos entre ellas y aumentar al mximo el contacto dei sujeto con las rejillas. Skinner y Campbell (1947) han creado un revolvedor para alternar la polaridad de cada rejilla y evitar as que el animal apoye las patas en rejillas de la misma polaridad. Dinsmoor (1961) invento un estimulador para reducir las variaciones dei flujo de la corriente que pasa por el sujeto. Hoffman y Fleshler (1962) han perfeccionado la tcnica dei revolvedor, con el fin de hacer alter- naciones de polaridad ms rpidas y confiables. A pesar de estas me- joras sustanciales, el choque a las patas dei animal tiene las desventajas siguientes: a) permite que haya escape no autorizado, y b ) permite que haya variabilidad en la estimulacin real que llega al sujeto. La produccin de reacciones esquelticas duraderas se ha reducido un poco mediante el procedimiento de hacer que las duraciones de la estimulacin sean muy breves; Estes (1944), por ejemplo, us una descarga corta dei capacitador (condensador).En este momento podemos poner en duda que se tenga un control tan preciso dei choque como estmulo punitivo. Ciertamente, en los estdios dei condicionamiento de evitacin (Boren, Sidman y Herm- stein, 1959) se han hallado pocos cmbios en las respuestas de evitacin emitidas ante una amplia gama de intensidades de choque aplicadas a las patas. Parece que se requiere un mnimo de intensidad para man- tener las respuestas de evitacin, pero que ms all de ese punto, el aumento de la intensidad produce pocos cmbios, o ninguno, en la tasa de respuestas de evitacin. Por otra parte, se ha encontrado que las respuestas castigadas son muy sensibles a los cmbios de intensidad dei estmulo punitivo. En un estdio (Hake y Azrin, 1963), un aumento de intensidad de 50 a 60 voltios (un cambio dei 20% ) produjo una reduccin instantnea de aproximadamente el 50% en la tasa de respuestas castigadas.Puede explicarse la sensibilidad de las respuestas castigadas a la intensidad dei choque, en comparacin con la insensibilidad de las respuestas de evitacin, confrontando los procedimientos de castigo y de evitacin en trminos de la frecuencia de los contactos habidos entre el sujeto y el estmulo aversivo. En el condicionamiento de evitacin de choques, las respuestas se emiten pronto con una tasa que es suficiente para eliminar virtualmente todas las administraciones dei choque.

  • METODOLOG A 463

    El resultado final es que se emite un gran nmero de respuestas; pero los choques son tan poco frecuentes que se necesita mucho tiempo para poder descubrir la ausncia de choques. Como resultado de esto, encontramos que la conducta de evitacin persiste durante perodos largos (Sidman, 1955). En el castigo por medio de choques, la situacin es diferente, pues generalmente cada respuesta va seguida por el choque. De este modo, el sujeto est haciendo contacto con el choque continuamente, a menos que haya habido una supresin completa de la respuesta castigada. En la supresin parcial, no hay problema para discriminar el momento preciso en que se suprime el choque. Por tanto, la contingncia de hacer terminar el choque durante el castigo tiene como resultado, generalmente, un cambio inmediato de la conducta castigada (Azrin, 19606). Por la misma naturaleza de los procesos que estudian, el control preciso parece ser esencial en los trabajos sobre el castigo, mientras que en el caso de los estdios sobre el condicionamiento de evitacin, tal vez no requieran ms que un estmulo efectivo al mnimo para mltiples propsitos. El contacto continuo que hay entre el sujeto y el estmulo aversivo explica tambin la sensibilidad que muestran las respuestas de escape ante los cmbios de intensidad dei estmulo aversivo (Barry y Harrison, 1957; Dinsmoor y Winograd, 1958; Harrison, Abelson y Fisher, 1960; Kaplan, 1952).DIFERENTES TIPOS DE ESTMULOS AVERSIVOS

    Se han encontrado varios tipos de estmulos punitivos efectivos. Mas- serman (1946) ha empleado una rfaga de aire con gatos y una serpiente de juguete con monos. Skinner (1938) us la bofetada de una^palanca, con ratas. El ruido ha sido efectivo con humanos (Azrin, 1958; Flana- gan, Goldiamond y Azrin, 1958; Herman y Azrin, 1964) y con pichones (Holz y Azrin, 1962a). El estmulo punitivo que se ha utilizado ms extensamente ha sido el choque elctrico administrado a travs de un piso de rejilla.Ya se ha visto que el choque a las patas tiene las siguientes desven- tajas: a) da lugar a variaciones en la intensidad con que se recibe ver- daderamente; b) permite que respuestas de escape no autorizadas tengan control de la intensidad y la duracin dei choque, y c) produce una perturbacin esqueltica extremada. El choque punitivo se ha administrado tambin a travs de electrodos implantados (Azrin, 1959

  • 464 CAP. 9 CASTIGO

    que. Estas reacciones perturbadoras se redujeron an ms al colocar los electrodos en la cola de unos monos-ardilla que se mantenan sentados sin sujecin alguna (Hake y Azrin, 1963). Este procedimiento elimino al gran desequilibrio de la postura que produce generalmente el choque a las patas. El ruido parece ser igualmente deseable, pues mediante el uso de audfonos ha sido posible especificar con precisin y controlar la intensidad dei estmulo que recibe el sujeto (Flanagan, Goldiamond, y Azrin, 1958), o tambin a travs de sistemas de altavoces que producen un campo sonoro uniforme (Holz y Azrin, 1962a). El ruido parece tener muchas ventajas para usarlo en los estdios dei castigo. Su principal desventaja es que carece de una amplia gama de efectividad. Incluso a intensidades muy altas, el ruido no ha producido una reduccin completa de la respuesta. A otros estmulos aversivos, como las bofetadas de la barra, las serpientes, las rfagas de aire, etc., no se les ha aplicado la prueba dei uso extensivo, pero no tienen mayores ventajas que el choque elctrico aplicado a las patas o que el ruido.LA ESTIMULACIN AVERSIVA CONDICIONADA COMO CASTIGO

    Los estmulos punitivos que hemos descrito hasta ahora, se definen en trminos de sus propiedades aversivas primarias. En teoria, debera ser posible usar un estmulo punitivo que fuera efectivo debido a su aso- ciacin con un estmulo aversivo primrio, ms que por cualquier propie- dad aversiva que tuviera en s mismo. Parece que este tipo de castigo se emplea frecuentemente en muchos tipos ordinrios de control de la conducta humana. Por ejemplo, cuando se castiga a un nino, la agresin fsica se usa con poca frecuencia. El procedimiento ms frecuente es fruncir el ceno o expresar frases que se suponen asociadas con eventos aversivos ms naturales. En varios estdios se ha tratado de establecer este castigo condicionado , que es el nombre con el que lo designaremos (Barlow, 1952; Evans, 1962; Mowrer y Aiken, 1954; Mowrer y Solomon, 1954). Los procedimientos empleados en estos estdios pueden describirse, en trminos generales, de la manera siguiente: un estmulo neutro, EC, es asociado con un choque elctrico, EIC, antes de condicionar de cualquier manera la conducta dei animal. Despus de varios apareamientos dei EC y el EIC, el animal es condicionado a responder por comida, pero sin que est presente ningn EC ni EIC. U na vez que la respuesta ha sido condicionada, se hace que el EC se presente despus de las respuestas. La reduccin de la frecuencia de estas respuestas que asi se produce, se atribuye a los efectos punitivos condicionados que tiene el EC en virtud de su asociacin previa con el choque EIC. Desafortunadamente, este paradigma bsico no permite hacer investigaciones a

  • M ETODOLOG A 465

    PROCEDIMIENTO

    segundos neutros neutros condicionada

    DESDE E L PR INC IPIO HASTA E L FIN

    F IG U R A 2. M todo p a ra producir castigo condicionado. Para la explicacin, vase el texto. (Tom ado de Azrin y Holz, datos no publicados.)

    Ilargo plazo dei castigo condicionado, pues el EC pierde su efectividad cuando deja de ser apareado con el EIC.Experimentos recientes (Hake y Azrin, 1965) trataron de superar el problema de mantener el castigo condicionado. La figura 2 muestra la situacin experimental general y el procedimiento de control. U n pichn fue reforzado con comida por responder en una tecla. El registro acumu- lativo que se encuentra abajo a la izquierda muestra la ejecucin obte- nida, tpica de un programa IV. En el segundo segmento desde la derecha, cada respuesta produjo un cambio de estmulo de 5 segundos que consistia en un cambio de la iluminacin y un cambio dei nivel de ruido dei am

  • 466 CAP. 9 CASTIGO

    biente. Puede verse que el estmulo neutro produjo pocos cmbios en la conducta, En el tercer segmento, el mismo estmulo neutro fue pre- sentado a intervalos irregulares separados por un promedio de 6 minutos. De nuevo, el estmulo neutro no afect la tasa de respuestas. Luego se administro un choque elctrico breve a travs de los electrodos implantados en la regin posterior dei pichn. Este choque se administro al final de la presentacin dei estmulo de 15 segundos, como se indica en el cuarto segmento dei registro acumulativo. Este procedimiento es seme- jante al procedimiento de supresin condicionada que crearon Estes y Skinner (1941). Puede verse que hubo una supresin de las respuestas en presencia dei estmulo (E C ), pero que la conducta no fue afectada apreciablemente en ausncia dei EC. El segmento dei registro acumulativo que se encuentra a la derecha representa los resultados obtenidos mediante el procedimiento de castigo condicionado, durante el cual cada respuesta produjo al EC durante 5 segundos. Puede verse que la tasa de respuestas se redujo de su nivel anterior de aproximadamente 80 respuestas por minuto a un nivel de supresin casi completa. Durante el castigo condicionado, la tasa de respuestas se recupero gradualmente, pero de todos modos no pas de 20 respuestas por minuto. U na caracterstica fundamental de este procedimiento es que se continuaron haciendo apa- reamientos dei EC con el EIC. Por tanto, el EC producido por la respuesta sigui teniendo sus propiedades aversivas condicionadas y pudo ser efectivo para suprimir la conducta castigada, tanto tiempo como estuvo en efecto el procedimiento. Parece que el castigo condicionado no ne- cesita ser un fenmeno transitorio; un estmulo que anteriormente era neutro continuar suprimiendo las respuestas despus de las cuales se presenta, si ese estmulo neutro es asociado ocasionalmente con el estmulo incondicionado.EL TIEMPO-FUERA DEL REFORZAMIENTO POSITIVO COMO ESTlMULO PUNITIVO

    El perodo de tiempo-fuera constituye otro ejemplo de estmulo punitivo condicionado. En la conocida ley de la extincin, cuando se suprime el reforzador, disminuye la frecuencia de la respuesta anteriormente reforzada. Si reforzamos alternadamente una respuesta en presencia de un estmulo, pero no la reforzamos en presencia de otro estmulo, enton- ces puede designarse a este ltimo con el nombre de estmulo tiempo- fuera; es decir, tiempo-fuera dei reforzamiento positivo (Ferster y Skinner, 1957). Historicamente, el tiempo-fuera dei reforzamiento positivo se ha considerado en sentido esttico, es decir, simplemente como un periodo de tiempo que separa las oportunidades de responder. Tal es el caso, por ejemplo, en los procedimientos de ensayos limitados, rampas, pasadizos, procedimientos de eleccin, etc., en los que se designa al tiempo-fuera

  • M ETODOLOG IA 467

    MINUTOS

    F IG U R A 3. Registro acum ulativo de las respuestas em itidas por un p ichn bajo un prog ram a IV de reforzam iento con comida. En el registro no se ind ican las adm inistraciones de la comida. Las raya s trazadas por la p lum a registradora (vase ejem plos en las flechas) ind ican la adm in istracin de un periodo de tiem po-fuera de un m inuto durante el cual se suspend i la ilum inacin de la cm ara experimental, lo cual evit la ocurrencia de cuales- quiera respuestas y reforzam ientos. El papel dei registrador no corri durante el periodo de tiem po-fuera. El tiem po-fuera se adm inistro inm ediatam ente despus de la primera respuesta em itida, luego de un intervalo de un m inuto transcurrido a partir dei tiem po-fuera anterior. (Tom ado de Azrin y Holz, datos no publicados.)

    como un intervalo entre ensayos. Aunque en los mtodos de ensayos limitados se han utilizado necesariamente periados de tiempo-fuera, no se han notado las posibles propiedades dinmicas que tiene este tiempo- fuera. Slo en los ltimos anos se ha descubierto que un estmulo de tiempo-fuera puede poseer propiedades reforzantes o aversivas y que, por tanto, se puede controlar la frecuencia de las respuestas disponiendo ese estmulo como consecuencia de las mismas.Parece ser que la primera vez que alguien not las posibles propiedades reforzantes o aversivas dei tiempo-fuera fue en un estdio de Herrn- stein (1955), en el cual se alter la frecuencia de las respuestas disponiendo perodos de tiempo-fuera de duraciones variadas despus de las respuestas. Hasta el momento, no se sabe bien por qu medios un estmulo de tiempo-fuera acta como estmulo punitivo. Si examinamos la situacin simple en la que un pichn responde para obtener comida en un programa de reforzamiento IV, podemos disponer un paradigma de castigo haciendo que, por ejemplo, cada quincuagsima respuesta pro- duzca un periodo de tiempo-fuera. Si el periodo de tiempo-fuera consti- tuyera un estmulo punitivo, podramos esperar que disminuyera la tasa total de respuestas para obtener comida. En nuestra propia experiencia Ho se ha notado ninguna disminucin, como puede verse en la figura 3 (datos no publicados), en donde se le administro un tiempo-fuera de 60

  • 468 CAP. 9 CASTIGO

    segundos a la primera respuesta emitida despus de un minuto. En realidad, ya se haba notado anteriormente un aumento de la tasa total, cuando los perodos de tiempo-fuera se introducan independientemente de las respuetsas (Ferster y Skinner, 1957). Si aplicramos nuestra definicin de estmulo punitivo, pareceria que el perodo de tiempo- fuera no llena los requisitos de estmulo punitivo, pues la ocurrencia de un perodo de tiempo-fuera despus de la respuesta de picoteo no redujo la probabilidad futura de esa respuesta.Sin embargo, los efectos punitivos de un estmulo de tiempo-fuera se han visto en varios estdios en los que el sujeto dispona de algn modo de conducta alternativo. Por ejemplo, Ferster (1958) encontro que el tiempo-fuera suprimia la conducta si haba un estmulo pretiempo- fuera disponible. Solamente las respuestas que se emitan ante el estmulo pretiempo-fuera eran castigadas por la accin dei tiempo-fuera. Si el sujeto no emitia respuestas durante la presencia de este estmulo breve pretiempo-fuera, entonces no se presentaba el perodo de tiempo- fuera. El sujeto podia tener un modo de conducta alternativo para evitar los perodos de tiempo-fuera, en el sentido de que el estmulo punitivo podia ser eliminado respondiendo en momentos diferentes, en vez de dejar de responder. Ferster ampli an ms el uso dei tiempo-fuera como estmulo punitivo al demostrar que un perodo de tiempo-fuera podia eliminar selectivamente los tiempos entre respuestas (TERs) castigados, mientras que no afectaba a los TERs no castigados. Este investigador programo los periodos de tiempo-fuera de tal manera que se presen- taran despus de TERs largos, pero no despus de TERs cortos. Como resultado de esto, disminuy la frecuencia relativa de los TERs largos. De nuevo, se hizo que el tiempo-fuera tuviera efectos de estmulo punitivo, proporcionndole al sujeto un modo de responder alternativo (TERs cortos) que eliminaba el estmulo punitivo sin tener que dejar de responder por completo.U n estdio posterior de Holz, Azrin y Ayllon (1963a) esclareci an ms los medios posibles a travs de los cuales el perodo de tiempo- fuera podia actuar como estmulo punitivo. En este estdio, se condiciono a seres humanos para responder en un programa IV con el fin de obtener cigarrillos como reforzamiento. En una parte dei experimento, los sujetos tenan a su disposicin un manipulando de respuestas. Luego se programo un perodo de tiempo-fuera para que se presentara por cada dcima respuesta emitida en ese manipulando. Los resultados de este procedimiento concordaron con la regia general mencionada anteriormente. Es decir, cuando no se tena ninguna respuesta alternativa, el perodo de tiempo-fuera produca, cuando mucho, una supresin parcial de las respuestas castigadas. En la segunda parte dei procedi-

  • M E T O D O L O G IA 4 6 9

    (Imiento se tenan dos respuestas, cualquiera de las cuales produca el reforzamiento. Luego se programo el tiempo-fuera de la misma manera como se haba hecho anteriormente, para que se presentara despus de cada dcima respuesta emitida en uno de los manipulandos. En este procedimiento de respuesta alternativo, el periodo de tiempo-fuera pro- dujo una supresin casi inmediata y virtualmente completa en este manipulando. La emisin de respuestas se desplaz al manipulando en el cual no se haba programado ningn periodo de tiempo-fuera como estmulo punitivo. Entonces, parece que un periodo asociado con ex- tincin, que constituye un periodo de tiempo-fuera, puede funcionar como estmulo punitivo, pero no es muy efectivo comparado con otros tipos de estmulos punitivos, como el ruido o el choque elctrico o, incluso, con estmulos aversivos condicionados. No obstante, el tiempo-fuera puede ser un estmulo punitivo muy efectivo si el organismo dispone de una respuesta alternativa que no s castigada y que produce reforza- mientos. Se ha encontrado que la efectividad dei tiempo-fuera como estmulo punitivo est en funcin de la duracin dei tiempo-fuera, lo cual ha sido usado eficazmente para eliminar las respuestas incorrec- tas en un procedimiento de igualacin a la muestra (Ferster y Appel, 1961; Zimmerman y Baydan, 1963; Zimmerman y Ferster, 1963).EL CASTIGO POR MEDIO DEL "COSTO DE RESPUESTA"

    El costo de respuesta es un tercer tipo de castigo condicionado que ha utilizado Weiner (1962) con sujetos humanos que trabajaban para obtener puntos en un cantador. Despus de que la conducta se haba vuelto estable, dispuso las cosas de tal manera que cada respuesta res- taba un punto de los que estaban en el contador. Esta sustraccin de los puntos dei contador como consecuencia de una respuesta se denomino costo de respuesta. El efecto que tuvo este procedimiento fue mayor que el que se observa generalmente cuando se ha empleado un periodo de tiempo-fuera (que senala la ausncia de reforzamiento) como estmulo punitivo. Weiner encontro una reduccin de las respuestas que era inmediata y en algunos casos casi completa. En cada sujeto, la contingncia dei costo de respuesta redujo el nmero de las respuestas a una pequena fraccin dei nivel de las respuestas ,no castigadas. Pareceria, entonces, que el costo de respuesta es similar al choque elctrico intenso en trminos dei grado de reduccin de la respuesta logrado. O tra similitud con el choque elctrico intenso era que la contingncia dei costo de respuesta no permitia que hubiera una recuperacin de las respuestas castigadas durante el periodo de castigo. Hay dos aspectos que parece necesario tener en cuenta al crear una situacin en la que puede usarse el costo de respuesta: primero, debe haber algn nivel

  • 4 70 CAP. 9 CASTIGO

    de reforzamiento positivo, a fin de tener la oportunidad de retirar experimentalmente ese reforzamiento, y segundo, debe haber un refor- zador condicionado, pues no parece posible disponer una situacin en la que se pueda eliminar un reforzador primrio que el animal ya haya obtenido. A pesar de estas limitaciones, el costo de respuestas parece ser un estmulo punitivo que tiene un gran efecto en las respuestas de los humanos. El procedimiento dei costo de respuesta es particularmente interesante debido a su semejanza con el uso dei cambio monetrio. Adems, el procedimiento dei costo de respuesta ejemplifica con detalle el modo como puede considerarse que el reforzamiento positivo y el negativo se encuentran situados a lo largo de un solo continuo. En el procedimiento de Weiner, la adicin de un punto al contador de respuestas constitua un reforzamiento. Por lo contrario, la sustraccin de un punto dei contador de respuestas constitua un estmulo punitivo. Es de suponerse que la ausncia de cmbios en el contador de respuestas constituiria un estado de cosas neutral. El procedimiento de Weiner parece proporcionar una oportunidad excelente para estudiar el reforzamiento y el castigo concurrentes empleando una sola dimensin de estmulo, a fin de programar tanto las consecuencias reforzantes como las punitivas.VARIABLES RELACIONADAS CON LA ADMINISTRACIN DEL CASTIGO

    U na vez que el estmulo punitivo ha sido especificado, su efecto depende en gran parte de la manera como se administre el estmulo. El estmulo punitivo puede presentarse gradualmente o de sbito, inme- diatamente despus de una respuesta o de una demora. Puede ser ligero o severo; se pueden castigar todas las respuestas o castigar slo algunas de ellas. Puede disponerse que se presente continuamente o puede de- jarse una pausa. Como se ha descubierto que estas consideraciones afec- tan el grado de reduccin obtenida, cada una de ellas ser examinada en detalle.Modo de presentacin

    Es fundamental el modo como se presenta por primera vez el estmulo punitivo. La presentacin sbita dei castigo parece producir una mayor reduccin de las respuestas castigadas que si se aumenta gradualmente la intensidad dei castigo. Masserman (1946) informa que los gatos siguen respondiendo bajo un castigo severo si el estmulo punitivo ha sido introducido con baja intensidad y se ha aumentado gradualmente

  • ADM IN ISTRAC I N DEL CASTIGO 471

    durante un periodo. Asimismo, se ha notado (Azrin, Holz y Hake, 1963) que:Fue necesario tener mucho cuidado al presentarle el castigo por primera vez al sujeto. En un estdio previo dei castigo continuo se haba demostrado que si se empleaba inicialmente una intensidad elevada (80 voltios o ms), era probable suprimir las respuestas completamente y, por lo general, de manera irreversible. Si la presentacin inicial dei castigo se haca a intensidades ms bajas (60 voltios o menos), la ejecucin se mantena fcilmente, incluso cuando posteriormente se haca aumentar el castigo a intensidades hasta de 130 voltios.Brethower y Reynolds (1962) notaron que la presentacin inicial de un castigo de intensidad elevada produca una gran reduccin de las respuestas en un sujeto. En un estdio experimental directo de este problema, Miller (1960) encontro que el castigo produca una reduccin menor de la respuesta si la intensidad dei estmulo punitivo se aumen- taba gradualmente en dias sucesivos. Parece entonces que la supresin de las respuestas que produce el castigo se acentua al presentar sbita- mente el estmulo punitivo con toda su intensidad. Este fenmeno no se limita a la presentacin dei castigo. Se ha descubierto que un aumento sbito y sustancial de la intensidad prevaleciente dei estmulo punitivo tambin acenta el grado de supresin producido (Azrin, 1959a; 19606; Holz y Azrin, 1963).An no se ha podido determinar la base de esta efectividad acentuada dei castigo. Puede ser que la aparicin inicial* dei castigo sea especialmente efectivo no slo debido a sus propiedades aversivas, sino tambin porque constituye un cambio de estmulo muy dramtico. Es sabido que la presentacin sbita de un estmulo novedoso por s mismo reduce la emisin de las respuestas. Esta novedad puede combinarse con la aver- sidad dei estmulo punitivo, a fin de producir una reduccin inicial profunda de las respuestas castigadas.U na situacin semejante parece existir con respecto al reforzamiento positivo que se da por medio de la administracin de comida. Cuando se da comida a un pichn mediante un depsito operado por un sole- noide ruidoso, el primer movimiento dei solenoide suele causar una per- turbacin en la conducta dei animal. Entonces, paradjicamente, parece que la administracin de reforzamientos comestibles realmente ha re- ducido la conducta. El procedimiento comnmente adoptado en tales circunstancias es hacer que los animales se adapten al sonido dei solenoide, antes de tratar de evaluar la efectividad dei reforzamiento comestible. Por analogia, entonces, pareceria que el castigo se pudiera estudiar de modo semejante, haciendo primero que el animal se adapte a la novedad consumada dei estmulo punitivo, en vez de presentarle el estmulo pu-

  • 472 CAP. 9 CASTIGO

    nitivo a intensidad elevada en la primera presentacin. En ausncia de tales precauciones, puede suceder que la supresin extremada pro- ducida por la ocurrencia inicial de un castigo de gran intensidad cons- tituya una confusin de las propiedades aversivas dei estmulo punitivo con sus propiedades de estmulo novedoso. Esta explicacin no parece dar cuenta por completo de la sensibilidad que muestran las respuestas castigadas ante un aumento sbito dei castigo. Chung (1965) ha notado este efecto cuando se aumenta sbitamente el requisito de fuerza de una respuesta.Inmediatez dei castigo

    Al definir el castigo afirmamos que el estmulo punitivo debe admi- nistrarse despus de la respuesta que se ha de castigar. Por implicacin, afirmamos tambin que tal administracin debe ser inmediata para lograr un mximo de efectividad. Estes (1944) plante la cuestin de si era necesaria la inmediatez dei castigo. Llev a cabo un experimento control en el que el estmulo punitivo no era administrado inmediatamente despus de la respuesta, sino algn tiempo despus de la emisin de la misma. Los resultados de este procedimiento de castigo mediato se com- pararon con los resultados de un procedimiento de castigo inmediato. stos indicaron que el estmulo punitivo era igualmente efectivo si se reducan las respuestas cuando era inmediato y cuando no lo era. En un estdio, Hunt y Brady (1955) obtuvieron resultados similares. En ambos estdios la administracin dei castigo se limit a un perodo de menos de una hora. En estdios posteriores (Azrin, 1956) se obtuvieron resultados similares en que el castigo inmediato no era ms efectivo que el mediato durante la primera hora. Sin embargo, despus de ese momento las respuestas se recuperaron sustancialmente y muchas veces por completo durante el castigo mediato, mientras que durante el castigo inmediato las respuestas se redujeron indefinidamente y muchas veces por completo. Para una efectividad duradera, el estmulo punitivo debe administrarse inmediatamente.Cuando se quiere administrar el castigo inmediatamente despus de una respuesta, el procedimiento tcnico es directo; sin embargo, el estdio dei castigo mediato presenta algunos problemas metodolgicos. Tcnicamente, se han empleado cuatro mtodos para programar el castigo mediato. En uno de estos mtodos, el estmulo aversivo se administra por medio de un aparato contador, independientemente de la conducta dei sujeto (Azrin, 1956). La desventaja aparente de este mtodo es que, ocasionalmente, el estmulo aversivo puede presentarse inmediatamente despus de una respuesta. A fin de evitar este apareamiento

  • ADM IN ISTRAC I N DEL CASTIGO 473

    ocasional dei estmulo aversivo con la respuesta, se ha utilizado un segundo mtodo en el que el experimentador observa al sujeto y administra el choque solamente cuando el sujeto no est respondiendo. Algunos investigadores (Estes, 1944; Hunt y Brady, 1955) han empleado una combinacin de estos dos mtodos con el fin de evitar coincidncias accidentales de las respuestas con el estmulo punitivo. El tercer mtodo ha consistido en administrar automticamente un estmulo punitivo siem- pre que ha transcurrido un tiempo fijo sin emitir una respuesta. Pareceria que este tercer procedimiento fuera a prueba de tontos para eliminar cualquier coincidncia de la respuesta con el estmulo punitivo. Con todo, ste es precisamente el mtodo que ha usado extensivamente Sid- man (1953) para mantener la conducta en vez de eliminaria. Cuando este mtodo se emplea al mismo tiempo que el reforzamiento positivo para una respuesta (Azrin, 1958; Kelleher y Cook, 1959) las respuestas aumentan en vez de disminuir, como seria el caso con el castigo.El cuarto mtodo para evitar que la respuesta sea seguida por el inicio dei estmulo punitivo consiste en abandonar el uso de un estmulo punitivo discreto. En este mtodo de estimulacin no contingente, el ms simple de todos, el estmulo punitivo se presenta como un evento continuo, ms que discreto. Si el estmulo se presenta sin interrupcin, no existe ninguna posibilidad de que el inicio o la terminacin dei estmulo coincida con la ocurrencia de una respuesta en particular. Este mtodo de programar el castigo mediato evita las desventajas de los tres mtodos anteriores. Con todo, el choque elctrico no puede usarse fcilmente para comparar este mtodo de castigo mediato con el castigo inmediato, pues el choque elctrico continuo da lugar a reacciones esquelticas que pueden interferir con la emisin ^ de respuestas. El ruido es un estmulo punitivo ms adecuado para usarlo en presentaciones continuas, pues el ruido continuo no parece producir reacciones esquelticas interferentes. En un estdio en que se emple el ruido como castigo inmediato, se hizo una comparacin con los efectos dei ruido continuo (Azrin, 1958). El ruido se programo con sujetos humanos de dos m aneras: en el procedimiento de castigo inmediato se produca un estallido ruidoso inmediatamente despus de cada respuesta, mien- tras que en el segundo procedimiento el ruido se administraba continuamente. Se encontro que las respuestas se reducan mientras estaba presente la contingncia punitiva en el procedimiento en el que el ruido se administraba inmediatamente despus de las respuestas. Cuando el ruido se administraba en una base continua, en vez de en una contingente sobre la respuesta, no se produca ninguna reaccin duradera. Parece, entonces, que la inmediatez dei castigo es un determinante fundamental dei grado de reduccin de respuestas obtenido. En los cuatro

  • 474 CAP. 9 CASTIGO

    mtodos, slo en las etapas iniciales dei castigo tiene un efecto apre- ciable el castigo mediato, al reducir la emisin de respuestas.Intensidad dei castigo

    Se ha encontrado que la intensidad dei castigo es uno de los princi- pales determinantes dei grado de reduccin de la respuesta que produce el castigo. Todos los estdios de la intensidad dei castigo han descu- bierto que mientras mayor sea la intensidad dei estimulo punitivo, ma- yor ser la reduccin de las respuestas castigadas (Appel, 1963; Azrin, 19596; 1960a; Azrin, Holz y Hake, 1963; Brethower y Reynolds, 1962; Dinsmoor, 1952; Estes, 1944). Cuando se ha aplicado un choque elctrico, como en los estdios anteriores, la supresin ha sido virtualmente completa en las intensidades altas (Appel, 1961; Azrin, 1959a). Como se hizo notar anteriormente, la amplia gama de efectividad dei choque elctrico constituye su principal ventaja. La severidad dei choque elctrico puede manipularse a lo largo de una gama lo suficientemente amplia para producir cualquier grado de supresin deseada. No todos los estmulos aversivos han resultado poseer el grado de efectividad dei choque elctrico. Como se vio en la figura 3, el castigo de tiempo- fuera produjo poca supresin, incluso cuando la duracin de tiempo-fuera era muy grande. De modo semejante, el castigo administrado por medio dei ruido intenso no parece ser capaz de eliminar completamente las respuestas dentro de la gama de intensidades practicable que ha sido empleada. Utilizando seres humanos como sujetos, Azrin (1958) encontro que haba poca supresin, relativamente, cuando la intensidad dei castigo sonoro era de 105 decibeles o menos. Las intensidades grandes, hasta de 135 decibeles, redujeron las respuestas aproximadamente en un 50 por ciento. Cuando se usaron pichones como sujetos, Holz y Azrin (1962a) encontraron que el castigo sonoro reduca las respuestas en no ms dei 80 por ciento, aunque la intensidad dei ruido fuera de 138 decibeles. Cuando se us una bofetada de la barra como estmulo punitivo, el grado de supresin parece ser igualmente pequeno (Skinner, 1938), aunque no se hizo ninguna manipulacin experimental de la intensidad de la bofetada para determinar si se podia aumentar el grado de supresin. Las rfagas de aire parecen ser muy efectivas. Mas- serman (1946) informo que haba una supresin completa cuando las respuestas se castigaban con rfagas de aire. De nuevo, no se hizo nin- gn estdio de los cmbios dei grado de supresin como funcin de la intensidad de la rfaga de aire. Es probable que la capacidad que tiene el choque elctrico de producir cualquier grado de supresin que se desee, explique en parte el uso generalizado dei choque elctrico como estmulo punitivo.

  • ADM IN ISTRAC I N DEL CASTIGO475

    Programa de castigo

    RAZN FIJA

    En el caso ms simple, se administra un estmulo punitivo por cada respuesta. Este programa de castigo puede disenarse como un castio-o continuo por analogia con el reforzamiento positivo. Alternativamente puede administrarse un estmulo punitivo por cada n respuestas (castigo R F ). La primera presentacin dei castigo RF produjo una acelera- cin positiva en el periodo situado entre las administraciones sucesivas dei estmulo punitivo (Azrin, Holz y Hake, 1963). En la exposicin continua, surgi una tasa de respuestas uniforme sin ninguna acelera- cin ni desaceleracin de las respuestas castigadas entre las administraciones sucesivas dei estmulo punitivo. La uniformidad de la tasa de respuestas prevaleci cuando la razn de las respuestas no castigadas en relacin con las castigadas se aumento de 1:1 a 1000:1; la uniformidad dei patrn de respuestas no fue alterada por los cmbios de intensidad dei castigo ni por el nivel de privacin de comida, aunque cada una de estas opera- ciones cambi la tasa de respuestas absoluta. La frecuencia de las respuestas castigadas estuvo en funcin directa de la razn fija: mientras mayor era la proporcin de respuestas castigadas, mayor fue la reduccin de la respuesta. De este modo, el castigo continuo (RF 1) produjo la mayor supresin. Zimmerman y Ferster (1963) encontraron la misma superio- ridad dei castigo continuo sobre el intermitente usando un periodo de tiempo-fuera como estmulo punitivo. Hendry y Van-Toler (1964) encontraron una aceleracin negativa de las respuestas bajo el castigo de razn fija cuando las respuestas eran mantepidas con reforzamiento continuo, en vez dei programa de reforzamiento de intervalo variable que usaron Azrin, Holz y Hake (1963).INTERVALO FIJO

    Bajo el castigo en IF, el estmulo punitivo se administra a la pri- mera respuesta que se emite despus de un tiempo fijo transcurrido desde que se administro el castigo anterior. Hunt y Brady (1955) y Azrin (1956) han utilizado este programa con algunas modificaciones. En ambos estdios, se produjo una reduccin general de las respuestas con las primeras administraciones dei estmulo punitivo. Se encontro que despus de una exposicin prolongada al programa IF (Azrin, 1956), la tasa de respuestas disminua a cero conforme se acercaba el momento de administrar el castigo programado. La existencia de esta supresin anticipatoria demuestra cmo puede restringirse especificamente el efec- to dei castigo al momento en que el mismo ha sido programado. Este

  • 476 CAP. 9 CASTIGO

    patrn temporal de las respuestas parece ser similar al patrn temporal que se observa bajo el programa de reforzamiento IF con comida (Skinner, 1938), a excepcin de que se produce una aceleracin negativa, en vez de una positiva.An no se han estudiado extensivamente otros tipos de programas de castigo. Al comparar el castigo continuo con un programa de castigo intermitente, Estes (1944) encontro que el castigo continuo era ms efectivo que el intermitente mientras el castigo estaba en efecto. Este hallazgo concuerda con el descubrimiento acerca dei castigo de razn fija, que tambin es un programa intermitente. En un estdio, se comparo el programa de castigo IV con el IF y se encontro que el primero pro- duca ms supresin (Azrin, 1956). Otro ejemplo de un programa de castigo es el castigo diferencial de tasas altas de respuesta de Ferster (1958).Asueto sin castigoPodra parecer que un periodo de asueto o tiempo-fuera de un perodo de castigo permitiria ganar fuerza a la respuesta castigada. Los resultados obtenidos indican que no es esto lo que sucede. U n mtodo de proporcionar un asueto consiste en evitar que ocurra la respuesta (no hay respuesta, no hay reforzamientos, no hay castigo) durante un periodo entre las sesiones. Los resultados indican que la reimplantacin de la situacin de castigo suprime las respuestas con igual intensidad (Mas- serman, 1946), a veces mayor (Azrin, 19596; 19606), que antes dei asueto. Tambin se obtuvo este nivel de supresin cuando se interrumpi brevemente una sola sesin (Azrin, 19606). Masserman (1946) cit un ejemplo dramtico: dio un descanso de veinte meses a un gato cuyas respuestas haban sido suprimidas por completo. Cuando se reintrodujo al sujeto a la situacin experimental, las respuestas siguieron estando completamente suprimidas, aunque se haba eliminado el estmulo punitivo.Otro tipo de asueto permite que la respuesta sea reforzada mientras el castigo se elimina temporalmente. Podra parecer que los reforzamientos adicionales fortalecen la respuesta y que sta resiste los efectos de cualquier castigo posterior. De nuevo, los hallazgos indican que lo que sucede es que el retiro dei castigo tiene como resultado una supresin igualmente grande (Brethower y Reynolds, 1962) o mayor (Azrin, 19606; Masserman, 1946) cuando el castigo se vuelve a aplicar posteriormente. El espacio temporal por si mismo no reduce los efectos supresivos dei castigo.Se ha visto que la efectividad dei estmulo punitivo es influida por la intensidad, la frecuencia, la programacin y la distribucin temporal dei estmulo. Tambin se ha encontrado que cada uno de estos factores

  • VARIABLES QUE INFLUYEN EN LOS EFECTOS DEL CASTIGO 477

    desempena un papel primordial como determinante de la efectividad de un estmulo reforzante; por ejemplo, se ha encontrado que el reforzamiento demorado es menos efectivo (pero no inefectivo) para man- tener la respuesta cuando se usa comida como reforzamiento (Skinner, 1938). Asimismo, se ha visto que el castigo demorado fue menos efectivo (pero de ninguna manera inefectivo) para suprimir las respuestas; y se ha encontrado que un periodo de descanso aumenta la efectividad de un reforzador positivo (Ferster y Skinner, 1957; Reynolds, 1961) dei mismo modo que hemos visto que un periodo de descanso o asueto aumenta la efectividad dei castigo. El reforzamiento positivo y el castigo pare- cen comparables en otros aspectos, como veremos en secciones posteriores.Como regia emprica, parece adecuado describir al castigo como un proceso semejante al reforzamiento positivo en trminos de sus determinantes, pero opuesto al mismo en trminos de la direccin dei cambio conductual; por ejemplo, la frecuencia es un determinante primordial tanto de las respuestas reforzadas con comida (Skinner, 1938) como de las respuestas castigadas. Un aumento de la frecuencia de la administracin de comida aumentar las respuestas reforzadas con comida, pero un aumento de la frecuencia de la administracin dei castigo har disminuir las respuestas castigadas. Ciertamente, es necesario hacer in- vestigaciones adicionales a fin de dilucidar la generalidad de esta com- paracin terica dei reforzamiento con el castigo. Sin embargo, a un nivel descriptivo, el castigo y el reforzamiento estn entrelazados inex- tricablemente: la propia existencia dei proceso de castigo exige que haya algunos procedimientos de reforzamiento concurrentes, como veremos en la seccin siguiente.VARIABLES DEL REFORZAMIENTO QUE INFLUYEN EN LOS EFECTOS DEL CASTIGO

    Si una respuesta es castigada, pero no es reforzada de alguna manera, se extingue por la ausncia de .reforzamiento, y el uso dei castigo slo acelera la eliminacin de la respuesta. Dinsmoor (1952) ha ex- presado la misma opinin acerca de la existencia necesaria dei reforzamiento.Para que una persona pueda aprender a em itir en prim er lugar una cierta respuesta, supuestamente se requiere algn tipo de reforzamiento. Si el reforzamiento se presenta como una simple consecuencia fsica dei acto, no parece haber ninguna razn para suponer que el reforzam iento cese siempre que se empieza a aplicar el castigo. En realidad, si el reforzamiento se suprime durante m ucho tiempo, se inicia la extincin, y tal vez deje de haber respuestas que castigar (pg. 27).

  • 478 CAP. 9 CASTIGO

    U na situacin punitiva duradera debe incluir tanto el reforzamiento como el castigo de las respuestas. Examinemos varios aspectos dei reforzamiento que se han revelado significativos para la efectividad dei castigo.Programas de reforzamiento

    Ya que la respuesta castigada tambin es reforzada, la eleccin de un programa de reforzamiento en particular debe ser importante para determinar el efecto que va a tener un estmulo punitivo. En el caso ms simple, cada respuesta es reforzada y castigada. U n programa de reforzamiento continuo crea una situacin especial en la que el castigo se administra en el mismo momento en que el organismo se acerca al reforzamiento, como sucede en el estdio de Masserman (1946). Como resultado de esto, la rfaga de aire punitiva elimin tanto la conducta de alimentarse como la respuesta operante. Este problema se reduce al mnimo si se utiliza un programa de reforzamiento intermitente en el cual el estmulo punitivo no se aparee exclusivamente con el reforzamiento de comida, pues las respuestas no reforzadas sern tambin castigadas.Se ha encontrado que el tipo de reduccin de la respuesta que produce el castigo depende dei tipo de programas de reforzamiento que est manteniendo las respuestas castigadas. Cuando se usa nicamente un programa de reforzamiento IV, las respuestas se emiten a una tasa uniforme (Ferster y Skinner, 1957). El castigo de cada respuesta reduce la tasa, pero no cambia esta uniformidad bsica (Azrin, 1960a; 19606; Brethower y Reynolds, 1962; Dinsmoor, 1952; Holz y Azrin, 1961).Cuando se usa un programa de reforzamiento IF, normalmente se presenta una aceleracin positiva de las respuestas entre los reforzamientos (Ferster y Skinner, 1957). Puede considerarse que el grado de esta aceleracin de la respuesta es un tipo de discriminacin temporal o un patrn. Se han creado dos medidas (Fry, Kelleher y Cook, 1960; Herr- stein y Morse, 19756) para cuantificar el grado de aceleracin de la respuesta. Cuando se administra un castigo por cada respuesta, puede reducirse considerablemente el nmero de respuestas IF (Azrin, 1958; Estes, 1944; Skinner, 1938), pero el grado de discriminacin temporal permanece inmutable (Azrin y Holz, 1961).Bajo el reforzamiento RF, la tasa de respuestas suele ser bivalente: de inmediato despus dei reforzamiento se presenta un periodo de cero respuestas, seguido por un cambio repentino a un encarreramiento de la razn con una tasa de respuestas muy alta (Skinner, 1938). Cuando el castigo se administra a cada respuesta durante el reforzamiento RF, la pausa posreforzamiento se alarga, pero hay slo una ligera reduc-

  • VARIABLES QUE INFLUYEN EN LOS EFECTOS DEL CASTIGO 479

    cin en la alta tasa de respuestas (Azrin, 19596). Dardano y Sauerbrunn (1964a) encontraron el mismo resultado cuando se administraba un solo castigo a la primera respuesta de la razn fija. La parte inicial dei en- carreramiento de la razn parece ser muy sensible a los efectos dei castigo. Esto puede verse en un segundo experimento de Dardano y Sauerbrunn (19646) en el que una larga pausa precedia al encarreramiento de la razn cuando se administraba un choque intenso durante la parte inicial de la razn. La pausa era ms corta cuando el choque intenso se administraba durante la ltima parte de la razn. En un tercer experimento, Dardano y Sauerbrunn (1964c) encontraron que sus sujetos pre- feran un requisito de tasa elevada que no era castigada, a un requisito de tasa baja que era castigada. El uso dei castigo durante el reforzamiento RF no se manifiesta en una tasa ms baja, como sera de es- perarse por la definicin bsica dei castigo. La tasa de respuestas terminal permanece constante; lo que se reduce es la tasa de respuestas total.El procedimiento de reforzamiento puede disponerse tambin de una manera tal que haya un reforzamiento diferencial de las tasas bajas. Este programa rdb produce ordinariamente una emisin de respuestas de tasa baja en la que los tiempos entre respuestas generalmente se aproxi- man al tiempo entre respuestas mnimo requerido para obtener reforzamiento (Anger, 1956). Asimismo, se obtienen explosiones de respuestas ocasionales; esto se nota en la alta frecuencia que tienen los tiempos entre respuestas cortos en la distribucin dei tiempo entre respuestas. Cuando se castiga cada respuesta durante el reforzamiento rdb, estos tiempos entre respuestas cortos son eliminados, incluso con bajas intensidades de castigo que no producen cmbios en el resto de la distribucin de los tiempos entre respuestas (Holz, Azrin y Ulrich, 1963). En las intensidades de castigo ms altas, se alarga el tiempo modal entre respuestas.Hemos visto que la eleccin de un programa de reforzamiento en particular para mantener la respuesta castigada, determina el patrn temporal que tienen las respuestas durante el castigo. A fin de especificar la naturaleza de la reduccin de respuestas que produce el castigo, se debe especificar cul es el programa de reforzamiento que est man- teniendo las respuestas. La simple afirmacin de que el castigo reduce las respuestas castigadas es inadecuada y, ocasionalmente, inexacta.Frecuencia dei reforzamiento

    Se han efectuado dos estdios (Azrin y Holz, 1961; Estes, 1944) en los que se ha comparado el grado de reduccin de las respuestas que se produjo cuando el castigo se aplic durante la extincin, con el

  • 480 CAP. 9 CASTIGO

    F IG U R A 4. Efectos de la extincin de las respuestas em itidas en un intervalo fijo ante d iversas in tensidades de castigo m antenido. N o hubo n ingn reforzam iento despus dei primero, el cual se adm inistro al inicio de la sesin. El castigo se adm inistro despus de cada respuesta. (Tom ado de Azrin y Holz, 1961.)

    grado de reduccin habido cuando el castigo se aplic durante el reforzamiento. En ambos estdios se encontro que el castigo produca una tasa de respuestas ms baja cuando se aplicaba durante los perodos de extincin. Asimismo, en ambos estdios se demostro que en tanto se mantuviera el castigo mientras duraba el perodo de extincin, el proceso de extincin podia acortarse considerablemente, tanto con respecto al nmero de respuestas como por lo que se refiere al tiempo que duraba la extincin (vase la figura 4 ). Parece, entonces, que tanto una frecuencia de reforzamiento reducida, como el castigo de gran intensidad operan en la misma direccin; ambos procedimientos reducen la tasa de la respuesta. De este modo, cuando ambos se usan simultnea-

  • VARIABLES QUE INFLUYEN EN LOS EFECTOS DEL CASTIGO 481

    mente, la eliminacin de la conducta es ms rpida que cuando seemplea slo el castigo o la extincin.Hemos visto que la presencia o ausncia dei reforzamiento de la respuesta castigada determina la efectividad dei castigo. Tambin sucede que la adicin de un castigo altera la frecuencia dei reforzamiento dela respuesta castigada. Como se dijo anteriormente, por lo general se usael castigo para contrarrestar un reforzamiento concurrente. Como la administracin dei reforzamiento depende de la emisin de las respuestas, la reduccin de stas mediante el castigo lleva generalmente a una reduccin de la frecuencia de reforzamiento. Si se usa un programa de reforzamiento RF, existe una interrelacin inversa entre la intensidad dei castigo y la frecuencia de reforzamiento (Azrin, 1959>), pues la frecuencia de reforzamiento se reduce en proporcin directa a la efectividad dei castigo. Bajo programas de intervalo, generalmente el nmero de respuestas emitidas es mayor que el nmero necesario para obtener la mxima frecuencia de reforzamiento. Por tanto, la reduccin de la frecuencia de la respuesta por medio dei castigo lleva a poca o ninguna reduccin de la frecuencia de reforzamiento, salvo cuando las respuestas se suprimen casi completamente (Azrin y Holz, 1961; Holz, Azrin y Ulrich, 1963). Es probable que muchos investigadores hayan utilizado los programas de reforzamiento de intervalo debido a este alto grado de independencia que hay entre el castigo y la frecuencia de reforzamiento.El programa de reforzamiento drb es especialmente til como mtodo para estudiar el castigo. Como el castigo produce pausas ms largas entre las respuestas, a menudo la frecuencia de reforzamiento aumenta durante el castigo (Holz, Azrin y Ulrich, 1963). Puede considerarse que el castigo de las respuestas drb se hace en provenho dei sujeto castigado (mayor frecuencia de reforzamiento positivo). En resumen, el proceso dei castigo lleva indirectamente a una menor frecuencia de reforzamiento en los programas de reforzamiento de razn, a una mayor frecuencia de reforzamiento bajo el reforzamiento drb, y a pocos cmbios bajo el reforzamiento de intervalo.U na opinin comn acerca dei castigo pretende que ste interfiere con la ejecucin deseable o productiva. El empleo dei reforzamiento drb es un caso en el que el castigo de una respuesta aumenta realmente la eficiencia de esa respuesta. De tal suerte, es inexacto considerar que el empleo concurrente dei castigo y el reforzamiento constituye nece- sariamente una situacin de conflicto acerca de la recepcin dei reforzamiento. En realidad, slo durante los programas de reforzamiento de razn los efectos reductivos dei castigo llevan a una disminucin dei reforzamiento.

  • 482 CAP. 9 CASTIGO

    Motivacin para responderLa medida en que una respuesta reforzada con comida resiste los efectos dei castigo depende dei grado de privacin de comida. Dinsmoor (1952) encontro que el castigo reduca las respuestas si el sujeto era privado de comida en mayor o menor grado. Sin embargo, con una con- siderable privacin de comida, las respuestas eran reducidas en una proporcin ms pequena. Se ha encontrado que cuando ha estado en efecto una larga historia de reforzamiento de IV con comida, la tasa de respuestas no cambia apreciablemente como funcin dei grado de privacin de comida (Ferster y Skinner, 1957). No obstante, cuando se agrega el castigo despus de esta larga historia, la tasa de respuestas castigadas parece ser extrahamente sensible, incluso, a cmbios ligeros de privacin de comida (Azrin, 19606; Azrin, Holz y Hake, 1963). En un caso, el castigo se volvi casi inefectivo al aumentar el grado de motivacin para emitir las respuestas castigadas (Azrin, Holz y Hake, 1963). Sin embargo, si las respuestas han sido completamente suprimidas por una motivacin baja para la comida, el aumento de la motivacin no parece ser efectivo para restablecer las respuestas (Masserman, 1946; Storms, Boroczi y Broen, 1962).

    Nmero de respuestas disponiblesEn la mayora de los estdios sobre el castigo, se pone a disposicin dei sujeto una sola respuesta para obtener el reforzamiento. Cuando esta respuesta tambin es castigada, el sujeto no tiene ningn medio alternativo para obtener el reforzamiento de comida. Si el castigo hace que el sujeto deje de responder por completo, no se produce ningn reforzamiento. Consideremos ahora la situacin en la que el sujeto s tiene a su disposicin alguna respuesta alternativa que no ha sido castigada y que puede producir el reforzamiento. Hemos visto anteriormente ejemplos de este caso en el experimento de Holz, Azrin y Ayllon (1963), en una seccin anterior dedicada a los efectos dei tiempo-fuera. En este punto podemos poner en tela de duda si los resultados de este experimento son aplicables a las situaciones punitivas en general, o si se limi- tan a las situaciones que utilizan las propiedades nicas de un periodo de tiempo-fuera como estmulo punitivo.Herman y Azrin (1964) llevaron a cabo un experimento en el que se repitieron las caratersticas esenciales dei procedimiento de Holz; sin embargo, en vez de emplear un tiempo-fuera como estmulo punitivo, usaron un ruido. Los resultados obtenidos con ruido, como se ve en la figura 5, fueron esencialmente los mismos que se obtuvieron

  • VARIABLES QUE INFLUYEN EN LOS EFECTOS DEL CASTIGO 483

    MINUTOS

    F IG U R A 5. Registros acum ulativos de las respuestas castigadas em itidas por su{etos hum anos en un p rogram a de reforzam iento IV. N o se ind ican las adm inistraciones de reforza- m ientos. El castigo era un son ido m olesto em itido por un zum bador, que se ap licaba a cada respuesta. (Basado en datos tom ados de Herm an y Azrin, 1964.)

    con el tiempo-fuera. La tasa de respuestas en una situacin de respuesta nica fue afectada slo ligeramente por una intensidad dada de castigo sonoro; mientras que en una situacin de respuesta alternativa, la tasa de respuestas castigada emitida en el mismo manipulando fue re- ducida por completo y casi inmediatamente. Parece que la situacin de respuesta alternativa produce una mayor supresin de respuesta castigada que una situacin de respuesta nica.En un experimento adicional (Azrin, datos inditos) se usaron pi- chones como sujetos y un choque con un electrodo como estmulo punitivo, a fin de estudiar los efectos de una situacin de respuesta alternativa en comparacin con una situacin de respuesta nica. Como manipulandos, se usaron dos teclas de respuesta circulares. Los picoteos en cualquier tecla eran reforzados segn un programa de reforzamiento con comida RF 25. Cuando se pona a disposicin dei sujeto una sola tecla, mediante el procedimiento de cubrir la segunda tecla, las 25 respuestas dei requisito de razn fija tenan que ser emitidas en el manipulando disponible. Cuando dispona de las dos teclas, el sujeto podia distribuir las 25 respuestas de cualquier manera; una parte, todas o ninguna de las 25 respuestas podan emitirse en un manipulando dado. El castigo por medio de un choque en la cola se administraba a cada una de las respuestas emitidas en una de las teclas. Cuando slo haba un manipulando (situacin de respuesta nica), se registraba un castigo

  • 484 CAP. 9 CASTIGO

    INTENSIDAD D EL CASTIGO ( VOLTIO S )

    F IG U R A 6. La tasa de respuestas ca stigadas como funcin de la intensidad dei castigo. Los datos se tom aron de un p ichn que h a b a sido reforzado bajo un p rogram a RF 25. H ab a dos teclas de respuesta; la s respuestas em itidas en am b as teclas eran efectivas para llenar el requisito RF. El castigo se adm in istro a todas las respuestas em itidas en la tecla preferida, de m anera concurrente con el p rogram a RF de comida. La intensidad dei castigo se aum ento con descargas de diez voltios, dejando pasa r por lo m enos cinco d ia s para cada intensidad. Este procedim iento se llev a cabo con la tecla preferida cubierta (sin respuesta alternativa) y con am b as teclas de respuesta descubiertas (con respuesta alternativa). (Tom ado de A zrin y Holz, datos no publicados.)

    por cada respuesta. Cuando se disponia de ambos manipulandos en la situacin de respuesta alternativa, slo se castigaban las respuestas emitidas en un manipulando (el manipulando preferido).U na parte de los resultados de este experimento se resumen en la figura 6, que muestra la tasa de respuestas emitida en el manipulando castigado con diversas intensidades de choque. Puede verse que la tasa de respuestas emitida en el manipulando castigado estuvo en funcin inversa de la intensidad dei choque, como se muestra en la parte superior, en la seccin sobre la intensidad dei castigo. No se puede observar ninguna reduccin de las respuestas superior a aproximadamente 40 voltios en la situacin de respuestas nica; a 50 voltios, la tasa se redujo slo en un 10%. Incluso a 60 voltios, la tasa de respuestas sigui siendo de aproximadamente el 70% de la tasa no castigada. En la situacin de respuesta alternativa, el castigo no tuvo un efecto ms pronunciado. A 50 voltios, se suprimieron completamente las respuestas emitidas en el manipulando castigado, aunque la misma intensidad de castigo pro-

  • VARIABLES QUE INFLUYEN EN LOS EFECTOS DEL CASTIGO 485

    dujo una reduccin muy pequena en la situacin de respuesta nica. Por tanto, podemos llegar a la conclusin de que la situacin de respuesta alternativa hace que una intensidad de choque dada produzca una mayor supresin que en una situacin de respuesta nica, ya sea que el estmulo aversivo sea un periodo de tiempo-fuera, un ruido molesto, un choque con electrodo o que los sujetos sean seres humanos o pichones.

    Escape de un estmulo punitivo

    Acabamos de estudiar la situacin en la que el sujeto dispone con- currentemente de una respuesta alternativa no castigada mientras se castiga una respuesta diferente. Consideremos ahora la situacin en la que el sujeto tiene un medio para escapar de la situacin en la que la respuesta es castigada, a una situacin en la que la respuesta no es castigada. En el procedimiento punitivo comn, el sujeto tiene la opcin de responder y recibir tanto el castigo como el reforzamiento, o de no responder, en cuyo caso no recibe ninguna de las dos cosas. El procedimiento de respuesta alternativa difiere dei procedimiento comn en que hay una segunda respuesta que proporciona la misma frecuencia de reforzamiento y no proporciona ningn castigo. En el tercer procedimiento que examinamos ahora, al sujeto se le da la oportunidad de escapar enteramente de la situacin relacionada con el castigo.El procedimiento es el siguiente: un pichn es reforzado con comidasegn un programa de reforzamiento de razn fija a fin de establecer una frecuencia de respuestas elevadas. Luego se administra el castigo en forma de un choque elctrico despus de cada respuesta, con lo cual se construye el procedimiento comn de castigo y reforzamiento con comida concurrentes. Luego se pone a disposicin dei sujeto una. segunda tecla de respuestas. La respuesta emitida en esta segunda tecla de respuestas no produce reforzamiento ni comida. En vez de eso, produce un cambio de estmulos, que consiste en un cambio de la iluminacin y un cambio dei nivel de ruido dei ambiente. Ante este estmulo cambiado, el sujeto puede responder en la tecla de respuesta comn y obtener comidacomo reforzamiento, pero sin que se administre ningn castigo. Entonces,la funcin de la respuesta de escape emitida en la segunda tecla de respuestas es la de proporcionar un periodo de escape durante el cual puede emitirse la respuesta sin ser castigada. U na vez emitida la respuesta de escape, el periodo de seguridad dura hasta la administracin dei reforzamiento. Inmediatamente despus de la comida reforzante, el sujeto debe emitir otra respuesta de escape con el fin de reinstalar el periodo de escape.

  • 486 CAP. 9 CASTIGO

    IN T E N S ID A D DEL C AST IG O ( V O L T IO S )

    F IG U R A 7. Respuestas de un p ichn tpico en un RF 2 5 de reforzam iento con comida. Las respuestas se castigaban concurrentemente (curva continua), a m enos que el sujeto em itiera una respuesta de escape en otra tecla de respuesta, lo que p roduca un periodo durante el cual pod an emitirse las respuestas sin que se ap licara el castigo (curva punteada). (Tom ado de Azrin, Hake, Holz y Hutchinson, 1965.)

    La figura 7, basada en los datos de Azrin, Hake, Holz y Hutchinson (1965), muestra los resultados de este procedimiento. Cuando no se administro ningn castigo o se administro uno muy ligero, se emitieron pocas respuestas de escape. Cuando la intensidad lleg a 40 voltios, el sujeto estaba emitiendo respuestas de escape suficientes para permanecer en la situacin segura durante casi toda la sesin experimental. La misma figura muestra que las respuestas se desplazaron de la situacin estmulo donde haba castigo a la situacin estmulo en la que no lo haba. En este procedimiento, el castigo no solamente llev a una reduccin de las respuestas castigadas, sino que retir al sujeto de la situacin estmulo en la que se haba programado el castigo.En la investigacin anterior se comparo experimentalmente este procedimiento de escape con el procedimiento de castigo comn en el cual ningn escape era posible. Los resultados de esta comparacin se mues- tran en la figura 8, tomada de Azrin, Hake, Holz y Hutchinson (1965). El procedimiento de escape y castigo tuvo como resultado mayor supresin de respuestas castigadas que el procedimiento que no tena escape. La lnea continua de la figura 8 indica la reduccin progresiva de las respuestas como funcin de la intensidad dei castigo sin oportunidad de escapar. En esta figura puede verse que no se obtuvo una supresin completa, sino hasta que se alcanz una intensidad de 70 voltios. En 30 voltios se observo poca o ninguna supresin cuando no haba ningn escape po-

  • VARIABLES QUE INFLUYEN EN LOS EFECTOS DEL CASTIGO 487

    co

    F IG U R A 8. Tasa de respuestas ca stigadas em itidas, cuando no h a y n ingn escape posible, com parada con la ta sa de respuestas ca stigadas em itidas cuando h a y un escape posible. U na so la respuesta em itida en una tecla de escape e lim inaba el castigo durante un periodo, que term inaba con el siguiente reforzamiento. Las respuestas p a ra obtener com ida eran m antenidas con un p rogram a RF 25. (Tom ado de Azrin, Hake, Holz y Hutchinson, 1965.)

    sible; sin embargo, en el procedimiento de castigo y escape (lnea punteada), 30 voltios produjeron una eliminacin casi completa de las respuestas castigadas. A la ligera intensidad de 40 voltios, la respuesta castigada se redujo a un nivel cero. De tal suerte, una intensidad de castigo que produjo poca o ninguna supresin en el procedimiento en el que no haba la oportunidad de escapar, produjo una supresin completa en el procedimiento de castigo y escape. A fin de evaluar la fuerza de esta conducta de escape, en la tercera parte dei procedimiento se le pedia al sujeto que emitiera ms de una respuesta para producir el periodo de escape. Se encontro (vase la figura 9) que, si se empleaba el periodo de escape como evento reforzante, podan mantenerse requisitos de razn fija hasta de aproximadamente cien respuestas. Asimismo, cuando la respuesta de escape se programaba segn un programa IF, surgia el patrn de respuestas IF comn. De este modo, parece evidente que la tendencia a escapar de una situacin seriamente punitiva fue lo bastante grande para mantener niveles sustanciales de respuestas de escape. Estos resultados muestran que uno de los principales efectos que se producen al castigar una respuesta es la generacin de una fuerte tendencia por parte dei sujeto a escapar totalmente de la situacin punitiva. Esta tendencia a escapar de la situacin punitiva se ve incluso a intensidades de castigo que no son lo bastante severas para suprimir la propia respuesta castigada.

  • 488

    ESCAPE RF D E L CAST IGO

    CAP. 9 CASTIGO

    500

    (/)