Adiestramiento con Clicker
• B.F. Skinner padre del condicionamiento instrumental (1920) • Marian y Keller Breland alumnos de Skinner lo aplican al
entrenamiento animal y forman “Animal Behavior Enterprises”. • Bob Bailey • Karen Pryor: delfinesàperro
TIPOS DE CONDICIONAMIENTO: CLASICO Y OPERANTE
• Clásico – Click – Refuerzo – Movimientos involuntarios
• Operante – El animal muestra un comportamiento para
obtener un estímulo deseable. – Al usar el clicker, el perro se vuelve
voluntarioso, atento y cooperativo
TIPOS DE CONDICIONAMIENTO …
¢ La consecuencia es conIngente a la respuesta que previamente ha emiIdo el sujeto.
¢ La conducta se transforma en el instrumento para conseguir lo deseado.
¢ La asociación se da entre las respuestas y las consecuencias que se
derivan de ellas.
¢ Dos sucesos que ocurren a la vez quedan emparejados tras sucesivas repeIciones.
¢ EI: esPmulo que por si mismo provoca una respuesta (comida).
¢ EC: esPmulo que por si solo no produce nada (campana).
¢ RI: respuesta provocada por el EI. ¢ RC: respuesta obtenida por el EC
Condicionamiento Operante o Instrumetal
Condicionamiento Clásico
Bases del clicker training
-‐ Asociación de un esPmulo audiIvo con un reforzador primario. -‐EsPmulo Puente – hace “puente” entre la respuesta deseada y la entrega del refuerzo
primario. -‐Reforzador Condicionado -‐ son EC que previamente se han asociado, por condicionamiento
clásico, con un EI. El perro predice que al aparecer el EC, vendrá el EI. En estos casos el EC se transforma en un reforzador condicionado (RC) que permite que el perro sea premiado sin la intervención ni la distracción del refuerzo.
EL MOTIVADOR
• El motivador adecuado
– A mi perro no le interesa la comida. – Probar y utilizar diversas opciones
de motivadores.
EL TIMING
• Tiempo que transcurre entre la acción y el refuerzo.
• El momento justo.
LA LATENCIA
• Tiempo que transcurre entre el comando y la acción
• Mejorando latencias – Ansiedad – Puliendo hacia mejores latencias
EL REFORZADOR CONDICIONADO
• Una vez que el perro entiende que el sonido implica que el refuerzo viene en camino; ya tengo un reforzador condicionado.
• Por ejemplo, si el perro escucha este sonido cada vez que realiza un salto, comenzará a saltar con mayor frecuencia.
• Luego comprenderá que saltar solo funciona cuando el adiestrador levanta el brazo, así el levantamiento del brazo del adiestrador pasa a significar que hay luz verde para saltar.
• El adiestrador luego puede poner otras condiciones como: saltar sólo gana premio cuando es en una cierta dirección, o cuando salta más de 40 centímetros.
REFUERZO DIRECTO / CONDICIONADO
• El refuerzo directo tiene la limitación de que no permite un buen timing.
• El refuerzo condicionado permite marcar el momento justo de la acción.
• Al crear un refuerzo condicionado auditivo, el perro no tiene que estar pendiente de lo que hacemos, sólo del sonido.
CARGANDO EL CLICKER
• Para enseñarle al perro el significado del sonido, voy haciendo sonar el clicker y dándole un trozo de comida en distintas posiciones y lugares; de esta forma evito que haga asociaciones indeseadas.
CUANDO CLICKEAR
• E l c l i c k e r s e u t i l i z a p a r a m o l d e a r comportamientos o para pulir detalles, pero no es necesario para comportamientos que ya han sido aprendidos.
ES UN JUEGO
• Se da la oportunidad al animal de ganar una y otra vez
• Juego de descubrir que le ganará el premio (adivinanza)
• Canal de comunicación eficiente para darme a entender al perro
Técnicas de entrenamiento
• Moldeado Libre (free shaping) • Guiado • Captura • TargeIng • Luring • Channeling
TargeIng • Elemento direccionador de la conducta
Atendiendo al perro • nose targeIng • paw targeIng • Otros … Atendiendo al elemento • Hand target • Foot target • SIck target • Patch target • Laser target • Otros…
• TargeIng
• Luring
-‐Comportamientos groseros. -‐Precisión y fiabilidad relaIvas. -‐Procedimiento de facilitación.
• Channeling UIlizando elementos del ambiente, ayudaremos al animal a realizar una conducta. Ej: caminar hacia atrás en línea recta.
• Marca -‐Es una variación del targeIng que implica tocar con las patas o dirigirse a determinado lugar marcado por un elemento sobre cual se le ha enseñado a situarse encima. -‐Traslados A àB -‐Direccionales -‐Ejercicio “STOP”
Guiado • Mediante manipulación
csica se lleva al animal a realizar un comportamiento deseado.
• Ej: presionar a la altura de los hombros para echarlo.
• Se trata de verdaderamente esperar y capturar una conducta generada de manera espontánea por parte del animal.
• Todas las acciones parten del propio sujeto sin intervención humana alguna, se trata de momentos absolutamente mágicos en los que el animal toma la iniciaIva.
• Muy usado en entrenamientos de zoológico por la imposibilidad de interactuar con animales de alto riesgo.
Captura
Moldeado Libre (Free Shaping)
• Entrenamiento por el que se refuerzan partes del comportamiento deseado o aproximaciones que nos llevan a él.
- El perro descubre progresivamente y de una forma natural que esperamos de él.
El moldeado, se consigue mediante
Aproximaciones Sucesivas.
Aproximación Sucesiva • Llegando a una conducta desde cero • Por ejemplo: Quiero que el perro se gire en si
mismo como persiguiéndose la cola. – Parto clickeando cualquier movimiento, incluso una
mirada en la dirección seleccionada – Luego un paso – Luego una vuelta – Luego dos
• Con targeting
ALENTANDO CON LA VOZ
• Entrenador y Actor
• Reforzador Terciario “Bien”
SUBIENDO LA VARA
• Una vez que tengo la conducta que deseo, comienzo a pulir clickeando sólo aquellas veces en las que se acerca mas a la conducta ideal y voy subiendo el grado de perfección gradualmente y de forma realista.
INTRODUCIENDO EL COMANDO
• Al inicio de la acción
• En el medio
• Al final
UNIENDO COMANDOS
• Comandos gestuales procedentes del targeting
• Comandos visuales y verbales
UN COMANDO, UNA REACCION
• Doy la orden
• Espero
• Analizo la reacción • Doy otra orden
UN COMANDO SIN REACCION
• Doy la orden y el perro no responde
• No repetir comandos
• Buscar alternativas
• Volver atrás
• Targeting