Post on 11-Jan-2016
description
Lernen und Gedächtnis
VorlesungChristian Kaernbach
Teil 1: Lernen
Konditioniertes Lernen
• Hauptparadigma des Behaviorismus– Der Mensch als Reiz-Reaktions-System– Mentale Größen sind
• nicht erfaßbar
• nicht existent
• Implizites Gedächtnis
• Klassisches Konditionieren• Instrumentelles Konditionieren• Implizites Lernen
Klassisches Konditionieren
• unkonditionierter Stimulus (US)– Pawlow: Fleisch– z. B. Luftstrom gegen Hornhaut
• unkonditionierte Reaktion (UR)– Pawlow: Speichelbildung– hier: Lidschlag
• konditionierter Stimulus (CS)– Pawlow: Klingel– z. B. Ton
• konditionierte Reaktion (CR)– Pawlow: Speichelbildung– hier: Lidschlag– CR UR
Klassisches Konditionieren• Die CR wird schnell gelernt.
– eine CS-US Koppelung kann ausreichen.
• Sie kann zwar gelöscht werden,– wiederholte Darbietung von CS ohne US.
• aber sie wird nie vergessen.– bei weiterer CS-US Koppelung:
• Ersparnis– ohne weitere CS-US Koppelung:
• spontane Erholung• Kontext (Erneuerung)• US o.ä. (Wiederherstellung)• Relevanz: Stabilität der Phobie
• Gegenkonditionieren• Clockwork Orange
Stanley Kubrick / Anthony Burgess
CS
US
CS
US
CS
US
Zeitverhältnisse
• simultan
• verzögert
• rückwirkend
CS
US
CS
US
CS
US
• simultan
• verzögert
• rückwirkend
250
500
750
125
Zeitverhältnisse
CR ist antizipatorische Reaktion auf den US
Paßfähigkeit von US und CS
• Experiment mit Ratten:– US1: Stromschlag
US2: Brechmittel
– CS1: TonCS2: Süßstoff
CS1+CS2+US1: CR nur bei CS1 CS1+CS2+US2: CR nur bei CS2
• Ein Geschmacksreiz ist ein besserer Prädiktor für Brechreiz als ein Ton
• Ein externer Reiz ist ein besserer Prädiktor für Stromschlag als ein Geschmack
Neurophysiologiedes klassischenKonditionierens
• us1 Mantelrand/us2 Siphon berühren
ur schwacher Kiemenrückzug
• US Stromschlag Schwanz UR starker Kiemenrückzug
• CS1 Mantelrand/CS2 Siphon berühren
CR starker Kiemenrückzugselektiv auf CS1 oder CS2(CS+ bzw. CS–)
• Hebb Lernregel (1949)
Klassische Konditionierung:Was wird gelernt?
• konditionierter „Reflex“?– Reflex US UR– neue Verbindung CS UR = neuer Reflex?– CS CR UR!– gelernt wird nicht CS CR, sondern CS US
• UR verhindern: CR wird trotzdem gelernt• US entwerten (US: Futter bei hungrigen/satten Ratten)• CS2 mit CS1 paaren, dann CS1 mit US: CR auf CS2
Klassische Konditionierung:Was wird gelernt?
• Informationswert des CS– Hauptparameter: Kontiguität P(US|CS)
Wahrscheinlichkeit, daß US auftritt, wenn CS gegeben wurde
– ebenfalls wichtig: Basisrate P(US|–CS)Wahrscheinlichkeit, daß US auftritt,wenn kein CS gegeben wurde
– Informationswert: Kontingenz P = P(US|CS) – P(US|–CS)
P(US|–CS)
Klassische Konditionierung:Was wird gelernt?
• Informationswert des CS– Hauptparameter: Kontiguität P(US|CS)
Wahrscheinlichkeit, daß US auftritt, wenn CS gegeben wurde
– ebenfalls wichtig: Basisrate P(US|–CS)Wahrscheinlichkeit, daß US auftritt,wenn kein CS gegeben wurde
– Informationswert: Kontingenz P = P(US|CS) – P(US|–CS)
Menschen
Instrumentelles Konditionieren• klassisches Konditionieren:
respondentes Verhalten(Reaktion auf einen Reiz)
• instrumentelles Konditionieren:operantes Verhalten zur Herbeiführung einer Konsequenz
• benötigt: „Verstärker“nach KonsequenzReaktion positiv negativ
geschieht positive Bestrafung Verstärkung
entfällt Bestrafung negative
Verstärkung
Instrumentelles Konditionieren• benötigt: „Verstärker“nach KonsequenzReaktion positiv negativ
geschieht positive Bestrafung Verstärkung
entfällt Bestrafung negative Verstärkung
• Verstärker (operationale Def.)
ein Reiz, der die Auftretenswahrscheinlichkeit einer Reaktion erhöht(Skinner, 1938)
Beispiel Echogedächtnis bei TierenEchogedächtnis bei Tieren
• Wüstenrennmäuse (Kooperation mit Holger Schulze, Magdeburg)
0
5
10
15
20
25
30
0 5 10 15 20
Trainingsdauer [Tage]
Tra
inin
gsle
istu
ng 20 ms
40 ms 60 ms
100 ms80 ms
• Naive Tiere (N=21, 4 pro Gruppe):– shuttle box, go/no-go task– Periodenlänge 20...100 ms– 60 EV pro Tag
• Hochtrainierte Tiere (N=2),Periode wird bei guter Leistung verlängert:
– 160 Tage Training (9600 EV!)– maximal 400 ms
Zeitverhältnisse, Paßfähigkeit
• CS-US Abstand am besten ca. 500 ms• R-V Abstand am besten ca. 500 ms
• US und CS müssen paßfähig sein• R und V müssen paßfähig sein
– instinctive drift
Instrumentelles Lernen:Was wird gelernt?
• Wasserman et al. (1993):– VPn drücken Taste.
– Manchmal geht dann das Licht an: P(O|R).
– Manchmal geht das Licht auch so an: P(O|–R).
– Kausalurteil: VPn-Urteile reflektieren die Größe von P(O|R) – P(O|–R)
Instrumentelles Lernen:Was wird gelernt?
• Wasserman et al. (1993):– VPn drücken Taste.
– Manchmal geht dann das Licht an: P(O|R).
– Manchmal geht das Licht auch so an: P(O|–R).
– Kausalurteil: VPn-Urteile reflektieren die Größe von P(O|R) – P(O|–R)
Ratten
shaping, chaining
• Verstärken erst von Bewegungsansatz,dann peu à peu von weitergehender Bewegung.
• Separates Einlernen von Teilbewegungen,dann Verkettung verstärken.
• Dressur
Aberglauben
• Skinner (1948):– keine Kontingenz
zwischen Reaktion und Verstärker:alle 15 s Futter
– Tauben lernenirrelevante Bewegungsmuster
• Staddon & Simmelhag (1971)– Replikation von Skinner, aber
gleichförmigeres Verhalten, antizipatorisch
• Brown & Jenkins (1968): “autoshaping”– in zufälligen Intervallen wird Tastatur beleuchtet, dann kommt Futter
– Tauben picken auf Taste, als ob dadurch das Futter käme
Der Behaviorismus und die Pädagogik
• Give me a dozen healthy infants, well-formed, and my own specified world to bring them up in and I'll guarantee to take any one at random and train him to become any type of specialist I might select--doctor, lawyer, artist, merchant-chief and, yes, even beggar-man and thief, regardless of his talents, penchants, tendencies, abilities, vocations, and race of his ancestors. I am going beyond my facts and I admit it, but so have the advocates of the contrary and they have been doing it for many thousands of years. (Watson, Behaviorism, 1924, S.104)
• Denn wir können die Kinder nach unserem Sinne nicht formen; So wie Gott sie uns gab, so muß man sie haben und lieben, Sie erziehen aufs beste und jeglichen lassen gewähren. Denn der eine hat die, die anderen andere Gaben;Jeder braucht sie, und jeder ist doch nur auf eigene Weise Gut und glücklich.(Goethe, Hermann und Dorothea)
Instrumentelles Lernen aus Sicht der Betroffenen
Ich habe ihn gut dressiert.Kaum drücke ich den Hebel herunter,
kommt er gerannt und gibt mir eine Nuß.
Implizites Lernen
• findet beiläufig statt
• ohne Aufmerksamkeitszuwendung
• bleibt unbewußt
experimentelle Paradigmen
• Steuerung komplexer Systeme
• Erlernen von versteckten Kovarianzen
• Sequenzenlernen
• Erlernen einer finite state Grammatik
finite state Grammatik
in out
X
K
P
T
P
X
S
K
S
T
• TXS• PKPS• TSSSXXTTTKPS• TXSS
Unbewußtes Lernen
• Ist Wissen, daß in Paradigmen des impliziten Lernens demonstriert wird, wirklich unbewußt?
• Wie sensitiv ist der Test auf Bewußtheit verglichen mit dem Test der Fertigkeit?– Sensitivität kaum vergleichbar
– multiple choice statt freier Bericht• aber: Aha-Erlebnis bei Befragung vermeiden
– z. B. Wissensfragmente beim Grammatiklernen
– gute Abschätzung der Kausalstärke beim instr. Lernen• Sind sich klassische konditionierte Ratten
(Kontiguität + Basisrate) ihres Wissens „bewußt“? (mental map)