Functieleer: deel 1...Ernst Heinrich Weber (1795 – 1878) 1834: boek ‘De puslu, resoptione,...
Transcript of Functieleer: deel 1...Ernst Heinrich Weber (1795 – 1878) 1834: boek ‘De puslu, resoptione,...
1
Functieleer: deel 1
2. Waarneming
2.1. Inleiding
Waarneming is zonder meer één van de belangrijkste psychologische functies.
→ Belangrijk voor overleving
→ Waarneming past ons gedrag aan aan de omgeving
Waarneming is een belangrijk beginpunt voor het menselijk functioneren om verschillende
redenen:
- Logisch vertrekpunt
Gedrag vertrekt vanuit interne of externe prikkels die geregistreerd en verwerkt
worden, waarna gedrag in gang wordt gezet in functie van deze prikkels.
S-R model (input-output): gedrag wordt afgestemd op de omgeving om een doel te
bereiken
- Waarneming wordt al lang bestudeerd
Sensoriële psychofysica stond ermee aan de wieg van de psychologie en door
intense interactie tussen psychologie en andere wetenschappen is er een stevige
wetenschappelijke basis om snel vooruitgang te boeken en tot solide basiskennis te
komen.
- Waarneming is een prototypisch onderwerp binnen de functieleer omdat alle
aspecten daarin aan bod komen en alle grote theoretische stromingen er onderzoek
over hebben gedaan
Toespitsen op visuele waarneming (= belangrijkste)
Wat maakt waarneming belangrijk en interessant?
- Vanuit het menselijk functioneren, is waarneming een venster op de wereld
Zicht op werkelijkheid, om ons gedrag aan te passen aan de omstandigheden
- Vanuit de wetenschap, is waarneming een echt venster op de geest
Waarneming is het prototype van het geest-lichaam probleem:
Een centrale vraag bij de waarnemingsonderzoekers is: ‘why do things look the way they
do?’
1935: Koffka vroeg zich dit voor het eerst af in zijn boek ‘Principles of Getalt psychology’
De mogelijke antwoorden op deze centrale vraag zijn onder te verdelen in 2 categorieën:
- Omdat de dingen zijn wat ze zijn
- Omdat de onderzoekers zijn wat ze zijn
Representatief voor de filosofische discussie tussen objectivisme en subjectivisme, tussen
empirisme en rationalisme en tussen materialisme en idealisme.
2
2.2. Basisnoties van het oog en het visueel brein a) De ‘input’ van waaruit visuele waarneming dient te vertrekken
Het oog is geen perfect optisch instrument.
Fundamentele oorzaak: evolutie
Visuele waarneming komt voort uit een geëvolueerd biologisch systeem
Geen perfecte registratie van de fysische realiteit, maar een subjectieve constructie die
soms grondig verschilt van de fysische realiteit.
Het oog bestaat uit meerdere componenten en is niet op de juiste manier gebouwd zodat er
een perfecte optische registratie en verwerking is van de prikkels
De lichtgevoelige receptoren (kegeltjes en staafjes) zitten achteraan in het netvlies (=
retina)
Kegeltjes (cones) zijn geconcentreerd in de fovea
Staafjes (rods) zijn minder goed voor details
Verklaring: staafjes leveren een ander voordeel.
Staafjes blijven bij minder licht beter werken en ze zijn meer geschikt om snel
veranderende prikkels te verwerken.
Het netvliesbeeld is veel waziger, behalve in het centraal deel van het visueel veld en staat
op zijn kop
Bijkomend probleem: ter hoogte van de plaats waar de optische zenuw vertrekt
naar de hersenen, liggen geen receptoren
= Blinde vlek, maar we merken dit niet omdat we met twee ogen kijken en omdat
onze ogen voortdurend bewegen
De input bestaat uit een reeks opeenvolgende netvliesbeelden
We maken ongeveer 2 à 4 snelle oogbewegingen (= oogsprongen/saccades) per
seconde
Daartussen staan onze ogen ook even stil = fixatie
Nadeel: smearing = het uitvagen van het beeld tijdens beweging (door saccades)
Wordt onderdrukt op tal van manier (saccadische supressie)
Gevolg is dat het oog blind is tijden oogsprong en dus ook die gaten moeten
worden opgevuld.
Er is een enorme kloof tussen de kwaliteit van de input en de output (wazig/omgedraaid
versus gedetailleerd en permanent beeld)
3
b) De ‘bouwstenen’ waarmee het visueel systeem aan de slag moet volgens de
psychofysische benadering
In de waarnemingspsychologie wordt er een onderscheid gemaakt tussen elementaire
gewaarwordingen (= sensaties) en de uiteindelijke waarneming (= perceptie).
Geldt voor alle zintuigen
Gewaarwordingen zijn prikkels die geregistreerd worden door het zintuig, die worden
verwerkt en geïnterpreteerd, dit is de waarneming.
Voor de visuele modaliteit heb je:
- Registratie van invallend licht door middel van de receptoren en de zenuwimpulsen
- Waarneming van objecten, scènes en gebeurtenissen.
Ook hier heb je dezelfde tweedeling tussen de sensoriële gewaarwordingen en de
waarneming.
Proximale en distale stimuli:
- Proximale stimuli: de nabije prikkels zoals ze geregistreerd worden ter hoogt van het
eigen lichaam (gewaarwordingen)
- Distale stimuli: externe oorzaken van deze prikkels in de buitenwereld (waarneming)
Psychofysica houdt zich bezig met:
- Meting van de elementaire gewaarwordingen (sensoriële psychofysica)
- Samenhang tussen fysische grootheden en de intensiteit van de gewaarwording
- De ontwikkeling van wetenschappelijke methoden hiervoor
Fechner maakt in zijn boek ‘Elemente der Psychofysik’ (1860) een onderscheid tussen twee
soorten psychofysica:
- Outer psychophysics: heeft betrekking op de relatie tussen de intensiteit van fysische
prikkels (R) en de intensiteit van de sensatie (S)
- Inner psychophysics: heeft betrekking op de relatie tussen de intensiteit van de
neurale excitatie (E) of de hoeveelheid zenuwimpulsen en de intensiteit van de
sensatie (S)
Een groot deel van de psychofysica gaat over drempelmetingen.
Drempel slaat op een grenswaarde tussen stimuli die één soort respons uitlokken en
stimuli die een ander soort respons uitlokken.
Absolute drempel (RL): grenswaarde markeert de overgang tussen af- en aanwezigheid
van sensatie
Differentiële drempel (DL): kleinste toegevoegde stimulusintensiteit die toelaat om een
verschil waar te nemen
Onderdrempel: de minimale stimulusintensiteit (signaalsterkte) die nodig is om
waargenomen te worden
4
Bovendrempel: de grenswaarde waarboven de proefpersoon niet langer verschillen kan
waarnemen
Wordt gemeten door een eenvoudige detectietaak
Van zodra men de absolute drempel overschreden heeft en zich dus binnen het waarneembare
bereik van een stimulusdimensie begeeft, kan men de vraag stellen naar de DL of het juist
merkbare verschil (JND = just noticeable difference).
Gemeten door discriminatietaak
Meting van DL is in praktijk moeilijker dan RL, ook theoretisch is de trapfunctie
ingewikkelder.
Men vertrekt van een bepaalde standaard stimulusintensiteit die men vergelijkt met een
hogere of lagere intensiteit
Dicht bij de standaard gaat de proefpersoon geen verschil merken
In praktijk liggen de proporties tussen 0 en 1
Bij de ideale situatie met een duidelijke trapfunctie definieert men de DL of JND als de
helft van het onzekerheidsinterval (IU = interval of uncertainty) waarbij de responswaarden
op 0.50 blijven.
Binnen het stimulusbereik waarin men stimuluswaarden goed kan discrimineren, kan men
de prikkelintensiteit ook nog verder opdrijven. Daarvoor is het wel nuttig de bovendrempel te
kennen.
Men kan de DL of JND meten op meerdere plaatsen van de fysische schaal, het continuüm
van prikkelintensiteiten.
DL is geen vaste waarde, maar DL staat in verhouding tot de stimulusintensiteit van de
standaardprikkel
Ernst Heinrich Weber (1795 – 1878)
1834: boek ‘De puslu, resoptione, auditu et tactu’
Ging over meerdere zintuiglijke modaliteiten
Wet van Weber
= de stimulusintensiteit moet met een constante fractie van zijn waarde verhoogd
worden om een juist merkbaar verschil te bekomen.
Web van Weber k = Δ l
l
met l voor intensiteit en Δ l voor de kleinste toevoeging (increment) die tot een JND leidt.
De k noemt men de Weber fractie of Weber constante
De wet van Weber gaat meestal op voor een groot deel van het stimulusbereik, hoewel er ook
afwijkingen zijn in de zones van de extreme waarden, waar de Weber fracties meestal hoger
zijn.
5
Er zijn twee manieren om de wet van Weber grafisch voor te stellen.
- Δ l plotten tegenover l
Men krijgt dan een stijgende rechte met k als richtingscoëfficiënt
- Δ l / l plotten tegenover l
Men krijgt een rechte die alle l-waarden afbeeldt op dezelfde (constante) waarde k,
parallel aan de x-as
Weber had erg belangrijk werk gedaan voor de meting van drempels een daarbij ook deze wet
vastgeld. Maar toch was het Fechner die het wetenschappelijk belang op een hoger niveau
tilde van de Weberwet door het als vertrekpunt te nemen van fundamenteel inzicht en hij deed
ook nog een grote bijdrage aan de psychofysica.
Als je metingen wil doen van de gewaarwordingen van fysische prikkels, moet je een schaal
hebben met een nulpunt en een meeteenheid. Fechner realiseerde zich dat de absolute drempel
(RL) gebruikt kon worden om een nulpunt te bepalen en het JND om een meeteenheid te
bepalen.
Wet van Weber-Fechner: S = k log R
Om de sterkte van een gewaarwording S te laten toenemen als een rekenkundige reeks
(opgeteld met een constante) moet men de stimulusintensiteit R laten toenemen volgens een
meetkundige reeks (vermenigvuldig met een vaste factor)
Vormt een afbeelding (mapping) tussen R en de grootte van de overeenkomstige
gewaarwording ervan.
Mapping geeft vorm aan de essentie van de psychofysica: een exacte wetenschap van de
functionele relaties tussen lichaam en geest.
Maar bij de meting van drempels en de bepaling van de overeenkomsten tussen fysische en
psychische grootheden komen een aantal ernstige praktische problemen kijken.
Psychofysica mag niet beïnvloedt worden door beslissingscomponent
= signaaldetectietheorie
Essentieel om de signaaldetectietheorie te kunnen toepassen is dat er naast beurten waarin
effectief een prikkel aangeboden wordt (signaalbeurten) ook beurten ingelast worden waarin
geen prikkel aangeboden wordt (gissingsbeurten of catch trials).
De mate waarin DNS een onderscheid kunnen maken tussen signaal- en gissingsbeurten,
wordt gevoeligheid of sensitivity genoemd.
Algemene kwantitatieve uitdrukking = v[u(H) – u(F)]
Als er geen verschil is tussen het aantal treffers en vals alarmen, dan is de gevoeligheid 0
DNS konden geen onderscheid maken
De beste maat voor sensitiviteit blijkt het verschil in z-scores tussen het aantal treffers en
de vals alarmen
d’ = z(H) – z(F)
6
De mate waarin proefpersonen geneigd zijn één antwoord meer te geven dan het andere wordt
antwoordtendens of response bias genoemd.
Algemene kwantitatieve uitdrukking = V[u(H) + v(F)]
Als er geen bias is naar één van beide antwoorden, wordt deze formule gelijk aan 0
De beste maat voor bias is c = -0.5 [z(H) + z(F)]
C = criteriumwaarde, een plaats op een beslissingscontinuüm waar de proefpersoon
voor zichzelf beslist de lat te leggen
c) De ‘bouwstenen’ volgens neurofysiologische benadering
Wat aan de basis ligt bij waarneming volgens de neurofysiologische benadering zijn
hersenscellen die vuren als er een prikkel verschijnt in hun receptief veld.
Hersencellen = neuronen
Vuren = reageren door middel van spikes
Receptief veld = visueel veld waarvoor zij gevoelig zijn
Hubel en Wiesel
1981: Nobelprijs geneeskunde voor de ontdekking dat cellen in LGN en in de primaire
visuele cortex of V1 bij katten en apen op een specifieke manier reageren in functie van
bepaalde prikkeleigenschappen
LGN = Lateral Geniculate Nucleus
= een tussenstation tussen het oog en de visuele cortex
Primaire visuele cortex of V1 = het eerste corticaal gebied waar cellen reageren op
visuele prikkels
Ontdekking was min of meer toevallig
Ze waren bezig om het receptief veld te zoeken voor een bepaalde cel, maar
merkten dat deze cel helemaal niet reageerde op de stip die in de dia te zien was, maar
juist op de rand van de dia toen ze die in en uit de lader haalden
Cel reageerde op een prikkel op een rand in een bepaalde oriëntatie
Systematisch onderzoek in functie van de stimuluseigenschappen bracht aan het licht dat
tamelijk wat cellen in de V1 een erg specifiek responsprofiel vertonen
Cirkelvormige stimulus met center-surround structuur met positief centrum en
negatieve omgeving of omgekeerd
= on-off cellen
Langwerpige stimulus ofwel lang ofwel breed
Nog andere cellen reageren op een rand, vb. bruuske overgang donker en licht
7
Een deel van deze diversiteit is toe te schrijven aan twee fundamenteel verschillende
celtypes:
- Simple cells
Gevoelig voor een lijnstuk met een bepaalde lijndikte en oriëntatie op een
welbepaalde plaats in het receptief veld
- Complex cells
Stabiel reageren voor variaties van posities in hun receptief veld
- Hypercomplex cells
Reageren enkel als de lijnlengte overeenkomt met de grootte van hun receptief veld
Op die manier geven deze responsprofielen aan de cel een welbepaalde betekenis. Verder
onderzoek heeft aangetoond dat dergelijke cellen specifieke responsprofielen vertonen in
functie van specifieke stimuluseigenschappen (= tuning).
De meeste cellen in de vroege visuele gebieden hebben relatief kleine receptieve velden en
vertonen specifieke tuning functies voor specifieke stimuluseigenschappen
= kenmerkdetectoren (feature detectors) = ze signaleren wat de basale kenmerken zijn van
een klein stukje van de stimulus in hun receptief veld
Responsprofielen van neuronen kunnen we ook opvatten als filters voor visuele
informatieverwerking
Het biedt een synthese aan tussen het psychofysische en neurofysiologische op de
bouwstenen van de visuele waarneming
Alle cellen samen voorzien het visueel systeem van een gefilterd ‘input’ beeld.
d) Het hiërarchisch en modulair visueel brein
De ‘input’ voor het visueel systeem is dus geen echt beeld maar een verzameling van vuren.
De hersenen moeten de informatie verwerken (decoderen)
Er zijn heel wat verschillende gebieden met elk hun eigen specialisatie
De hersenen bestaan uit vier grote lobben die allemaal tussenkomen tijdens visuele
waarneming en allemaal subregio’s (= Brodmann areas) bevatten.
Het visueel systeem wordt vaak opgedeeld in twee grote stromen van visuele
informatieverwerking, telkens bestaande uit meerdere verwerkingsstations.
- Ventrale of ‘wat’ stroom
Loopt vanuit V1 over enkel bijkomende stations in de temporale cortex naar
anterieure gebieden waar hogere-orde verwerking van de object-identiteit plaatsvindt
voor bewuste herkenning
- Dorsale of ‘waar’ stroom
Loopt vanuit de V1 dorsaal naar de pariëtele cortex
8
Er zijn mensen met hersenbeschadiging die niet meer in staat zijn tot bewuste herkenning (=
agnosie) maar die wel nog aangepast gedrag kunnen stellen.
Dit kan omdat de werking in de pariëtele cortex nog visueel gebaseerde actie toelaat
In veel van deze visuele gebieden wordt retinotopie vastgesteld
= het feit dat de plaats in het visueel veld waar de prikkel aanwezig is, ook gecodeerd wordt.
Om de ‘mapping’ zo goed mogelijk te begrijpen moet men
De hersenschors afrollen en ontvouwen (unfolding)
Er verschijnt een retinotopische map met codering van links-rechts en boven-onder
De hersenschors is een soort van laken (sheet) bestaande uit een dicht netwerk van neuronen
die allemaal met elkaar verbonden zijn.
Belangrijke aspecten van de corticale hiërarchie
De receptieve velden worden steeds groter naarmate je hoger op komt in elk van beide
stromen.
Specialisatie in hogere gebieden
Vb.: Fusiform face area (FFA): hersenschors die specifiek coderen voor gezichten
Vb.: Parahippocampal place area (PPA): hersenschors die specifiek coderen voor
plaatsen
= Modules
De hersenen zijn een groot complex netwerk met heel veel stations die sterkt met elkaar
verbonden zijn, telkens met wederzijdse connecties, zowel voorwaarts als achterwaarts
= information flow
Feedforward
Feedback
Wordt geassocieerd met ‘bottom-up’ en ‘top-down’
e) Voorlopige conclusie
Waarneming vergt heel wat verwerkingsprocessen tussen input en output. Dit proces bestaat
uit meerdere stappen, dit wordt in 3 niveaus van verwerking onderverdeeld:
1) Low level registratie
Decodering van de eerste neurale responsen als signalen van enkelvoudige
kenmerken binnen het receptief veld van één cel
2) Mid level
Perceptuele groepering van de gefragmenteerde input
3) High level
Interpretatie van de gebeurtenis van wat er te zien is.
9
2.3. Perceptuele organisatie
a) Probleemstelling en definitie
De binnenkomende prikkels zijn erg fragmentarisch.
Ze moeten georganiseerd worden tot grotere, samenhangende gehelen alvorens ze
betekenis krijgen.
Perceptuele organisatie
= een verzameling van processen die instaan voor het organiseren van de fragmentarische
proximale stimuli in grotere, gestructureerde gehelen
Processen:
- Perceptuele groepering
- Textuursegregatie
- Figuur-achtergrond organisatie
- Aspecten van vormperceptie
In de literatuur zijn er vele voorbeelden die het belang van organisatie van losse fragmenten
aanduiden.
Zwarte en witte elementen waarvan het niet steeds duidelijk is welke elementen tot de
figuur (object) en welke tot de achtergrond behoren.
Eenmaal de figuur duidelijk is, kan je nooit meer de ongeorganiseerde chaos van vlekken
zien.
Max Wertheimer (1923)
Perceptueel bewustzijn bestaat uit georganiseerde gehelen, niet uit afzonderlijke sensaties.
Voorbeelden van natuurlijke scènes met camouflage
Kan nagebootst worden door gefragmenteerde lijntekeningen die ingebed zijn in een
achtergrond van andere lijnfragmenten met dezelfde low-level eigenschappen
Gabor displays
Tal van willekeurige lijnen of vormen of omtrekken van bestaande voorwerpen worden
verstopt
Voordeel: er kan veel psychologisch en neurofysiologisch onderzoek gedaan worden over
de verwerking van de primitieve elementen op zich
b) Perceptuele groepering
Wertheimer legde ook de basis van het klassiek Gestaltpsychologisch onderzoek over de
groeperingsprincipes of Gestaltwetten.
Hij gebruikte daarvoor eenvoudige stippenpatronen of lijnfiguren waarmee hij de rol
illustreerde van verschillende factoren die perceptuele groepering bepalen.
(nabijheid, gelijkenis, continuïteit, gemeenschappelijk lot, …)
10
Het onderzoek van de Gestaltwetten kende een aantal problemen:
- Teveel verschillende wetten
- Onvoldoende precies geformuleerd
- Ze komen in de praktijk verweven voor
- Men beperkte zich tot demonstraties (geen experimenten)
- Geen verklaring voor de Gestaltwetten
Tegenwoordig kunnen we deze problemen een oplossing geven:
- Er kan vertrokken worden vanuit een stevig theoretisch kader
- Meeste wetten kunnen kwantitatief geformuleerd worden
- We werken met goed gecontroleerde stimuli
- Psychofysische experimenten
- Psychofysische bevindingen relateren aan ecologisch nut van de Gestaltwetten en aan
neuroanatomische en neurofysiologische principes van visuele informatieverwerking
Voorbeeld: onderzoek over op basis van nabijheid.
Eerste stap: uitwerking van goede stimulusset
Stippenrasters (lattices)
Werden gekarakteriseerd aan de hand van hun basisparallellogram met zijden a en
b onder een hoek y
Kunnen in een ruimte geplaatst worden met twee parameters
In de experimenten krijgen ppn een groot aantal individuele rasters, individueel en kort
aangeboden in een willekeurige globale oriëntatie, waarna ze moeten zeggen welke oriëntatie
ze erin zagen
Antwoordfrequenties werden omgezet in relatieve keuzes
Waar de relatieve keuze voor een bepaalde oriëntatie afneemt als exponentiële functie van
de relatieve afstand in die richting, zal de grafie van de log-getransformeerde waarden hiervan
een dalende rechte lijn noteren
Pure Distance Law (Kubovy et al. 1998)
Voorspelt groeperen door nabijheid in punt roosters die op vier manieren kunnen
worden georganiseerd door het groeperen van stippen op langs parallelle lijnen.
Gaat in tegen één van de basisprincipes van de Gestaltwetten (geheel is meer dan
som van de delen)
Tweede fase: principe werd gecombineerd met andere groeperingsprincipes (similiariteit,
continuïteit) door gebruik te maken van Gabor lattices
= Rasters waarbij het basiselement niet langer een stip is, maar een Gabor patch, een
vlekje met een helderheidsverloop dat beschreven kan worden aan de hand van een
Gabor functie.
Gabor filter wordt vaak gebruikt voor de modellering van het receptief veld van simple
cells.
11
Psychofysisch onderzoek heeft aangetoond dat er interacties optreden tussen naburige Gabor
patches.
Detectie van Gabor patch wordt bemoeilijkt door buren op korte afstand (laterale
maskering)
Vergemakkelijkt door buren op langere afstand (collineaire facilitatie)
De sterkte van deze effecten hangt af van de alineëring tussen de elementen
Alineëring staat centraal in onderzoek met snake detection
= Hoe sterk de locale oriëntatie samenvalt met de globale rechte of kromme waarvan
het element deel uitmaakt
Snake detection: hier laat men ppn een stukje kromme zoeken in een wirwar van gabor
patches
Benodigde zoektijd hangt af van verschillende elementen en worden verder
gespecificeerd in termen van association field
= een veld van onderlinge aantrekking tussen buurelementen
c) Textuursegregatie
Bij textuursegregatie gaat het om het maken van een onderscheid tussen verschillende regio’s
in een niet-homogeen veld.
Twee onderling samenhangende processen:
- Perceptuele groepering binnen een regio
- Segregatie of afscheiding tussen twee regio’s
d) Figuur-achtergrond organisatie
Bij figuur-achtergrond organisatie is er eveneens een onderscheid tussen verschillende regio’s
in een niet-homogeen veld, maar bovendien krijgt één regio hier een speciale status, als figuur
tegenover de achtergrond.
Ook hier heeft de Gestaltpsychologie een essentiële bijdrage geleverd door het probleem
duidelijk te stellen en door via overtuigende demonstraties enkele principes aan te wijzen die
figuur-achtergrond organisatie bepalen.
Een kleine, convexe, symmetrische regio heeft meer kans om als figuur beschouwd te worden
dan een grote, concave, asymmetrische regio.
12
Recent zijn een aantal bijkomende principes ontdekt
Peterson en Gibson (1994)
Toonden aan dat omtrekfiguren die overeenkomen met herkenbare voorwerpen een
grotere kans hebben om als figuur gezien te worden
Gestaltpsychologen hadden steeds beklemtoond dat familiariteit geen rol kon spelen
Palmer en Ghose (2008)
Rol aangetoond van extremal edges
= randen waarvan de waarnemer ziet dat het oppervlak verder doorloopt maar uit
beeld verdwijnt door het gezichtspunt van de waarnemer
Cut edges = men ziet het oppervlak werkelijk ophouden aan de rand.
In vergelijking met de klassieke Gestaltpsychologie, is recenter onderzoek meer gericht op
ecologische principes en word meer nadruk gelegd op wisselwerking tussen verschillende
processen en op mogelijke mechanismen.
Lamme vond dat de karakteristieke responsen van V1 neuronen bij apen een bepaalde
temporele dynamiek volgen
Eerst onderscheid tussen optimale en niet-optimale oriëntatie in het receptief veld
Dan onderscheid tussen rand van een figuur en de achtergrond
Ten slotte onderscheid tussen binnenkant van een figuur en de achtergrond
Machilsen et al. (2009)
Wisselwerking tussen verschillende processen
Gabor Displays waarbij Gabor elementen een gesloten figuur konden vormen die verder
ingebed was in een wirwar van achtergrond elementen
Ppn moesten aangeven welke van twee opeenvolgende, kort aangeboden stimuli een figuur
bevatte.
Performantie daalde systematisch met oriëntatieruis
e) Figuur-achtergrond organisatie en perceptuele multistabiliteit
Figuur-achtergrond organisatie is intrinsiek ambigu omdat de toekenning van figuur-status
aan een regio uit het visueel veld slechts gebaseerd is op een geheel van aanwijzingen (cues)
met een zekere waarschijnlijkheid.
Geen enkele aanwijzing is op zich volledig eenduidig en het proces is dus intrinsiek
probabilistisch, niet deterministisch.
Cues worden verwerkt door visueel systeem (= niet perfect gemeten) en dus onderhevig
aan ruis
Het proces van figuur-achtergrond toewijzing is dan ook stochastisch en kan over tijd
wijzigen.
13
Edgar Rubin (1886 – 1950)
Vase-faces figuur
Illustreert goed de essentie van het fenomeen: de figuur heeft een rand, de achtergrond
niet, want de achtergrond loopt door achter (onder) de figuur. De ambiguïteit in de prikkel
resulteert in een strijd om de rand (border-ownership BOWN). Als men de zwarte regio als
figuur neemt, dan behoort de rand tot de zwarte figuur en loopt de witte regio door achter
(onder) de zwarte. In dat geval ziet men een soort vaas
Als men de witte omliggende regio’s als figuur aanneemt, dan ziet men gezichten
Indien men de Rubin figuur goed kent, kan men wisselen tussen beide percepten
= switching
Maar men kan nooit beide percepties tegelijk zien!
Het is erg belangrijk om te begrijpen dat toekenning van border-ownership gebeurt door de
omgeving van de rand mee in rekening te brengen.
BOWN is een configurationele eigenschap
= tot welke regio een stukje van de rand behoort, hangt af van de configuratie waarin
dat stukje rand is opgenomen
Zhou et al. (2000)
V2 cellen in de cortex van de aap kunnen een onderscheid maken en rekening houden met
de context buiten hun receptief veld
BOWN is onafhankelijke van de contrastpolariteit
= cel blijkt telkens meer te vuren wanneer zich in haar receptief veld een rand bevindt
die links de figuur bevat en rechts de achtergrond, dan wanneer de figuur rechts staat.
f) Visuele illusies als illustratie van een algemeen Gestaltprincipe
De configurationele codering van BOWN is slechts één voorbeeld van een algemeen
Gestaltprincipe
Het visueel systeem codeert zelden of nooit de absolute waarde van locale eigenschappen
maar veeleer de relatieve waarde van eigenschappen, daarbij ook voortdurend rekening
houdend met de globale configuratie of context.
Het helderheidscontrast bij helderheidsovergangen door het visueel systeem lijkt overdreven
te worden
Mach bands – Craik-O’Brien-Cornsweet effect – Chevreul illusie
Helderheid wordt altijd relatief gecodeerd ten overstaan van de naburige regio’s
14
Waarneming van grootte blijkt ook sterkt onderhevig aan vergelijking met naburige
elementen.
Joseph Delboeuf (1831 – 1896)
Heeft varianten bedacht ter illustratie hiervan: binnenste cirkels lijken andere
grootte te hebben, maar zijn in feite gelijk.
Ebbinghaus-illusie: de binnenste cirkel wordt als kleiner gezien.
De klassieke geometrische illusies zijn allemaal goede voorbeelden van vertekende
waarneming doordat de basiselementen niet los gezien worden van de configuratie waarin ze
opgenomen zijn.
De andere illusies zie extra blad.
g) Subjectieve contouren, modale en amodale vervollediging
De waarneming van randen waar er fysisch geen helderheidsverschil is (= illusoire of
subjectieve contouren), is één van de meest fascinerende fenomenen van de perceptuele
organisatie.
Gaetano Kanizsa (1913 – 1993)
Varianten geïntroduceerd die bijgedragen hebben aan de populariteit van dit fenomeen
Kanizsa-driehoek = combinatie van 3 illusies:
- Je ziet randen waar er geen zijn
- Je ziet de helderheid van de bovenste driehoek als lichter dan
de regio’s ernaast
- Je ziet een diepte-ordening
15
Neurofysiologen hebben ontdekt dat V2 cellen in de cortex van de aap niet enkel reageren op
echte randen in hun perceptief veld, maar ook op illusoire contouren en bij perceptuele
invulling van collineaire lijnfragmenten, zeker in geval van bedekking of occlusie.
Met Kanizsa-driehoek is meer aan de hand
Surface filling-in op basis van locale occlusion cues
Complex samenspel tussen verschillende processen
Albert Michotte (1881 -1965)
Heeft verschillende soorten vervollediging / completie die tussenkomen in Kanizsa figuren
explicitiet onderscheiden:
- Modale completie
Vervolledigde figuur bezit echte sensoriële kwaliteiten
- Amodale completie
Figuur wordt geïnterpreteerd als volledig waarbij de rand toch niet echt gezien
wordt
Toch is amodale vervollediging een perceptueel fenomeen: je ziet bedekking en je zit ook de
meest eenvoudige vervollediging, ook al weet je dat er een complexer lijnpatroon bedekt is.
De rol van occlusie is ook erg belangrijk om fragmenten te kunnen groeperen tot grotere,
zinvolle gehelen.
Bregman B’s
Men ziet fragmenten alleen maar deeltjes van de letter B die bedekt zijn door een
vlek
Veel onderzoek is er op gericht om te achterhalen welke principes amodale completie
bepalen.
Good continuation overheerst vaak in deze principes
Er is ook veel onderzoek om na te gaan in hoeverre de processen en principes bij modale en
amodale completie vergelijkbaar zijn.
Bij ambigue figuren (zwarte silhouetten) met competitie tussen twee mogelijke figuur- en
achtergrond organisaties, is er een voorkeur voor korte modale vervollediging en lange
amodale vervollediging
Zo kan je ook 3D beelden induceren
Paradoxale effecten: indien er meer occlusie is, lijkt er bij amodale completie meer
afronding te zijn, terwijl dit bij modale completie omgekeerd is.
Paradox kan opgelost worden als men de nadruk legt op wat er visueel gegeven is
en wat er precies aangevuld moet worden
Om een visueel probleem goed te begrijpen, moet men goed kijken wat de waarneming
precies is en een analyse maken van wat er gegeven is in het beeld en wat het visueel systeem
dan moet doen om tot die bepaalde waarneming te kunnen komen.
16
h) Deel-geheel relaties
Een belangrijk onderwerp in de Gestaltpsychologie van perceptuele organisatie is de
verhouding tussen delen en het geheel.
Essentieel verschilpunt tussen Graz school en Berlijn school:
- Graz school
Von Ehrenfels
Geheel is meer dan de som van de delen
Superadditieve, emergente Gestalt-eigenschappen
- Berlijn school
Koffka, Wertheimer
Geheel is ander dan de som van de delen
Het geheel heeft een eigen ontologische status en oefent invloed uit op de delen
Soms zijn de delen vervormd door het geheel waarin ze opgenomen zijn en soms zijn de delen
niet langer aanwezig in de bewuste perceptuele ervaring of alleszins moeilijker toegankelijk
voor het visueel bewustzijn.
Embedded figures
Delen kunnen moeilijk teruggevonden worden in de grotere gehelen
Patroon werd gebruikt om de kracht van intrinsieke perceptuele organisatieprocessen te
beklemtonen tegenover de rol van ervaring.
Witkin (1950)
Ontwikkelde een test op basis van embedded figures
= Embedded Figures Test (EFT)
Bedoeld om perceptuele stijlen te meten als veldafhankelijkheid en veldonafhankelijkheid
(VA en VO)
Met veldafhankelijkheid (VA) heb je meer moeite met de test en ben je meer onderhevig
aan geometrische illusies.
Problematiek van deel-geheel relaties is ook relevant voor de hedendaagse vision science.
Theorieën over de corticale hiërarchie en stadia van visuele informatieverwerking
Configural superiority effect
Bestudeerd door Pomerantz en collegas in 1977
Essentie: het toevoegen van een redundante (= overbodig) context leidt tot nieuwe gehelen
die soms een voordeel kunnen opleveren.
Zoeken van een ‘odd man out’ zal dit sneller en beter gaan met een overbodige context
erbij. Met dezelfde features en overbodige context, maar op een andere plaats samengezet,
kan men echter ook gehelen of configuraties bekomen die de zoektaak moeilijker maken.
17
Kubilius et al. (2011)
Onderzochten de neurale basis in het licht van de coricale hiërarchie van dit fenomeen.
Repliceerden gedragseffecten bij proefpersonen terwijl ze in de scanner lagen
Conditie met featurs of parts bleek moeilijker te zijn
Resultaat: gehelen worden geleidelijk opgebouwd in hogere gebieden die instaan voor
vorm- en objectperceptie.
Bistable Diamond
Hier ziet men ofwel:
- Op-en-neer gaande beweging van losse, diagonale georiënteerde lijnsegmenten
- Links-rechts over-en-weer gaande beweging van een geïntegreerde ruitfiguur
Je kan switchen tussen beide percepten
Fang et al. (2008)
Presenteerden bistable diamon aan ppn terwijl ze in de scanner lagen
Ppn moesten zeggen wat ze zagen
Onderzoekers konden zo de activatie in verschillende hersengebieden relateren aan de
verschillende percepten
Resultaat: locale percepten gingen gepaard met hoge activatie in de lagere corticale
gebieden en lage activitie in hogere gebieden (LOC)
Globale percepten brachten het omgekeerde patroon mee
Codering van delen in de lagere corticale gebieden worden onderdrukt door de codering van
grotere gehelen in de hogere corticale gebieden.
Over de theoretische implicaties hiervan wordt nog discussie gevoerd.
Mogelijke interpretatie = explaining away
In alle gebieden wordt volgens deze theorie aan ‘predictive coding’ gedaan.
= op basis van binnenkomende signalen wordt een voorspelling gemaakt van wat
verwacht kan worden en deze predictie teruggekoppeld naar de lagere gebieden
de-Wit et al. (2012)
Het zien van de ruit bleek gepaard te gaan met een reductie van activiteit in V1 is niet
retinotopisch specifiek.
2.4. Ambiguïteiten door het probleem van onderdeterminantie
a) Verandering van theoretisch perspectief
In de fenomenen in voorgaande paragraaf lag de nadruk op autonome organisatieprocessen.
Centraal stond het ‘Prägnanz’ of ‘Goodness’ principe: de perceptuele organisatie zal steeds
zo eenvoudig of zo goed mogelijk zijn, gegeven de beschikbare prikkels.
Minimumprincipe of eenvoudigheidsbeginsel is een van de basistellingen van de
Gestaltpsychologie.
18
In de fenomenen die we in deze paragrafen zullen bespreken, zal de nadruk liggen op
invloeden van kennis en verwachtingen.
Veridicaliteit staat centraal
Volgens de cognitieve psychologie wil de waarneming de realiteit zo waarheidsgetrouw
mogelijk vatten.
Waarschijnlijkheidsbeginsel of likelihood principle
b) Klassieke ambiguïteiten en contexteffecten
Er zijn ook tal van ambigue figuren die meerdere semantische interpretaties toelaten,
afhankelijk van de interpretatie van de afzonderlijke delen die allemaal tot één figuur of
voorwerp behoren.
Worden toegepast in visuele kunst en reclame
De interpretatie van ambigue figuren is onderhevig aan contextinvloeden.
Het omslagpunt van de ene interpretatie naar de andere blijkt ook vertraagd te zijn door de
sequentie van de aanbiedingen (= hysterese). Dit wordt beschouwd als kenmerk van een zelf-
organiserend niet-lineair dynamisch systeem.
c) Klassieke ambiguïteiten, onbewuste redeneringen en assumpties
Ambiguïteiten zijn niet beperkt tot vorm- of objectperceptie, ook in de waarneming van
helderheid of kleur moet het visueel systeem voortdurend geregistreerde helderheden of
kleurwaarden disambigueren (ondubbelzinnig maken) om ze correct te interpreteren.
Elke waarde in het beeld is altijd een resultante van:
- Intrinsieke objecteigenschappen (reflectantie, pigmentstructuur)
- Extrinsieke eigenschappen van lichtbron (sterkte, kleurspectrum)
- Scène
De interactie tussen lichtinval en vormperceptie staat ook centraal in de waarneming van het
hol masker (demonstratie van Gregory).
Ambiguïteit tussen de richting van kromming van het oppervlak en positie van de lichtbron
19
d) Grootteconstantie, rol van ervaring en New Look psychologie
Één van de klassieke ambiguïteiten die voortdurend door het visueel systeem opgelost moet
worden, is het probleem dat grootte in het netvliesbeeld zowel afhankelijk is van de grootte
van het voorwerp als van de kijkafstand.
Twee voorwerpen die fysisch even groot zijn, kunnen toch verschillende groottes in het
netvliesbeeld hebben
Twee dezelfde groottes in het netvliesbeeld kunnen afkomstig zijn van voorwerpen met
verschillende ware grootte, bekeken van op een andere afstand
= onderdeterminantie
Kan leiden tot grootteconstantie
= we zien dat iets in werkelijkheid eenzelfde fysische grootte heeft ondanks dat het
in functie van de afstand, wisselende groottes in het netvliesbeeld heeft.
Één theorie hierover stelt dat het visueel systeem een onbewuste redenering opbouwt waarbij
een vraagstuk met één onbekende (= ware grootte) en één bekende (= retinale grootte)
opgelost wordt door bijkomende informatie of assumpties over de tweede onbekende (=
kijkafstand).
Von Helmholtz
Introduceerde de idee dat waarneming gebaseerd is op onbewuste redeneringen of
inferenties.
Een ander aspect van de theorie is de rol van ervaring.
Een ontwikkelende waarnemer moet de retinale groottes leren associëren met kijkafstand
en ware grootte.
Zeigler & Leibowitz (1957)
Klassiek experiment over rol van ervaring
Ppn werden gevraagd om ware groottes van voorwerpen te schatten (men zette het
experiment zo op dat de grootte in het netvlies constant bleef)
Volwassenen deden deze schatting vrij goed
Kinderen vielen in twee subsets:
- Voor klein afstanden waren de schattingen nog redelijk goed
- Vanaf 1.5 m – 2 m volgden de schattingen meer de retinale grootte dan de ware
grootte
Kinderen hebben minder ervaring met grotere kijkafstanden en compenseren daarom
minder goed daarvoor.
Ook volwassenen zijn minder goed tot grootteconstantie in staat voor voorwerpen die
vanuit verticale richting bekeken worden.
20
Bruner & Goodman (1947)
Experiment over rol van ervaring uit de persoonlijke levenssfeer
Muntstukken worden systematisch overschat door jongens uit arme gezinnen.
De waarde die men aan iets hecht speelt een rol bij grootteschatting ervan en dit is
individueel verschillend
De rol van subjectieve factoren en persoonlijke waarden werd sterk benadrukt in de New
Look psychologie (Jerome Bruner)
Mensen blijken te verschillen in wat men spontaan eerst ziet
Geslacht, leeftijd, persoonlijkheid, (onbewuste) motieven en verlangens spelen hierbij een
rol
e) Onderdeterminantie van 3D door 2D, vormconstantie, onmogelijke figuren en
illusies
Het probleem van onderdeterminantie plaagt niet alleen de waarneming van grootte maar ook
van vorm.
Essentie: bij de projectie van 3D voorwerpen naar 2D netvliesbeelden gaat de derde
dimensie verloren
Recovery problem = ill-posed problem
= 3e dimensie afleiden uit 2D beelden
Elke waarneming is een vraagstuk met teveel onbekenden.
Typische oplossingstrategie = bijkomende assumpties maken
Vormconstantie
= Een object behoudt dezelfde vorm al lijkt het anders gezien uit een andere hoek
De ambiguïteit van 2D beelden geeft ook weer aanleiding tot multistabiliteit in de 3D
waarneming.
Necker-kubus kan men als twee verschillende kubussen zien (lijntekeningen)
Ook onmogelijke figuren zijn het gevolg van de ambiguïteit van lijntekeningen.
Blijkbaar is de gewoonte om 3D te zien in 2D plaatjes sterken dan ons streven naar globale
consistentie
Deze ambiguïteit is ook een bron van kijkplezier
Kunstenaars maken hier gretig gebruik van.
21
De spontane en sterke dieptewaarneming vertekent soms onze waarneming van grootte.
Richard Gregory (1923 – 2010)
Grote verdediger van rol van verkeerdelijk toegepaste grootteconstantie in Müller-Lyer
illusie
Ook vormperceptie kan vertekend zijn ten gevolge van een verkeerde ruimtelijke interpretatie.
Shepard tables
Futura gebouw in New York
Het visueel systeem interpreteert de hoeken die afwijken van 90° als een afwijking in één
richting, terwijl het in werkelijkheid gaat om een afwijking in de andere richting.
f) Onderdeterminantie van 3D door 2D, transactionalisme en Bayesiaanse
inferentie
Bovenstaande effecten, verklaringen, … krijgen een centrale plaats in het transactionalisme.
Adelbert Ames (1880 – 1958) = belangrijkste vertegenwoordiger
Het transactionalisme stelt dat de waarnemer bij het oplossen van het probleem van
onderdeterminantie beroep doet op zijn jarenlange ervaringen en ‘transacties’ met onze
omgeving.
Vb.: Kamer van Ames
Wordt nog vaak gebruikt in filmsets op personages groter of kleiner te laten lijken
Venster van Ames
Trapeziumvormig
Wanneer je dit venster laat ronddraaien rond zijn verticale as, dan zie je een heen-en-weer
beweging van 180° waarbij telkens de langere zijkant als dichterbij wordt waargenomen
Dit komt doordat we de assumptie hebben dat het een rechthoekig venster is
Vertekende dieptewaarneming manifesteert zich als een verkeerde waarneming van
continue rotatie
Men heeft de laatste decennia de relatief vage idee van onbewuste inferenties in de
waarneming een stevige theoretische onderbouw gegeven door een kwantitatieve uitwerking
van het inferentieprobleem en een mogelijk oplossingsschema.
Gebaseerd op theorema van Thomas Bayes (18e eeuw)
22
Theorema van Bayes
Ook van toepassing op problemen van hypothesetoetsing aan de hand van data en
inferentie van scène-eigenschappen uit beeldeigenschappen
De kans op een bepaalde 2D (posterior) hoek φ gegeven een bepaalde 3D hoek θ
(likelihood) vermenigvuldigd met de onvoorwaardelijke kans dat de 3D hoek θ voorkomt
(prior) genormaliseerd voor de onvoorwaardelijke kans op voorkomen van de 2D hoek φ
Het redeneerschema van Bayesiaanse inferentie is in essentie vrij eenvoudig
Je kan ook gewichten toekennen aan bepaalde uitkomsten door winst- of verliesfuncties
Het is toepasbaar op veel verschillende deelproblemen van de visuele waarnemingen
Gebaseerd op assumpties die via overerving genetisch gecodeerd kunnen zijn in het
visueel brein van de soort
Gebaseerd op leerprocessen in de culturele leefwereld
Krachtige formele theorie
Vergt veel empirisch onderzoek
Kan ingeroepen worden om het onderliggende proces te modelleren
Zeer mainstream
2.5. Semantische interpretatie van objecten en scènes
a) Objectherkenning
Objectherkenning
= Het semantisch herkennen van de identiteit van een voorwerp of het kunnen aangeven tot
welke basiscategorie van voorwerpen het behoort
Het basisprobleem van objectherkenning bestaat in het vinden van een overeenkomst tussen:
- een ‘on-line’ berekende objectvoorstelling
- een ‘off-line’ gestockeerde objectvoorstelling in het visueel geheugen
= matching
Een grote uitdaging voor het herkenninsproces is het loskoppelen van intrinsieke en
extrinsieke eigenschappen bij het analyseren van het beeld.
23
Twee grote mogelijkheden:
- Men kan proberen op tot één gezichtspuntonafhankelijke 3D objectvoorstelling per
object te komen
Moeilijk te berekenen
Voordeel: één representatie stockeren
Klein opslag en matching probleem
- Per object meerdere gezichtspuntafhankelijke objectvoorstellingen hebben
Makkelijk te berekenen
Nadeel: veel meer opslagruimte nodig
Matching-probleem is groter
Recognition By Components (RBC) theorie van Biederman (1987)
één 3D objectvoorstelling per object
Uitgangspunten zijn goed uitgelicht
Biederman wil een theorie die in staat is om te verklaren hoe objectherkenning vaak
mogelijk is onder ‘clutter’, met slechts beperkte informatie over een deel van het voorwerp.
Wil ook verklaren dat men een nooit eerder gezien voorwerp tot structureel kan
beschrijven aan de hand van de basiscomponenten en hun spatiale relaties
Wil de mogelijkheden exploiteren die het combineren van een beperkt aantal componenten
in verschillende onderlinge relaties biedt.
Zijn theorie omvat meerdere informatieverwerkingsstappen die grotendeel ‘bottom-up’
verlopen. Na randdetectie vinden er twee processen plaats die parallel verlopen:
- Detectie van niet-toevallige eigenschappen (non-accidental properties NAPs)
- Segmentatie van het beeld ter hoogte van diepe concaviteiten
Op basis hiervan kan men de bouwstenen van het voorwerp bepalen.
Vervolgens moet men de globale spatiale relaties hiertussen bepalen op ruw categorisch
niveau en in het visueel systeem op zoek gaan naar een overeenkomstige
gezichtspuntonafhankelijke representatie. Indien een ‘match’ gevonden wordt, is het
voorwerp herkend.
De kern van deze theorie zit bij de bepaling van de bouwstenen van een voorwerp. Dit omvat
een theorie over wat deze bouwstenen zijn en hoe men ze kan extraheren uit het beeld.
Segmentatie van het beeld ter hoogte van regio’s met diepe concaviteiten (inkepingen)
Plaatsen waar de kromming negatief is, doordat twee basisdelen samengevoegd zijn
NAPs
Er zijn bepaalde eigenschappen in het beeld aanwezig die men kan gebruiken bij
het oplossen van het ‘recovery’ probleem
24
Bij de veronderstelling van een algemeen standpunt (general viewpoint assumption) mag men
deze regelmaat in het beeld gebruiken om gelijkaardige regelmaat in de scène af te leiden.
Men mag aannemen dat degelijke regelmaat niet het toevallig resultaat is van één welbepaald
gezichtspunt.
NAPs laten toe om een aantal distincties te maken die van belang zijn bij het correct
classificeren van bouwstenen.
Theorie wat de bouwstenen zijn
Hij gaat er vanuit dat men met een aantal basale distincties kan volstaan. Hij verondersteld
dat men het onderscheid moet kunnen maken tussen 36 verschillende bouwstenen, ‘geons’
genoemd.
Komt daartoe door een ruwe opdeling in functie van categorische kenmerken van de
doorsnede en de as van zijn 3D componenten.
De experimentele evidentie voor RBC berust grotendeels op onderzoek met lijntekeningen
van bestaande voorwerpen.
Experiment:
1) Er werden lijntekeningen geselecteerd van voorwerpen die uit een variabel aantal
basisdelen bestaan
2) Van elke voorwerp werden dan lijntekeningen getoond waarin ofwel het maximaal
aantal basisdelen aanwezig was, ofwel kleiner aantal
Resultaat: zelfs bij korte aanbiedingen met beperkt aantal basisdelen bleek de herkenning
vrij goed. Volledig aantal basisdelen bleek niet nodig voor een goede herkenning.
b) Scènecontexteffecten op objectherkenning
Invloed van scènecontext op objectherkenning: 3 klassieke voorbeelden
Palmer (1975)
Presenteerde afbeelding van contextscène voor 3 seconden
Dan volgde kort een afbeelding van één object in 3 condities:
- Consistent met de scène
- Inconsistent met de scène
- Neutraal ten opzichte van de scène
Herkenning bleek veel beter in consistente conditie
Loftus en Mackworth (1978)
Ppn moesten gedurende 4 seconden naar afbeelden van scènes kijken en registreerden
daarbij de oogbewegingen die ze maakten
Fixaties op onwaarschijnlijke objecten duurden langer en werden gevolgd door meer
fixaties
25
Biederman (1981) en Biederman et al. (1982)
Experimenten over ‘speeded object verification’
Methode:
1) Er verscheen een semantisch label van een object
2) Fixatiepunt
3) Korte aanbieding van een afbeelding van een scène
4) Gevolgd door ‘mask’(wirwarplaatje om retinaal nabeeld te maskeren) met een
‘probe’ erin (plaatsaanduiding waar men de target moest zoeken)
5) Ppn moesten ja of nee antwoorden als ze dachten dat het doelobject al dan niet in
de scène aanwezig was
Resultaten:
1) Semantiek van een scène wordt in een oogopslag opgepikt en heeft invloed op de
detecteerbaarheid van de doelobjecten
Veel kritieken tegen de algemene resultaten van deze experimenten
Belangrijkste: je kan niet met zekerheid op basis van deze resultaten besluiten dat de
effecten zuiver perceptueel zijn van aard. Het kan best zijn dat het post-perceptuele
decisieprocssen betreft.
Toch moet erkend worden dat het visueel systeem gebruik lijkt te maken van minimale
informatie om verwachtingen op te bouwen en verdere visuele informatieverwerking te
faciliteren.
c) Snelle categorisatie van objecten
Categorisatie
= Het onderbrengen van een concrete (visuele) prikkel in een grote categorie
Men kan categoriseren op meerdere niveaus in een hiërarchie.
Basisniveau (hond)
Subordinaat niveau (poedel)
Superordinaat niveau (zoogdier / dier)
Categorisatie vergt een nog hogere vorm van visuele informatieverwerking, in die zin dat nog
meer moet loskomen van concrete visuele details van de prikkel om te komen tot grotere,
semantische categorieën waarvan de visuele kenmerken niet steeds duidelijk zijn.
26
Thorpe et al. (1996)
Methode:
1) Presenteerde groot aantal kleurfoto’s een korte tijd
2) Ppn moesten go/no-go taak aangeven of ze een dier zagen of niet
3) Elke foto werd slechts 1 keer getoond en er kon om het even welk dier in
voorkomen en om het even waar in de foto
Resultaten:
1) Gemiddeld percentage correcte antwoorden 94%
2) Gemiddelde reactietijd 445 milliseconden
3) Positieve correlatie tussen RT en CA = speed-accuracy tradeoff
= langere RT gaan gepaard met hogere CA
Als men sneller antwoordt, maakt men meer fouten
Resultaten op hersenniveau:
1) Event-related potentials (ERPs)
= Men kan de elektronische activiteit in de afzonderlijke elektroden relateren aan
de perceptuele en cognitieve processen die zich aan de hersenen afspelen na
aanbieding van de prikkel
Gemiddeld hadden de ppn 150 – 160 milliseconden nodig om te beslissen of het
een go of no-go was
Deze bevindingen wijzen op het belang van snelle, visuele feedforward processing, ook voor
hogere semantische processen als categorie. Blijkbaar is het visueel systeem in staat om heel
snel de essentiële kenmerken uit een beeld te extraheren.
Deze studie heeft heel wat vervolgonderzoek geïnspireerd. Er zijn twee onderzoekslijnen:
- Aantonen/uitsluiten dat eenvoudige visuele cues aan de basis kunnen liggen van het
effect
- De paradoxale bevinding dat categorisatie voor kleinere homogenere categorieën de
ganse RT-distributie met 40 – 50 seconden naar rechts doet opschuiven
Het duurt langer om een prikkel te categoriseren in een kleinere, homogenere
categorie
d) Snelle categorisatie van scènes
Schyns en Oliva (1994, 1997)
Onderzoek over de rol van lage en hoge spatiale frequenties in de snelle categorisatie van
scènes
Scène is meestal complexer en bestaat uit meerdere objecten die in verschillende spatiale
relaties tegenover elkaar staan
Scène is meer onderhevig aan clutter, occlusie, … .
27
Een hypothese over hoe een scène snel gecategoriseerd kan worden, is dat de ruwe spatiale
schaal (de lage spatiale frequenties LSF) diagnostisch zou kunnen zijn voor de typische
ruimtelijke organisatie van de globale spatiale relaties en dat de fijne spatiale schaal (hoge
spatiale frequenties HSF) vervolgens meer kritisch zou kunnen zijn voor de kleinere details
van de voorwerpen in de scène.
Lagere spatiale frequenties worden sneller verwerkt in het visueel systeem en dus zou
scènecategorisatie sneller kunnen gaan dan objectcategorisatie.
Schyns en Oliva (1994)
Hybride afbeeldingen waarin de HSF van één scène gecombineerd werden met de LSF van
een andere.
Combinatie van afbeeldingen van twee scènes
Eerste experiment:
1) Ppn kregen vooraf semantisch label en moesten ja/nee matching taak uitvoeren
2) Hybride afbeeldingen van eerste type werden heel kort of gewoon kort aangeboden
3) Resultaat: Men extraheert met heel korte aanbiedingen eerder de LSF terwijl met
langere aanbiedingen eerder de HSF extraheert.
Tweede experiment:
1) Hybride afbeeldingen van tweede type
2) Twee afbeeldingen werden kort na elkaar gepresenteerd
3) Ppn moesten benoemen wat ze zagen
4) Resultaat: ppn gaven in 67% van de gevallen het antwoord dat overeenkwam met
de targetscène in de ‘coarse-to-fine’ verwerkingsvolgorde
Samen vormden deze experimenten sterke evidentie voor de aanvangshypothese dat snelle
scèneperceptie hoofdzakelijk gebaseerd is op LSF
Oliva en Schyns (1997)
Toonden aan dat het visueel systeem beide spatiale schalen van in het begin verwerkt en de
schaal kan selecteren die het meest diagnostisch is voor de gestelde taak
Oliva en Torralba (2006)
Onderzoek om te achterhalen welke scène-eigenschapen men kan extraheren uit vrij
eenvoudige beeldkenmerken
Vertrekpunt: analyse van het beeld als geheel
Volgens hen is scène een entiteit op zich met eigen karakteristieke globale
beeldkenmerken (spatial envelope properties)
Openheid of expansie van de grens van de spatiale envelop
Natuurlijkheid of ruwheid van de inhoud van het beeld
7 globale scènekenmerken die enerzijds goed extraheerbaar zijn uit gemiddelde
beeldeigenschappen en anderzijds relevant blijken voor scènecategorisatie
28
Green en Oliva (2009)
Aangetoond dat mensen effectief in staat zijn om deze globale beeldeigenschappen te
extraheren.
Methode:
1) Ppn werden getraind om de 7 relevante globale scènekarakteristieken correct te
analyseren en te benoemen
2) Beelden werden kort aangeboden een dynamisch gemaskeerd
3) Ppn moesten ja/nee taak uitvoeren zowel voor beeldeigenschappen als
scènecategorisaties
Resultaat:
1) Proportie correcte classificatie nam toe met stijgende stimulusduur
e) Slotbeschouwing over visuele informatieverwerking
Een steeds terugkerend resultaat is de enorme snelheid en flexibiliteit van visuele
informatieverwerking door het menselijk visueel systeem.
Kracht is gebaseerd op het dens neuraal netwerk met tal van tussenstations en sterke
interconnectiviteit
Ulric Neisser
Een van de grondlegger van cognitieve psychologie
1976: algemeen theoretisch model ‘analyse door synthese’
Binnenkomende prikkels worden niet passief en doelloos verwerkt door filters,
maar steeds in het licht van hypothesen die als een momentane synthese beschouwd
kunnen worden van de beschikbare bottom-up informatie en top-down kennis
Essentieel: voortdurende wisselwerking tussen verschillende deelsystemen
Massief-parallelle informatieverwerking
Hochstein en Ahissar (2002)
Reverse Hierarchy Theory
Nieuwe visie op corticale hiërarchie waarbij ze expliciet onderscheid maken tussen
structurele, anatomische aspecten en functionele, procesmatige aspecten.
In de eerste informatieverwerkingsstroom (feedforward sweep) wordt heel snel
doorgestroomd naar de hoge visuele gebieden, waar hypothesen over globale categorieën
gegenereerd worden
In tragere wisselwerking tussen top-down en bottom-up verwerkingsprocessen worden
details ingevuld
Onderscheid low-level en high-level processing in de spatiale zin
Early en late processing in de temporale zin
29
Bar et al. (2006)
Concreet model over de verwerking van HSF en LSF in functie van de tijd
LSF van het beeld wordt snel dorgestuurd naar de prefontale cortex (PFC), waar
hypothesen gegenereerd worden zowel over de scènecontext als de globale vorm van
voorwerpen in de scène
Hypothesen en LSF worden teruggekoppeld en in een trage feedforward stroom
gecombineerd met HSF van een verdere beeldanalyse
Schyns, Gosselin en hun collega’s
Ontwikkelden experimentele procedure waarin ze ppn enkel zwart-witte ruisbeelden laten
zien en hen wel vragen om een bepaald targetobject te detecteren wanneer ze dit menen te
zien.
Eerste experiment: Gosselin & Schyns (2003)
De letter S of een glimlachende mond detecteren in ruispatronen
Later experiment: Smith et al. (2012)
Gezicht zoeken
Ppn houden er verschillende templates op na
Dit template laat ons toe van alles te zien in wolken of schimmels
Experimentele psychologie is blijkbaar in staat om door slimme beeldanalysetechnieken deze
puur subjectieve, mentale entiteiten te visualiseren.
30
2.6. alternatieve theoretische denkkaders
a) Intermezzo: terugblik en vooruitblik
We hebben visuele waarneming vooral besproken vanuit de ‘mainstream visie’
Wordt door de meeste onderzoekers als theoretisch denkkader gehanteerd
We zijn begonnen met hedendaagse visie op werking van het oog en visueel brein en zijn
geëindigd bij recente pogingen om de wisselwerking tussen bottom-up, feedforward en top-
down, feedback visuele informatieverwerking concreet te begrijpen.
Er zijn twee grote alternatieve benaderingen. Ze zijn allebei van dezelfde denker en keren zich
expliciet af tegen wat we dachten te weten. Ze reiken nieuwe inzichten aan over hoe de
waarneming te begrijpen en te onderzoeken.
Visuele waarneming is nu eenmaal een complex, multidimensioneel probleem dat zich niet in
eenvoudige, enkelvoudige termen laat verklaren.
b) De ecologische benadering van James Gibson (DTP)
James J. Gibson (1904 – 1979)
Filosofische fundamenten: realisme en pragmatisme
Gebruikte ook elementen uit Gestaltpyschologie (fenomenologie) en behaviorisme
(empirisme)
Vertrekpunt: waarneming staat steeds ten dienste van zinvol gedrag in een zinvolle
omgeving.
Nadruk op ecologische validiteit
Hij schreef drie grote boeken:
- 1950: The perception of the visual world
- 1966: The senses considered as perceptual systems
- 1979: The ecological approach to visual perception
In de ecologische benadering van visuele waarneming staat de omgeving centraal als bron
van stimulatie en daarin spelen vooral oppervlakken een essentiële rol.
Opvallend: De omgeving biedt veel meer informatie dan vroeger gedacht werd
Probleem van grootteconstantie is enkel probleem als men de beschikbare informatie
beperkt tot het object zelf
Je moet kijken naar de omgeving
Hogere-orde variabelen vormen een sleutelbegrip.
Deze worden meteen opgepikt (direkt pick-up) en niet berekend uit lagere-orde variabelen.
31
Gibson heeft een studie gedaan over het licht als bron van informatie over de omgeving.
Ecologische optica
Klassieke optica: licht is een fysisch verschijnsel
Twee soorten licht:
- Stralingslicht (radiënt licht)
Afkomstig van lichtbron en bevat enkel informatie over de lichtbron zelf
- Omgevingslicht (ambiënt licht)
Afkomstig van de omgeving en bevat dus informatie over voorwerpen uit de
omgeving
Optic array is ook van groot theoretisch belang.
Gehele patroon van licht zoals dat invalt op het oog
Facetoog van insecten is perfect in staat om een patroon van invallend licht op te vangen
Een patroon van licht dat uit de omgeving komt, kan enorm veel informatie bevatten over
voorwerpen en oppervlakken uit de omgeving
Eleanor J. Gibson
Visual cliff
= textuurpatroon met specificatie van randen en diepte, textuurgradiënten voor
kanteling
Invarianten spelen ook een centrale rol in de ecologische optica
Invarianten
= gelijkblijvende factoren ondanks veranderingen
Latere volgelingen hebben er nog ‘transformationele invarianten’ aan toegevoegd
= Een bepaald patroon van verandering onafhankelijk van de structuur waarop de
transformatie plaatsvindt
Optic flow
Stroom van optische elementen die ontstaat in de optica array van een bewegende
waarnemer
Als je als waarnemer aan een redelijke snelheid beweegt in de ene richting, ontstaat er een
‘optic flow’ in de ander richting met redelijke snelheid en verder af een stroom die stilstaat of
met je meebeweegt.
Bewegingsparallax
= de richting en snelheid van de optic flow is een direct functie van afstand ten
opzichte van de bewegende waarnemer
Optical looming
= het snel expanderende ‘flow field’ ten gevolge van een snel naderend voorwerp
De ‘focus of expansion’ in een ‘optic flow field’ geeft aan waar je als waarnemer naartoe
beweegt
Sterke bron van informatie bij navigatie
32
Hogere-orde invariant ‘Tau’
= De verhouding van de grootte in het netvliesbeeld tot de sterkt van de verandering van die
grootte over tijd
Specifeert hoe lang men nog heeft vooraleer men het oppervlak zal raken
= Time-to-contact
Affordances
= Neologisme waarmee Gibson verwijst naar eigenschappen van voorwerpen die in directe
relatie staan met gedrag van de waarnemer
Affordantie is wat je met het voorwerp kan doen in het licht van je behoeften
Vb.: be-zit-baarheid van een stoel
Affordanties worden gespecifeerd door hogere-orde invarianten in de verhoudingen tussen
eigenschapen of dimensies van het voorwerp en da waarnemer
Begrip krijgt veel weerklank
Vb.: bij een deur die men moet openduwen, moet je een deurklink vermijden die
uitnodigt om te trekken
Wat zegt de ecologische benadering over het proces van waarneming zelf?
Als men kan aantonen dat de visuele informatie voldoende rijk is om alles te specificeren
wat nodig is om je gedrag te kunnen aan passen aan de omgeving, dan hoeft waarneming deze
informatie enkel maar te detecteren
Perceptie is beperkt tot ‘direkt pick-up’ van de invarianten uit de visuele informatie
Resonance en tuning
Het visueel systeem moet enkel resoneren met de beschikbare informatie
Dit proces bevat smart mechanisms die meteen hogere-orde invarianten registreren
Deze visie gaat radicaal in tegen alle eerder perceptietheorieën die stellen dat waarneming
indirect is. Gibson stelt dat waarneming direct is, zonder tussenliggende processen.
Deze tegenstelling is erg fundamenteel: het gaat om een andere manier van wetenschap
doen en zelfs om een ander wereldbeeld.
Indirecte theorieën van
perceptie
Ecologische of directe
perceptietheorie
Informatie Arm (sensaties) Rijk (specificaties)
Perceptie Verrijking Detectie
Licht Energie Informatie
Variabelen Lagere-orde Hogere-orde
Optica Fysische Ecologische
Zintuigen Passieve kanalen Actieve perceptuele systemen
Activiteit Elaboratie Exploratie
Omgeving-waarnemer Dualisme Ecosysteem
Empirisch onderzoek Reductie van stimulus Onderzoek van stimulus
33
c) De computationele benadering van David Marr (CTP)
David Marr (1945 – 1980)
Grondlegger van een nieuwe, interdisciplinaire benadering van waarneming
Vison = waarneming
1982: ‘Vision: A computational investigation into the human representation and processing
of visual information’
Bevatte redelijk wat modellen die fout waren of niet werken
Toch een mijlpaal in de vision sciences
Marr beschouwde alle eerder werk als louter descriptief, niet verklarend:
- Pyschofysica
Sensoriële codering van prikkels op systeemniveau
- Neurofysiologie
Op celniveau
Beiden geen gedetailleerde verklaring van de manier waarop waarneming echt werkt.
Als je een systeem wilt nabouwen, dan moet je echt alles in detail begrijpen.
Wat ontbrak in de visies volgens Marr, was de computationele theorie
Een analyse van de taak (functie) van visuele waarneming als een
informatieverwerkingsprobleem
Input en output van het probleem in detail
Pas daarna kan je vragen stellen naar de manier waarop je I en O kan voorstellen,
transformeren en berekenen.
Niveau van representatie en algoritmes
Het niveau van de hardware implementatie
3e niveau waarop je waarneming kan bestuderen
Fysische realisatie van deze representaties en algoritmes in brein en machine
Het conceptueel onderscheiden van deze 3 verklaringsniveaus is van grote blijvende waarde
voor vision science.
De kern van computationele benadering
Er is veel informatie beschikbaar, maar impliciet
De informatie moet geëxtraheerd worden uit de inputbeelden en verwerkt worden om ze
expliciet te kunnen maken.
Zoveel mogelijk bottom-up verwerken met meerdere tussenstappen
Visuele informatieverwerking omvat een reeks processen (informatie verwerken) en
representaties tussen input en output (tussentijdse resultaten voor verdere analyse).
34
Marr onderscheidt drie grote stappen:
- Primaire schets
- 2,5D schets
- 3D objectmodel
Primaire schets / raw primal sketch
Input bestaat uit netvliesbeelden als een verzameling grijswaarden (impliciet)
Randen extraheren gebeurt door filter die eerst randen wazig maakt (blurring) en dan een
zwart-wit versie maakt door tresholding)
Nul-doorgang (zero-crossing)
Men past filteroperatie toe op meerdere spatiale schalen toe en uit elk beeld extraheert men
primitieve features
Tresholding
= alle grijswaarden boven een bepaalde drempel wit, onder de drempel zwart
Full primal sketch
Marr gebruikt symbolen (tokens) om de belangrijkste attributen van features te kunnen
weergeven, los van hun identiteit
2,5D schets
Marr probeert de 3e dimensie te achterhalen
Eerst gezichtspuntafhankelijke aspecten van diepte extraheren
Ruimtelijke oriëntaties van oppervlakken uit standpunt van waarnemer
Representatie is 2,5D schets
Maakt gebruik van vectoren waarvan de grootte overeenkomt met ‘slant’ en de
oriëntatie met ‘tilt’
Berekening gebeurt door verschillende onafhankelijke modules
Berekenen dieptecue
Principe is telkens gelijkaardig
Random-dot stereogrammen van Bela Julesz
Correspondentieprobleem
= Combinatorische explosie van mogelijks overeenkomstige punten
Explosie inperken door eenvoudige constraints in te roepen:
- Compatibiliteit
Wit = wit, zwart = zwart
- Uniciteit
Elke stip komt overeen met slechts één andere stip
- Continuïteit
De veranderingen van diepte verlopen zo geleidelijk mogelijk
35
Combinatie hiervan en de implementatie in een neuraal netwerk convergeert naar unieke
oplossing: waarneming van figuur tegen een achtergrond.
Berekening van 3D model
Gezichtspuntonafhankelijke representatie van voorwerpen
Vertrekpunt: een globale weergave van de spatiale relaties tussen de belangrijkste delen
kan volstaan voor herkenning
Werken met gewone cilinders
Hiërarchische voorstelling van meerdere spatiale schalen van een voorwerp
Twee tegenstrijdige eisen verzoenen die aan objectherkenning gesteld worden in
functie van het niveau waarop men objecten moet kunnen herkennen
CTP DTP ITP
Gelijkenissen Informatie is rijk Berekeningen en processen
nodig voor informatie te
verwerken
Verschillen CTP stelt berekeningen
nodig om informatie te
verwerken
Direct pick-up
CTP bevat algemene,
fysische constraints die
impliciet in het systeem
ingebakken zijn
Object-specifieke
hypothsen
CTP gebruikt kennis om
informatie stap voor stap te
verwerken
Kennis wordt gebruikt om
beschikbare informatie te
verrijken
Een groot deel van dit werk is geïntegreerd in de mainstream benadering.
Meer expliciete modellering
Meer samenwerking tussen verschillende disciplines van vision science
Meer convergentie
Toch moeilijker dan gedacht om generische modellen voor te stellen die zowel voor
biologische – als voor computervisie van toepassing zijn.
Invloed van computervisie op de psychologie van de waarneming is terug getaand
36
d) Twee toepassingen als illustratie
Onderzoek over biologische bewegingsperceptie
Gunnar Johansson (1911 – 1998)
1950: ‘Configurations in event perception: an experimental study’
Gestaltpsychologische traditie
1973: ‘landmark paper’
Biologische bewegingsperceptie
Originele techniek om stimuli te reduceren tot hun essentie
= Puntlichtfiguren
Essentie van het fenomeen
Dwingende, spontane, automatische Gestaltwaarneming die gebaseerd is op
spatiotemporele relaties in de input
Hij stelde codeertheorie voor die gebaseerd was op zijn eerder werk over ‘event
configurations’
Relaties tussen afzonderlijke trajecten en binnen een bepaald referentiekader zijn cruciaal.
Cognitieve codeertheorie: volgens hem worden absolute bewegingen ontbonden in
gemeenschappelijke en relatieve bewegingen.
= Vectoranalyse
= Soort algoritme om het computationeel probleem van veelheid aan locale trajecten
op te lossen naar één consistente interpretatie
Van toepassing op biologische bewegingsperceptie
Later onderzoek heeft aangetoond dat ‘point-light displays’ ook informatie bevatten voor de
categorisatie van geslacht, leeftijd, gemoedstoestand, …. .
Vervolgonderzoek was er voornamelijk op gericht om te achterhalen wat hiervoor precies de
kritische informatiebronnen (cues) zijn en hoe goed die verwerkt worden.
Poljac et al. (2012)
Vertrekpunt = Suchow en Alvarez (2011) over motion silencing
= Bewegingsperceptie suggereert de bewuste toegang tot kenmerken van locale delen
van de configuratie verhindert of onderdrukt
Verklaring van onderzoekers: low-level
Taak vereist tussenkomst van locale mechanismen en bewegend voorwerp besteedt
slechts weinig tijd op elke locatie
Kort venster om een verandering op te pikken
Verklaring van boek: mid-level
Objecthood: details van geheel zijn minder toegankelijk voor visueel bewustzijn.
Beweging is geen noodzakelijke en voldoende voorwaarde voor het effect
37
Dieptewaarneming
Soort dieptecue Wat?
Oculomotorische
dieptecues
Gebaseerd op feit dat oog beschikt over spieren die zorgen dat
voorwerpen scherp afgebeeld worden op netvlies
Idee: hersenen geven bevel aan deze spieren, beschikken over
feedback van dat signaal waardoor het visueel systeem er ook
gebruik van kan maken
Accommodatie
= proces waardoor de kromming van de lens aangepast wordt,
zodat de beelden scherp afbeeld worden.
Convergentie
= proces waarmee de ogen samen op een voorwerp gericht
kunnen worden
Dragen in geringe mate bij aan dieptewaarneming
Visuele cues:
- Binoculaire cues
(stereovisie)
- Monoculaire
cues:
Dynamische
cues
Statische cues
Belangrijke informatiebron om nauwkeurige diepteschattingen
te bekomen.
Retinale disparitieit
= verschil dat bestaat tussen beide netvliesbeelden doordat de
ogen vanuit een lichtjes verschillende ruimtelijke positie kijken
naar een welbepaald punt in de 3D ruimte
Bewegingsparallax
In plaats van twee beelden afkomstig van twee ogen op één
ogenblik in de tijd, hebben we twee beelden afkomstig van één
oog op twee momenten in de tijd
Betrouwbare dieptebron
Informatiebronnen in één statisch beeld
Interpositie of occlusie: indien een voorwerp iets bedekt, is het
eerste dichterbij dan het andere
Relatieve grootte: voorwerpen die verder weg, lijken kleiner
Relatieve hoogte: idem als hierboven
Textuurgradiënten
Lineair perspectief: parallelle lijnen die in perspectief getekend
zijn, convergeren in verdwijnpunt
Atmosferische perspectief: voorwerpen verder weg zijn waziger