Syl Lab Us Spelt He Orie

49
7/23/2019 Syl Lab Us Spelt He Orie http://slidepdf.com/reader/full/syl-lab-us-spelt-he-orie 1/49 SYLLABUS INLEIDING SPELTHEORIE Eerste versie: Maurice Koster Herzien: Marco van der Leij 23 april 2013

Transcript of Syl Lab Us Spelt He Orie

Page 1: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 149

SYLLABUS

INLEIDING SPELTHEORIE

Eerste versie Maurice Koster

Herzien Marco van der Leij

23 april 2013

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 249

1 Introductie wat is speltheorie

Speltheorie is niet meer en niet minder dan een gereedschapskist met analytische hulpmiddelenom sociale interactie formeel te bestuderen Het bouwt voort op de klassieke beslissingstheorie dieuitsluitend situaties beschouwt waarbij een enkel individu optimaliseert met Natuur als tegenspelerHier staat Natuur voor een kansverdeling over toestanden van de omgeving van het individuonafhankelijk van zijnhaar acties

De speltheorie onderscheidt zich daarin dat het beslissingsprocessen betreft waarbij het resul-taat voor een individu niet alleen van zijn eigen actie afhangt maar ook van die van anderen Indat opzicht kan je de klassieke beslissingstheorie als deeltheorie van de speltheorie opvatten Ditklinkt allemaal abstract maar binnen dit raamwerk vallen ook de huis-en-tuingezelschapsspelenzoals schaken Risk en Kolonisten van Catan Hoewel het vakgebied zich van hieruit ontwikkeldeen daaraan zijn naam ontleent is het toepassingsgebied enorm groter geworden De belangrijk-ste gebieden die met speltheorie te maken hebben zijn de wiskundige economie en de anderemaatschappij- en gedragsstudies Pionier van de speltheorie is de wetenschappelijke duizendpootJohn Von Neumann en van zijn hand verscheen het eerste gezaghebbende werk The Theory of Games and Economic Behavior (1944) dat hij samen met de wiskundig econoom Oskar Morgen-stern schreef1 Sinds het werk van John von Neumann zijn spelen een wetenschappelijke metafoorvoor een veel breder spektrum van menselijke interacties waarbij de uitkomsten afhangen van deinteracties van twee of meerdere personen die tegengestelde of verstrengelde belangen hebben Despeltheorie stelt zich ondermeer de volgende vragen

bull Wat betekent het om rationeel een strategie te overwegen wanneer de uitkomsten afhangenvan de strategieen die anderen kiezen

bull In spelen die wederzijdse winst (of verlies) toestaan is het ldquorationeelrdquo om samen te werkenom zo de winst te maximaliseren (verlies te beperken) of is het juist rdquorationeelrdquo om agressief te zoeken naar individueel gewin zonder te kijken naar efficientie op groepsniveau

bull Als het antwoord op de vorige vraag soms luidt in welke omstandigheden is agressief handelenrationeel en welke omstandigheden samenwerking

bull Onder welke omstandigheden kan rationeel egoısme leiden tot spontane morele regels

bull Wat is de invloed van voortdurende relaties wanneer een zelfde situatie vaker beleefd wordt

bull Zijn mensen cooperatiever dan lsquorationeelrsquo kan worden genoemd Of juist agressiever of beide

In de literatuur wordt er doorgaans een onderscheid gemaakt tussen cooperatieve en niet-cooperatieve spelen Couml operatieve spelen zijn spelen waarin de spelers bindende afspraken kunnen

1De eerste werken dateren uit de vroeg 18e eeuw bijvoorbeeld De Montmort (1713) Bernoulli (1738) Cournot(1883) Bertrand (1883) Borel (1924) Von Neumann (1928) Zonder hier een volledig overzicht van de geschiedenis tegeven kan een naam op deze plek niet achterwege blijven en dat is John Nash Met de publicatie van zijn proefschriftin 1951 heeft hij een onuitwisbare indruk achtergelaten bij de systematische bestudering van spelen Zijn conceptvan een evenwicht vormt nog steeds de spil van de speltheorieVoor een mooi overzicht zie wwwgametheorynet

2

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 349

maken dit in tegenstelling tot niet-couml operatieve spelen waar geen bindende afspraken mogelijk zijnDe modellen zijn niet geheel complementair de grote misvatting is dat in niet-cooperatieve theoriegeen samenwerking voorkomt Het belangrijkste verschil is dat de co operatieve theorie uitgaat vanvolledige samenwerking terwijl in een niet-cooperatief raamwerk samenwerking tot stand komt alsresultaat van individuele beschouwingen

De cooperatieve speltheorie onderzoekt situaties waar individuen op een natuurlijke maniertot overeenstemming kunnen komen Je kan het opvatten alsof ze bij elkaar komen en via onder-handelingen afspreken welk einddoel ze zouden willen behalen Verder kunnen die individuen daneen verdrag sluiten dat eenieder verplicht zich ook zo te gedragen als afgesproken is Met anderewoorden de inhoud van het verdrag ligt in het kader van de spelregels besloten

De niet-cooperatieve theorie daartegen onderzoekt een totaal andere klasse van problemenZie hier het beeld voor je van individuen die compleet van elkaar verwijderd staan en op geenenkele manier met elkaar communiceren kunnen Of ze kunnen wel communiceren maar kunnenelkaar daar niet aan eventuele afspraken houden omdat er geen verdragen mogelijk zijn De enigemogelijkheid om met elkaar in contact te komen bestaat uit de interactie die het spel de individuentoestaat

Dit lijkt zo op het eerste gezicht een absurde situatie maar de opgetekende situatie is een veelalgemener model dan het cooperatieve Namelijk de handelingen waar de cooperatieve theorieeenvoudigweg vanuit gaat zijn altijd beschikbaar in de niet-cooperatieve theorie Terwijl aaneen verdrag in de cooperatieve theorie niet te tornen valt is het in de niet-co operatieve theoriedeel van de strategie of het verdrag wel dan niet geeerbiedigd wordt Cooperatieve theorie isniet zozeer geinteresseerd in de communicatiestructuren maar is gericht op het dragen van de

consequenties van de afgesproken acties Vragen als wie krijgt wat bij samenwerking vormendaarbij het hoofdmenu

Voor vele situaties kan het cooperatieve model echter zeer praktisch en nuttig zijn en veleeenvoudige cooperatieve situaties laten zich alleen met vele omwegen of zelfs totaal niet met eenniet-cooperatief model beschrijven De theorieen kiezen een ander zwaartepunt in ieder geval ishet centrale thema van de niet-cooperatieve theorie het mechanisme van sociale interactie - en daarwillen we in deze cursus aandacht aan besteden

Het basisbegrip spel bestaat uit vijf componenten

bull De spelers

bull Een complete beschrijving van wat de spelers doen een complete beschrijving van alle mo-gelijke acties De strategieen van een speler zijn de volledige lijsten met acties

bull De informatie die iedere speler tot beschikking heeft wanneer de acties worden gekozenHieronder valt onder meer informatie over het spelverloop

bull Een beschrijving van consequenties voor iedere speler voor ieder profiel van strategieen

bull Een beschrijving van de preferenties van de spelers over de consequenties

3

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 449

Een belangrijke vereenvoudiging die we zullen maken is dat we ervanuit zullen gaan dat prefe-renties van de verschillende spelers worden weergegeven door nutsfuncties maar daarover meer inde volgende hoofdstukken

In dit vak zullen twee variaties op dit zeer algemene raamwerk bekeken worden We beginnenin Hoofdstuk 2 met de meest eenvoudige situaties waarbij spelers simultaan een actie onderne-men en iedere speler volledig geinformeerd is en we eindigen bij meer gecompliceerde situaties inHoofdstuk 7 waarbij spelers in een bepaalde volgorde aan zet zijn

We zullen alleen spelen behandelen waarbij aangenomen wordt dat beide spelers alles van el-kaar afweten welke speelmogelijkheden ze hebben en hoeveel ze krijgen uitbetaald Dit wordenspelen met volledige informatie genoemd Spelen met onvolledige informatie hebben meer econo-

mische toepassingen maar zijn ook ingewikkelder en worden in dit inleidend vak speltheorie nietbehandeld

2 Spelen in strategische vorm met volledige informatie

De simpelste vorm van strategische afhankelijkheid is te vinden in een context waar verschillendeindividuen gelijktijdig acties ondernemen en daarmee de uitkomst van de interactie bepalen Ditwordt gemodelleerd als een spel in strategische vorm

Definitie 21 Een spel in strategische vorm is een tripel⟨

N (S i)iisinN (ui)iisinN ⟩

met

bull de verzameling spelers N = 1 nbull de strategieverzamelingen van de spelers S i i isin N

bull de uitbetalingen van spelers nutsfuncties ui S rarr R

Het concept van spel in strategische vorm probeert situaties te modelleren waarbij er strategischeafhankelijkheid bestaat tussen spelers die of tegelijkertijd acties ondernemen of niet tegelijkertijdmaar zonder observatie van de acties van de andere spelers Dus een strategisch spel staat niet model voor een situatie waarbij spelers in een bepaalde volgorde acties ondernemen na observatievan een zeker spelverloop waarbij al eerder andere spelers actief zijn geweest Dan zouden we dezespelverlopen in de beschrijving moeten opnemen Dit soort spelen komen we nog in Hoofdstuk 7tegen

Een spel in strategische vorm heeft dus drie elementen de spelers de strategieen en de uitbe-talingen Wat betreft de spelers er is niets dat je tegenhoudt om de spelers anders te noemen of te labelen dan hierboven gedaan is met natuurlijke getallen Iedere keuze is in dit verband evenwillekeurig

Wat betreft de strategie en bij gegeven strategieverzamelingen (S i)iisinN definieren we de verza-meling van strategieprofielen van het spel als

S = timesiisinN S i =1048699

(s1 s2 sn) si isin S i i = 1 n

983165

4

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 549

Dus een strategieprofiel s = (s1 s2 sn) is niets meer dan een geordende combinatie van stra-tegieen

Ieder strategieprofiel s isin S heeft (u1 (s) un (s)) als uitbetalingen voor de spelers We nemenaan dat voor iedere speler er een uitbetalingsfunctie oftewel een nutsfunctie ui S rarr R bestaat diede preferenties van de speler weergeeft Dat wil zeggen dat een speler i isin N het strategieprofiel s(zwak) prefereert boven strategieprofiel sprime precies wanneer ui (sprime) le ui (s) Daarbij wordt s striktboven sprime geprefereerd als ui (sprime) lt ui (s)

Ook al noemen we ui (s) een uitbetaling we zullen een statement als ui (s) gt ui (sprime) louterordinaal opvatten Dit betekent dat we geen speciale betekenis aan de grootte van het verschilui (s)minusui (sprime) geven maar alleen het teken voorop stellen Al wat belangrijk is is hoe de individuelespelers de verschillende uitkomsten rangschikken

Merk op dat de uitbetalingsfuncties het interactieve element bevatten aangezien de uitbetalin-gen niet alleen van een speler zijn eigen strategie maar ook die van de andere spelers afhangen

Merk op dat we een component van een spel nog onderbelicht hebben de informatie Watweet een speler van de situatie Is hijzij op de hoogte van de spelregels Wat weet een spelervan de andere spelers Wat weet een speler over dat wat de spelers over hemhaar weten Dezeinformatie is cruciaal bij menig strategische analyse In dit vak beschouwen we een veredeld modelwaarin van spelers aangenomen wordt alles te weten Anders gezegd de spelers hebben volledige informatie

Definitie 22 Bij een spel in strategische vorm met volledige informatie wordt aangenomen datalles maar dan ook alles dat met de formulering van het spel te maken heeft (dwz de spelers

de verzamelingen acties en strategieen en de uitbetalingsfuncties) bekend is voor iedere spelerSterker nog iedere speler weet dat alle spelers alles weten van het spel en alle spelers weten datalle spelers weten dat alle spelers alles van het spel weten ad infimum We zullen hier verderniet veel aandacht aan schenken en gewoonweg postuleren dat de eigenschappen van het spelgemeenschappelijke kennis zijn zonder er werkelijk bij stil te staan wat dit eigenlijk betekent

21 Bimatrixspelen

Het eenvoudigste type spelen waarbij spelers verscheidene acties hebben en via interactie elkaarsuitbetalingen kunnen beınvloeden hebben twee spelers die zich ieder bedienen van twee strategie enDeze spelen laten zich in matrixvorm opstellen en zijn eenvoudig te onderzoeken maar ook complex

genoeg om hiermee allerlei speltheoretische concepten te bespreken De algemene structuur is devolgendespeler 2

speler 1L R

T a w b xB c y d z

Speler 1 heeft strategieen T (top) en B (bottom) en speler 2 heeft strategieen L (links) en R(rechts) Verder staan abc en d voor de uitbetalingen voor speler 1 en wxy en z voor die voor

5

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 649

speler 2 De uitkomst (T R) resulteert in de uitbetaling b voor speler 1 en uitbetaling x voor speler2 Een iets andere en meer wiskundige formulering van dit spel is als geordend paar 2 times 2 matrices(A B) met

A =

983080 a bc d

983081 en B =

983080 w x

y z

983081

A resp B heet de uitbetalingsmatrix van speler 1 resp 2

Voorbeeld 23 Prisonersrsquo DilemmaHet Prisonersrsquo Dilemma is het bekendste 2 times2 bimatrixspel dat er bestaat Alleen in de psychologieen sociologie zijn er al honderden artikelen aan gewijd Zo ook komt het in Southpark voor en in

spelshows Wat het spel zo interessant maakt is dat het een interessant samenspelconflict laatzien van individuele belangen en het collectief belang Reden genoeg voor ons om dit als eerstevoorbeeld te bespreken

Het verhaal is als volgt Twee gangsters begaan samen een roofoverval en worden daarna gepaktdoor de politie maar zonder op heterdaad betrapt te worden Op het politiebureau worden de beideverdachten in aparte cellen geplaatst en wordt hen het volgende aanbod gedaan De verdachtenkunnen de misdaad bekennen of liegen Als beide liegen wat inhoudt dat ze ontkennen dan krijgenze toch een jaar celstraf vanwege illegaal wapenbezit - a minor offence Stel nu dat er slechts eenverdachte bekent terwijl de ander blijft ontkennen In dat geval wordt de bekentenis beloondmet vrijspraak indien de verdachte als kroongetuige optreedt In dat geval levert dat vijf jaar celop voor de ontkennende verdachte Biechten beide gevangenen hun misdaad op dan krijgen zebeide vier jaar cel Dit kunnen we formuleren als bimatrixspel Hier staat C voor Confess en D

voor Deny In onderstaande tabel worden de resultaten bij de verschillende antwoorden van deverdachten weergegeven in het aantal jaren opsluiting

verdachte 2C D

verdachte 1 C 4 4 0 5D 5 0 1 1

Deze tabel volstaat echter nog niet als een geschikt matrixspel om de situatie te beschrijven nleen hoger aantal jaren gevangenisstraf correspondeert niet met een hoger nut Hier kunnen wehet volgende aan doen Stel dat het nut van de verdachten gegeven wordt door het aantal jarengevangenisstraf dat ten opzichte van de maximale straf van vijf jaar ontlopen wordt Dan volgthet bijbehorende bimatrixspel

verdachte 2C D

verdachte 1 C 1 1 5 0D 0 5 4 4

Zo levert vrijspraak voor een verdachte een uitbetaling 5 minus 0 = 5 op en als beide ontkennen spaartiedere verdachte 4 jaar cel Zo levert de uitkomst (C D) de uitbetalingen (5 0) op die terug tevinden is in matrixcel (1 2) De eerste coordinaat staat voor de uitbetaling voor speler 1 en detweede voor die van speler 2

6

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 749

Een eerste speltheoretische analyse

Stel je ziet jezelf geplaatst voor dit probleem wat zou je doen Ik denk dat wanneer het gaat om 4 jaar cel in plaats van 5 jaar cel je de 4 jaar cel prefereert Net zo gaat vrijspraak boven 1 jaar celWe zetten de mogelijkheden eens op een rijtje als je partner in crime bekent dan is het het besteom ook te bekennen Als hijzij echter niet bekent dan kan je vrijspraak krijgen door te bekennendus wederom is bekennen optimaal Kortom wat je medeverdachte ook doet bekennen levert jede minste jaren cel op Deze redenatie is geldig voor beide spelers ophangen met als oplossing deuitkomst (C C ) ndash beide bekennen

Veel mensen vinden deze uitkomst tegenstrijdig omdat de gevangenen zo precies die toestandbereiken die voor beiden samen het slechtst uitpakt Namelijk in totaliteit komt met (C C ) het

totaal aantal jaren in de nor op 4 + 4 = 8 jaren terwijl het bij ( D D) slechts gaat om 1 + 1 = 2 jaren De omstandigheden zijn echter zo gemaakt dat deze laatste uitkomst niet bereikt wordt

Het gaat aan menigeen met gezond verstand te boven dat hier het egoısme van individuenleidt tot een resultaat dat voor beiden slecht is Betekent dit dat de bovenstaande redenatie nietzo overtuigend is als het op het eerste gezicht lijkt

De tegenwerping tegen bovenstaande analyse hangt vermoedelijk samen met de bijzondere vormvan de geschiedenis Je kan je afvragen of het echt wel lonend is je vriend te verraden om een jaargevangenisstraf te ontlopen Wat gebeurt er namelijk als deze na vijf jaar vrijkomt Barst hij uitelkaar van wraakgevoelens Dit laat al zien dat het verhaal eigenlijk niet bij de uitbetalingsmatrixpast en in ieder geval moeten de jaren gevangenisstraf niet als nut worden opgevat Maar dan ishet ook niet echt verwonderlijk dat een analyse op basis van diezelfde uitbetalingsmatrix leidt toteen paradoxale uitkomst Zou je zelf een betere uitbetalingsmatrix weten Hieronder een voorbeeld

dat beter te verkopen is

Voorbeeld 24 Twee handelaren die op de zwarte markt opereren willen handelswaar uitwisselenvia geheime kanalen hebben ze afgesproken op een bepaald tijdstip elkaar de koffers met overeenge-komen goederen te overhandigen De handelaren kennen elkaar niet en nemen de grootste moeiteom bij de uitwisseling onherkenbaar te blijven waarmee een nieuwe ontmoeting onwaarschijnlijkwordt Verder kan ook de inhoud van de koffers niet gecontroleerd worden omdat de overhandi-ging snel verlopen moet De inhoud van de eigen koffer is de handelaren precies 1000 Euro waardterwijl de handelswaren van de ander het viervoudige oplevert namelijk 4000 Euro Bij de over-eengekomen ruil zou eenieder dus 4000 Euro winnen of zelfs 5000 Euro als de eigen koffer metwaardeloze kiezelstenen gevuld wordt De bijbehorende bimatrix luidt als volgt

handelaar 2W S

handelaar 1 W 4000 4000 0 5000S 5000 0 1000 1000

Het is duidelijk dat de actie om de koffer met stenen te vullen een strikt optimale strategie S bepaalt wat de andere handelaar ook van plan is te doen Dit levert de uitkomst (S S ) ophetgeen betekent dat er effectief niets verhandeld wordt

7

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 849

Opgave 21 In een spelshow met Peter-Jan Rens strijden in het laatste spel twee overgeblevenkandidaten om een geldbedrag x De spelers wordt gevraagd om tegelijkertijd aan te geven of menhet geldbedrag zou willen delen of niet Als geen van beiden willen delen dan gaat het geldbedragin rook op en krijgen beide spelers niets Het geldbedrag wordt gelijk verdeeld onder de kandidatenals ze allebei hebben aangegeven het bedrag te willen delen Als er maar een speler wil delen dangaat het volledige bedrag naar de andere speler Formuleer de bijbehorende bimatrix Is dit spelvergelijkbaar met het Prisonersrsquo Dilemma Zo ja waarom en zo nee waarom niet

Opgave 22 Cournot duopolyGegeven is een markt voor een goed Y waarop twee bedrijven A en B actief zijn De inversevraagfunctie wordt gegeven door p (Q) = a minus Q waarbij a een positieve constante is en Q de totale

geaggregeerde productie door A en B Beide bedrijven produceren met constante marginale kostenc gt 0 en zonder vaste kosten zodat de kostenfuncties gegeven worden door

C i (q i) = cq i voor alle q i ge 0 en i = A B

Neem aan dat de bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveau bepalenModeleer deze situatie als 2 times 3 bimatrixspel als gegeven is dat A op twee productieniveaursquosq LA = 3 q H A = 5 en dat B op drie productieniveaursquos q LB = 1 q M

B = 3 en q H B = 5 kan producerenNeem hierbij voor de constanten a = 10 c = 2

3 Dominantie IEWDS en IEDS oplossing

Het probleem waar spelers voor staan is dat ze uit hun actieverzameling een keuze moeten makenzonder dat ze weten wat de andere spelers doen Daarom probeert iedere speler de acties van deandere spelers in te schatten wat in het algemeen vrij lastig is Hoewel in sommige gevallen doetdit probleem zich niet echt voor omdat er een actie voorhanden is die optimaal is ongeacht devoorgenomen speelwijze van de tegenstanders Deze situatie hebben we in het vorige hoofdstuk aleens gezien en wel bij het Prisonersrsquo Dilemma Hier is het opbiechten van de misdaad optimaalof de tegenstander nu ook opbiecht of juist niet In dit geval ligt het voor speler 1 voor de hand deactie Confess te kiezen Hetzelfde geldt voor speler 2 Dit idee zullen we nu formeel opschrijven

Notatie 31 Gegeven is de strategieen S = timesiisinN S i van een n-persoonsspel in strategischevorm en neem s = (s1 sn) isin S Dan definieren we sminusi als het profiel van strategieen

(s1 siminus1 si+1 sn) isin timesjisinN iS j en we schrijven s = (si sminusi) Dus sminusi is niets andersdan het strategieenprofiel van de spelers in het spel behalve speler i De verzameling van al zulkeprofielen noteren we met S minusi

Definitie 32 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Strategiesi isin S i van speler i domineert zwak strategie sprimei isin S i als geldt dat

bull ui (si sminusi) ge ui (sprimei sminusi) voor alle sminusi isin S minusi en

8

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 2: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 249

1 Introductie wat is speltheorie

Speltheorie is niet meer en niet minder dan een gereedschapskist met analytische hulpmiddelenom sociale interactie formeel te bestuderen Het bouwt voort op de klassieke beslissingstheorie dieuitsluitend situaties beschouwt waarbij een enkel individu optimaliseert met Natuur als tegenspelerHier staat Natuur voor een kansverdeling over toestanden van de omgeving van het individuonafhankelijk van zijnhaar acties

De speltheorie onderscheidt zich daarin dat het beslissingsprocessen betreft waarbij het resul-taat voor een individu niet alleen van zijn eigen actie afhangt maar ook van die van anderen Indat opzicht kan je de klassieke beslissingstheorie als deeltheorie van de speltheorie opvatten Ditklinkt allemaal abstract maar binnen dit raamwerk vallen ook de huis-en-tuingezelschapsspelenzoals schaken Risk en Kolonisten van Catan Hoewel het vakgebied zich van hieruit ontwikkeldeen daaraan zijn naam ontleent is het toepassingsgebied enorm groter geworden De belangrijk-ste gebieden die met speltheorie te maken hebben zijn de wiskundige economie en de anderemaatschappij- en gedragsstudies Pionier van de speltheorie is de wetenschappelijke duizendpootJohn Von Neumann en van zijn hand verscheen het eerste gezaghebbende werk The Theory of Games and Economic Behavior (1944) dat hij samen met de wiskundig econoom Oskar Morgen-stern schreef1 Sinds het werk van John von Neumann zijn spelen een wetenschappelijke metafoorvoor een veel breder spektrum van menselijke interacties waarbij de uitkomsten afhangen van deinteracties van twee of meerdere personen die tegengestelde of verstrengelde belangen hebben Despeltheorie stelt zich ondermeer de volgende vragen

bull Wat betekent het om rationeel een strategie te overwegen wanneer de uitkomsten afhangenvan de strategieen die anderen kiezen

bull In spelen die wederzijdse winst (of verlies) toestaan is het ldquorationeelrdquo om samen te werkenom zo de winst te maximaliseren (verlies te beperken) of is het juist rdquorationeelrdquo om agressief te zoeken naar individueel gewin zonder te kijken naar efficientie op groepsniveau

bull Als het antwoord op de vorige vraag soms luidt in welke omstandigheden is agressief handelenrationeel en welke omstandigheden samenwerking

bull Onder welke omstandigheden kan rationeel egoısme leiden tot spontane morele regels

bull Wat is de invloed van voortdurende relaties wanneer een zelfde situatie vaker beleefd wordt

bull Zijn mensen cooperatiever dan lsquorationeelrsquo kan worden genoemd Of juist agressiever of beide

In de literatuur wordt er doorgaans een onderscheid gemaakt tussen cooperatieve en niet-cooperatieve spelen Couml operatieve spelen zijn spelen waarin de spelers bindende afspraken kunnen

1De eerste werken dateren uit de vroeg 18e eeuw bijvoorbeeld De Montmort (1713) Bernoulli (1738) Cournot(1883) Bertrand (1883) Borel (1924) Von Neumann (1928) Zonder hier een volledig overzicht van de geschiedenis tegeven kan een naam op deze plek niet achterwege blijven en dat is John Nash Met de publicatie van zijn proefschriftin 1951 heeft hij een onuitwisbare indruk achtergelaten bij de systematische bestudering van spelen Zijn conceptvan een evenwicht vormt nog steeds de spil van de speltheorieVoor een mooi overzicht zie wwwgametheorynet

2

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 349

maken dit in tegenstelling tot niet-couml operatieve spelen waar geen bindende afspraken mogelijk zijnDe modellen zijn niet geheel complementair de grote misvatting is dat in niet-cooperatieve theoriegeen samenwerking voorkomt Het belangrijkste verschil is dat de co operatieve theorie uitgaat vanvolledige samenwerking terwijl in een niet-cooperatief raamwerk samenwerking tot stand komt alsresultaat van individuele beschouwingen

De cooperatieve speltheorie onderzoekt situaties waar individuen op een natuurlijke maniertot overeenstemming kunnen komen Je kan het opvatten alsof ze bij elkaar komen en via onder-handelingen afspreken welk einddoel ze zouden willen behalen Verder kunnen die individuen daneen verdrag sluiten dat eenieder verplicht zich ook zo te gedragen als afgesproken is Met anderewoorden de inhoud van het verdrag ligt in het kader van de spelregels besloten

De niet-cooperatieve theorie daartegen onderzoekt een totaal andere klasse van problemenZie hier het beeld voor je van individuen die compleet van elkaar verwijderd staan en op geenenkele manier met elkaar communiceren kunnen Of ze kunnen wel communiceren maar kunnenelkaar daar niet aan eventuele afspraken houden omdat er geen verdragen mogelijk zijn De enigemogelijkheid om met elkaar in contact te komen bestaat uit de interactie die het spel de individuentoestaat

Dit lijkt zo op het eerste gezicht een absurde situatie maar de opgetekende situatie is een veelalgemener model dan het cooperatieve Namelijk de handelingen waar de cooperatieve theorieeenvoudigweg vanuit gaat zijn altijd beschikbaar in de niet-cooperatieve theorie Terwijl aaneen verdrag in de cooperatieve theorie niet te tornen valt is het in de niet-co operatieve theoriedeel van de strategie of het verdrag wel dan niet geeerbiedigd wordt Cooperatieve theorie isniet zozeer geinteresseerd in de communicatiestructuren maar is gericht op het dragen van de

consequenties van de afgesproken acties Vragen als wie krijgt wat bij samenwerking vormendaarbij het hoofdmenu

Voor vele situaties kan het cooperatieve model echter zeer praktisch en nuttig zijn en veleeenvoudige cooperatieve situaties laten zich alleen met vele omwegen of zelfs totaal niet met eenniet-cooperatief model beschrijven De theorieen kiezen een ander zwaartepunt in ieder geval ishet centrale thema van de niet-cooperatieve theorie het mechanisme van sociale interactie - en daarwillen we in deze cursus aandacht aan besteden

Het basisbegrip spel bestaat uit vijf componenten

bull De spelers

bull Een complete beschrijving van wat de spelers doen een complete beschrijving van alle mo-gelijke acties De strategieen van een speler zijn de volledige lijsten met acties

bull De informatie die iedere speler tot beschikking heeft wanneer de acties worden gekozenHieronder valt onder meer informatie over het spelverloop

bull Een beschrijving van consequenties voor iedere speler voor ieder profiel van strategieen

bull Een beschrijving van de preferenties van de spelers over de consequenties

3

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 449

Een belangrijke vereenvoudiging die we zullen maken is dat we ervanuit zullen gaan dat prefe-renties van de verschillende spelers worden weergegeven door nutsfuncties maar daarover meer inde volgende hoofdstukken

In dit vak zullen twee variaties op dit zeer algemene raamwerk bekeken worden We beginnenin Hoofdstuk 2 met de meest eenvoudige situaties waarbij spelers simultaan een actie onderne-men en iedere speler volledig geinformeerd is en we eindigen bij meer gecompliceerde situaties inHoofdstuk 7 waarbij spelers in een bepaalde volgorde aan zet zijn

We zullen alleen spelen behandelen waarbij aangenomen wordt dat beide spelers alles van el-kaar afweten welke speelmogelijkheden ze hebben en hoeveel ze krijgen uitbetaald Dit wordenspelen met volledige informatie genoemd Spelen met onvolledige informatie hebben meer econo-

mische toepassingen maar zijn ook ingewikkelder en worden in dit inleidend vak speltheorie nietbehandeld

2 Spelen in strategische vorm met volledige informatie

De simpelste vorm van strategische afhankelijkheid is te vinden in een context waar verschillendeindividuen gelijktijdig acties ondernemen en daarmee de uitkomst van de interactie bepalen Ditwordt gemodelleerd als een spel in strategische vorm

Definitie 21 Een spel in strategische vorm is een tripel⟨

N (S i)iisinN (ui)iisinN ⟩

met

bull de verzameling spelers N = 1 nbull de strategieverzamelingen van de spelers S i i isin N

bull de uitbetalingen van spelers nutsfuncties ui S rarr R

Het concept van spel in strategische vorm probeert situaties te modelleren waarbij er strategischeafhankelijkheid bestaat tussen spelers die of tegelijkertijd acties ondernemen of niet tegelijkertijdmaar zonder observatie van de acties van de andere spelers Dus een strategisch spel staat niet model voor een situatie waarbij spelers in een bepaalde volgorde acties ondernemen na observatievan een zeker spelverloop waarbij al eerder andere spelers actief zijn geweest Dan zouden we dezespelverlopen in de beschrijving moeten opnemen Dit soort spelen komen we nog in Hoofdstuk 7tegen

Een spel in strategische vorm heeft dus drie elementen de spelers de strategieen en de uitbe-talingen Wat betreft de spelers er is niets dat je tegenhoudt om de spelers anders te noemen of te labelen dan hierboven gedaan is met natuurlijke getallen Iedere keuze is in dit verband evenwillekeurig

Wat betreft de strategie en bij gegeven strategieverzamelingen (S i)iisinN definieren we de verza-meling van strategieprofielen van het spel als

S = timesiisinN S i =1048699

(s1 s2 sn) si isin S i i = 1 n

983165

4

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 549

Dus een strategieprofiel s = (s1 s2 sn) is niets meer dan een geordende combinatie van stra-tegieen

Ieder strategieprofiel s isin S heeft (u1 (s) un (s)) als uitbetalingen voor de spelers We nemenaan dat voor iedere speler er een uitbetalingsfunctie oftewel een nutsfunctie ui S rarr R bestaat diede preferenties van de speler weergeeft Dat wil zeggen dat een speler i isin N het strategieprofiel s(zwak) prefereert boven strategieprofiel sprime precies wanneer ui (sprime) le ui (s) Daarbij wordt s striktboven sprime geprefereerd als ui (sprime) lt ui (s)

Ook al noemen we ui (s) een uitbetaling we zullen een statement als ui (s) gt ui (sprime) louterordinaal opvatten Dit betekent dat we geen speciale betekenis aan de grootte van het verschilui (s)minusui (sprime) geven maar alleen het teken voorop stellen Al wat belangrijk is is hoe de individuelespelers de verschillende uitkomsten rangschikken

Merk op dat de uitbetalingsfuncties het interactieve element bevatten aangezien de uitbetalin-gen niet alleen van een speler zijn eigen strategie maar ook die van de andere spelers afhangen

Merk op dat we een component van een spel nog onderbelicht hebben de informatie Watweet een speler van de situatie Is hijzij op de hoogte van de spelregels Wat weet een spelervan de andere spelers Wat weet een speler over dat wat de spelers over hemhaar weten Dezeinformatie is cruciaal bij menig strategische analyse In dit vak beschouwen we een veredeld modelwaarin van spelers aangenomen wordt alles te weten Anders gezegd de spelers hebben volledige informatie

Definitie 22 Bij een spel in strategische vorm met volledige informatie wordt aangenomen datalles maar dan ook alles dat met de formulering van het spel te maken heeft (dwz de spelers

de verzamelingen acties en strategieen en de uitbetalingsfuncties) bekend is voor iedere spelerSterker nog iedere speler weet dat alle spelers alles weten van het spel en alle spelers weten datalle spelers weten dat alle spelers alles van het spel weten ad infimum We zullen hier verderniet veel aandacht aan schenken en gewoonweg postuleren dat de eigenschappen van het spelgemeenschappelijke kennis zijn zonder er werkelijk bij stil te staan wat dit eigenlijk betekent

21 Bimatrixspelen

Het eenvoudigste type spelen waarbij spelers verscheidene acties hebben en via interactie elkaarsuitbetalingen kunnen beınvloeden hebben twee spelers die zich ieder bedienen van twee strategie enDeze spelen laten zich in matrixvorm opstellen en zijn eenvoudig te onderzoeken maar ook complex

genoeg om hiermee allerlei speltheoretische concepten te bespreken De algemene structuur is devolgendespeler 2

speler 1L R

T a w b xB c y d z

Speler 1 heeft strategieen T (top) en B (bottom) en speler 2 heeft strategieen L (links) en R(rechts) Verder staan abc en d voor de uitbetalingen voor speler 1 en wxy en z voor die voor

5

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 649

speler 2 De uitkomst (T R) resulteert in de uitbetaling b voor speler 1 en uitbetaling x voor speler2 Een iets andere en meer wiskundige formulering van dit spel is als geordend paar 2 times 2 matrices(A B) met

A =

983080 a bc d

983081 en B =

983080 w x

y z

983081

A resp B heet de uitbetalingsmatrix van speler 1 resp 2

Voorbeeld 23 Prisonersrsquo DilemmaHet Prisonersrsquo Dilemma is het bekendste 2 times2 bimatrixspel dat er bestaat Alleen in de psychologieen sociologie zijn er al honderden artikelen aan gewijd Zo ook komt het in Southpark voor en in

spelshows Wat het spel zo interessant maakt is dat het een interessant samenspelconflict laatzien van individuele belangen en het collectief belang Reden genoeg voor ons om dit als eerstevoorbeeld te bespreken

Het verhaal is als volgt Twee gangsters begaan samen een roofoverval en worden daarna gepaktdoor de politie maar zonder op heterdaad betrapt te worden Op het politiebureau worden de beideverdachten in aparte cellen geplaatst en wordt hen het volgende aanbod gedaan De verdachtenkunnen de misdaad bekennen of liegen Als beide liegen wat inhoudt dat ze ontkennen dan krijgenze toch een jaar celstraf vanwege illegaal wapenbezit - a minor offence Stel nu dat er slechts eenverdachte bekent terwijl de ander blijft ontkennen In dat geval wordt de bekentenis beloondmet vrijspraak indien de verdachte als kroongetuige optreedt In dat geval levert dat vijf jaar celop voor de ontkennende verdachte Biechten beide gevangenen hun misdaad op dan krijgen zebeide vier jaar cel Dit kunnen we formuleren als bimatrixspel Hier staat C voor Confess en D

voor Deny In onderstaande tabel worden de resultaten bij de verschillende antwoorden van deverdachten weergegeven in het aantal jaren opsluiting

verdachte 2C D

verdachte 1 C 4 4 0 5D 5 0 1 1

Deze tabel volstaat echter nog niet als een geschikt matrixspel om de situatie te beschrijven nleen hoger aantal jaren gevangenisstraf correspondeert niet met een hoger nut Hier kunnen wehet volgende aan doen Stel dat het nut van de verdachten gegeven wordt door het aantal jarengevangenisstraf dat ten opzichte van de maximale straf van vijf jaar ontlopen wordt Dan volgthet bijbehorende bimatrixspel

verdachte 2C D

verdachte 1 C 1 1 5 0D 0 5 4 4

Zo levert vrijspraak voor een verdachte een uitbetaling 5 minus 0 = 5 op en als beide ontkennen spaartiedere verdachte 4 jaar cel Zo levert de uitkomst (C D) de uitbetalingen (5 0) op die terug tevinden is in matrixcel (1 2) De eerste coordinaat staat voor de uitbetaling voor speler 1 en detweede voor die van speler 2

6

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 749

Een eerste speltheoretische analyse

Stel je ziet jezelf geplaatst voor dit probleem wat zou je doen Ik denk dat wanneer het gaat om 4 jaar cel in plaats van 5 jaar cel je de 4 jaar cel prefereert Net zo gaat vrijspraak boven 1 jaar celWe zetten de mogelijkheden eens op een rijtje als je partner in crime bekent dan is het het besteom ook te bekennen Als hijzij echter niet bekent dan kan je vrijspraak krijgen door te bekennendus wederom is bekennen optimaal Kortom wat je medeverdachte ook doet bekennen levert jede minste jaren cel op Deze redenatie is geldig voor beide spelers ophangen met als oplossing deuitkomst (C C ) ndash beide bekennen

Veel mensen vinden deze uitkomst tegenstrijdig omdat de gevangenen zo precies die toestandbereiken die voor beiden samen het slechtst uitpakt Namelijk in totaliteit komt met (C C ) het

totaal aantal jaren in de nor op 4 + 4 = 8 jaren terwijl het bij ( D D) slechts gaat om 1 + 1 = 2 jaren De omstandigheden zijn echter zo gemaakt dat deze laatste uitkomst niet bereikt wordt

Het gaat aan menigeen met gezond verstand te boven dat hier het egoısme van individuenleidt tot een resultaat dat voor beiden slecht is Betekent dit dat de bovenstaande redenatie nietzo overtuigend is als het op het eerste gezicht lijkt

De tegenwerping tegen bovenstaande analyse hangt vermoedelijk samen met de bijzondere vormvan de geschiedenis Je kan je afvragen of het echt wel lonend is je vriend te verraden om een jaargevangenisstraf te ontlopen Wat gebeurt er namelijk als deze na vijf jaar vrijkomt Barst hij uitelkaar van wraakgevoelens Dit laat al zien dat het verhaal eigenlijk niet bij de uitbetalingsmatrixpast en in ieder geval moeten de jaren gevangenisstraf niet als nut worden opgevat Maar dan ishet ook niet echt verwonderlijk dat een analyse op basis van diezelfde uitbetalingsmatrix leidt toteen paradoxale uitkomst Zou je zelf een betere uitbetalingsmatrix weten Hieronder een voorbeeld

dat beter te verkopen is

Voorbeeld 24 Twee handelaren die op de zwarte markt opereren willen handelswaar uitwisselenvia geheime kanalen hebben ze afgesproken op een bepaald tijdstip elkaar de koffers met overeenge-komen goederen te overhandigen De handelaren kennen elkaar niet en nemen de grootste moeiteom bij de uitwisseling onherkenbaar te blijven waarmee een nieuwe ontmoeting onwaarschijnlijkwordt Verder kan ook de inhoud van de koffers niet gecontroleerd worden omdat de overhandi-ging snel verlopen moet De inhoud van de eigen koffer is de handelaren precies 1000 Euro waardterwijl de handelswaren van de ander het viervoudige oplevert namelijk 4000 Euro Bij de over-eengekomen ruil zou eenieder dus 4000 Euro winnen of zelfs 5000 Euro als de eigen koffer metwaardeloze kiezelstenen gevuld wordt De bijbehorende bimatrix luidt als volgt

handelaar 2W S

handelaar 1 W 4000 4000 0 5000S 5000 0 1000 1000

Het is duidelijk dat de actie om de koffer met stenen te vullen een strikt optimale strategie S bepaalt wat de andere handelaar ook van plan is te doen Dit levert de uitkomst (S S ) ophetgeen betekent dat er effectief niets verhandeld wordt

7

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 849

Opgave 21 In een spelshow met Peter-Jan Rens strijden in het laatste spel twee overgeblevenkandidaten om een geldbedrag x De spelers wordt gevraagd om tegelijkertijd aan te geven of menhet geldbedrag zou willen delen of niet Als geen van beiden willen delen dan gaat het geldbedragin rook op en krijgen beide spelers niets Het geldbedrag wordt gelijk verdeeld onder de kandidatenals ze allebei hebben aangegeven het bedrag te willen delen Als er maar een speler wil delen dangaat het volledige bedrag naar de andere speler Formuleer de bijbehorende bimatrix Is dit spelvergelijkbaar met het Prisonersrsquo Dilemma Zo ja waarom en zo nee waarom niet

Opgave 22 Cournot duopolyGegeven is een markt voor een goed Y waarop twee bedrijven A en B actief zijn De inversevraagfunctie wordt gegeven door p (Q) = a minus Q waarbij a een positieve constante is en Q de totale

geaggregeerde productie door A en B Beide bedrijven produceren met constante marginale kostenc gt 0 en zonder vaste kosten zodat de kostenfuncties gegeven worden door

C i (q i) = cq i voor alle q i ge 0 en i = A B

Neem aan dat de bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveau bepalenModeleer deze situatie als 2 times 3 bimatrixspel als gegeven is dat A op twee productieniveaursquosq LA = 3 q H A = 5 en dat B op drie productieniveaursquos q LB = 1 q M

B = 3 en q H B = 5 kan producerenNeem hierbij voor de constanten a = 10 c = 2

3 Dominantie IEWDS en IEDS oplossing

Het probleem waar spelers voor staan is dat ze uit hun actieverzameling een keuze moeten makenzonder dat ze weten wat de andere spelers doen Daarom probeert iedere speler de acties van deandere spelers in te schatten wat in het algemeen vrij lastig is Hoewel in sommige gevallen doetdit probleem zich niet echt voor omdat er een actie voorhanden is die optimaal is ongeacht devoorgenomen speelwijze van de tegenstanders Deze situatie hebben we in het vorige hoofdstuk aleens gezien en wel bij het Prisonersrsquo Dilemma Hier is het opbiechten van de misdaad optimaalof de tegenstander nu ook opbiecht of juist niet In dit geval ligt het voor speler 1 voor de hand deactie Confess te kiezen Hetzelfde geldt voor speler 2 Dit idee zullen we nu formeel opschrijven

Notatie 31 Gegeven is de strategieen S = timesiisinN S i van een n-persoonsspel in strategischevorm en neem s = (s1 sn) isin S Dan definieren we sminusi als het profiel van strategieen

(s1 siminus1 si+1 sn) isin timesjisinN iS j en we schrijven s = (si sminusi) Dus sminusi is niets andersdan het strategieenprofiel van de spelers in het spel behalve speler i De verzameling van al zulkeprofielen noteren we met S minusi

Definitie 32 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Strategiesi isin S i van speler i domineert zwak strategie sprimei isin S i als geldt dat

bull ui (si sminusi) ge ui (sprimei sminusi) voor alle sminusi isin S minusi en

8

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 3: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 349

maken dit in tegenstelling tot niet-couml operatieve spelen waar geen bindende afspraken mogelijk zijnDe modellen zijn niet geheel complementair de grote misvatting is dat in niet-cooperatieve theoriegeen samenwerking voorkomt Het belangrijkste verschil is dat de co operatieve theorie uitgaat vanvolledige samenwerking terwijl in een niet-cooperatief raamwerk samenwerking tot stand komt alsresultaat van individuele beschouwingen

De cooperatieve speltheorie onderzoekt situaties waar individuen op een natuurlijke maniertot overeenstemming kunnen komen Je kan het opvatten alsof ze bij elkaar komen en via onder-handelingen afspreken welk einddoel ze zouden willen behalen Verder kunnen die individuen daneen verdrag sluiten dat eenieder verplicht zich ook zo te gedragen als afgesproken is Met anderewoorden de inhoud van het verdrag ligt in het kader van de spelregels besloten

De niet-cooperatieve theorie daartegen onderzoekt een totaal andere klasse van problemenZie hier het beeld voor je van individuen die compleet van elkaar verwijderd staan en op geenenkele manier met elkaar communiceren kunnen Of ze kunnen wel communiceren maar kunnenelkaar daar niet aan eventuele afspraken houden omdat er geen verdragen mogelijk zijn De enigemogelijkheid om met elkaar in contact te komen bestaat uit de interactie die het spel de individuentoestaat

Dit lijkt zo op het eerste gezicht een absurde situatie maar de opgetekende situatie is een veelalgemener model dan het cooperatieve Namelijk de handelingen waar de cooperatieve theorieeenvoudigweg vanuit gaat zijn altijd beschikbaar in de niet-cooperatieve theorie Terwijl aaneen verdrag in de cooperatieve theorie niet te tornen valt is het in de niet-co operatieve theoriedeel van de strategie of het verdrag wel dan niet geeerbiedigd wordt Cooperatieve theorie isniet zozeer geinteresseerd in de communicatiestructuren maar is gericht op het dragen van de

consequenties van de afgesproken acties Vragen als wie krijgt wat bij samenwerking vormendaarbij het hoofdmenu

Voor vele situaties kan het cooperatieve model echter zeer praktisch en nuttig zijn en veleeenvoudige cooperatieve situaties laten zich alleen met vele omwegen of zelfs totaal niet met eenniet-cooperatief model beschrijven De theorieen kiezen een ander zwaartepunt in ieder geval ishet centrale thema van de niet-cooperatieve theorie het mechanisme van sociale interactie - en daarwillen we in deze cursus aandacht aan besteden

Het basisbegrip spel bestaat uit vijf componenten

bull De spelers

bull Een complete beschrijving van wat de spelers doen een complete beschrijving van alle mo-gelijke acties De strategieen van een speler zijn de volledige lijsten met acties

bull De informatie die iedere speler tot beschikking heeft wanneer de acties worden gekozenHieronder valt onder meer informatie over het spelverloop

bull Een beschrijving van consequenties voor iedere speler voor ieder profiel van strategieen

bull Een beschrijving van de preferenties van de spelers over de consequenties

3

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 449

Een belangrijke vereenvoudiging die we zullen maken is dat we ervanuit zullen gaan dat prefe-renties van de verschillende spelers worden weergegeven door nutsfuncties maar daarover meer inde volgende hoofdstukken

In dit vak zullen twee variaties op dit zeer algemene raamwerk bekeken worden We beginnenin Hoofdstuk 2 met de meest eenvoudige situaties waarbij spelers simultaan een actie onderne-men en iedere speler volledig geinformeerd is en we eindigen bij meer gecompliceerde situaties inHoofdstuk 7 waarbij spelers in een bepaalde volgorde aan zet zijn

We zullen alleen spelen behandelen waarbij aangenomen wordt dat beide spelers alles van el-kaar afweten welke speelmogelijkheden ze hebben en hoeveel ze krijgen uitbetaald Dit wordenspelen met volledige informatie genoemd Spelen met onvolledige informatie hebben meer econo-

mische toepassingen maar zijn ook ingewikkelder en worden in dit inleidend vak speltheorie nietbehandeld

2 Spelen in strategische vorm met volledige informatie

De simpelste vorm van strategische afhankelijkheid is te vinden in een context waar verschillendeindividuen gelijktijdig acties ondernemen en daarmee de uitkomst van de interactie bepalen Ditwordt gemodelleerd als een spel in strategische vorm

Definitie 21 Een spel in strategische vorm is een tripel⟨

N (S i)iisinN (ui)iisinN ⟩

met

bull de verzameling spelers N = 1 nbull de strategieverzamelingen van de spelers S i i isin N

bull de uitbetalingen van spelers nutsfuncties ui S rarr R

Het concept van spel in strategische vorm probeert situaties te modelleren waarbij er strategischeafhankelijkheid bestaat tussen spelers die of tegelijkertijd acties ondernemen of niet tegelijkertijdmaar zonder observatie van de acties van de andere spelers Dus een strategisch spel staat niet model voor een situatie waarbij spelers in een bepaalde volgorde acties ondernemen na observatievan een zeker spelverloop waarbij al eerder andere spelers actief zijn geweest Dan zouden we dezespelverlopen in de beschrijving moeten opnemen Dit soort spelen komen we nog in Hoofdstuk 7tegen

Een spel in strategische vorm heeft dus drie elementen de spelers de strategieen en de uitbe-talingen Wat betreft de spelers er is niets dat je tegenhoudt om de spelers anders te noemen of te labelen dan hierboven gedaan is met natuurlijke getallen Iedere keuze is in dit verband evenwillekeurig

Wat betreft de strategie en bij gegeven strategieverzamelingen (S i)iisinN definieren we de verza-meling van strategieprofielen van het spel als

S = timesiisinN S i =1048699

(s1 s2 sn) si isin S i i = 1 n

983165

4

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 549

Dus een strategieprofiel s = (s1 s2 sn) is niets meer dan een geordende combinatie van stra-tegieen

Ieder strategieprofiel s isin S heeft (u1 (s) un (s)) als uitbetalingen voor de spelers We nemenaan dat voor iedere speler er een uitbetalingsfunctie oftewel een nutsfunctie ui S rarr R bestaat diede preferenties van de speler weergeeft Dat wil zeggen dat een speler i isin N het strategieprofiel s(zwak) prefereert boven strategieprofiel sprime precies wanneer ui (sprime) le ui (s) Daarbij wordt s striktboven sprime geprefereerd als ui (sprime) lt ui (s)

Ook al noemen we ui (s) een uitbetaling we zullen een statement als ui (s) gt ui (sprime) louterordinaal opvatten Dit betekent dat we geen speciale betekenis aan de grootte van het verschilui (s)minusui (sprime) geven maar alleen het teken voorop stellen Al wat belangrijk is is hoe de individuelespelers de verschillende uitkomsten rangschikken

Merk op dat de uitbetalingsfuncties het interactieve element bevatten aangezien de uitbetalin-gen niet alleen van een speler zijn eigen strategie maar ook die van de andere spelers afhangen

Merk op dat we een component van een spel nog onderbelicht hebben de informatie Watweet een speler van de situatie Is hijzij op de hoogte van de spelregels Wat weet een spelervan de andere spelers Wat weet een speler over dat wat de spelers over hemhaar weten Dezeinformatie is cruciaal bij menig strategische analyse In dit vak beschouwen we een veredeld modelwaarin van spelers aangenomen wordt alles te weten Anders gezegd de spelers hebben volledige informatie

Definitie 22 Bij een spel in strategische vorm met volledige informatie wordt aangenomen datalles maar dan ook alles dat met de formulering van het spel te maken heeft (dwz de spelers

de verzamelingen acties en strategieen en de uitbetalingsfuncties) bekend is voor iedere spelerSterker nog iedere speler weet dat alle spelers alles weten van het spel en alle spelers weten datalle spelers weten dat alle spelers alles van het spel weten ad infimum We zullen hier verderniet veel aandacht aan schenken en gewoonweg postuleren dat de eigenschappen van het spelgemeenschappelijke kennis zijn zonder er werkelijk bij stil te staan wat dit eigenlijk betekent

21 Bimatrixspelen

Het eenvoudigste type spelen waarbij spelers verscheidene acties hebben en via interactie elkaarsuitbetalingen kunnen beınvloeden hebben twee spelers die zich ieder bedienen van twee strategie enDeze spelen laten zich in matrixvorm opstellen en zijn eenvoudig te onderzoeken maar ook complex

genoeg om hiermee allerlei speltheoretische concepten te bespreken De algemene structuur is devolgendespeler 2

speler 1L R

T a w b xB c y d z

Speler 1 heeft strategieen T (top) en B (bottom) en speler 2 heeft strategieen L (links) en R(rechts) Verder staan abc en d voor de uitbetalingen voor speler 1 en wxy en z voor die voor

5

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 649

speler 2 De uitkomst (T R) resulteert in de uitbetaling b voor speler 1 en uitbetaling x voor speler2 Een iets andere en meer wiskundige formulering van dit spel is als geordend paar 2 times 2 matrices(A B) met

A =

983080 a bc d

983081 en B =

983080 w x

y z

983081

A resp B heet de uitbetalingsmatrix van speler 1 resp 2

Voorbeeld 23 Prisonersrsquo DilemmaHet Prisonersrsquo Dilemma is het bekendste 2 times2 bimatrixspel dat er bestaat Alleen in de psychologieen sociologie zijn er al honderden artikelen aan gewijd Zo ook komt het in Southpark voor en in

spelshows Wat het spel zo interessant maakt is dat het een interessant samenspelconflict laatzien van individuele belangen en het collectief belang Reden genoeg voor ons om dit als eerstevoorbeeld te bespreken

Het verhaal is als volgt Twee gangsters begaan samen een roofoverval en worden daarna gepaktdoor de politie maar zonder op heterdaad betrapt te worden Op het politiebureau worden de beideverdachten in aparte cellen geplaatst en wordt hen het volgende aanbod gedaan De verdachtenkunnen de misdaad bekennen of liegen Als beide liegen wat inhoudt dat ze ontkennen dan krijgenze toch een jaar celstraf vanwege illegaal wapenbezit - a minor offence Stel nu dat er slechts eenverdachte bekent terwijl de ander blijft ontkennen In dat geval wordt de bekentenis beloondmet vrijspraak indien de verdachte als kroongetuige optreedt In dat geval levert dat vijf jaar celop voor de ontkennende verdachte Biechten beide gevangenen hun misdaad op dan krijgen zebeide vier jaar cel Dit kunnen we formuleren als bimatrixspel Hier staat C voor Confess en D

voor Deny In onderstaande tabel worden de resultaten bij de verschillende antwoorden van deverdachten weergegeven in het aantal jaren opsluiting

verdachte 2C D

verdachte 1 C 4 4 0 5D 5 0 1 1

Deze tabel volstaat echter nog niet als een geschikt matrixspel om de situatie te beschrijven nleen hoger aantal jaren gevangenisstraf correspondeert niet met een hoger nut Hier kunnen wehet volgende aan doen Stel dat het nut van de verdachten gegeven wordt door het aantal jarengevangenisstraf dat ten opzichte van de maximale straf van vijf jaar ontlopen wordt Dan volgthet bijbehorende bimatrixspel

verdachte 2C D

verdachte 1 C 1 1 5 0D 0 5 4 4

Zo levert vrijspraak voor een verdachte een uitbetaling 5 minus 0 = 5 op en als beide ontkennen spaartiedere verdachte 4 jaar cel Zo levert de uitkomst (C D) de uitbetalingen (5 0) op die terug tevinden is in matrixcel (1 2) De eerste coordinaat staat voor de uitbetaling voor speler 1 en detweede voor die van speler 2

6

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 749

Een eerste speltheoretische analyse

Stel je ziet jezelf geplaatst voor dit probleem wat zou je doen Ik denk dat wanneer het gaat om 4 jaar cel in plaats van 5 jaar cel je de 4 jaar cel prefereert Net zo gaat vrijspraak boven 1 jaar celWe zetten de mogelijkheden eens op een rijtje als je partner in crime bekent dan is het het besteom ook te bekennen Als hijzij echter niet bekent dan kan je vrijspraak krijgen door te bekennendus wederom is bekennen optimaal Kortom wat je medeverdachte ook doet bekennen levert jede minste jaren cel op Deze redenatie is geldig voor beide spelers ophangen met als oplossing deuitkomst (C C ) ndash beide bekennen

Veel mensen vinden deze uitkomst tegenstrijdig omdat de gevangenen zo precies die toestandbereiken die voor beiden samen het slechtst uitpakt Namelijk in totaliteit komt met (C C ) het

totaal aantal jaren in de nor op 4 + 4 = 8 jaren terwijl het bij ( D D) slechts gaat om 1 + 1 = 2 jaren De omstandigheden zijn echter zo gemaakt dat deze laatste uitkomst niet bereikt wordt

Het gaat aan menigeen met gezond verstand te boven dat hier het egoısme van individuenleidt tot een resultaat dat voor beiden slecht is Betekent dit dat de bovenstaande redenatie nietzo overtuigend is als het op het eerste gezicht lijkt

De tegenwerping tegen bovenstaande analyse hangt vermoedelijk samen met de bijzondere vormvan de geschiedenis Je kan je afvragen of het echt wel lonend is je vriend te verraden om een jaargevangenisstraf te ontlopen Wat gebeurt er namelijk als deze na vijf jaar vrijkomt Barst hij uitelkaar van wraakgevoelens Dit laat al zien dat het verhaal eigenlijk niet bij de uitbetalingsmatrixpast en in ieder geval moeten de jaren gevangenisstraf niet als nut worden opgevat Maar dan ishet ook niet echt verwonderlijk dat een analyse op basis van diezelfde uitbetalingsmatrix leidt toteen paradoxale uitkomst Zou je zelf een betere uitbetalingsmatrix weten Hieronder een voorbeeld

dat beter te verkopen is

Voorbeeld 24 Twee handelaren die op de zwarte markt opereren willen handelswaar uitwisselenvia geheime kanalen hebben ze afgesproken op een bepaald tijdstip elkaar de koffers met overeenge-komen goederen te overhandigen De handelaren kennen elkaar niet en nemen de grootste moeiteom bij de uitwisseling onherkenbaar te blijven waarmee een nieuwe ontmoeting onwaarschijnlijkwordt Verder kan ook de inhoud van de koffers niet gecontroleerd worden omdat de overhandi-ging snel verlopen moet De inhoud van de eigen koffer is de handelaren precies 1000 Euro waardterwijl de handelswaren van de ander het viervoudige oplevert namelijk 4000 Euro Bij de over-eengekomen ruil zou eenieder dus 4000 Euro winnen of zelfs 5000 Euro als de eigen koffer metwaardeloze kiezelstenen gevuld wordt De bijbehorende bimatrix luidt als volgt

handelaar 2W S

handelaar 1 W 4000 4000 0 5000S 5000 0 1000 1000

Het is duidelijk dat de actie om de koffer met stenen te vullen een strikt optimale strategie S bepaalt wat de andere handelaar ook van plan is te doen Dit levert de uitkomst (S S ) ophetgeen betekent dat er effectief niets verhandeld wordt

7

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 849

Opgave 21 In een spelshow met Peter-Jan Rens strijden in het laatste spel twee overgeblevenkandidaten om een geldbedrag x De spelers wordt gevraagd om tegelijkertijd aan te geven of menhet geldbedrag zou willen delen of niet Als geen van beiden willen delen dan gaat het geldbedragin rook op en krijgen beide spelers niets Het geldbedrag wordt gelijk verdeeld onder de kandidatenals ze allebei hebben aangegeven het bedrag te willen delen Als er maar een speler wil delen dangaat het volledige bedrag naar de andere speler Formuleer de bijbehorende bimatrix Is dit spelvergelijkbaar met het Prisonersrsquo Dilemma Zo ja waarom en zo nee waarom niet

Opgave 22 Cournot duopolyGegeven is een markt voor een goed Y waarop twee bedrijven A en B actief zijn De inversevraagfunctie wordt gegeven door p (Q) = a minus Q waarbij a een positieve constante is en Q de totale

geaggregeerde productie door A en B Beide bedrijven produceren met constante marginale kostenc gt 0 en zonder vaste kosten zodat de kostenfuncties gegeven worden door

C i (q i) = cq i voor alle q i ge 0 en i = A B

Neem aan dat de bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveau bepalenModeleer deze situatie als 2 times 3 bimatrixspel als gegeven is dat A op twee productieniveaursquosq LA = 3 q H A = 5 en dat B op drie productieniveaursquos q LB = 1 q M

B = 3 en q H B = 5 kan producerenNeem hierbij voor de constanten a = 10 c = 2

3 Dominantie IEWDS en IEDS oplossing

Het probleem waar spelers voor staan is dat ze uit hun actieverzameling een keuze moeten makenzonder dat ze weten wat de andere spelers doen Daarom probeert iedere speler de acties van deandere spelers in te schatten wat in het algemeen vrij lastig is Hoewel in sommige gevallen doetdit probleem zich niet echt voor omdat er een actie voorhanden is die optimaal is ongeacht devoorgenomen speelwijze van de tegenstanders Deze situatie hebben we in het vorige hoofdstuk aleens gezien en wel bij het Prisonersrsquo Dilemma Hier is het opbiechten van de misdaad optimaalof de tegenstander nu ook opbiecht of juist niet In dit geval ligt het voor speler 1 voor de hand deactie Confess te kiezen Hetzelfde geldt voor speler 2 Dit idee zullen we nu formeel opschrijven

Notatie 31 Gegeven is de strategieen S = timesiisinN S i van een n-persoonsspel in strategischevorm en neem s = (s1 sn) isin S Dan definieren we sminusi als het profiel van strategieen

(s1 siminus1 si+1 sn) isin timesjisinN iS j en we schrijven s = (si sminusi) Dus sminusi is niets andersdan het strategieenprofiel van de spelers in het spel behalve speler i De verzameling van al zulkeprofielen noteren we met S minusi

Definitie 32 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Strategiesi isin S i van speler i domineert zwak strategie sprimei isin S i als geldt dat

bull ui (si sminusi) ge ui (sprimei sminusi) voor alle sminusi isin S minusi en

8

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 4: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 449

Een belangrijke vereenvoudiging die we zullen maken is dat we ervanuit zullen gaan dat prefe-renties van de verschillende spelers worden weergegeven door nutsfuncties maar daarover meer inde volgende hoofdstukken

In dit vak zullen twee variaties op dit zeer algemene raamwerk bekeken worden We beginnenin Hoofdstuk 2 met de meest eenvoudige situaties waarbij spelers simultaan een actie onderne-men en iedere speler volledig geinformeerd is en we eindigen bij meer gecompliceerde situaties inHoofdstuk 7 waarbij spelers in een bepaalde volgorde aan zet zijn

We zullen alleen spelen behandelen waarbij aangenomen wordt dat beide spelers alles van el-kaar afweten welke speelmogelijkheden ze hebben en hoeveel ze krijgen uitbetaald Dit wordenspelen met volledige informatie genoemd Spelen met onvolledige informatie hebben meer econo-

mische toepassingen maar zijn ook ingewikkelder en worden in dit inleidend vak speltheorie nietbehandeld

2 Spelen in strategische vorm met volledige informatie

De simpelste vorm van strategische afhankelijkheid is te vinden in een context waar verschillendeindividuen gelijktijdig acties ondernemen en daarmee de uitkomst van de interactie bepalen Ditwordt gemodelleerd als een spel in strategische vorm

Definitie 21 Een spel in strategische vorm is een tripel⟨

N (S i)iisinN (ui)iisinN ⟩

met

bull de verzameling spelers N = 1 nbull de strategieverzamelingen van de spelers S i i isin N

bull de uitbetalingen van spelers nutsfuncties ui S rarr R

Het concept van spel in strategische vorm probeert situaties te modelleren waarbij er strategischeafhankelijkheid bestaat tussen spelers die of tegelijkertijd acties ondernemen of niet tegelijkertijdmaar zonder observatie van de acties van de andere spelers Dus een strategisch spel staat niet model voor een situatie waarbij spelers in een bepaalde volgorde acties ondernemen na observatievan een zeker spelverloop waarbij al eerder andere spelers actief zijn geweest Dan zouden we dezespelverlopen in de beschrijving moeten opnemen Dit soort spelen komen we nog in Hoofdstuk 7tegen

Een spel in strategische vorm heeft dus drie elementen de spelers de strategieen en de uitbe-talingen Wat betreft de spelers er is niets dat je tegenhoudt om de spelers anders te noemen of te labelen dan hierboven gedaan is met natuurlijke getallen Iedere keuze is in dit verband evenwillekeurig

Wat betreft de strategie en bij gegeven strategieverzamelingen (S i)iisinN definieren we de verza-meling van strategieprofielen van het spel als

S = timesiisinN S i =1048699

(s1 s2 sn) si isin S i i = 1 n

983165

4

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 549

Dus een strategieprofiel s = (s1 s2 sn) is niets meer dan een geordende combinatie van stra-tegieen

Ieder strategieprofiel s isin S heeft (u1 (s) un (s)) als uitbetalingen voor de spelers We nemenaan dat voor iedere speler er een uitbetalingsfunctie oftewel een nutsfunctie ui S rarr R bestaat diede preferenties van de speler weergeeft Dat wil zeggen dat een speler i isin N het strategieprofiel s(zwak) prefereert boven strategieprofiel sprime precies wanneer ui (sprime) le ui (s) Daarbij wordt s striktboven sprime geprefereerd als ui (sprime) lt ui (s)

Ook al noemen we ui (s) een uitbetaling we zullen een statement als ui (s) gt ui (sprime) louterordinaal opvatten Dit betekent dat we geen speciale betekenis aan de grootte van het verschilui (s)minusui (sprime) geven maar alleen het teken voorop stellen Al wat belangrijk is is hoe de individuelespelers de verschillende uitkomsten rangschikken

Merk op dat de uitbetalingsfuncties het interactieve element bevatten aangezien de uitbetalin-gen niet alleen van een speler zijn eigen strategie maar ook die van de andere spelers afhangen

Merk op dat we een component van een spel nog onderbelicht hebben de informatie Watweet een speler van de situatie Is hijzij op de hoogte van de spelregels Wat weet een spelervan de andere spelers Wat weet een speler over dat wat de spelers over hemhaar weten Dezeinformatie is cruciaal bij menig strategische analyse In dit vak beschouwen we een veredeld modelwaarin van spelers aangenomen wordt alles te weten Anders gezegd de spelers hebben volledige informatie

Definitie 22 Bij een spel in strategische vorm met volledige informatie wordt aangenomen datalles maar dan ook alles dat met de formulering van het spel te maken heeft (dwz de spelers

de verzamelingen acties en strategieen en de uitbetalingsfuncties) bekend is voor iedere spelerSterker nog iedere speler weet dat alle spelers alles weten van het spel en alle spelers weten datalle spelers weten dat alle spelers alles van het spel weten ad infimum We zullen hier verderniet veel aandacht aan schenken en gewoonweg postuleren dat de eigenschappen van het spelgemeenschappelijke kennis zijn zonder er werkelijk bij stil te staan wat dit eigenlijk betekent

21 Bimatrixspelen

Het eenvoudigste type spelen waarbij spelers verscheidene acties hebben en via interactie elkaarsuitbetalingen kunnen beınvloeden hebben twee spelers die zich ieder bedienen van twee strategie enDeze spelen laten zich in matrixvorm opstellen en zijn eenvoudig te onderzoeken maar ook complex

genoeg om hiermee allerlei speltheoretische concepten te bespreken De algemene structuur is devolgendespeler 2

speler 1L R

T a w b xB c y d z

Speler 1 heeft strategieen T (top) en B (bottom) en speler 2 heeft strategieen L (links) en R(rechts) Verder staan abc en d voor de uitbetalingen voor speler 1 en wxy en z voor die voor

5

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 649

speler 2 De uitkomst (T R) resulteert in de uitbetaling b voor speler 1 en uitbetaling x voor speler2 Een iets andere en meer wiskundige formulering van dit spel is als geordend paar 2 times 2 matrices(A B) met

A =

983080 a bc d

983081 en B =

983080 w x

y z

983081

A resp B heet de uitbetalingsmatrix van speler 1 resp 2

Voorbeeld 23 Prisonersrsquo DilemmaHet Prisonersrsquo Dilemma is het bekendste 2 times2 bimatrixspel dat er bestaat Alleen in de psychologieen sociologie zijn er al honderden artikelen aan gewijd Zo ook komt het in Southpark voor en in

spelshows Wat het spel zo interessant maakt is dat het een interessant samenspelconflict laatzien van individuele belangen en het collectief belang Reden genoeg voor ons om dit als eerstevoorbeeld te bespreken

Het verhaal is als volgt Twee gangsters begaan samen een roofoverval en worden daarna gepaktdoor de politie maar zonder op heterdaad betrapt te worden Op het politiebureau worden de beideverdachten in aparte cellen geplaatst en wordt hen het volgende aanbod gedaan De verdachtenkunnen de misdaad bekennen of liegen Als beide liegen wat inhoudt dat ze ontkennen dan krijgenze toch een jaar celstraf vanwege illegaal wapenbezit - a minor offence Stel nu dat er slechts eenverdachte bekent terwijl de ander blijft ontkennen In dat geval wordt de bekentenis beloondmet vrijspraak indien de verdachte als kroongetuige optreedt In dat geval levert dat vijf jaar celop voor de ontkennende verdachte Biechten beide gevangenen hun misdaad op dan krijgen zebeide vier jaar cel Dit kunnen we formuleren als bimatrixspel Hier staat C voor Confess en D

voor Deny In onderstaande tabel worden de resultaten bij de verschillende antwoorden van deverdachten weergegeven in het aantal jaren opsluiting

verdachte 2C D

verdachte 1 C 4 4 0 5D 5 0 1 1

Deze tabel volstaat echter nog niet als een geschikt matrixspel om de situatie te beschrijven nleen hoger aantal jaren gevangenisstraf correspondeert niet met een hoger nut Hier kunnen wehet volgende aan doen Stel dat het nut van de verdachten gegeven wordt door het aantal jarengevangenisstraf dat ten opzichte van de maximale straf van vijf jaar ontlopen wordt Dan volgthet bijbehorende bimatrixspel

verdachte 2C D

verdachte 1 C 1 1 5 0D 0 5 4 4

Zo levert vrijspraak voor een verdachte een uitbetaling 5 minus 0 = 5 op en als beide ontkennen spaartiedere verdachte 4 jaar cel Zo levert de uitkomst (C D) de uitbetalingen (5 0) op die terug tevinden is in matrixcel (1 2) De eerste coordinaat staat voor de uitbetaling voor speler 1 en detweede voor die van speler 2

6

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 749

Een eerste speltheoretische analyse

Stel je ziet jezelf geplaatst voor dit probleem wat zou je doen Ik denk dat wanneer het gaat om 4 jaar cel in plaats van 5 jaar cel je de 4 jaar cel prefereert Net zo gaat vrijspraak boven 1 jaar celWe zetten de mogelijkheden eens op een rijtje als je partner in crime bekent dan is het het besteom ook te bekennen Als hijzij echter niet bekent dan kan je vrijspraak krijgen door te bekennendus wederom is bekennen optimaal Kortom wat je medeverdachte ook doet bekennen levert jede minste jaren cel op Deze redenatie is geldig voor beide spelers ophangen met als oplossing deuitkomst (C C ) ndash beide bekennen

Veel mensen vinden deze uitkomst tegenstrijdig omdat de gevangenen zo precies die toestandbereiken die voor beiden samen het slechtst uitpakt Namelijk in totaliteit komt met (C C ) het

totaal aantal jaren in de nor op 4 + 4 = 8 jaren terwijl het bij ( D D) slechts gaat om 1 + 1 = 2 jaren De omstandigheden zijn echter zo gemaakt dat deze laatste uitkomst niet bereikt wordt

Het gaat aan menigeen met gezond verstand te boven dat hier het egoısme van individuenleidt tot een resultaat dat voor beiden slecht is Betekent dit dat de bovenstaande redenatie nietzo overtuigend is als het op het eerste gezicht lijkt

De tegenwerping tegen bovenstaande analyse hangt vermoedelijk samen met de bijzondere vormvan de geschiedenis Je kan je afvragen of het echt wel lonend is je vriend te verraden om een jaargevangenisstraf te ontlopen Wat gebeurt er namelijk als deze na vijf jaar vrijkomt Barst hij uitelkaar van wraakgevoelens Dit laat al zien dat het verhaal eigenlijk niet bij de uitbetalingsmatrixpast en in ieder geval moeten de jaren gevangenisstraf niet als nut worden opgevat Maar dan ishet ook niet echt verwonderlijk dat een analyse op basis van diezelfde uitbetalingsmatrix leidt toteen paradoxale uitkomst Zou je zelf een betere uitbetalingsmatrix weten Hieronder een voorbeeld

dat beter te verkopen is

Voorbeeld 24 Twee handelaren die op de zwarte markt opereren willen handelswaar uitwisselenvia geheime kanalen hebben ze afgesproken op een bepaald tijdstip elkaar de koffers met overeenge-komen goederen te overhandigen De handelaren kennen elkaar niet en nemen de grootste moeiteom bij de uitwisseling onherkenbaar te blijven waarmee een nieuwe ontmoeting onwaarschijnlijkwordt Verder kan ook de inhoud van de koffers niet gecontroleerd worden omdat de overhandi-ging snel verlopen moet De inhoud van de eigen koffer is de handelaren precies 1000 Euro waardterwijl de handelswaren van de ander het viervoudige oplevert namelijk 4000 Euro Bij de over-eengekomen ruil zou eenieder dus 4000 Euro winnen of zelfs 5000 Euro als de eigen koffer metwaardeloze kiezelstenen gevuld wordt De bijbehorende bimatrix luidt als volgt

handelaar 2W S

handelaar 1 W 4000 4000 0 5000S 5000 0 1000 1000

Het is duidelijk dat de actie om de koffer met stenen te vullen een strikt optimale strategie S bepaalt wat de andere handelaar ook van plan is te doen Dit levert de uitkomst (S S ) ophetgeen betekent dat er effectief niets verhandeld wordt

7

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 849

Opgave 21 In een spelshow met Peter-Jan Rens strijden in het laatste spel twee overgeblevenkandidaten om een geldbedrag x De spelers wordt gevraagd om tegelijkertijd aan te geven of menhet geldbedrag zou willen delen of niet Als geen van beiden willen delen dan gaat het geldbedragin rook op en krijgen beide spelers niets Het geldbedrag wordt gelijk verdeeld onder de kandidatenals ze allebei hebben aangegeven het bedrag te willen delen Als er maar een speler wil delen dangaat het volledige bedrag naar de andere speler Formuleer de bijbehorende bimatrix Is dit spelvergelijkbaar met het Prisonersrsquo Dilemma Zo ja waarom en zo nee waarom niet

Opgave 22 Cournot duopolyGegeven is een markt voor een goed Y waarop twee bedrijven A en B actief zijn De inversevraagfunctie wordt gegeven door p (Q) = a minus Q waarbij a een positieve constante is en Q de totale

geaggregeerde productie door A en B Beide bedrijven produceren met constante marginale kostenc gt 0 en zonder vaste kosten zodat de kostenfuncties gegeven worden door

C i (q i) = cq i voor alle q i ge 0 en i = A B

Neem aan dat de bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveau bepalenModeleer deze situatie als 2 times 3 bimatrixspel als gegeven is dat A op twee productieniveaursquosq LA = 3 q H A = 5 en dat B op drie productieniveaursquos q LB = 1 q M

B = 3 en q H B = 5 kan producerenNeem hierbij voor de constanten a = 10 c = 2

3 Dominantie IEWDS en IEDS oplossing

Het probleem waar spelers voor staan is dat ze uit hun actieverzameling een keuze moeten makenzonder dat ze weten wat de andere spelers doen Daarom probeert iedere speler de acties van deandere spelers in te schatten wat in het algemeen vrij lastig is Hoewel in sommige gevallen doetdit probleem zich niet echt voor omdat er een actie voorhanden is die optimaal is ongeacht devoorgenomen speelwijze van de tegenstanders Deze situatie hebben we in het vorige hoofdstuk aleens gezien en wel bij het Prisonersrsquo Dilemma Hier is het opbiechten van de misdaad optimaalof de tegenstander nu ook opbiecht of juist niet In dit geval ligt het voor speler 1 voor de hand deactie Confess te kiezen Hetzelfde geldt voor speler 2 Dit idee zullen we nu formeel opschrijven

Notatie 31 Gegeven is de strategieen S = timesiisinN S i van een n-persoonsspel in strategischevorm en neem s = (s1 sn) isin S Dan definieren we sminusi als het profiel van strategieen

(s1 siminus1 si+1 sn) isin timesjisinN iS j en we schrijven s = (si sminusi) Dus sminusi is niets andersdan het strategieenprofiel van de spelers in het spel behalve speler i De verzameling van al zulkeprofielen noteren we met S minusi

Definitie 32 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Strategiesi isin S i van speler i domineert zwak strategie sprimei isin S i als geldt dat

bull ui (si sminusi) ge ui (sprimei sminusi) voor alle sminusi isin S minusi en

8

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 5: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 549

Dus een strategieprofiel s = (s1 s2 sn) is niets meer dan een geordende combinatie van stra-tegieen

Ieder strategieprofiel s isin S heeft (u1 (s) un (s)) als uitbetalingen voor de spelers We nemenaan dat voor iedere speler er een uitbetalingsfunctie oftewel een nutsfunctie ui S rarr R bestaat diede preferenties van de speler weergeeft Dat wil zeggen dat een speler i isin N het strategieprofiel s(zwak) prefereert boven strategieprofiel sprime precies wanneer ui (sprime) le ui (s) Daarbij wordt s striktboven sprime geprefereerd als ui (sprime) lt ui (s)

Ook al noemen we ui (s) een uitbetaling we zullen een statement als ui (s) gt ui (sprime) louterordinaal opvatten Dit betekent dat we geen speciale betekenis aan de grootte van het verschilui (s)minusui (sprime) geven maar alleen het teken voorop stellen Al wat belangrijk is is hoe de individuelespelers de verschillende uitkomsten rangschikken

Merk op dat de uitbetalingsfuncties het interactieve element bevatten aangezien de uitbetalin-gen niet alleen van een speler zijn eigen strategie maar ook die van de andere spelers afhangen

Merk op dat we een component van een spel nog onderbelicht hebben de informatie Watweet een speler van de situatie Is hijzij op de hoogte van de spelregels Wat weet een spelervan de andere spelers Wat weet een speler over dat wat de spelers over hemhaar weten Dezeinformatie is cruciaal bij menig strategische analyse In dit vak beschouwen we een veredeld modelwaarin van spelers aangenomen wordt alles te weten Anders gezegd de spelers hebben volledige informatie

Definitie 22 Bij een spel in strategische vorm met volledige informatie wordt aangenomen datalles maar dan ook alles dat met de formulering van het spel te maken heeft (dwz de spelers

de verzamelingen acties en strategieen en de uitbetalingsfuncties) bekend is voor iedere spelerSterker nog iedere speler weet dat alle spelers alles weten van het spel en alle spelers weten datalle spelers weten dat alle spelers alles van het spel weten ad infimum We zullen hier verderniet veel aandacht aan schenken en gewoonweg postuleren dat de eigenschappen van het spelgemeenschappelijke kennis zijn zonder er werkelijk bij stil te staan wat dit eigenlijk betekent

21 Bimatrixspelen

Het eenvoudigste type spelen waarbij spelers verscheidene acties hebben en via interactie elkaarsuitbetalingen kunnen beınvloeden hebben twee spelers die zich ieder bedienen van twee strategie enDeze spelen laten zich in matrixvorm opstellen en zijn eenvoudig te onderzoeken maar ook complex

genoeg om hiermee allerlei speltheoretische concepten te bespreken De algemene structuur is devolgendespeler 2

speler 1L R

T a w b xB c y d z

Speler 1 heeft strategieen T (top) en B (bottom) en speler 2 heeft strategieen L (links) en R(rechts) Verder staan abc en d voor de uitbetalingen voor speler 1 en wxy en z voor die voor

5

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 649

speler 2 De uitkomst (T R) resulteert in de uitbetaling b voor speler 1 en uitbetaling x voor speler2 Een iets andere en meer wiskundige formulering van dit spel is als geordend paar 2 times 2 matrices(A B) met

A =

983080 a bc d

983081 en B =

983080 w x

y z

983081

A resp B heet de uitbetalingsmatrix van speler 1 resp 2

Voorbeeld 23 Prisonersrsquo DilemmaHet Prisonersrsquo Dilemma is het bekendste 2 times2 bimatrixspel dat er bestaat Alleen in de psychologieen sociologie zijn er al honderden artikelen aan gewijd Zo ook komt het in Southpark voor en in

spelshows Wat het spel zo interessant maakt is dat het een interessant samenspelconflict laatzien van individuele belangen en het collectief belang Reden genoeg voor ons om dit als eerstevoorbeeld te bespreken

Het verhaal is als volgt Twee gangsters begaan samen een roofoverval en worden daarna gepaktdoor de politie maar zonder op heterdaad betrapt te worden Op het politiebureau worden de beideverdachten in aparte cellen geplaatst en wordt hen het volgende aanbod gedaan De verdachtenkunnen de misdaad bekennen of liegen Als beide liegen wat inhoudt dat ze ontkennen dan krijgenze toch een jaar celstraf vanwege illegaal wapenbezit - a minor offence Stel nu dat er slechts eenverdachte bekent terwijl de ander blijft ontkennen In dat geval wordt de bekentenis beloondmet vrijspraak indien de verdachte als kroongetuige optreedt In dat geval levert dat vijf jaar celop voor de ontkennende verdachte Biechten beide gevangenen hun misdaad op dan krijgen zebeide vier jaar cel Dit kunnen we formuleren als bimatrixspel Hier staat C voor Confess en D

voor Deny In onderstaande tabel worden de resultaten bij de verschillende antwoorden van deverdachten weergegeven in het aantal jaren opsluiting

verdachte 2C D

verdachte 1 C 4 4 0 5D 5 0 1 1

Deze tabel volstaat echter nog niet als een geschikt matrixspel om de situatie te beschrijven nleen hoger aantal jaren gevangenisstraf correspondeert niet met een hoger nut Hier kunnen wehet volgende aan doen Stel dat het nut van de verdachten gegeven wordt door het aantal jarengevangenisstraf dat ten opzichte van de maximale straf van vijf jaar ontlopen wordt Dan volgthet bijbehorende bimatrixspel

verdachte 2C D

verdachte 1 C 1 1 5 0D 0 5 4 4

Zo levert vrijspraak voor een verdachte een uitbetaling 5 minus 0 = 5 op en als beide ontkennen spaartiedere verdachte 4 jaar cel Zo levert de uitkomst (C D) de uitbetalingen (5 0) op die terug tevinden is in matrixcel (1 2) De eerste coordinaat staat voor de uitbetaling voor speler 1 en detweede voor die van speler 2

6

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 749

Een eerste speltheoretische analyse

Stel je ziet jezelf geplaatst voor dit probleem wat zou je doen Ik denk dat wanneer het gaat om 4 jaar cel in plaats van 5 jaar cel je de 4 jaar cel prefereert Net zo gaat vrijspraak boven 1 jaar celWe zetten de mogelijkheden eens op een rijtje als je partner in crime bekent dan is het het besteom ook te bekennen Als hijzij echter niet bekent dan kan je vrijspraak krijgen door te bekennendus wederom is bekennen optimaal Kortom wat je medeverdachte ook doet bekennen levert jede minste jaren cel op Deze redenatie is geldig voor beide spelers ophangen met als oplossing deuitkomst (C C ) ndash beide bekennen

Veel mensen vinden deze uitkomst tegenstrijdig omdat de gevangenen zo precies die toestandbereiken die voor beiden samen het slechtst uitpakt Namelijk in totaliteit komt met (C C ) het

totaal aantal jaren in de nor op 4 + 4 = 8 jaren terwijl het bij ( D D) slechts gaat om 1 + 1 = 2 jaren De omstandigheden zijn echter zo gemaakt dat deze laatste uitkomst niet bereikt wordt

Het gaat aan menigeen met gezond verstand te boven dat hier het egoısme van individuenleidt tot een resultaat dat voor beiden slecht is Betekent dit dat de bovenstaande redenatie nietzo overtuigend is als het op het eerste gezicht lijkt

De tegenwerping tegen bovenstaande analyse hangt vermoedelijk samen met de bijzondere vormvan de geschiedenis Je kan je afvragen of het echt wel lonend is je vriend te verraden om een jaargevangenisstraf te ontlopen Wat gebeurt er namelijk als deze na vijf jaar vrijkomt Barst hij uitelkaar van wraakgevoelens Dit laat al zien dat het verhaal eigenlijk niet bij de uitbetalingsmatrixpast en in ieder geval moeten de jaren gevangenisstraf niet als nut worden opgevat Maar dan ishet ook niet echt verwonderlijk dat een analyse op basis van diezelfde uitbetalingsmatrix leidt toteen paradoxale uitkomst Zou je zelf een betere uitbetalingsmatrix weten Hieronder een voorbeeld

dat beter te verkopen is

Voorbeeld 24 Twee handelaren die op de zwarte markt opereren willen handelswaar uitwisselenvia geheime kanalen hebben ze afgesproken op een bepaald tijdstip elkaar de koffers met overeenge-komen goederen te overhandigen De handelaren kennen elkaar niet en nemen de grootste moeiteom bij de uitwisseling onherkenbaar te blijven waarmee een nieuwe ontmoeting onwaarschijnlijkwordt Verder kan ook de inhoud van de koffers niet gecontroleerd worden omdat de overhandi-ging snel verlopen moet De inhoud van de eigen koffer is de handelaren precies 1000 Euro waardterwijl de handelswaren van de ander het viervoudige oplevert namelijk 4000 Euro Bij de over-eengekomen ruil zou eenieder dus 4000 Euro winnen of zelfs 5000 Euro als de eigen koffer metwaardeloze kiezelstenen gevuld wordt De bijbehorende bimatrix luidt als volgt

handelaar 2W S

handelaar 1 W 4000 4000 0 5000S 5000 0 1000 1000

Het is duidelijk dat de actie om de koffer met stenen te vullen een strikt optimale strategie S bepaalt wat de andere handelaar ook van plan is te doen Dit levert de uitkomst (S S ) ophetgeen betekent dat er effectief niets verhandeld wordt

7

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 849

Opgave 21 In een spelshow met Peter-Jan Rens strijden in het laatste spel twee overgeblevenkandidaten om een geldbedrag x De spelers wordt gevraagd om tegelijkertijd aan te geven of menhet geldbedrag zou willen delen of niet Als geen van beiden willen delen dan gaat het geldbedragin rook op en krijgen beide spelers niets Het geldbedrag wordt gelijk verdeeld onder de kandidatenals ze allebei hebben aangegeven het bedrag te willen delen Als er maar een speler wil delen dangaat het volledige bedrag naar de andere speler Formuleer de bijbehorende bimatrix Is dit spelvergelijkbaar met het Prisonersrsquo Dilemma Zo ja waarom en zo nee waarom niet

Opgave 22 Cournot duopolyGegeven is een markt voor een goed Y waarop twee bedrijven A en B actief zijn De inversevraagfunctie wordt gegeven door p (Q) = a minus Q waarbij a een positieve constante is en Q de totale

geaggregeerde productie door A en B Beide bedrijven produceren met constante marginale kostenc gt 0 en zonder vaste kosten zodat de kostenfuncties gegeven worden door

C i (q i) = cq i voor alle q i ge 0 en i = A B

Neem aan dat de bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveau bepalenModeleer deze situatie als 2 times 3 bimatrixspel als gegeven is dat A op twee productieniveaursquosq LA = 3 q H A = 5 en dat B op drie productieniveaursquos q LB = 1 q M

B = 3 en q H B = 5 kan producerenNeem hierbij voor de constanten a = 10 c = 2

3 Dominantie IEWDS en IEDS oplossing

Het probleem waar spelers voor staan is dat ze uit hun actieverzameling een keuze moeten makenzonder dat ze weten wat de andere spelers doen Daarom probeert iedere speler de acties van deandere spelers in te schatten wat in het algemeen vrij lastig is Hoewel in sommige gevallen doetdit probleem zich niet echt voor omdat er een actie voorhanden is die optimaal is ongeacht devoorgenomen speelwijze van de tegenstanders Deze situatie hebben we in het vorige hoofdstuk aleens gezien en wel bij het Prisonersrsquo Dilemma Hier is het opbiechten van de misdaad optimaalof de tegenstander nu ook opbiecht of juist niet In dit geval ligt het voor speler 1 voor de hand deactie Confess te kiezen Hetzelfde geldt voor speler 2 Dit idee zullen we nu formeel opschrijven

Notatie 31 Gegeven is de strategieen S = timesiisinN S i van een n-persoonsspel in strategischevorm en neem s = (s1 sn) isin S Dan definieren we sminusi als het profiel van strategieen

(s1 siminus1 si+1 sn) isin timesjisinN iS j en we schrijven s = (si sminusi) Dus sminusi is niets andersdan het strategieenprofiel van de spelers in het spel behalve speler i De verzameling van al zulkeprofielen noteren we met S minusi

Definitie 32 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Strategiesi isin S i van speler i domineert zwak strategie sprimei isin S i als geldt dat

bull ui (si sminusi) ge ui (sprimei sminusi) voor alle sminusi isin S minusi en

8

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 6: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 649

speler 2 De uitkomst (T R) resulteert in de uitbetaling b voor speler 1 en uitbetaling x voor speler2 Een iets andere en meer wiskundige formulering van dit spel is als geordend paar 2 times 2 matrices(A B) met

A =

983080 a bc d

983081 en B =

983080 w x

y z

983081

A resp B heet de uitbetalingsmatrix van speler 1 resp 2

Voorbeeld 23 Prisonersrsquo DilemmaHet Prisonersrsquo Dilemma is het bekendste 2 times2 bimatrixspel dat er bestaat Alleen in de psychologieen sociologie zijn er al honderden artikelen aan gewijd Zo ook komt het in Southpark voor en in

spelshows Wat het spel zo interessant maakt is dat het een interessant samenspelconflict laatzien van individuele belangen en het collectief belang Reden genoeg voor ons om dit als eerstevoorbeeld te bespreken

Het verhaal is als volgt Twee gangsters begaan samen een roofoverval en worden daarna gepaktdoor de politie maar zonder op heterdaad betrapt te worden Op het politiebureau worden de beideverdachten in aparte cellen geplaatst en wordt hen het volgende aanbod gedaan De verdachtenkunnen de misdaad bekennen of liegen Als beide liegen wat inhoudt dat ze ontkennen dan krijgenze toch een jaar celstraf vanwege illegaal wapenbezit - a minor offence Stel nu dat er slechts eenverdachte bekent terwijl de ander blijft ontkennen In dat geval wordt de bekentenis beloondmet vrijspraak indien de verdachte als kroongetuige optreedt In dat geval levert dat vijf jaar celop voor de ontkennende verdachte Biechten beide gevangenen hun misdaad op dan krijgen zebeide vier jaar cel Dit kunnen we formuleren als bimatrixspel Hier staat C voor Confess en D

voor Deny In onderstaande tabel worden de resultaten bij de verschillende antwoorden van deverdachten weergegeven in het aantal jaren opsluiting

verdachte 2C D

verdachte 1 C 4 4 0 5D 5 0 1 1

Deze tabel volstaat echter nog niet als een geschikt matrixspel om de situatie te beschrijven nleen hoger aantal jaren gevangenisstraf correspondeert niet met een hoger nut Hier kunnen wehet volgende aan doen Stel dat het nut van de verdachten gegeven wordt door het aantal jarengevangenisstraf dat ten opzichte van de maximale straf van vijf jaar ontlopen wordt Dan volgthet bijbehorende bimatrixspel

verdachte 2C D

verdachte 1 C 1 1 5 0D 0 5 4 4

Zo levert vrijspraak voor een verdachte een uitbetaling 5 minus 0 = 5 op en als beide ontkennen spaartiedere verdachte 4 jaar cel Zo levert de uitkomst (C D) de uitbetalingen (5 0) op die terug tevinden is in matrixcel (1 2) De eerste coordinaat staat voor de uitbetaling voor speler 1 en detweede voor die van speler 2

6

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 749

Een eerste speltheoretische analyse

Stel je ziet jezelf geplaatst voor dit probleem wat zou je doen Ik denk dat wanneer het gaat om 4 jaar cel in plaats van 5 jaar cel je de 4 jaar cel prefereert Net zo gaat vrijspraak boven 1 jaar celWe zetten de mogelijkheden eens op een rijtje als je partner in crime bekent dan is het het besteom ook te bekennen Als hijzij echter niet bekent dan kan je vrijspraak krijgen door te bekennendus wederom is bekennen optimaal Kortom wat je medeverdachte ook doet bekennen levert jede minste jaren cel op Deze redenatie is geldig voor beide spelers ophangen met als oplossing deuitkomst (C C ) ndash beide bekennen

Veel mensen vinden deze uitkomst tegenstrijdig omdat de gevangenen zo precies die toestandbereiken die voor beiden samen het slechtst uitpakt Namelijk in totaliteit komt met (C C ) het

totaal aantal jaren in de nor op 4 + 4 = 8 jaren terwijl het bij ( D D) slechts gaat om 1 + 1 = 2 jaren De omstandigheden zijn echter zo gemaakt dat deze laatste uitkomst niet bereikt wordt

Het gaat aan menigeen met gezond verstand te boven dat hier het egoısme van individuenleidt tot een resultaat dat voor beiden slecht is Betekent dit dat de bovenstaande redenatie nietzo overtuigend is als het op het eerste gezicht lijkt

De tegenwerping tegen bovenstaande analyse hangt vermoedelijk samen met de bijzondere vormvan de geschiedenis Je kan je afvragen of het echt wel lonend is je vriend te verraden om een jaargevangenisstraf te ontlopen Wat gebeurt er namelijk als deze na vijf jaar vrijkomt Barst hij uitelkaar van wraakgevoelens Dit laat al zien dat het verhaal eigenlijk niet bij de uitbetalingsmatrixpast en in ieder geval moeten de jaren gevangenisstraf niet als nut worden opgevat Maar dan ishet ook niet echt verwonderlijk dat een analyse op basis van diezelfde uitbetalingsmatrix leidt toteen paradoxale uitkomst Zou je zelf een betere uitbetalingsmatrix weten Hieronder een voorbeeld

dat beter te verkopen is

Voorbeeld 24 Twee handelaren die op de zwarte markt opereren willen handelswaar uitwisselenvia geheime kanalen hebben ze afgesproken op een bepaald tijdstip elkaar de koffers met overeenge-komen goederen te overhandigen De handelaren kennen elkaar niet en nemen de grootste moeiteom bij de uitwisseling onherkenbaar te blijven waarmee een nieuwe ontmoeting onwaarschijnlijkwordt Verder kan ook de inhoud van de koffers niet gecontroleerd worden omdat de overhandi-ging snel verlopen moet De inhoud van de eigen koffer is de handelaren precies 1000 Euro waardterwijl de handelswaren van de ander het viervoudige oplevert namelijk 4000 Euro Bij de over-eengekomen ruil zou eenieder dus 4000 Euro winnen of zelfs 5000 Euro als de eigen koffer metwaardeloze kiezelstenen gevuld wordt De bijbehorende bimatrix luidt als volgt

handelaar 2W S

handelaar 1 W 4000 4000 0 5000S 5000 0 1000 1000

Het is duidelijk dat de actie om de koffer met stenen te vullen een strikt optimale strategie S bepaalt wat de andere handelaar ook van plan is te doen Dit levert de uitkomst (S S ) ophetgeen betekent dat er effectief niets verhandeld wordt

7

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 849

Opgave 21 In een spelshow met Peter-Jan Rens strijden in het laatste spel twee overgeblevenkandidaten om een geldbedrag x De spelers wordt gevraagd om tegelijkertijd aan te geven of menhet geldbedrag zou willen delen of niet Als geen van beiden willen delen dan gaat het geldbedragin rook op en krijgen beide spelers niets Het geldbedrag wordt gelijk verdeeld onder de kandidatenals ze allebei hebben aangegeven het bedrag te willen delen Als er maar een speler wil delen dangaat het volledige bedrag naar de andere speler Formuleer de bijbehorende bimatrix Is dit spelvergelijkbaar met het Prisonersrsquo Dilemma Zo ja waarom en zo nee waarom niet

Opgave 22 Cournot duopolyGegeven is een markt voor een goed Y waarop twee bedrijven A en B actief zijn De inversevraagfunctie wordt gegeven door p (Q) = a minus Q waarbij a een positieve constante is en Q de totale

geaggregeerde productie door A en B Beide bedrijven produceren met constante marginale kostenc gt 0 en zonder vaste kosten zodat de kostenfuncties gegeven worden door

C i (q i) = cq i voor alle q i ge 0 en i = A B

Neem aan dat de bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveau bepalenModeleer deze situatie als 2 times 3 bimatrixspel als gegeven is dat A op twee productieniveaursquosq LA = 3 q H A = 5 en dat B op drie productieniveaursquos q LB = 1 q M

B = 3 en q H B = 5 kan producerenNeem hierbij voor de constanten a = 10 c = 2

3 Dominantie IEWDS en IEDS oplossing

Het probleem waar spelers voor staan is dat ze uit hun actieverzameling een keuze moeten makenzonder dat ze weten wat de andere spelers doen Daarom probeert iedere speler de acties van deandere spelers in te schatten wat in het algemeen vrij lastig is Hoewel in sommige gevallen doetdit probleem zich niet echt voor omdat er een actie voorhanden is die optimaal is ongeacht devoorgenomen speelwijze van de tegenstanders Deze situatie hebben we in het vorige hoofdstuk aleens gezien en wel bij het Prisonersrsquo Dilemma Hier is het opbiechten van de misdaad optimaalof de tegenstander nu ook opbiecht of juist niet In dit geval ligt het voor speler 1 voor de hand deactie Confess te kiezen Hetzelfde geldt voor speler 2 Dit idee zullen we nu formeel opschrijven

Notatie 31 Gegeven is de strategieen S = timesiisinN S i van een n-persoonsspel in strategischevorm en neem s = (s1 sn) isin S Dan definieren we sminusi als het profiel van strategieen

(s1 siminus1 si+1 sn) isin timesjisinN iS j en we schrijven s = (si sminusi) Dus sminusi is niets andersdan het strategieenprofiel van de spelers in het spel behalve speler i De verzameling van al zulkeprofielen noteren we met S minusi

Definitie 32 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Strategiesi isin S i van speler i domineert zwak strategie sprimei isin S i als geldt dat

bull ui (si sminusi) ge ui (sprimei sminusi) voor alle sminusi isin S minusi en

8

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 7: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 749

Een eerste speltheoretische analyse

Stel je ziet jezelf geplaatst voor dit probleem wat zou je doen Ik denk dat wanneer het gaat om 4 jaar cel in plaats van 5 jaar cel je de 4 jaar cel prefereert Net zo gaat vrijspraak boven 1 jaar celWe zetten de mogelijkheden eens op een rijtje als je partner in crime bekent dan is het het besteom ook te bekennen Als hijzij echter niet bekent dan kan je vrijspraak krijgen door te bekennendus wederom is bekennen optimaal Kortom wat je medeverdachte ook doet bekennen levert jede minste jaren cel op Deze redenatie is geldig voor beide spelers ophangen met als oplossing deuitkomst (C C ) ndash beide bekennen

Veel mensen vinden deze uitkomst tegenstrijdig omdat de gevangenen zo precies die toestandbereiken die voor beiden samen het slechtst uitpakt Namelijk in totaliteit komt met (C C ) het

totaal aantal jaren in de nor op 4 + 4 = 8 jaren terwijl het bij ( D D) slechts gaat om 1 + 1 = 2 jaren De omstandigheden zijn echter zo gemaakt dat deze laatste uitkomst niet bereikt wordt

Het gaat aan menigeen met gezond verstand te boven dat hier het egoısme van individuenleidt tot een resultaat dat voor beiden slecht is Betekent dit dat de bovenstaande redenatie nietzo overtuigend is als het op het eerste gezicht lijkt

De tegenwerping tegen bovenstaande analyse hangt vermoedelijk samen met de bijzondere vormvan de geschiedenis Je kan je afvragen of het echt wel lonend is je vriend te verraden om een jaargevangenisstraf te ontlopen Wat gebeurt er namelijk als deze na vijf jaar vrijkomt Barst hij uitelkaar van wraakgevoelens Dit laat al zien dat het verhaal eigenlijk niet bij de uitbetalingsmatrixpast en in ieder geval moeten de jaren gevangenisstraf niet als nut worden opgevat Maar dan ishet ook niet echt verwonderlijk dat een analyse op basis van diezelfde uitbetalingsmatrix leidt toteen paradoxale uitkomst Zou je zelf een betere uitbetalingsmatrix weten Hieronder een voorbeeld

dat beter te verkopen is

Voorbeeld 24 Twee handelaren die op de zwarte markt opereren willen handelswaar uitwisselenvia geheime kanalen hebben ze afgesproken op een bepaald tijdstip elkaar de koffers met overeenge-komen goederen te overhandigen De handelaren kennen elkaar niet en nemen de grootste moeiteom bij de uitwisseling onherkenbaar te blijven waarmee een nieuwe ontmoeting onwaarschijnlijkwordt Verder kan ook de inhoud van de koffers niet gecontroleerd worden omdat de overhandi-ging snel verlopen moet De inhoud van de eigen koffer is de handelaren precies 1000 Euro waardterwijl de handelswaren van de ander het viervoudige oplevert namelijk 4000 Euro Bij de over-eengekomen ruil zou eenieder dus 4000 Euro winnen of zelfs 5000 Euro als de eigen koffer metwaardeloze kiezelstenen gevuld wordt De bijbehorende bimatrix luidt als volgt

handelaar 2W S

handelaar 1 W 4000 4000 0 5000S 5000 0 1000 1000

Het is duidelijk dat de actie om de koffer met stenen te vullen een strikt optimale strategie S bepaalt wat de andere handelaar ook van plan is te doen Dit levert de uitkomst (S S ) ophetgeen betekent dat er effectief niets verhandeld wordt

7

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 849

Opgave 21 In een spelshow met Peter-Jan Rens strijden in het laatste spel twee overgeblevenkandidaten om een geldbedrag x De spelers wordt gevraagd om tegelijkertijd aan te geven of menhet geldbedrag zou willen delen of niet Als geen van beiden willen delen dan gaat het geldbedragin rook op en krijgen beide spelers niets Het geldbedrag wordt gelijk verdeeld onder de kandidatenals ze allebei hebben aangegeven het bedrag te willen delen Als er maar een speler wil delen dangaat het volledige bedrag naar de andere speler Formuleer de bijbehorende bimatrix Is dit spelvergelijkbaar met het Prisonersrsquo Dilemma Zo ja waarom en zo nee waarom niet

Opgave 22 Cournot duopolyGegeven is een markt voor een goed Y waarop twee bedrijven A en B actief zijn De inversevraagfunctie wordt gegeven door p (Q) = a minus Q waarbij a een positieve constante is en Q de totale

geaggregeerde productie door A en B Beide bedrijven produceren met constante marginale kostenc gt 0 en zonder vaste kosten zodat de kostenfuncties gegeven worden door

C i (q i) = cq i voor alle q i ge 0 en i = A B

Neem aan dat de bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveau bepalenModeleer deze situatie als 2 times 3 bimatrixspel als gegeven is dat A op twee productieniveaursquosq LA = 3 q H A = 5 en dat B op drie productieniveaursquos q LB = 1 q M

B = 3 en q H B = 5 kan producerenNeem hierbij voor de constanten a = 10 c = 2

3 Dominantie IEWDS en IEDS oplossing

Het probleem waar spelers voor staan is dat ze uit hun actieverzameling een keuze moeten makenzonder dat ze weten wat de andere spelers doen Daarom probeert iedere speler de acties van deandere spelers in te schatten wat in het algemeen vrij lastig is Hoewel in sommige gevallen doetdit probleem zich niet echt voor omdat er een actie voorhanden is die optimaal is ongeacht devoorgenomen speelwijze van de tegenstanders Deze situatie hebben we in het vorige hoofdstuk aleens gezien en wel bij het Prisonersrsquo Dilemma Hier is het opbiechten van de misdaad optimaalof de tegenstander nu ook opbiecht of juist niet In dit geval ligt het voor speler 1 voor de hand deactie Confess te kiezen Hetzelfde geldt voor speler 2 Dit idee zullen we nu formeel opschrijven

Notatie 31 Gegeven is de strategieen S = timesiisinN S i van een n-persoonsspel in strategischevorm en neem s = (s1 sn) isin S Dan definieren we sminusi als het profiel van strategieen

(s1 siminus1 si+1 sn) isin timesjisinN iS j en we schrijven s = (si sminusi) Dus sminusi is niets andersdan het strategieenprofiel van de spelers in het spel behalve speler i De verzameling van al zulkeprofielen noteren we met S minusi

Definitie 32 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Strategiesi isin S i van speler i domineert zwak strategie sprimei isin S i als geldt dat

bull ui (si sminusi) ge ui (sprimei sminusi) voor alle sminusi isin S minusi en

8

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 8: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 849

Opgave 21 In een spelshow met Peter-Jan Rens strijden in het laatste spel twee overgeblevenkandidaten om een geldbedrag x De spelers wordt gevraagd om tegelijkertijd aan te geven of menhet geldbedrag zou willen delen of niet Als geen van beiden willen delen dan gaat het geldbedragin rook op en krijgen beide spelers niets Het geldbedrag wordt gelijk verdeeld onder de kandidatenals ze allebei hebben aangegeven het bedrag te willen delen Als er maar een speler wil delen dangaat het volledige bedrag naar de andere speler Formuleer de bijbehorende bimatrix Is dit spelvergelijkbaar met het Prisonersrsquo Dilemma Zo ja waarom en zo nee waarom niet

Opgave 22 Cournot duopolyGegeven is een markt voor een goed Y waarop twee bedrijven A en B actief zijn De inversevraagfunctie wordt gegeven door p (Q) = a minus Q waarbij a een positieve constante is en Q de totale

geaggregeerde productie door A en B Beide bedrijven produceren met constante marginale kostenc gt 0 en zonder vaste kosten zodat de kostenfuncties gegeven worden door

C i (q i) = cq i voor alle q i ge 0 en i = A B

Neem aan dat de bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveau bepalenModeleer deze situatie als 2 times 3 bimatrixspel als gegeven is dat A op twee productieniveaursquosq LA = 3 q H A = 5 en dat B op drie productieniveaursquos q LB = 1 q M

B = 3 en q H B = 5 kan producerenNeem hierbij voor de constanten a = 10 c = 2

3 Dominantie IEWDS en IEDS oplossing

Het probleem waar spelers voor staan is dat ze uit hun actieverzameling een keuze moeten makenzonder dat ze weten wat de andere spelers doen Daarom probeert iedere speler de acties van deandere spelers in te schatten wat in het algemeen vrij lastig is Hoewel in sommige gevallen doetdit probleem zich niet echt voor omdat er een actie voorhanden is die optimaal is ongeacht devoorgenomen speelwijze van de tegenstanders Deze situatie hebben we in het vorige hoofdstuk aleens gezien en wel bij het Prisonersrsquo Dilemma Hier is het opbiechten van de misdaad optimaalof de tegenstander nu ook opbiecht of juist niet In dit geval ligt het voor speler 1 voor de hand deactie Confess te kiezen Hetzelfde geldt voor speler 2 Dit idee zullen we nu formeel opschrijven

Notatie 31 Gegeven is de strategieen S = timesiisinN S i van een n-persoonsspel in strategischevorm en neem s = (s1 sn) isin S Dan definieren we sminusi als het profiel van strategieen

(s1 siminus1 si+1 sn) isin timesjisinN iS j en we schrijven s = (si sminusi) Dus sminusi is niets andersdan het strategieenprofiel van de spelers in het spel behalve speler i De verzameling van al zulkeprofielen noteren we met S minusi

Definitie 32 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Strategiesi isin S i van speler i domineert zwak strategie sprimei isin S i als geldt dat

bull ui (si sminusi) ge ui (sprimei sminusi) voor alle sminusi isin S minusi en

8

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 9: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 949

bull ui (si sminusi) gt ui (sprimei sminusi) voor een bepaalde sminusi isin S minusi

De strategie si domineert sprimei als bovenstaande ongelijkheden alle strikt zijn Dit wordt ook welstrikte dominantie genoemd

Definitie 33 Een strategie si van speler i heet zwak dominant als deze iedere strategie in S izwak domineert Deze strategie wordt (strikt ) dominant genoemd als het iedere strategie in S i(strikt) domineert

Voorbeeld 34 Beschouw het volgende spel

L RT 1 0 2 0B 0 1 1 2

Hier is T een dominante strategie voor speler 1 De strategie R domineert L zwak voor speler 2

Opgave 31 De kunstliefhebbers Simon en Thomas bieden schriftelijk op een schilderij dat hen4000 Euro respectievelijk 3000 Euro waard is De hoogste bieder wint de veiling en betaalt de prijsgelijk aan het laagste bod Bij gelijke biedingen wordt er geloot

(a) Stel de uitbetalingsfuncties f (s t) voor Simon en g (s t) voor Thomas op

(b) Schets f (s t) als functie van t voor 3 verschillende waarden van s namelijk s = 2000 4000en 6000

(c) Het is bekend dat in een tweedeprijs-veilingspel het bieden van de eigen waarde een zwakdominante strategie is Motiveer deze bewering met behulp van de schetsen gemaakt in (b)

Opgave 32 Laat zien dat een speler hooguit 1 dominante strategie heeft

Samenvattend een dominante strategie voor een speler is een strategie dat optimaal is ongeacht

wat de tegenstanders doen Anders gezegd een speler met een dominante strategie hoeft zich geenzorgen te maken hoe de tegenstanders spelen omdat onder iedere aanname over de geplandestrategieen van de tegenstanders het spelen van de dominante strategie optimaal is Dit heeft alsgevolg dat er een goede reden is te veronderstellen dat rationele spelers hun dominante strategiein een gegeven spel spelen mits deze bestaat

Opgave 33 Leg uit waarom dit argument niet zo sterk is als het gaat om zwak dominantestrategieen

9

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 10: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1049

We kunnen bovenstaand argument voor een (zwak) dominante strategie ook omkeren door teveronderstellen dat een rationele speler i nooit een strategie sprimei isin S i kiest als er een andere strategiesi is die gegarandeerd een (zwak) hogere uitbetaling geeft ongeacht de strategieen van de anderespelers Dit leidt dan tot de volgende definitie

Definitie 35 Beschouw een spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Als er voor destrategie sprimei isin S i er een si isin S i bestaat zodat

bull ui (sprimei sminusi) le ui (si sminusi) voor alle sminusi isin S minusi en

bull ui (sprimei sminusi) lt ui (si sminusi) voor minimaal een sminusi isin S minusi

dan wordt sprimei door si zwak gedomineerd Zijn al deze ongelijkheden strikt dan wordt sprimei (strikt)gedomineerd door si

Voorbeeld 36 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 0 0 1 1 2B 0 3 2 0 0 1

Hier wordt strategie M van speler 2 gedomineerd door R Ten opzichte van beide strategieen vanspeler 1 moet M het afleggen tegen R Het is dus aannemelijk dat een rsquorationelersquo speler die als

doel heeft zijn uitbetaling te maximaliseren M niet speelt Er is namelijk geen inschatting van deandere spelers te maken die de keuze van een gedomineerde strategie als optimaal rechtvaardigtomdat er een strategie bestaat die beter presteert

Aangezien er sprake is van volledige informatie is speler 1 er zeer goed van op de hoogte datspeler 2 nooit M speelt als hij rationeel is Het lijkt dus redelijk te veronderstellen dat speler 1alleen interesse heeft in het gereduceerde spel Gprime

L RT 1 0 1 2B 0 3 0 1

dat overblijft na eliminatie van strategie M Echter in Gprime wordt B gedomineerd door T

Veronderstel nu dat speler 1 ook rsquorationeelrsquo is en geen gedomineerde strategieen gebruikt Alsspeler 2 zich hiervan bewust is dat wil zeggen als speler 2 beseft dat speler 1 beseft dat speler2 geen M speelt en speler 1 dus geen B dan reduceert het relevante spel verder tot Gprimeprime dooreliminatie van B

L RT 1 0 1 2

In Gprimeprime wordt strategie L door R gedomineerd Dan volgt uit de aanname dat beide spelers geengedomineerde strategieen gebruiken het strategieprofiel (T R) als oplossing van het spel G

10

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 11: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1149

Bovenstaand voorbeeld laat zien dat het zinvol is om voor een gegeven spel G alle strikt ge-domineerde acties te elimineren voor iedere speler want alle rsquorationelersquo spelers beseffen dat zulkestrategieen nooit gebruikt zullen gaan worden Voeren alle spelers deze fase van eliminatie vanstrategieen (in gedachten) uit dan wordt er eigenlijk een kleiner spel gespeeld dan het oorspronke-lijke Dan kunnen we ons wederom de vraag stellen of er in dit nieuwe gereduceerde spel er wellichtstrategieen bestaan die gedomineerd worden door een van de strategieen die de eerste eliminatieoverleeft heeft en deze dan gevoeglijk weer elimineren En waarom kunnen we dan niet nog verdergaan zover als we kunnen Dit levert het volgende oplossingsconcept op

Definitie 37 Gegeven is het spel in strategische vorm G =⟨

N (S i)iisinN (ui)iisinN ⟩

Definieer deprocedure van ge ıtereerde eliminatie van gedomineerde strategie en als volgt

(a) Stel g = G

(b) Indien er gedomineerde strategieen zijn in g bepaal dan voor iedere speler i isin N de bij-behorende verzameling S primei van ongedomineerde strategieen en herdefinieer het spel g als⟨

N (S primei)iisinN (ui)iisinN ⟩

(c) Herhaal (b) zolang er gedomineerde strategieen bestaan Als geen enkele speler in g meergedomineerde strategieen bezit dan is IEDS (G) de verzameling van alle (overgebleven)strategieprofielen in g

Merk op dat volgens (b) bij iedere iteratie alle mogelijke strategieen van alle spelers geelimineerdworden

Analoog definieren we de procedure van geıtereerde eliminatie van zwak gedomineerde strate-gieen De IEWDS oplossing bij G ofwel IEWDS (G) is de verzameling van strategieprofielen in S die deze eliminatie overleven

Of deze eliminatieprocedures zinvol zijn of niet hangt sterk van de context af daar zullenwe nog voorbeelden van zien In ieder geval zijn ze intuıtief en interessant Wellicht een trivialeopmerking maar de IEDS oplossing is een generalisatie van het concept dominante strategie dwzde IEDS oplossing bevat alle dominante strategieen (waarom) Verder is het concept ook beter tehanteren omdat het ook toepasbaar is op spelen die geen dominante strategie bezitten Op dezemanier kunnen we een voorspelling met betrekking tot de gevolgde speelwijze verkrijgen zonder dat ook maar een enkele speler een dominante strategie bezit De scherpst mogelijke voorspellingop basis van de IEDS oplossing wordt verkregen als deze slechts een enkel element bevat In dat

geval noemen we het spel G oplosbaar via dominantie

Voorbeeld 38 Beschouw het volgende tri-matrixspel waarbij speler 1 de rij kiest speler 2de kolom en speler 3 de tri-matrix In ieder matrix-vakje is het eerste tweede derde getal deuitbetaling van respectievelijk speler 1 2 en 3

speler 3 speelt U α β a 1 1 0 1 1 0b 0 1 0 0 1 0

11

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 12: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1249

speler 3 speelt D α β a 1 1 0 0 0 0b 0 1 0 1 1 0

Dit spel bevat geen strikt gedomineerde strategie dus IEDS (G) = S (alle strategieprofielen over-leven de IEDS-procedure) We bepalen nu IEWDS (G) Spelers 1 en 3 hebben geen zwak ge-domineerde strategieen maar speler 2 wel Strategie β wordt zwak gedomineerd door α en weelimineren dus β Het gereduceerde spel is dan

speler 3 speelt U αa 1 1 0b 0 1 0

speler 3 speelt D αa 1 1 0b 0 1 0

Nu wordt strategie b van speler 1 strikt gedomineerd door a We elimineren b Verdere eliminatieis niet mogelijk en twee strategieprofielen overleven dus de IEWDS-procedure IEWDS (G) =(aαU ) (aαD)

Opgave 34 Beschouw het 2 times 2 bimatrixspel Gβ

speler 2

speler 1L R

T 3 1 1 β

B 2 0 2 0

Bepaal voor iedere β de verzameling IEDS (Gβ) en IEWDS (Gβ)

Opgave 35 Beschouw het 4 times 4 bimatrixspel G

speler 2

speler 1

B1 B2 B3 B4

A1 3 1 3 1 0 0 0 0A2 0 0 0 0 1 3 1 3A3 2 1 minus1 0 2 1 minus1 0A4 minus1 0 0 3 minus1 0 0 3

a) Bepaal een zwak gedomineerde strategie voor speler 1b) Bepaal IEWDS (G)

Opgave 36 Bepaal een spel zonder zwak dominante strategieen

Opgave 37 Chairmanrsquos ParadoxBeschouw een commitee van drie personen die als taak hebben een keuze te maken uit drie alterna-tieven αβγ Iedere persoon brengt een stem uit en een alternatief wordt uiteindelijk gekozen

12

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 13: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1349

bij meerderheid van de stemmen Stemt ieder op een ander alternatief dan heeft de voorzitter vanhet commitee zeg speler 3 het voor het zeggen en zijnhaar keuze wordt doorslaggevend Dus zijnde spelers in dit spel niet volledig symmetrisch aangezien speler 3 in strategisch opzicht superieuris ten opzichte van spelers 1 en 2 Neem aan dat de preferenties van de spelers gegeven zijn als inde volgende lijst

Speler 1 Speler 2 Speler 3α β γ β γ αγ α β

Hierbij nemen we aan dat alternatief i door een speler geprefereerd wordt boven alternatief j alsi in de relevante kolom boven j vermeld staat Dus speler 2 prefereert β en γ boven α en β

boven γ en α Als iedere speler eerlijkheidshalve zijn meest geprefereerde alternatief in stemmingzou brengen dan zou ieder een ander alternatief kiezen en daarmee speler 3 de macht geven γ als winnend alternatief te declareren Echter de spelers hoeven niet waarheidsgetrouw hun echtepreferenties op zorsquon manier te laten blijken Dat heeft alleen maar zin als dat lonend is Wat zou ergebeuren als de spelers strategisch stemmen We modelleren dit scenario als een spel in strategischevorm waarbij de strategieruimtes gegeven worden door Ai = αβγ voor alle i isin 1 2 3 en deuitbetalingen in 3 times 3 tri-matrices worden weergegeven

α β γ α 2 0 1 0 1 2 0 1 2

speler 3 speelt γ β 0 1 2 1 2 0 0 1 2γ 0 1 2 0 1 2 0 1 2

α β γ α 2 0 1 2 0 1 2 0 1

speler 3 speelt α β 2 0 1 1 2 0 2 0 1γ 2 0 1 2 0 1 0 1 2

α β γ α 2 0 1 1 2 0 1 2 0

speler 3 speelt β β 1 2 0 1 2 0 1 2 0γ 1 2 0 1 2 0 0 1 2

Deze schematische voorstelling is als volgt te interpreteren speler 3 kiest een matrix speler 1 eenrij en speler 2 een kolom Zo hebben we bij strategieprofiel (αββ ) de uitkomst (1 2 0) metuitbetaling 1 2 en 0 voor respectievelijk de spelers 1 2 en 3

Laat zien dat de IEWDS (G) gegeven wordt door (β β γ )

Opgave 38 Beschouw de volgende aangepaste procedure van eliminatie van zwak gedomineerdestrategieen Iedere ronde schrappen we hooguit een enkele zwak gedomineerde strategie voor eenwillekeurige speler totdat er geen zwak gedomineerde strategieen meer zijn Laat zien dat dit tot

13

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 14: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1449

verschillende reducties kan leiden in het onderstaande 2-persoons-bimatrixspel

L M RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

4 Nash evenwicht

In het vorige hoofdstuk hebben we situaties geanalyseerd waarbij het nog mogelijk was op deindividuele speler gefocust te blijven Namelijk als een speler onafhankelijk van de acties vanandere spelers een strikt optimale strategie heeft dan legt rationaliteit van de speler deze strategievast En als iedere speler zich in zorsquon vergelijkbare positie bevindt dan leidt dit tot een dominantstrategieprofiel Helaas hebben veel interessante spelen geen (zwak) dominante strategie en zijnbijvoorbeeld concepten als IEDS en IEWDS nutteloos Kijk bijvoorbeeld maar eens naar hetvolgende spel

L M RT 2 2 0 1 0 1M 0 1 1 3 0 2B 0 1 0 2 1 3

In dit geval kunnen we geen enkele strategie elimineren of het nu om zwakke of sterke versie van

dominantie gaatWe keren op onze schreden terug en bekijken nogmaals het basismodel Als basisveronder-

stelling hebben we voor deze cursus aangenomen dat spelers rationeel zijn wat wil zeggen datze de beste van de beschikbare strategieen zullen gebruiken om hun doelstellingen te verwezen-lijken Zonder deze aanname precies te maken is deze niet wezenlijk anders dan die je al benttegengekomen bij micro-economie Het gros van de daar behandelde modellen reduceerden hetbeslissingsprobleem voor een individu tot het oplossen van het volgende probleem

maxxisinX

u (x ϑ) (1)

Hierbij staat x voor een vector van keuzevariabelen zoals bijvoorbeeld een consumptiebundel enX voor de verzameling van beschikbare acties cq strategieen zoals de budgetverzameling Devariabele ϑ staat voor een vector van parameters die buiten de invloedssfeer van het individu

liggen (zoals bijvoorbeeld prijs en inkomen) en u is de nutsfunctie Dat wat een situatie een spelin strategische vorm maakt is precies dat een optimale strategie voor een individuele beslisserafhangt van de actiesstrategieen van de andere beslissers De algemene formulering van hetbeslissingsprobleem (1) kunnen we ook voor dit soort situaties gebruiken door ϑ op te vattenals het profiel met strategieen van de andere spelers die de nutsfunctie van speler i beınvloedenMet andere woorden als we schrijven x = si X = S i en ϑ = sminusi dan wordt het relevantebeslissingsprobleem voor speler i bij gegeven sminusi isin S minusi gegeven door

maxsiisinS i

ui (si sminusi) (2)

14

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 15: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1549

Het probleem hierbij is dat een speler in het algemeen niet weet wat de voorgenomen acties of strategieen in sminusi zijn Dit staat in schril contrast met het enkelvoudige beslissingsprobleem (1)waar ϑ een gegeven vector van exogene parameters is Daarom is het in het algemeen noodzakelijkeen analyse uit te voeren die tegelijkertijd de individuele beslissingsproblemen voor alle spelers isimultaan behandeld

Voorbeeld 41 Gegeven is het bimatrixspel G

L RT 2 2 0 1B 0 1 1 3

Zijn er strategieprofielen die voor de individuele spelers de optimalisatieproblemen (2) tegelijkertijdoplossen Bekijk (B L) Dit strategieprofiel voldoet zeker niet aan de optimaliteitseis voor speler1 aangezien eenzijdige afwijking naar de strategie T de uitkomst (2 2) geeft waarbij speler 1 erdan 2 op vooruit gaat Net zo kunnen we (T R) afwijzen omdat speler 2 ten opzichte van T beterL kan spelen Neem nu (T L) Er geldt

u1 (T L) = 2 gt 0 = u1 (B L) u2 (T L) = 2 gt 1 = u2 (T R)

Dus T is optimaal tegen L en andersom is L ook optimaal tegen T Dus dit is een geschiktstrategieprofiel Is dit het enige Er is nog een andere profiel te weten (B R) Er geldt

u1 (B R) = 1 gt 0 = u1 (T R) u2 (B R) = 3 gt 1 = u2 (B L)

Dus B is optimaal tegen R en omgekeerd is R optimaal tegen B Voor G zijn er dus twee strate-gieprofielen die de problemen (2) tegelijkertijd oplossen

Deze denkwijze voert tot het bekendste oplossingsconcept uit de speltheorie ndash het Nash-evenwicht2

- en lost ten dele de problemen uit het vorige hoofdstuk op Hier volgt de formele defnitie

Definitie 42 Beschouw een spel G =⟨

N (S i)iisinN (ui)iisinN ⟩

Een strategieprofiel slowast isin S is eenNash-evenwicht als voor alle i isin N geldt dat

ui1048616

si slowastminusi1048617

le ui1048616

slowasti slowastminusi1048617

voor alle si isin S i

De verzameling van alle Nash-evenwichten van G wordt genoteerd als N E (G)

2Het basisidee achter het Nash-evenwicht is al ontdekt in 1838 door Cournot Een formele behandeling enrigoreuze analyse liet echter op zich wachten tot het beroemde werk van de wiskundige John Nash in 1950 Nashkreeg de Nobelprijs in 1994 (samen met John Harsanyi en Reinhardt Selten) voor zijn bijdragen aan de speltheorieVoor een interessante bibliografie over John Nash zie S Nasar (1998) ldquoA Beautiful Mindrdquo New York Simon andSchuster Bekender is nog de verfilming

15

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 16: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1649

Dus een Nash-evenwicht is een strategieprofiel dat de beslissingsproblemen (2) voor alle i isin N tegelijkertijd oplost Wanneer ieder individu acties onderneemt die consistent zijn met een Nash-evenwicht dan heeft niemand een prikkel om eenzijdig af te wijken naar een andere strategiewant de uitbetalingen vandaar uit kunnen alleen maar afnemen Precies dit facet maakt het Nash-evenwicht een evenwicht

Voorbeeld 43 In bovenstaand voorbeeld wordt N E (G) gegeven door (T L) (B R)

Opgave 41 Stag HuntTwee hongerige jagers gaan het bos in met het doel iets te vangen Ze moeten daarbij de keus

maken of ze voor een groot of een klein dier gaan Om groot wild (stag) te kunnen vangen moetende jagers samenwerken alleen wanneer ze beiden alert blijven tijd en energie erin stoppen kunnenze succes hebben Daartegen is het jagen van klein wild een stuk eenvoudiger en de jagers kunnendit succesvol doen zonder de hulp van de ander Besluiten ze samen het grote wild te jagen daneisen ze ieder de helft van de buit op Noteren we de actie klein wild jagen met K en groot wild jagen met G dan kunnen we de situatie modelleren door het volgende 2 times 2 bimatrixspel G

G K G 2 2 0 1K 1 0 1 1

Bepaal N E (G)

Opgave 42 Gedegenereerd Prisonersrsquo DilemmaBeschouw het spel GC D

C 9 9 0 9D 9 0 1 1

Bepaal N E (G) IEWDS (G) en IEDS (G)

Voorbeeld 44 Coordinatiespelen

(a) Stel je voor je bent met een vriend in Rio de Janeiro Carnaval aan het vieren en hetonvermijdelijke gebeurt je raakt elkaar kwijt Het wordt nog erger als je bemerkt dat jemobiel dienst weigert Er zijn twee opvallende plekken waar je samen bent geweest en jeweet dat je maat dat ook weet namelijk het Casino waar je binnen 1 dag al bijna van jevakantiegeld was verlost en het trefpunt bij het Centraal Station Nadeel is dat deze plekkenver uit elkaar liggen Je hebt alleen succes als jij precies dezelfde kant oploopt als je vriend

Het onderstaand 2 times 2 bimatrixspel geeft deze strategische situatie weer

a ba 1 1 0 0b 0 0 1 1

16

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 17: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1749

Bovenstaand 2times2 bimatrix is een coordinatiespel in de zuiverste vorm Spelers kunnen alleeniets verdienen als ze precies hetzelfde doen als de tegenstander

(b) Je neemt in voorgaande situatie de verkeerde beslissing maar je leent een mobieltje vaniemand en neemt meteen contact op Je hebt je vriend zorsquon 4 sekonden aan de lijn en zonderook maar het kleinste beetje informatie te hebben uitgewisseld wordt je telefoongesprek ruwonderbroken nu moet je beslissen bel jij terug of wacht je tot je vriend jou belt In heteerste geval schiet je er niets mee op als de ander ook besluit te bellen en in het tweede gevalzou het maar zo kunnen zijn dat jullie allebei aan het wachten zijn Je hebt alleen succes als je de beslissingen zo weet te coordineren dat er precies een van jullie belt Dit correspondeertmet het coordinatiespel

wachten bellen

wachten 0 0 1 1bellen 1 1 0 0

In tegenstelling tot zuivere coordinatiespelen zijn in de praktijk de verschillende uitbetalingenover het algemeen niet volledig symmetrisch Neem bijvoorbeeld het onderstaande win-win spelwaarbij er geen conflicterende belangen zijn

a ba 2 2 0 0b 0 0 1 1

Hier zijn er twee Nash-evenwichten maar beide spelers hebben de voorkeur voor het evenwicht(a a)

Een andere bron van asymmetrie verkrijgen we wederom door een kleine aanpassing van deuitbetalingen

T F T 3 1 0 0F 0 0 1 3

Ook hier zijn de spelers beter af indien ze de strategie en kunnen coordineren maar de spelershebben een verschillende waardering over de evenwichten Dit type spel is bekend onder de naamBattle of the Sexes Het verhaal dat hierbij hoort is als volgt een man en een vrouw willen graagsamen iets in hun vrije tijd ondernemen maar ze zijn zo verlegen dat ze niet iets durven af tespreken Ze besluiten onafhankelijk van elkaar hetzij naar het theater hetzij naar het voetbalstadionte gaan Wanneer ze elkaar niet tegenkomen dan is dat het slechtste wat hen kan overkomen Maar

de man gaat het liefst naar een voetbalwedstrijd terwijl de vrouw het liefst naar het theater gaat

Opgave 43 Het nut ontleend aan een bepaald technisch product hangt klaarblijkelijk niet alleenvan het product zelf af maar ook van het feit of het systeem elders gebruikt wordt Bekijk bijvoor-beeld het product video waarvoor er een tijdje geleden verschillende systemen in omloop warenwaaronder VHS en Video 2000 Als trotse eigenaar van een VHS-recorder had je weinig aan eenVideo 2000 opname van de plaatselijke videotheek en andersom Neem aan dat het autonome nut

17

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 18: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1849

van het systeem Video 2000 voor een huurder 4 is terwijl VHS nut 2 geeft De nutten wordenmet 6 verhoogd als de videotheek in de buurt hetzelfde systeem gebruikt Voor een videotheekbedraagt het nut altijd 5 wanneer de huurder hetzelfde systeem heeft en anders 0 omdat verhuurgeen zin heeft

(a) Modelleer deze situatie als bimatrixspel

(b) Bepaal zo mogelijk de Nash-evenwichten

In een Nash evenwicht presteren spelers optimaal gegeven de strategieen van de anderen Een

andere manier om dit te verwoorden is de Nash evenwichtsstrategie als beste antwoord Definitie 45 Gegeven is G =

⟨N (S i)iisinN (ui)iisinN

⟩ De strategie slowasti heet beste antwoord op

sminusi isin S minusi alsslowasti isin arg max

siisinS iui(si sminusi)

De verzameling van alle beste antwoorden op sminusi isin S minusi noteren we met Bi(sminusi) We definierenverder dan nog de beste-antwoordcorrespondentie als de correspondentie3 B S rArr S

B(s) = timesiisinN Bi(sminusi)

Stelling 46 Gegeven is G =⟨

N (S i)iisinN (ui)iisinN ⟩

Dan geldt

slowast isin N E (G) lArrrArr slowast isin B(slowast)

Bewijs Stel slowast isin B(slowast) Dan geldt voor iedere speler i isin N slowasti isin Bi(slowastminusi) Maar dat betekentvolgens de definitie van Bi dat slowasti een best antwoord op slowastminusi is oftewel

slowasti isin arg maxsiisinS i

ui(si slowastminusi)

wat weer betekent dat voor iedere speler i isin N en si isin S i ui(slowasti slowastminusi) ge ui(si slowastminusi) Dit is preciesde definitie van een Nash-evenwicht in Definitie 42 Dus slowast isin N E (G) We gebruikten hier telkensequivalente definities dus het omgekeerde geldt ook als slowast een Nash-evenwicht dan is slowast isin B(slowast)

Stelling 46 laat zien dat de dekpunten van de beste-antwoordcorrespondentie een Nash-evenwichtzijn4 Dit geeft ons een eenvoudige procedure om Nash-evenwichten te bepalen namelijk be-paal eerst voor iedere speler i en voor ieder strategieprofiel van de andere spelers sminusi isin S minusi de

3Het wiskundig concept ldquocorrespondentierdquo is een generalisatie van het wiskundig concept ldquofunctierdquo Terwijl eenfunctie g X rarr Y voor iedere x isin X een uniek element y = f (x) isin Y teruggeeft geeft een correspondentieg X rArr Y voor iedere x isin X een verzameling van (een of meerdere) elementen y = g (x) sube Y terug Omdat eenbest antwoord niet uniek hoeft te zijn gebruiken we hier het concept correspondentie

4Een dekpunt van een correspondentie g X rArr X is een element x isin X waarvoor geldt dat x isin g(x)

18

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 19: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 1949

beste-antwoorden Bi(sminusi) Bepaal vervolgens welke strategieprofielen dekpunten van de beste-antwoordcorrespondentie zijn

In het geval van een bimatrixspel met twee spelers komt deze procedure neer op het onderstrepenvan uitbetalingen van spelers Dit noemen we de onderstreepmethode

Voorbeeld 47 Bekijk onderstaand spel

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal nu eerst de beste antwoorden van speler 1 op iedere strategie van speler 2 door per kolomde hoogste uitbetaling van speler 1 te onderstrepen Dit levert onderstaande bimatrix op

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Bepaal vervolgens op dezelfde wijze de beste antwoorden van speler 2 door per rij de hoogsteuitbetaling van speler 2 te onderstrepen Dit levert onderstaande bimatrix op Merk hierbij opdat speler 2 twee beste antwoorden heeft als speler 1 M speelt

L C RT 3 2 0 1 0 1M 1 1 1 2 0 2B 0 1 0 2 1 3

Als we bovenstaande matrix bekijken dan zien we dat in drie hokjes beide uitbetalingen zijn onder-streept bij (T L) (M C ) en (B R) Voor ieder van deze drie strategieprofielen spelen beide spelerseen best antwoord en dit zijn dus inderdaad de dekpunten van de beste-antwoordcorrespondentieen dus ook de Nash-evenwichten

N E (G) = (T L) (M M ) (B R)

Voorbeeld 48 Beschouw nu onderstaand tri-matrixspel met drie spelers waarbij speler 1 de rijkiest speler 2 de kolom en speler 3 de matrix

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

19

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 20: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2049

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Voor iedere kolom (strategie van speler 2) en tri-matrix (strategie van speler 3) zoeken we de besteantwoorden van speler 1 en we onderstrepen de bijbehorende uitbetaling Dit levert het volgende

op L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Vervolgens doen we hetzelfde voor speler 2 voor iedere rij en tri-matrix zoeken we de kolom diede hoogste uitbetaling voor speler 2 oplevert en we onderstrepen dit getal We krijgen dan hetvolgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3L C R

T 7 8 6 2 4 8 5 8 6speler 3 speelt C M 9 1 7 7 9 4 9 1 6

B 3 3 1 8 2 7 2 8 8

Tot slot zoeken we de beste antwoorden van speler 3 Hiertoe vergelijken we voor een gegevenrij en kolom de uitbetalingen van speler 3 in de drie matrices en we onderstrepen het hoogstegetal Bijvoorbeeld als speler 1 T speelt en speler 2 L dan zijn de uitbetalingen voor speler

20

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 21: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2149

3 u3(T L A) = 9 u3(T L B) = 7 en u3(T L C ) = 6 Strategie A is dus het beste antwoordop (T L) en we onderstrepen getal 9 in de bovenste tri-matrix bovenste rij en linkerkolom Zoverdergaand verkrijgen we het volgende

L C RT 4 4 9 2 6 1 4 2 4

speler 3 speelt A M 6 2 9 6 9 5 3 9 3B 2 6 4 9 9 8 3 6 9

L C RT 7 6 7 8 8 5 9 1 6

speler 3 speelt B M 3 2 9 7 9 7 8 3 9

B 9 1 1 2 8 7 3 3 3

L C RT 7 8 6 2 4 8 5 8 6

speler 3 speelt C M 9 1 7 7 9 4 9 1 6B 3 3 1 8 2 7 2 8 8

Als we nu alle strategieprofielen bekijken dan zien we dat alleen bij ( BCA) alle uitbetalingenonderstreept zijn Het unieke Nash-evenwicht is dus NE (G) = (BCA)

Opgave 44 Bepaal alle Nash evenwichten in het 5 times 5 bimatrixspel G

C 1 C 2 C 3 C 4 C 5

R1 2 2 0 4 0 1 0 1 0 1R2 3 4 1 3 4 4 1 1 1 2R3 0 1 2 5 1 2 2 3 1 2R4 3 2 3 1 4 2 1 2 2 1R5 1 1 2 2 0 2 3 3 2 3

Opgave 45 Nash Demand GameVeronderstel dat twee individuen (1 en 2) onderling 100 Euro moeten verdelen Ze besluiten dit alsvolgt te doen gelijktijdig leggen beiden een claim neer die weergeeft hoeveel van de 100 Euro wordtopgeeist Is de som van de claims kleiner of gelijk aan 100 Euro dan krijgen beiden het geclaimdebedrag Overschrijdt die som de 100 Euro dan krijgt geen van beiden ook maar iets Het geld datoverblijft na de uitkering wordt aan goede doelen besteed waaraan geen van de spelers een directnut ontleent We kunnen dit scenario modelleren als spel in strategische vorm met strategieruimtenS 1 = S 2 = [0 100] en uitbetalingsfuncties

ui (c1 c2) =

983163 ci als c1 + c2 le 100 en0 in andere gevallen

voor i isin 1 2 Laat zien dat (50 50) een Nash-evenwicht is Zijn er meer evenwichten Zo jabepaal deze

21

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 22: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2249

Opgave 46 Bepaal de evenwichten van het spel G met spelersverzameling 1 2 strategieenruimtenS i = [0 1] voor i = 1 2 en nutsfuncties

u1(s1 s2) = s1s2 + 3(1 minus s1)(1 minus s2)u2(s1 s2) = 2s1s2 + 2(1 minus s1)(1 minus s2)

Opgave 47 De inwoners N = 1 2 van het dorp de Arena bezitten gezamenlijk een tech-nologie voor de produktie van een (perfect deelbaar) goed Y Deze technologie wordt volledigbeschreven door de kwadratische kostenfunktie c(y) = y2 dwz de produktie van y eenheden kosty2 Euro Iedere bewoner i isin N plaatst tegelijkertijd zijn bestelling met de gewenste hoeveelheid

q i van goed Y waarna de totale gewenste hoeveelheid Q = q 1 + q 2 + + q n wordt geproduceerdDe kosten worden proportioneel doorgerekend per individu wat betekent dat inwoner i voor debestelling van q i eenheden

xi = q iQ

middot c(Q) (3)

Euro betaalt uitgaande van het feit dat Q gt 0 Anders hoeft niemand iets te betalen Inwoneri isin N ontleent nut aan de geproduceerde hoeveelheid goed q i en de daarbij behorende kosten xiwelk wordt weergegeven door de nutsfunctie ui

ui(q i xi) = aq i minus xi waarbij a gt 0 (4)

De constante a kan men interpreteren als de prijs die inwoner i isin N krijgt bij verkoop van zijneenheden van goed Y

(a) Bepaal de eerste orde voorwaarde voor de nutsmaximalisatie van inwoner i die de produktievoor de andere inwoners als gegeven beschouwt

(b) Neem aan dat alle individuele bestellingen in evenwicht positief zijn en bepaal mbv on-derdeel (a) de totale hoeveelheid Qlowast die dan geproduceerd wordt en wel in termen van deconstante a en het aantal inwoners n

5 Nash evenwicht en dominantie

We zijn begonnen met analyseren van spelen in termen van dominantie en we hebben daarnahet begrip Nash-evenwicht ingevoerd Hoe verhouden deze begrippen zich tot elkaar Bekijk hetvolgende matrixspel

speler 2

speler 1

L M RT 1 1 0 1 0 1M 0 0 1 0 0 1B 1 0 0 1 1 0

22

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 23: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2349

Er is hier precies een Nash-evenwicht en wel (T L) Maar strategie L wordt zwak gedomineerddoor M En dus bevat de IEWDS oplossing niet het unieke Nash-evenwicht Zwakke dominantie isblijkbaar iets anders dan wat het Nash-evenwicht probeert uit te drukken Hoe zit dit met (sterke)dominantie

Stelling 51 Voor een spel in strategische vorm G geldt N E (G) sube IEDS (G)

Bewijs Stel slowastisin IEDS (G) Dan is er een speler i isin N en een strategie bi isin S i die slowasti domineertMaar dan geldt voor alle strategieprofielen sminusi isin S minusi dat ui(slowasti sminusi) lt ui(bi sminusi) In het bijzondergeldt dan voor sminusi = slowastminusi dat

ui(slowasti slowast

minusi) lt ui(bi slowast

minusi)

Maar dan is slowast geen Nash-evenwicht omdat dit zou inhouden dat ui(slowasti slowastminusi) ge ui(bi slowastminusi) Metandere woorden als slowastisin IESD (G) dan slowastisin N E (G) dus N E (G) sube IEDS (G)

Stelling 52 Gegeven is een eindig spel in strategische vorm G Als de procedure van eliminatie van zwak gedomineerde strategie en resulteert in een uniek strategieprofiel dan is dit profiel een Nash evenwicht oftewel

IEWDS (G) = 1 =rArr IEWDS (G) = N E (G)

Problemen met het Nash-evenwicht

Gegeven het feit dat het concept van Nash evenwicht het bekendste en meest gebruikte evenwichts-concept in economische toepassingen is is het van belang de beperkingen ervan in te zien Wezullen een aantal van de meest essentiele hier bespreken

1 Een Nash-evenwicht kan het gebruik van zwak gedomineerde strategieen niet uitsluiten Be-kijk nog eens het spel aan het begin van dit hoofdstuk Als speler 2 ook maar het geringstevermoeden heeft dat speler 1 de strategie B hanteert dan dwingt nutsmaximalisatie speler2 tot het spelen van M hoe klein dit vermoeden ook zijn kan Omdat het in het algemeenzelden gebeurt dat spelers rsquozekerrsquo zijn van de intenties van de andere spelers lijkt een zwakgedomineerd Nash-evenwicht onwaarschijnlijk5

2 Nash-evenwichten hoeven niet te bestaan Weet je nog een voorbeeld te herinneren

3 Nash-evenwichten hoeven niet uniek te zijn Dit is ondermeer het geval bij coordinatiespelenHet problematische zit hem in het feit dat de notie van Nash-evenwicht ons dan niet verderhelpt als idee om een scherpe voorspelling te maken hoe een spel gespeeld wordt Hetprobleem is fundamenteel en we moeten daarmee leren leven sommige spelen hebben geennatuurlijke oplossing

5Je kan afspreken dat je niet geınteresseerd bent in zwak gedomineerde evenwichten Dit leidt tot een eersteverfijning van het Nash-evenwicht concept een ongedomineerd Nash-eveniwcht van een spel G in strategische vormis een Nash evenwicht waarbij geen van de gebruikte strategieen zwak gedomineerd wordt

23

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 24: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2449

4 Nash-evenwichten zijn in het algemeen niet bestand tegen groepsgewijze afwijkingen In dedefinitie van het Nash-evenwicht ligt alleen besloten dat eenzijdige afwijking niet loont Maareisen we stabiliteit ten aanzien van een combinatie van afwijkingen door meerdere spelersdan voldoet niet ieder Nash-evenwicht hier aan In het Prisonerrsquos Dilemma is de uitkomst bij(D D) namelijk inferieur ten opzichte van de cooperatieve uitkomst die hoort bij de situatiewaarbij beide spelers afwijkende strategieen spelen

In dit verband kan men een verfijning aan het Nash-evenwichtsconcept brengen door voorieder Nash-evenwicht te vereisen dat er geen ander Nash-evenwicht bestaat dat voor iederespeler een hogere uitbetaling geeft Men spreekt dan van Pareto-effici ente Nash evenwichten Je zou redelijkerwijs kunnen verwachten dat als er meerdere Nash evenwichten zijn spelersin ieder geval coordineren op een Pareto-efficient Nash evenwicht

Opgave 51 In het volgende spel G kiest speler 1 een rij speler 2 een kolom en speler 3 eenmatrix

speler 3 speelt U α β a 1 1 minus5 minus5 minus5 0b minus5 minus5 0 0 2 7

speler 3 speelt D α β a 1 1 6 minus5 minus5 0b minus5 minus5 0 minus2 minus2 0

(a) Laat zien dat N E (G) = (aαD) (bβU )

(b) Welk van bovenstaande Nash-evenwichten zijn Pareto-efficiente Nash-evenwichten

6 Gemengde uitbreiding en Nash evenwicht

Voorbeeld 61 Matching PenniesSjaak en Dorien zijn al 25 jaar getrouwd en ze hebben samen al heel wat beleefd en een grootaantal problemen doorstaan zo ook het rsquoprobleemrsquo van de afwas Na een paar jaar van gezeur

besluiten ze tot de volgende procedure om te bepalen wie die avond de afwas moet doen Na deavondmaaltijd pakken ze beiden een Euro en kiezen onafhankelijk van elkaar of ze die met kop danwel met munt boven in hun handpalm nemen Dan laten ze elkaar zien wat de keuze is geweestHebben ze allebei dezelfde keus gemaakt dan moet Sjaak afwassen en in de andere gevallen DorienDeze situatie laat zich door middel van het volgende 2 times 2 bimatrixspel omschrijven met rijspelerDorien en kolomspeler Sjaak

K M K 1 minus1 minus1 1M minus1 1 1 minus1

24

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 25: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2549

Wat moeten de spelers in dit geval doen Het concept Nash evenwicht biedt hier geen uitwegen dominantie evenmin Dit spel heeft geen Nash evenwicht en geen zwak of sterk gedomineerdestrategieen Maar stel je eens voor dat Sjaak iedere avond met kop komt aanzetten dan is hetvoor Dorien optimaal om ook kop te spelen Voorspelbaarheid wordt hier afgestraft Net zo geldtdat wanneer Sjaak weet dat in de meerderheid van de gevallen Dorien voor munt kiest dan kan hijdit uitbuiten door kop te spelen Namelijk in verwachting is deze strategie dan beter dan muntKortom de speler die voorspelbaar is lijdt hieronder Een mogelijkheid om hier aan te ontkomenis randomisatie waarbij zowel Sjaak als Dorien met een zekere kans kop en met een zekere kansmunt spelen Ze spelen dan zogenaamde gemengde strategie en Welke van de gemengde strategieenis dan optimaal Als een van beide strategieen zou worden bevoordeeld in die zin dat deze methogere kans wordt gespeeld dan is deze met dezelfde redenatie als boven uit te buiten Dus als

zowel Sjaak als Dorien met kans 12 kop en dus met kans 12 munt spelen heeft het voor beidengeen zin van hun strategie af te wijken

Voorbeeld 62 We veranderen nu iets aan de uitbetalingen

K 2 M 2K 1 1 minus1 minus2 2M 1 minus2 2 2 minus2

Het spel is niet meer symmetrisch maar merk wel op dat wederom de winst van de ene spelergelijk is aan het verlies van de ander Kortom voor ieder strategieprofiel s isin S is de som van deuitbetalingen u1(s) + u2(s) = 0 Zulke spelen noemen we nulsom-spelen

Wederom zijn er geen Nash evenwichten Nog steeds is het zo dat de spelers wederzijds in-formatie omtrent speelgedrag kunnen uitbuiten Als speler 1 waarschijnlijk K 1 speelt dan loonthet voor speler 2 om M 2 te spelen etcetera Echter deze waarschijnlijkheden waarop de keuzegebaseerd is verandert en zullen ook ongelijk zijn omdat het spel niet meer symmetrisch is Webekijken het eens wat preciezer en proberen antwoord te geven op de volgende vragen

(a) Hoe onvoorspelbaar moet speler 1 spelen dwz met welke kans p wordt K 1 gespeeld

(b) Gegeven de kans q op K 2 van speler 2 wat is een optimale reactie van speler 1

We beginnen met de eerste vraag Er geldt

u1( pK 2) = p middot 1 + (1 minus p) middot minus2 = 3 p minus 2

u1( pM 2) = p middot minus2 + (1 minus p) middot 2 = 2 minus 4 p

Wanneer 3 p minus 2 gt 2 minus 4 p dan kan speler 2 dit uitbuiten door M 2 te spelen want dat minimaliseertde verwachte opbrengst voor speler 1 en aangezien het spel een nulsom-spel is maximaliseert dusde verwachte opbrengst voor speler 2 Dit is precies het geval voor alle p gt 4

7 Net zo wordt

speler 1 uitgebuit wanneer p lt 47

in het geval speler 2 optimaal tegenspeelt met K 2 Wanneerspeler 1 optimaal tegenspel veronderstelt dan kan speler 1 zijn minimale verwachte uitbetaling

25

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 26: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2649

maximaliseren door p = 47

Deze strategie wordt daarom ook minmax strategie genoemd In datgeval zorgt speler 1 ervoor dat speler 2 dezelfde uitbetaling krijgt ongeacht zijn strategie

Veronderstel dat speler 2 met kans q strategie K 2 gebruikt Wat is een optimale reactie vanspeler 1 We bepalen eerst de verwachte uitbetalingen voor de verschillende strategieen

u1(K 1 q ) = q middot 1 + (1 minus q ) middot minus2 = 3q minus 2

u1(M 1 q ) = q middot minus2 + (1 minus q ) middot 2 = 2 minus 4q

Hieraan zien we dat wanneer 3q minus 2 = 2 minus 4q dan kan speler 1 dit uitbuiten en is speler 2 hetslachtoffer Speler 2 is er dus bij gebaat om zo onvoorspelbaar te spelen dat de kans op M 2 gelijk isaan q = 4

7 Merk op dat in dat geval de strategieen M 1 en K 1 dezelfde verwachte uitbetaling voor

speler 1 opleveren Beide spelers kunnen zich niet eenzijdig verbeteren met een andere randomisatiestrategie dan voorgeschreven in het profiel kansen ( plowast q lowast) = ( 4

7 47)

Speler 1 kan zich via randomisatie verzekeren van een maximale betaling 27

Zo ook kan speler 2zich verzekeren van een betaling van minimaal 2

7 mits randomisatie tot de mogelijkheden behoort

Bovenstaande voorbeelden laten zien dat het soms wenselijk is dat spelers andere typen vanstrategieen kunnen gebruiken gemengde strategie en in het bijzonder Een speler kan zijn actieverbergen door het gooien van een dobbelsteen munten of door het draaien aan een roulette wielDe spelers gebruiken randomisatie-mechanismen om een bepaalde kansverdeling over de strategieente implementeren We zullen nu het een en ander gaan formaliseren

Definitie 63 Voor een gegeven spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm definierenwe een gemengde strategie voor speler i als een kansverdeling over zijn strategieen in S i dat wilzeggen een functie σi S i rarr R+ zodat

sumsiisinS i

σi(si) = 1 voor alle i isin N De verzameling van allegemengde strategieen van speler i noteren we met Σi

Voor een gemengde strategie σi interpreteren we σi(si) als de kans waarmee de strategie si isin S iwordt gespeeld Speciale gemengde strategieen zijn die σi isin Σi die kans 1 toekennen aan eenbepaalde si isin S Deze strategieen heten zuiver We zullen als er geen verwarring mogelijk is dezestrategie dan als si noteren

Aan de andere kant noemen we een gemengde strategie σi isin Σi waaraan iedere si isin S i eenpositieve kans wordt toegekend dwz forallsi isin S i σi(si) gt 0 een volledig gemengde strategie

Wanneer een speler eindig veel strategieen heeft dan kunnen we een gemengde strategie ookmet een kansvector aangeven Dit zullen we nog veel gebruiken in de matrixspelen Bijvoorbeeldin Matching Pennies kunnen we de strategie met kans 13 M en kans 23 K spelen aangeven met(13 23)

Het lijkt alsof gemengde strategieen in de praktijk niet zo veel voorkomen Maar dit kan goedeen bewuste keuze zijn Soms worden ze echter wel gebruikt Het Gemeentelijk Vervoersbedrijf probeert via weloverwogen controles het zwartrijden te beperken de betere tennisspelers varierenhun servicegedrag en voetballers randomiseren bij het nemen van penalties Dit laatste voorbeeld

26

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 27: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2749

illustreert prima een andere interpretatie van een gemengde strategie Bij WKrsquos en andere grotevoetbaltoernooien bereiden keepers zich voor op de penalty series door van iedere speler de frequen-ties te bestuderen dat er links middendoor of rechts werd ingeschoten Klaarblijkelijk kent eenkeeper aan de relatieve frequenties een gemengde strategie toe Zo ook zijn in spelen die zeer vaakgespeeld worden en met varierende tegenstanders de frequenties van de zuivere strategieen van detegenstanders equivalent met gemengde strategieen van de tegenstanders Zo kan je een gemengdestrategie opvatten als een verdeling van potentiele tegenstanders in een grote populatie waarbijbekend is dat iedere speler een bepaalde zuivere strategie speelt Wanneer in zulke populaties jeieder individu met gelijke kans treft dan simuleren de frequenties een gemengde strategie van detegenstander

In veel situaties is deze interpretatie niet van toepassing Toch kan je belang hechten aan ge-

mengde strategieen Wanneer een speler probeert te bedenken wat andere spelers doen of gaandoen zal hijzij kansen toekennen aan de verschillende mogelijke strategieprofielen voor de anderespelers Daarbij wetend dat alle spelers onafhankelijk van elkaar beslissen zijn deze kansen onaf-hankelijk voor iedere speler Formeel gesproken resulteert dit in een gemengd strategieprofiel overde strategische keuzes voor de andere spelers In deze interpretatie staan gemengde strategieenmodel voor de wijze waarop spelers redeneren over hun tegenspelers en op een manier die consistentis met de regels van het spel Gemengde strategieen worden zo gebruikt om onzekerheid over deandere spelers te modelleren

Een gemengd strategieprofiel σ = (σi)iisinN bepaalt een kansverdeling over combinaties vanstrategieen volgens

σ(s) = σ(s1 s2 sn) =

n

prodi=1

σi(si) voor alle s isin S

We schrijven Σ = timesiisinN Σi voor de verzameling van alle gemengde strategieprofielen Voor gegevenkansverdeling over combinaties van zuivere strategieen kunnen we de uitbetalingsfuncties uitbreidennaar de ruimte van gemengde strategieen We definieren voor speler i de verwachte uitbetaling doorde functie U i Σ rarr R met6

U i(σ) =991761sisinS

σ(s)ui(s)

Definitie 64 Gegeven is het spel G = ⟨N (S i)iisinN (ui)iisinN ⟩ in strategische vorm De gemengde uitbreiding voor G is het oneindige spel in strategische vorm

Γ(G) = ⟨N (Σi)iisinN (U i)iisinN ⟩

Definitie 65 Een zuiver strategieprofiel slowast isin S is een zuiver Nash evenwicht als slowast isin N E (G)Een gemengde strategieprofiel σlowast isin Σ is een Nash evenwicht van de gemengde uitbreiding of eengemengd Nash-evenwicht als σlowast isin N E (Γ(G))

6Als model deugt dit alleen als de preferenties van spelers over loterijen zich laten modelleren via verwacht nutDit is ondermeer zo voor zgn von Neumann-Morgenstern preferenties

27

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 28: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2849

Voorbeeld 66 Beschouw nogmaals Matching Pennies

K M K 1 minus1 minus1 1M minus1 1 1 minus1

Dit spel heeft geen Nash evenwicht in zuivere strategieen Maar wel een Nash evenwicht in ge-mengde strategieen namelijk (( 12 12 ) ( 12 12)) Schrijf σ1 = ( p 1minus p) voor een willekeurige gemengdestrategie voor speler 1 dan

U 1(σ1 (12

12

)) = p middot (12 middot 1 + 1

2 middot minus1) + (1 minus p) middot (12 middot minus1 + 1

2 middot 1) = 0

Dus ongeacht hoe speler 1 randomiseert de uitbetaling is 0 Maar dat betekent ook dat (12

12) isin

B1(( 12

12

)) Zo ook volgt uit symmetrie overwegingen ( 12

12

) isin B2((12

12

))

Opgave 61 In de film Cry Baby proberen twee jongens indruk te maken door op elkaar inte rijden degene die als eerste van zijn ramkoers wijkt wordt aangemerkt als angsthaas en lijdtgezichtsverlies bij zijn vrienden In het geval geen van beiden afwijken volgt onherroepelijk heteindehuis Dit spel staat ook wel bekend als Game of Chicken en laat zich vertalen in het volgende2 times 2 bimatrixspel G

S DS minus1 minus1 minus10 0D 0 minus10 minus100 minus100

Laat zien dat in een Nash evenwicht in gemengde strategie en beide spelers met kans 191 rechtuitrijden

Het is de nu komende stelling van John Nash die wereldfaam heeft gekregen Het laat zien datvoor eindige spelen er altijd een gemengd evenwicht te vinden is

Stelling 67 (Nash 1950) Ieder eindig spel in strategische vorm G heeft een Nash evenwicht in bijbehorende gemengde uitbreiding ofwel N E (Γ(G)) = empty7

Het bewijs is een toepassing van de dekpuntstelling van Brouwer

Hoewel bovenstaande stelling het bestaan van een Nash evenwicht in gemengde strategieengarandeert geeft het nog geen recept hoe je die zou kunnen vinden Daartoe helpen onderstaande

twee stellingen Een voorbeeld illustreert het direct gebruik ervan Ze zijn evenwel wat bredertoepasbaar omdat er geen beperkingen als eindige strategieenverzameling nodig is

Stelling 68 Stel si sprimei zijn zuivere beste antwoorden op σminusi isin Σminusi in de gemengde uitbreiding Γ(G) Dan is iedere randomisatie over si en sprimei een beste antwoord op σminusi Kort gezegd

si sprimei isin Bi(σminusi) =rArr σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi) voor alle λ isin [0 1]

7In de oorspronkelijke versie staat de eis dat er maar eindig veel spelers zijn maar dat ligt hier in de definitievan spel in strategische vorm besloten

28

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 29: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 2949

Bewijs Stel si sprimei isin Bi(σminusi) Dan U i(si σminusi) = U i(sprimei σminusi) en dus

U i(σi σminusi) = U i(λsi + (1 minus λ)sprimei σminusi) = λU i(si σminusi) + (1 minus λ)U i(sprimei σminusi)

= λU i(si σminusi) + (1 minus λ)U i(si σminusi)

= U i(si σminusi)

Dit betekent dat σi equiv λsi + (1 minus λ)sprimei isin Bi(σminusi)

Stelling 69 Stel σlowast isin N E (Γ(G)) Als de zuivere strategie si geen best antwoord is op het gemengd

strategieprofiel σ

lowast

minusi dan wordt deze in σ

lowast

met kans 0 gespeeld Anders geformuleerd si isin Bi(σlowast

minusi) =rArr σlowasti (si) = 0

Voorbeeld 610 Bovenstaande stellingen kan je prima gebruiken om beste-antwoordcorrespondentiesop te stellen Bekijk het volgende spel

L RT 1 2 3 0B 0 0 4 1

Stel speler 2 speelt L met kans q Dan

U 1(T q ) = q middot 1 + (1 minus q ) middot 3 = 3 minus 2q

U 1(B q ) = q middot 0 + (1 minus q ) middot 4 = 4 minus 4q

Dan volgt

T isin B1((q 1 minus q )) lArrrArr 3 minus 2q ge 4 minus 4q lArrrArr q ge 12

en

B isin B1((q 1 minus q )) lArrrArr 3 minus 2q le 4 minus 4q lArrrArr q le 12

Omdat voor q = 12

beide strategieen een best antwoord zijn geldt dat iedere randomisatie over T en B een best antwoord is We zien dan

B1((q 1 minus q )) =

(1 0) als q gt 12

( p 1 minus p) p isin [0 1] als q = 1

2(0 1) als q lt 1

2

Zie onderstaande figuur

29

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 30: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3049

0

1

1

q

12

p

Stel nu dat speler 1 randomiseert met ( p 1 minus p) Dan

U 2(L p) = p middot 2 + (1 minus p) middot 0 = 2 p en

U 2(R p) = p middot 0 + (1 minus p) middot 1 = 1 minus p

Bekijk dan de beste antwoorden voor speler 2

L isin B2(( p 1 minus p)) lArrrArr 2 p ge 1 minus p lArrrArr p ge 13

en

R isin B2(( p 1 minus p)) lArrrArr 2 p le 1 minus p lArrrArr p le 13

Omdat voor p = 13

zowel L als R een beste antwoord zijn geldt dat iedere randomisatie over L enR een best antwoord is We zien dan

B2(( p 1 minus p)) =

(1 0) als p gt 13

(q 1 minus q ) q isin [0 1] als p = 13

(0 1) als p lt 13

In onderstaande figuur zie je de beste antwoorden als functie van p weergegeven Rechts de figuurals we beide beste antwoordcorrespondenties samen afbeelden De intersecties zijn precies de Nashevenwichten

0

1

1

q

13 p 0

1

1

q

13

12

p

Dus Nash evenwicht zijn ((1 0) (1 0)) ((0 1) (0 1)) en ((13 23) (12 12))

30

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 31: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3149

Opgave 62 Bepaal de Nash evenwichten in zuivere en gemengde strategieen van het spel G

L RT 5 2 1 3B 2 1 4 1

Opgave 63 Beredeneer welke van onderstaande figuren een beste-antwoordcorrespondentie zoukunnen voorstellen bij een tweepersoons-2 times 2-bimatrixspel Hierbij geeft p respectievelijk q dekans aan waarmee speler 1 respectievelijk 2 strategie 1 speelt

0

1

1

q

a

p 0

1

1

q

b

c p

Opgave 64 Geef een voorbeeld van een 2 times 2 bimatrixspel waarvoor de verzameling Nash even-wichten in gemengde strategieen precies overeenkomt met de beste-antwoordcorrespondentie vanspeler 2 als in onderstaande figuur

0

1

1

q

1

3 p

Opgave 65 Geef een voorbeeld van een 2 times 2 bimatrixspel G met als verzameling van Nashevenwichten N E (Γ(G)) = ((1 0) (q 1 minus q ))

13 le q le 1 in de gemengde uitbreiding

31

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 32: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3249

0

1

1

q

13

p

Dominantie

De eerder gegeven definities van dominantie kunnen we ook toepassen op de gemengde uitbreidingΓ(G) Zoals al eerder opgemerkt is kan je een zuivere strategie opvatten als een speciale gemengdestrategie Daarom zullen meer strategieen gedomineerd worden in de gemengde uitbreiding

Voorbeeld 611 Bekijk eens de volgende twee 2-persoons-matrixspelen waarbij alleen de uitbe-talingen voor de rij-speler 1 zijn aangegeven

G1 L RT minus4 0

M 0 minus4B minus3 minus3

G2 L RT 4 0

M 0 4B 3 3

In de gemengde uitbreiding Γ(G1) bij het linker spel wordt de derde rij bij B gedomineerd dooreen gemengde strategie waarbij de eerste twee rijen ieder met kans 12 wordt gespeeld In Γ(G2)wordt dezelfde gemengde strategie gedomineerd door de derde rij bij B Hieruit volgt dus dat eenzuivere strategie door een gemengde strategie gedomineerd kan worden en omgekeerd

Je kan je afvragen wat nu precies de relatie tussen dominantie in Γ(G) en G is oftewel wat derelatie tussen gedomineerde zuivere en gemengde strategieen is De volgende stelling doet hierovereen uitspraak

Definitie 612 De drager D(σi) van een gemengde strategie σ

i isin Σ

i is de strategie

umlenverzameling

D(σi) sube S i met alle zuivere strategieen die met positieve kans in σi worden gespeeld dat wil zeggenvoor alle si isin D(σi) geldt σi(si) gt 0 en voor alle sprimei isin D(σi) (maar s primei isin S i) geldt σi(sprimei) = 0

Stelling 613 Stel dat in Γ(G) de drager van een gemengde strategie σi isin Σi een (zwak) gedomi-neerde strategie si isin S i bevat dan wordt σi (zwak) gedomineerd

Dit betekent dat we bij het bepalen van N E (Γ(G)) gedomineerde zuivere strategieen buitenbeschouwing kunnen laten en kunnen elimineren uit de bimatrix Dit eliminatieproces kunnen we

32

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 33: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3349

zonodig herhalen in een IE(W)DS procedure Er geldt ook net als voorheen in Hoofdstuk 5 dateen Nash evenwicht in gemengde strategieen een verfijning is van (strikt) IEDS

Stelling 614 Voor een spel met gemengde uitbreiding Γ(G) geldt NE (Γ(G)) sube IEDS (Γ(G))

Voorbeeld 615 Beschouw het 2 times 3 bimatrixspel G

L M RT 1 1 1 3 3 0B 0 1 0 0 4 4

Bepaal N E (Γ(G))

Oplossing We zien meteen de Nash evenwichten in zuivere strategieen (T M ) en (B R) Ineen gemengd evenwicht wordt de strategie L niet gebruikt aangezien L gedomineerd wordt door(0 12 12) Dus kunnen we kijken naar het gereduceerde spel Gprime

M RT 1 3 3 0B 0 0 4 4

Als speler 1 met kans p de eerste rij speelt en speler 2 met kans q de eerste kolom dan luiden devergelijkingen voor een Nash evenwicht in gemengde strategieen

3 p = 4(1 minus p) q + 3(1 minus q ) = 4q

Hieruit volgt p = 47 en q = 12 Dus met strategieen als kansvectoren luidt de oplossing

NE (Γ(G)) = ((1 0) (0 1 0)) ((0 1) (0 0 1)) ((47 37) (0 12 12))

Opgave 66 Gegeven is het 3 times 3 bimatrixspel G

L C RT minusa 2 3 0 0 minusaM 0 0 1 1 0 0B 2a 3 0 0 minusa 2

waarbij a een gegeven positief getal is

(a) Bepaal de Nash evenwichten in zuivere strategieen

(b) Laat zien dat speler 2 de strategie R in geen enkel evenwicht zuiver of gemengd speelt

(c) Bepaal alle evenwichten in gemengde strategieen

33

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 34: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3449

Opgave 67Gegeven is het tweepersoonsspel G

L C RT 2 1 2 1 1 0M 2 2 1 1 0 2B 1 1 1 1 2 1

De gemengde uitbreiding van G noteren we met Γ(G)

(a) Bepaal IEWDS (G) en IEDS (G)

(b) Bepaal N E (G)

(c) Laat zien dat NE (Γ(G)) geen evenwichten in volledig gemengde strategieen (waar alle stra-tegieen T M B en LCR met positieve kans worden gespeeld) bevat

(d) Zijn er evenwichten in NE (Γ(G)) die niet zuiver zijn

7 Spelen in uitgebreide vorm

Voor veel speltheoretische concepten is het beter om een andere weergave van een spel te gevendan alleen in strategische vorm Zo hebben we aangenomen dat spelen in de strategische vormsimultaan gespeeld worden Echter in de praktijk zijn er vele situaties te bedenken waarbij een

chronologie van belang is Niet alleen moet beschreven worden wat de spelers ondernemen maar ookwanneer en in welke volgorde Deze aanpak wordt geintegreerd middels de zogenaamde uitgebreide vorm

In het komende stuk zullen we gebruik maken van de representatie van spelen mbv bomen een wiskundige begrip uit de grafentheorie Om een en ander aanschouwelijk te kunnen makenzal de aandacht vooral uitgaan naar die spelen waarbij de relevante bomen grafisch weergegevenkunnen worden

Bekijk nu eens de volgende figuur die model staat voor een spelboom

Spelboom

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

34

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 35: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3549

Een dergelijke boom geeft alle mogelijke beslissingen en hun gevolgen in een spel weer zodat iedermogelijk verloop in de tijd herkenbaar wordt dit bepaalt dan precies de dynamische structuur vanhet spel Zoals in een beslissingsboom bepalen de beslissingsknopen spelsituaties waarin een vande spelers een beslissing moet nemen over de dan te nemen actie Om welke speler het gaat wordtbij de knoop aangegeven Zorsquon beslissing wordt een zet genoemd In het bovenstaande spel kanbijvoorbeeld speler 1 in de bovenste knoop kiezen tussen zetten A en B De verzameling van allezetten in deze beslissingsknoop is daarom M 1 = A B Natuurlijk hoeft een verzameling zettenniet altijd uit precies twee elementen te bestaan maar kan uit een willekeurig aantal bestaanen zelfs oneindig veel De verzameling zetten wordt in een spelboom weergegeven door uit de

beslissingsknopen ontspringende kanten Hoewel de kanten niet gericht zijn geldt stilzwijgend deovereenkomst dat alleen voorwaartse beweging mogelijk is Een spelboom bestaat dus altijd uiteen gerichte graaf Een bijzondere beslissingsknoop is de startknoop waar het spel begint In ditdictaat zal dit altijd de unieke bovenste knoop zijn en het spel verloopt van boven naar onder 8

Naast beslissingsknopen kent een spelboom ook eindknopen waar geen beslissingen meer genomenworden Deze bepalen de speluitkomsten ze hebben geen opvolgende knoop In bovenstaandvoorbeeld worden deze aangegeven met een open cirkeltje Normaal staan bij deze knopen deuitbetalingsvectoren

Hierboven heeft speler 1 eerst de keus uit A of B Kiest speler 1 A dan houdt het spel op enwordt het eindresultaat gegeven door de uitbetalingsvector (1 5) 1 voor speler 1 en 5 voor speler2 Heeft speler 1 echter B gekozen dan komt speler 2 aan bod en deze kiest dan tussen C en DVervolgens kiest speler 1 tussen E en F bij C en tussen G en H bij zet D van speler 2

Voorbeeld 71 Entry GameHet bedrijf Coca Cola beslist of het al dan niet zal toetreden op een markt waar alleen Pepsiopereert Als Coca Cola tot toetreden Entry besluit heeft Pepsi twee mogelijke reacties namelijkTough en Accommodating Dit spel wordt in onderstaande boom weergegeven

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

8Maar deze conventie geldt alleen lokaal er zijn boeken waar spelbomen anders gerepresenteerd worden Eenstartknoop is in ieder geval altijd daaraan herkenbaar dat deze geen voorganger heeft

35

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 36: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3649

Toeval wordt in uitgebreide spelen als zelfstandige speler weergegeven Deze toevalsspeler wordtook wel met Nature aangegeven De interpretatie van de verschillende spelers is eenduidig detoevalsspeler representeert het stochastisch element van een spel en de persoonlijke spelers hetstrategische element In de weergave wordt toeval precies zo behandeld als een speler die een zetkiest met het enige verschil dat meestal aan de betreffende kanten de kansen staan die Nature gebruikt Dit betekent ondermeer dat alle spelers van dezelfde kansverdeling over de zetten van detoevalsspeler uitgaan ndash een aanname waar in de speltheorie vaak stilzwijgend van wordt uitgegaanToeval wordt in spelbomen precies zo weergegeven als voor beslissingsbomen in de klassieke beslis-singstheorie normaal is Vaak wordt toeval met spelernummer 0 aangegeven en de toevalsspelerkomt als eerst aan zet Hieronder een voorbeeld

Voorbeeld 72 Hieronder genereert Nature de kans dat speler 1 of speler 2 aan zet komt

1 1 0 0 0 0 1 1

w 1minus w

ℓ r L R

Nature

21

De toevalsspeler Nature speelt vooral een belangrijke rol in spelen met onvolledige informatie Dit zijn spelen waarin er sprake is van onzekerheid over de zetten die spelers tot beschikking hebbenenof de uitbetalingen die spelers aan het einde van het spel krijgen Deze onzekerheid wordt dangemodelleerd door de introductie van een toevalsspeler en gebrek aan informatie over de zet die detoevalsspeler heeft gespeeld In dit introducerend vak zullen we echter alleen spelen met volledige informatie beschouwen Hierin speelt toeval geen rol en we laten daarom de toevalsspeler buitenbeschouwing

Opmerking Een spel met volledige informatie is niet hetzelfde als een spel met perfecte infor-matie Kort gezegd is een spel met volledige informatie een spel waarin toeval geen rol speelt of waarin alle spelers op het moment van beslissen waargenomen hebben wat het toeval heeft gedaanEen spel met perfecte informatie is een spel waarin de informatie volledig is en alle spelers hebbenop het moment van beslissen waargenomen welke zetten de andere spelers hebben gespeeld Eenpreciezere definitie van een spel met (im)perfecte informatie volgt in de volgende paragraaf

Imperfecte informatie

De bovenstaande beschrijving van een spel als spelboom is ideaal in het geval spelers om enom aan zet zijn en iedere speler neemt waar wat tot dan toe is gespeeld Met betrekking totde beschrijving van de informatie voor alle spelers krijgen we echter een eerste moeilijkheid alshet mogelijk moet zijn om zetten te kiezen zonder dat de uiteindelijke keuze aan de tegenstanders

36

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 37: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3749

bekend wordt gemaakt of dat de andere spelers deze niet kunnen waarnemen Zo kunnen weondermeer met een spelboom alleen nog niet de situaties als in de vorige hoofdstukken modellerenwaarbij spelers simultaan beslissingen nemen

Voorbeeld 73 Beschouw een zuiver coordinatiespel waarin beide spelers links of rechts kiezenen graag willen coordineren op dezelfde keuze In strategische vorm ziet het spel er als volgt uitmet twee zuivere Nash-evenwichten (L l) en (R r)

l rL 1 1 0 0R 0 0 1 1

Een mogelijke beschrijving van zorsquon spel met een spelboom zou het figuur hieronder kunnen zijnMaar het is duidelijk dat onderstaand spel niet de essentie van een coordinatiespel vat Eenspelboom vraagt namelijk een specifieke volgorde waarin zetten worden gedaan en omdat de tweedespeler dan altijd de beslissing kent die de eerste speler genomen heeft wanneer hij aan zet is wordthet coordinatiespel triviaal Voor speler 2 bestaat er hieronder eigenlijk geen beslissingsprobleemdit in tegenstelling tot de essentie van een coordinatiespel Speler 2 moet daar beslissen zondervan de zet van speler 1 op de hoogte te zijn

Ontaard coordinatie spel

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Om dit soort algemene spelsituaties te kunnen modelleren worden zogenaamde informatiever-zamelingen ingevoerd Een informatieverzameling van een speler is een verzameling van knopenzodat wanneer een speler aan zet is in een bepaalde knoop hij niet deze knoop van een andere indeze verzameling weet te onderscheiden De speler weet ten hoogste dat hij zich in een van deknopen uit deze informatieverzameling bevindt maar niet welke precies In een spelboom zullenwe informatieverzamelingen met een ovaal of een stippellijn aangeven Daarmee kunnen we ooksimultane beslissingen weergeven en is het nu voorliggende model (van spelbomen en informatie-

verzamelingen) een generalisatie van de spelen in strategische vorm

Voorbeeld 74 Bovengenoemd coordinatiespel kunnen we op de volgende manieren weergeven

37

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 38: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3849

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Simultaan zetten

1 1 0 0 0 0 1 1

L R

ℓ r ℓ r

1

22

Opgave 71 Laat zien dat bovenstaand boomdiagram niet uniek is dwz er is nog een andereequivalente beschrijving

Merk in bovenstaand voorbeeld op dat speler 2 nu weer dezelfde zetten uit kan voeren als hijaan de beurt is Dit ter onderscheid van de eerste situatie waarbij hij de situatie waarin hij aanzet komt kan onderscheiden De samenvatting van informatie door middel van een verzamelingknopen is dan alleen zinvol als een speler de zetten die daarbij beschikbaar zijn voor iedere knoophetzelfde zijn De volgende modellering is zinloos

Voorbeeld 75 Simultaan zetten onzinnige weergave

1 1 0 0 0 0 1 12 1

L R

ℓ r ℓ rm

1

22

Hier is de informatie voor speler 2 niet zinvol beschreven omdat hij meteen zou weten dat hijzich in de rechterknoop bevindt als zich daar drie mogelijke zetten voor zouden doen en in delinkerknoop maar twee Je kan dit alleen vermijden door te veronderstellen dat de speler totaalniet weet welke zetten er beschikbaar zijn maar dit is natuurlijk niet mogelijk omdat hij geenzinnige keus kan maken zonder zijn opties te kennen

Voor ieder speler lijkt het dus alsof in iedere beslissingsknoop in een bepaalde informatie-verzameling dezelfde zetten mogelijk zijn De zetten die voor een speler eenzelfde zet schijnen worden grafisch ook met dezelfde letter aangeduid Zie hierboven in de juiste weergave van het

38

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 39: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 3949

coordinatiespel waarbij de zetten ℓ en r gelabeled zijn terwijl in Voorbeeld 73 nog een verschilgemaakt wordt tussen ℓ L en r R We maken dus onderscheid tussen zetten die voor de spelers teonderscheiden zijn

Definitie 76 Een spel in uitgebreide vorm wordt bepaald door

(a) Verzameling spelers N = 0 1 2 n Hierbij staat 0 voor de toevalsspeler Nature

(b) Een gerichte boom G = (K E ) met knopenverzameling K en kanten E

(c) een partitie9 K 0 K 1 K 2 K n K U van K waarbij voor i isin N de verzameling K i staatvoor de knopen waar speler i aan zet is De zetten voor speler i in knoop k worden gegeven

door de kanten in E die uit k vertrekken Verder is K 0 de knopenverzameling waar Nature toevalszetten genereert en de knopen in K U zijn de uiteinden van de boom de knopenvanwaar geen kant in E meer vertrekt Dit zijn de uitbetalingsknopen en deze specificerenhet eind van het spel

(c) Bij iedere eindknoop k isin K U is er een uitbetalingsvector uk isin RN gegeven met uki als

uitbetaling voor speler i

(d) Informatie die de spelers hebben als ze aan zet zijn Voor iedere speler i kunnen we dit

aangeven door een partitie van de beslissingsknopen K i K 1i K p(i)i zodat speler i

knoop k isin K ji niet kan onderscheiden van andere elementen in K ji

Dit wordt verstaan onder de regels van het spel We zullen aannemen dat alle spelers deze

regels weten dus ze kennen de complete spelboom

Definitie 77 Bij een spel met perfecte informatie is iedere speler altijd over alle in een eerdertijdstip genomen zetten geınformeerd10 In zulke spelen bestaat iedere informatieverzameling uiteen unieke beslissingsknoop Bevat een spel minstens een informatieverzameling met meerderebeslissingsknopen dan gaat het om een spel met imperfecte informatie

Voorbeeld 78 Zou schaken gemodelleerd worden als spel in uitgebreide vorm dan is het eenspel met perfecte informatie omdat iedere zet voor de tegenstander te zien is

Opmerking

(a) Let op Perfecte informatie is wat anders dan volledige informatie Perfecte informatiebetekent dat alle daarvoorgenomen zetten waargenomen zijn op het moment dat een spelerbeslist Volledige informatie betreft kennis over preferenties en mogelijke zetten van spelers

9Een partitie houdt in dat de verzameling van alle knopen in de verschillende elementen is gelijk aan K en dedoorsnede van twee verschillende elementen is leeg

10Dit wil zeggen dat alle beslissingen van de tegenspelers waarneembaar zijn

39

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 40: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4049

(b) Wanneer de mogelijkheid bestaat dat spelers informatie uitwisselen dan wordt dit als apartezet gemodelleerd

We zijn de studie van spelen begonnen met het formaliseren van de mogelijkheden van despelers om een uitkomst van een interactief proces te beinvloeden In spelen in uitgebreide vormliggen die mogelijkheden besloten in de zetten die een speler kan doen Een combinatie van zettennoemen we een strategie Formeel

Definitie 79 Een strategie van een speler bepaalt een volledig spelplan wat betekent dat despeler aan ieder van zijn informatieverzamelingen een zet toekent

Dit houdt ondermeer in dat bij een strategie een speler gebonden is aan bepaalde afgesprokenzetten in latere fases in het spel

De intuıtie achter een spel in uitgebreide vorm is dat de spelers hun strategie opschrijven enbij een arbitratiecommissie neerleggen die ervoor zorgt dat de zetten uitgevoerd worden zoals despelers hebben aangegeven Iedere combinatie van strategieen zorgt zo voor een bepaald spelverloopmet een bepaalde speluitkomst Op deze manier kan ieder spel in uitgebreide vorm teruggebrachtworden tot een spel in strategische vorm

Voorbeeld 710 Bekijk het onderstaande spel in uitgebreide vorm

1 1 0 0 0 0 1 1

L R

ℓ r L R

1

22

Dit is een spel met perfecte informatie want de informatieverzamelingen van beide spelers bestaanuit een enkele beslissingsknoop Speler 1 heeft 1 informatieverzameling en daarom de twee strate-gieen L en R Speler 2 heeft twee informatieverzamelingen met ieder twee zetten dus is het aantalstrategieen van speler 2 gelijk aan 4 te weten ℓL ℓR rL en rR In strategische vorm ziet dit speler dan als volgt uit

ℓL ℓR rL rRL 1 1 1 1 0 0 0 0R 0 0 1 1 0 0 1 1

Dit spel heeft vier Nash evenwichten namelijk (L ℓL) (L ℓR) (R ℓR) en (R rR) We zullen ditnu ook als Nash evenwichten van het spel in uitgebreide vorm gaan beschouwen

Definitie 711 Een profiel van strategieen van een spel in uitgebreide vorm is een Nash evenwichtals deze een Nash evenwicht is in het geassocieerde spel in strategische vorm

40

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 41: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4149

Opgave 72 Beschouw nogmaals de Coca Cola ndash Pepsi situatie

O E

T A

Coca Cola

Pepsi

0 5

minus2minus1 1 2

(a) Bepaal alle strategieen van Coca Cola en Pepsi

(b) Bepaal N E (G)

Opgave 73 Beschouw het spel uit de inleiding tot dit hoofdstuk G

1 5

2 4 3 3 2 7 9 8

A B

C D

E F G H

1

2

11

(a) Bepaal alle strategieen van speler 1 en 2

(b) Bepaal N E (G)

Verdere aannamesNormaliter wordt voor informatieverzamelingen verder nog aangenomen dat twee op elkaar vol-gende beslissingsknopen niet in dezelfde informatieverzameling zitten Namelijk als dit het gevalis dan weet de speler in de tweede knoop blijkbaar niet meer of hij nog moet zetten of dat hetresultaat van de beslissing al verwezenlijkt is Het kan echter wel voorkomen dat een speler zijnbeslissingen in de loop van het spel vergeet

Voorbeeld 712 Hieronder herinnert speler 1 zich in tweede instantie niet of als startende spelerde beurt naar speler 2 is gegaan of niet

41

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 42: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4249

1

2

1

Definitie 713 Wanneer in een spel G iedere speler zich op ieder moment bewust is van eigen

acties in een eerdere spelfase dan spreken we van een spel met volledige herinnering (perfect recall )

Deelspelperfect evenwicht

Eerder zagen we dat spelen in strategische vorm niet altijd een Nash-evenwich in zuivere stra-tegieen hoeven te hebben alhoewel eindige spelen wel altijd een Nash-evenwicht in gemengdestrategieen hebben Hoe zit dat bij spelen in uitgebreide vorm

Stelling 714 (Kuhnrsquos algoritme) Ieder eindig spel in uitgebreide vorm met perfecte informatie

heeft een Nash evenwicht

We zullen geen formeel bewijs voor deze stelling geven maar de systematiek illustreren aan dehand van een voorbeeld Het bewijs bestaat daaruit dat voor ieder spel met perfecte informatieeen Nash evenwicht geconstrueerd wordt Zie volgend voorbeeld

Voorbeeld 715 Entry Game (2)Beschouw de situatie als in de eerder besproken Entry Game Coca Cola besluit tot intrede inde markt E of erbuiten blijven O Pepsi reageert fel T of past zich aan A bij intrede van CocaCola Stel nu dat Coca Cola de reactie van Pepsi afwacht en daarop een zelfde soort reactie geeftals Pepsi Coca Cola is agressief T of coulant A Waar bij de outside optie van Coca Cola hetbedrijf Pepsi de monopolistische winst 5 behaalt is bij E nog maar 3 mogelijk Onafhankelijk

van de verdere acties van Coca Cola verdient Pepsi 1 Daarnaast valt het marktsegment waaraannog 2 te verdienen is Deze wordt gelijk verdeeld bij gelijke zetten AA en T T Het bedrijf datals enige T speelt krijgt 2 erbij Echter het agressief opereren op de markt middels reklame enprijsstunten kent zijn prijs T kost in ieder geval 3 We hebben dan de situatie als in onderstaandboomdiagram

42

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 43: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4349

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De strategieen van de spelers worden gegeven door

S P = T A

S C = OTTOTAOATOAAETTETAEATEAA

Hierbij moet je de strategie van Coca Cola als volgt lezen de eerste letter bepaalt de strategiein informatieverzameling 1 O of E De tweede bepaalt of Coca Cola met T of A op T van Pepsireageert en de derde of Coca Cola met T of A of A van Pepsi antwoordt We kunnen met door allecombinaties van strategieen bij elkaar te zetten en uitbetalingen te vergelijken makkelijk de Nashevenwichten vinden en concluderen dat er meerdere zijn Maar dat doen we nu niet

Kijk eens naar de allerlaatste zetten in het spel waar Coca Cola reageert op de zet van PepsiIn een Nash evenwicht zal een speler op dit niveau optimaal willen presteren en een van die zettenkiezen die de hoogste uitbetaling leveren Zo ook Coca Cola Het maakt niet uit wat Pepsi doet na

E A is optimaal voor Coca Cola Als Coca Cola in de situatie gebracht wordt op T te reagerendan is A optimaal Op A van Pepsi is A optimaal voor Coca Cola Deze zetten leggen we nu vastvanaf dit spelmoment kan Coca Cola zich niet verbeteren In de spelboom hieronder geven we dezevastgelegde zetten aan met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Gegeven deze zetten van Coca Cola vergelijkt Pepsi de uitbetalingsvectoren (0 0) bij T en (1 2)bij A Dus in dat geval is het voor Pepsi optimaal om A te kiezen en deze zet leggen we vast

43

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 44: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4449

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Nu gaan we nog een stapje hoger in de beslissingsboom en komen we bij de startspeler uit Coca

Cola vergelijkt nu de uitbetalingsvectoren (0 5) bij O en (1 2) bij E en kiest dus E Dit resulteertin strategie EAA voor Coca Cola dwz eerst wordt E gespeeld en op beide zetten van Pepsiwordt geantwoord met A Het strategieprofiel (EAAA) is een Nash evenwicht In de spelboom isdit strategieprofiel weergegeven met dikke kanten

Entry Game (2)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

Wat we eigenlijk in bovenstaand voorbeeld doen is de spelers de gehele voorgeschiedenis vanhet spel laten vergeten en te optimaliseren gegeven de situatie waarin de speler zich bevindt Zois Coca Cola niet rancuneus na T van Pepsi maar gebruikt opnieuw objectieve standaarden omeen optimale reactie te geven in de nieuwe situatie in een deelspel

Om een (deelspel perfect) Nash-evenwicht te vinden beginnen we met het bepalen van deoptimale zet aan het eind van de spelboom en vervolgens gaan we telkens een stapje terug in despelboom om te bepalen wat de optimale zet is als in het vervolg iedereen optimaal speelt net

zolang tot de hele spelboom is bekeken Deze manier van redeneren heet ook wel terugwaartse inductie (Eng backward induction )

Opgave 74 Laat zien dat de backward induction oplossing van een spel niet uniek hoeft te zijn

In bovenstaand voorbeeld kan je een argument geven ter faveure van terugwaartse inductieBekijk bijvoorbeeld een ander Nash-evenwicht van het spel zoals bijvoorbeeld (OATT ) Ditevenwicht is niet plausibel omdat Coca Cola alleen maar vanwege de dreiging van T van Pepsieieren voor zijn geld kiest Maar T is een inferieure strategie voor Pepsi De zet T heet dan ook

44

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 45: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4549

wel een ongeloofwaardige dreiging En dat maakt het evenwicht niet waarschijnlijk Coca Cola kanmet een gerust hart de markt binnenwandelen

Het bepalen van bovenstaande oplossing hield sterk verband met de perfecte informatie Maarde notie van terugwaartse inductie lijkt op te houden in bovenstaand voorbeeld als na E van CocaCola de bedrijven beide onafhankelijk en simultaan besluiten of T of A gespeeld wordt als inonderstaand figuur

Entry Game (3)

0 5

minus2minus1 0 0 minus1 0 1 2

O E

T A

T A T A

C

P

CC

De terugwaartse-inductieprocedure kunnen we ook voor spelen met imperfecte informatie ge-neraliseren

Definitie 716 Een deelspel van een spel G in uitgebreide vorm is precies een deel dat een volwaar-dig spel vormt Iets technischer geformuleerd een deelspel begint met een enkele beslissingsknoopin een informatieverzameling met 1 element en bevat alle opvolgers van deze knoop Geen knoop ineen deelspel mag tot een informatieverzameling behoren die knopen bevat die niet tot het deelspelbehoren

De tweede formulering zegt zoiets als dat je bij het afzonderen van een deelspel geen informa-tieverzameling mag doorsnijden

Voorbeeld 717 Ieder spel G heeft een deelspel en wel zichzelf

Voorbeeld 718 Bekijk Entry Game (2) Hier vinden we naast het totale spel nog drie anderedeelspelen de twee met alleen Coca Cola als speler

minus2minus1 0 0 minus1 0 1 2

T A T A

CC

en ook nog

45

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 46: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4649

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

In Entry Game (3) is er naast het gehele spel alleen nog het post-entry deelspel

minus2minus1 0 0 minus1 0 1 2

T A

T A T A

P

CC

Opgave 75 Bekijk het onderstaande spel in uitgebreide vorm

1 2 4 2 0 5 3 2

L R

ℓ r L R

1

22

(a) Bepaal alle deelspelen van G

(b) Bepaal G in strategische vorm en N E (G)

(c) Bepaal de backward induction oplossing voor G

We kunnen misschien in de algemene boomstruktuur met vrijheden ten aanzien van informa-tieverzamelingen niet in iedere beslissingsknoop een beste zet voor een van de spelers aanwijzenzoals bij Kuhnrsquos backward algoritme Een generalisatie van dit idee is het uitgangspunt dat iederespeler in ieder deelspel optimaal speelt gegeven de strategieen van de andere spelers in dat deelspelDit houdt in dat iedere speler zijn zetten in het deelspel afstemt op een Nash evenwicht van datdeelspel

46

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 47: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4749

Definitie 719 Voor een gegeven spel G in uitgebreide vorm is een Nash evenwicht een deelspel-perfect evenwicht als geldt dat deze strategieen een Nash evenwicht in ieder deelspel van G bepalen

Opgave 76 Stackelberg modelBeschouw het Cournot duopoly model van Opgave 22 Stel dat de inverse vraagfunctie gegevenwordt door p(Q) = 10 minus Q waarbij Q staat voor de totale productie Q = q 1 + q 2 bij geproduceerdehoeveelheden q i van bedrijf i en dat de marginale kosten constant zijn gelijk 2 Dan luiden dewinstfuncties als er geen vaste kosten zijn

πi (q 1 q 2) = (10 minus Q) q i minus 2q i voor i = 1 2

Neem aan dat bedrijf 1 de keuze heeft tussen twee productieniveaursquos q L1 = 3 q H 1 = 5 Bedrijf 2heeft de keuze tussen drie productieniveaursquos q L2 = 1 q M

2 = 3 q H 2 = 5

(a) Neem eerst aan dat bedrijven onafhankelijk van elkaar en gelijktijdig hun productieniveaubepalen Bepaal het Nash-evenwicht

(b) We bekijken nu het spel G in uitgebreide vorm waarbij bedrijf 1 als eerste een hoeveelheid opde markt brengt Bedrijf 2 observeert deze hoeveelheid en bepaalt vervolgens de productieBepaal de terugwaartse-inductieoplossing

(c) Vergelijk je uitkomst uit (b) met het Nash-evenwicht in (a) Wat valt je op

Opgave 76 laat zien dat het lonend zijn kan om een spel in strategische vorm te vermijdenDoor het timing aspect kunstmatig toe te voegen kan een speler winst behalen Dit is een voorbeeldvan een situatie waarbij het een nadeel is informatie te hebben over de tegenstanders

Opgave 77 Battle of the Sexes with outside optionBeschouw het volgende spel in uitgebreide vorm als in onderstaande figuur

Battle of the Sexes with outside option

2 2

3 1 0 0 0 0 1 3

T C

S L

S L S L

1

2

11

In dit spel beslist speler 1 om thuis te blijven en een boek te lezen of om naar een concert tegaan van de Rolling Stones of Live Na de keuze thuis te blijven houdt het spel op Na keuzevoor concert krijgt speler 1 met het Battle of the Sexes spel met speler 2 te maken Speler 1 heeftliever Stones en speler 2 ziet liever Live Beiden blijven dan toch liever thuis dan alleen naarverschillende concerten

47

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 48: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4849

(a) Bepaal de strategische vorm G bij dit spel en N E (G)

(b) Welk van deze Nash evenwichten zijn deelspelperfect Zijn deze deelspelperfect Nash-evenwichtenalle even redelijk

(c) Bepaal IEWDS (G) Kan je dit in overeenstemming brengen met je antwoord bij vraag (b)

De opgave hierboven illustreert (informeel) de kracht van voorwaartse inductie als verfijningvan het concept deelspelperfectie We zien dat hoewel het coordinatiespel alleen twee volkomengelijkwaardige Nash evenwichten heeft men uit de niet waargenomen zetten van een tegenstanderconclusies kan trekken over het vervolg van het spel

Voorbeeld 720 De situatie kan nog extremer worden dan in bovenstaande opgave Beschouwmaar eens de situatie waarbij speler 1 kan kiezen of hij met L Battle of the Sexes wil spelen of eerst een dollar verbranden Deze situatie correspondeert met een spel in uitgebreide vorm als inonderstaand figuur

Burning Money L R

1

B S

B 3 1 0 0S 0 0 1 3

B S

B 2 1 minus1 0S minus1 0 0 3

Speler 1 heeft acht strategieen en speler 2 vier De strategische vorm wordt gegeven als 8 times 4-bimatrixspel

BB BS SB SS LBB 3 1 3 1 0 0 0 0LBS 3 1 3 1 0 0 0 0LSB 0 0 0 0 1 3 1 3LSS 0 0 0 0 1 3 1 3RBB 2 1 minus1 0 2 1 minus1 0RSB 2 1 minus1 0 2 1 minus1 0

RBS minus1 0 0 3 minus1 0 0 3RSS minus1 0 0 3 minus1 0 0 3

Hier staat bijvoorbeeld RSB voor de strategie van speler 1 waarbij allereerst het rechterspel wordtgekozen in het rechterspel S en in het rechterspel B Zoals je ziet zijn er 6 Nash evenwichtenin zuivere strategieen corresponderend met de vetgedrukte uitkomsten Eliminatie van zwakgedomineerde strategieen levert het volgende op

1 RBS en RS S worden zwak gedomineerd door LBB

48

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B

Page 49: Syl Lab Us Spelt He Orie

7232019 Syl Lab Us Spelt He Orie

httpslidepdfcomreaderfullsyl-lab-us-spelt-he-orie 4949

2 BS wordt zwak gedomineerd door BBSS door S B

3 LSS en LS B worden gedomineerd door RB B

4 BB domineert S B zwak

5 LBB en LBS domineren RB B en RSB

Volgens (LBBBB) e n (LBS BB) wordt er geen dollar verbrand en krijgt speler 1 zijn zinHet feit dat speler 1 een dollar kan vernietigen impliceert onder geitereerde eliminatie van zwakgedomineerde strategieen dat deze uitkomst ideaal is voor speler 1 Het redelijke evenwicht is(LBBBB) omdat (LBSBB) niet deelspelperfect is

Een intuitief argument voor deze uitkomst is de volgende Speler 1 moet anticiperen op hetfeit dat bij L de verwachte uitbetaling op zijn minst 3

4 is omdat wat ze ook denkt over speler 2dit haar gegarandeerde verwachte uitbetaling is Dus wanneer speler 2 R van speler 1 observeertdan moet de conclusie zijn dat speler 1 hier ook B gaat kiezen want anders is speler 1 zo slechteraf dan bij L Dus speler 2 speelt dan B Maar nu signaleert speler 1 met L dat de uitbetaling inhet deelspel nog beter is dan de 2 na R bij B van speler 2 Dus speler 1 speelt B na L en speler2 weet dat speler 1 hier L heeft gekozen en speelt ook B