5 tema. Lošimų teorijos metodai
description
Transcript of 5 tema. Lošimų teorijos metodai
1
5 tema. Lošimų teorijos metodai
Literatūra:1. S. Puškorius. Sprendimų priėmimo teorija.
Kiekybiniai metodai: Vadovėlis: – Vilnius: Lietuvos teisės universiteto Leidybos
centras, 2001. p.p.115-145.
2. S. Puškorius. Matematiniai metodai vadyboje: Vadovėlis: – Vilnius: TEV, 2001.
p.p.263-290
2
Įvadas• Lošimų teorija – sprendimai konfliktinėje situacijoje.• Lošimai su nuline suma – vienas išlošia tiek, kiek pralošia
kitas.• Lošimų matrica – analizės šaltinis.• Ėjimai – variantų pasirinkimai. Jie būna:
• Determinuoti• Atsitiktiniai
• Mišrūs• Strategija – vieno arba kokio nors derinio variantų
pasirinkimas.• Optimali strategija – rekomendacija, kokias strategijas
ir kiek dažnai taikyti, norint maksimizuoti savo išlošį.
• Pagrindinis žaidimo principas – priešininkas ne mažiau protingas.
3
Mokesčių matrica
,,, ... ... ... ... ...
2A
mA
1A
1B 2B 3B jB nB
11a 12a 13a ja1 na1
21a 22a 23a ja2 na2
1ma 3ma2ma mja mna
4
Lošimo uždavinių sprendimo metodai
• Taikant minimakso principą
• Grafiniu būdu
• Analitiniu
• Iteraciniu metodu
• Suformulavus tiesinio programavimo uždavinį
• Sprendimas taikant kompiuterį.
5
Uždavinio formulavimas
1. Savo ir priešininko strategijų numatymas
2. Lošimo matricos sudarymas
3. Matricos redukavimas.
6
Pavyzdys. Turime mokesčių matricą
3 4 2 1 -3
0 2 1 3 2
6 3 0 1 4
3 4 2 1 -3
2A
4A
1A
1B 2B 3B 4B 5B
3A
7
Po redukavimo
3 2 1 -3
0 1 3 2
6 0 1 4
1B
2A
1A
3B 4B 5B
3A
8
Minimakso principo taikymas
3 2 1 -3 -3
0 1 3 2 0
6 0 1 4 0
6 2 3 4
2A
j
1A
1B 3B 4B 5B i
3A
9
Minimakso principo taikymo formulės
1. Mūsų išlošių reikšmės:• Minimalus taikant konkrečią savo strategiją
• Geriausia mūsų strategija
• Apibendrintai
ijji amin
ii max
ijji aminmax
10
Minimakso principo taikymo formulės
1. Priešininko pralošimų reikšmės:• Maksimalus taikant konkrečią priešininko
strategiją
• Geriausia priešininko strategija
• Apibendrintai
ijij amax
jj min
ijij amaxmin
11
Svarbiausios sampratos:
• Apatinė lošimo vertė –
• Viršutinė lošimo vertė –
• Grynoji lošimo vertė –
• Santykis tarp šių rodiklių –
12
Pavyzdžio analizė
• Apatinė lošimo vertė 0• Viršutinė lošimo vertė 2
Išvados: 1. Grynoji lošimo vertė yra tarp 0 ir 2.
2. Norint išlošti daugiau, reikia taikyti strategijų rinkinį.
3. Reikia nustatyti, kiek dažnai būtina kaitalioti savo aktyviąsias strategijas.
4. Kai taikomos kelios strategijos – mišrios strategijos
13
Lošimas 2x2. Analitinis sprendinys
4 1 1
2 5 2
4 5
1A
1B
2A
2B i
j
14
Lošimas 2x2. Analitinis sprendinys
Formulės:• Mūsų strategijų tikimybės
• Priešininko strategijų tikimybės
• Grynoji lošimo vertė
12
21122211
21221
1 pp
aaaa
aap
12
21122211
12221
1
,
aaaa
aaq
21122211
21121122
aaaa
aaaa
15
Analitinis sprendinys
5,05,01
5,0
2
1
p
p
33,0
.67,06
4
2
1
q
q
67,26
16
16
Grafinis sprendinys. Lošimai 2xn ir mx2
1 2 4 0
3 2,5 0 5
2B
2A
1A
1B 3B 4B
17
Grafinio sprendinio algoritmas
1. Ant ašies 0x pažymime vieneto ilgio atkarpą bet kokiu masteliu. Tos atkarpos galuose brėžiame statmenas ašiai Ox tieses. Vienodu masteliu ant šių tiesių pažymime taškus, kurių aibė turi apimti didžiausius ir mažiausius mokesčių matricos elementus.
2. Nagrinėjame pirmą kito lošėjo strategiją B1 . Ant kairės ašies pažymime tašką a11 , ant dešinės – a21 . Šiuos taškus sujungiame tiese ir tiesės galus pažymime raidėmis B1B1 .Taip pat braižome visas kitas tieses BjBj , j = 2, 3, ..., n .
3. Iš 2 punkte gautų tiesių BjBj aibės išskiriame laužtinę, esančią žemiausiai visų kitų galimų laužtinių. Pažymime tos laužtinės tašką su didžiausia ordinate. Šis taškas S interpretuoja uždavinio sprendinį.
18
Grafinio sprendinio algoritmas
4. Iš taško S nubrėžiame statmenį į ašį 0x . Šis statmuo dalija vienetinę atkarpą į dvi dalis. Pažymime to taško projekciją raide K. To taško atstumas iki dešinės ašies yra proporcingas strategijos A1 taikymo tikimybei, o iki kairės ašies – strategijos A2 taikymo tikimybei. Išmatavus tų atkarpų ilgius ir padalijus iš mastelio, gaunamos tikimybės p1 ir p2 .
5. Taško S projekcija ant ordinačių ašių nustato grynąją lošimo vertę.
6. Kito lošėjo aktyviosios strategijos yra tos, kurios eina per tašką S. Jei jų yra daugiau kaip dvi, pasirenkamos bet kurios dvi strategijos.
7. Lošėjo B dviejų grynųjų strategijų taikymo tikimybės apskaičiuojamos taip. Naudodamiesi viena bet kuria ordinačių ašimi, nustatome visą atkarpos ilgį tarp jo aktyviųjų strategijų. Taško S projekcija ant tos ašies dalija šią atkarpą į dvi dalis, kurių ilgiai proporcingi aktyviųjų strategijų taikymo tikimybėms.
19
Lošimų mn sprendimo metodai1. Lošimo uždavinių sprendimas iteraciniu metodu
Esmė1. Šis metodas paprastai taikomas tada, kai tikslus sprendimas
nebūtinas:• Atliekamas teorinis eksperimentas, t.y. be realių veiksmų. • Tarkime, lošėjas A atsitiktiniu būdu pasirenka vieną iš savo
strategijų Ai . • Kitas lošėjas B daro tokį ėjimą, kuris mažiausiai naudingas
lošėjui A. • Lošėjas A, žinodamas konkrečią lošėjo B strategiją, pasirenka
tokią strategiją, kuri leidžia išlošti daugiausiai. • Dabar lošėjas B žino du lošėjo A ėjimus. • Įvertinęs pirmąsias dvi lošėjo A pasirinktas strategijas, jis atsako
tokia strategija, kuri minimizuoja lošėjo A vidutinį išlošį.
20
Lošimų mn sprendimo metodai1. Lošimo uždavinių sprendimas iteraciniu metodu
2. Iteracijos metu kiekvienas lošėjas, įvertinęs visus kito lošėjo ėjimus, į kitą priešininko ėjimą atsako optimaliąja strategija. Padaryti ėjimai sudaro kokią nors mišriąją strategiją, susidedančia iš grynųjų strategijų su jų panaudojimo dažniais.
3. Vidutinė lošimo vertė, gauta iteraciniu metodu (*), artėja prie grynosios lošimo vertės, o lošėjų strategijų taikymo tikimybės artėja prie tikslių jų reikšmių p1 , p2 , …, pm ir q1 , q2 , …, qn .
21
Lošimų mn sprendimo metodai1. Lošimo uždavinių sprendimas iteraciniu metodu
Pavyzdys. Žinomas jo tikslus sprendinys:
4 0 0
0 5 0
4 5
2),33,0;67,0(),5,0;5,0( BA SS
1A
2A
2B1B i
j
22
Lošimų mn sprendimo metodai1. Lošimo uždavinių sprendimas iteraciniu metodu
Iteracinė lentelė
k i j
1 2 0 5 1 4 0 0 2 4
2 1 4 5 1 8 0 2 3 4
3 1 8 5 2 8 5 5/3 13/6 8/3
4 1 12 5 2 8 10 5/4 15/8 10/4
5 2 12 10 2 8 15 2 2,5 3
1B 2B 1A 2A
23
Lošimų mn sprendimo metodai2. Lošimo uždavinių sprendimas tiesinio programavimo
metodu
Uždavinio formulavimas• Formuluojame lošimo uždavinį taip, kad rastume lošėjo A
optimaliąją strategiją = (p1 , p2 , ... , pm), • ši optimalioji mišrioji strategija turi suteikti galimybę lošėjui A
išlošti ne mažiau grynosios lošimo vertės ,• Taikant tiesinio programavimo metodą reikia, kad būtų teisinga
sąlyga, jog > 0. • Kadangi mokesčių matrica gali turėti ir neigiamų elementų, tai
grynoji lošimo vertė irgi gali būti neigiama. Bet šį trūkumą nesunku pašalinti pridėjus mažiausią mokesčių matricos elementą R prie kiekvieno mokesčių matricos elemento.
• Gaunama nauja matrica, kuria naudojantis apskaičiuojamos visos strategijų pi tikimybės (jos nuo tos operacijos nesikeičia), o grynoji lošimo vertė yra + R . Atlikę tokią mokesčių matricos transformaciją įvykdysime sąlygą, kad ’ > 0.
24
Lošimų mn sprendimo metodai2. Lošimo uždavinių sprendimas tiesinio
programavimo metodu
Formulės
.xaxaxa
xaxaxa
xaxaxa
mmn22n11n
mm2222112
mm1221111
1...
, 1...
, 1...
,
11
px
min1
m21
xxxL ...
R 1
25
Lošimų mn sprendimo metodai3. Lošimo uždavinių sprendimas taikant kompiuterį
Standartizuojame uždavinį:
1. Visos nelygybės yra ribinės sąlygos.
2. L yra tikslo funkcija.
Uždavinys sprendžiamas
pasitelkus programą Solver
26
Lošimų mn sprendimo metodai3. Lošimo uždavinių sprendimas taikant kompiuterį
1. Parengiamasis etapas:• Įjungiame Excel programą: Start /Microsoft
Excel.• Pasirenkame langelius, kuriuose užrašomos
kintamųjų reikšmės. Pirmoje (viršutinėje) – kintamųjų simboliai, antroje – jų reikšmes.
• Tarkime, kintamųjų simbolius užrašysime langeliuose C1:W1, o jų reikšmes – langeliuose C2:W2.
• Pradinės kintamųjų reikšmės pasirinktos lygios nuliui.
• Langeliuose C3:W5 užrašome ribinių sąlygų koeficientus.
27
Lošimų mn sprendimo metodai3. Lošimo uždavinių sprendimas taikant kompiuterį
2. Parengiamasis etapas:• Langeliuose A3:An užrašome ribinių sąlygų
laisvuosius narius.• Langeliuose B3:Bn užrašome ribinių sąlygų
apskaičiavimo formules.• Bet kokiame laisvame langelyje (tarkime, W1)
užrašome tikslo funkcijos apskaičiavimo formulč =C2 +D2 +E2...
• Visi reikiami duomenys įvesti. • Pavedame kompiuteriui sprčsti šį uždavinį.
28
Lošimų mn sprendimo metodai3. Lošimo uždavinių sprendimas taikant kompiuterį
2. Sprendimas:• Tools / Solver. Dialogo langelyje atlikti
tokius veiksmus:– Set Target Cell: W1 (žymeklį uždėti ant
langelio W1). – Pažymėti Min, nes norima minimizuoti
tikslo funkciją. – By Changing Cells: C2:W2 (nuoroda į
visus kintamuosius).– Add (nuorodos į ribines sąlygas):
29
Lošimų mn sprendimo metodai3. Lošimo uždavinių sprendimas taikant kompiuterį
• Cell Reference: B3:Bn (nuorodos į ribinių sąlygų formules).• >= 1 (visose ribinėse sąlygose yra ženklai daugiau arba
lygu vienetui. • Constraints: A3:An (nuorodos į ribinių sąlygų laisvuosius
narius).• OK.
– Add (nuorodos, kad visi kintamieji turi būti neneigiami):• Cell Reference:C2:W2.• >=• 0• OK.• Solve / Keep Solver Solution / OK.