Fundamentos de Teoría de Juegos - Parte...

21
MHD15 - FTJ: 0 J. Bautista, G. López Joaquín Bautista, Guillermo López Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA DE CATALUNYA – BARCELONATECH Modelos y Herramientas de Decisión – Máster Universitario de Ingeniería de Organización - ETSEIB OPE – ORGANIZACIÓN DE LA PRODUCCIÓN Y DE EMPRESA (ASPECTOS TÉCNICOS, JURÍDICOS Y ECONÓMICOS EN PRODUCCIÓN ) OPE-PROTHIUS – OPE-MSc.2015/07 (20150321) - http://futur.upc.edu/OPE - www.prothius.com - Departamento de Organización de Empresas – UPC

Transcript of Fundamentos de Teoría de Juegos - Parte...

Page 1: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 0 J. Bautista, G. López

Joaquín Bautista, Guillermo López

Fundamentos de Teoría de Juegos - III

UNIVERSITAT POLITÈCNICA DE CATALUNYA – BARCELONATECH

Modelos y Herramientas de Decisión – Máster Universitario de Ingeniería de Organización - ETSEIB

OPE – ORGANIZACIÓN DE LA PRODUCCIÓN Y DE EMPRESA (ASPECTOS TÉCNICOS, JURÍDICOS Y ECONÓMICOS EN PRODUCCIÓN )

OPE-PROTHIUS – OPE-MSc.2015/07 (20150321) - http://futur.upc.edu/OPE - www.prothius.com - Departamento de Organización de Empresas – UPC

Page 2: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 1 J. Bautista, G. López

•  Juegos con suma constante

•  Juegos con suma general

•  Dilema del prisionero

•  Guerra de socios

•  Juegos cooperativos

•  Condiciones de cooperación

•  Criterio individualista

•  Representación gráfica

•  Arbitraje de Nash

Contenido

Page 3: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 2 J. Bautista, G. López

Juegos con suma constante (1)

§ En los Juegos con suma constante, con 2 jugadores, el beneficio de J1 puede ser distinto a las pérdidas de J2 para cada par de estrategias de ambos jugadores.

Para (J1,J2) J2

µ1 µ2 µ3

J1

σ1 (a11,b11) (a12,b21) (a13,b31)

σ2 (a21,b12) (a22,b22) (a23,b32)

σ3 (a31,b13) (a32,b23) (a33,b33)

aij + bji = R !! i " #,!µ j "$

Condiciones:

!aij = aij " R 2, !bji = bji " R 2

Se cumple: !aij + !bji = 0 #! i $ %,#µ j $&

Transformar en juego de suma 0. Hacer:

Page 4: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 3 J. Bautista, G. López

Juegos con suma constante (2)

§ Ejemplo 9: Juegos con suma constante (2 jugadores). Planteo

Para (J1,J2) J2

µ1 µ2 µ3

J1

σ1 (30,70) (50,50) (60,40)

σ2 (50,50) (10,90) (30,70)

σ3 (20,80) (40,60) (10,90)

Para J1 J2

µ1 µ2 µ3

J1

σ1 -20 0 10

σ2 0 -40 -20

σ3 -30 -10 -40

aij + bji = R =100 !! i " #,!µ j "$ !aij = aij " 50, !bji = bji " 50 #! i $ %,#µ j $&

Page 5: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 4 J. Bautista, G. López

Juegos con suma constante (3)

§ Ejemplo 9: Juegos con suma constante (2 jugadores). Resolución

Para J1 J2

µ1 µ2 µ3

J1

σ1 -20 0 10

σ2 0 -40 -20

σ3 -30 -10 -40

!3!!

1

Para J1 J2

µ1 µ2 µ3

J1 σ1 -20 0 10

σ2 0 -40 -20

-20

-40

0 0

Valor del juego: ! 20 " v " 0

µ3! µ

2

Para J1 J2

µ1 µ2

J1 σ1 -20 0

σ2 0 -40

Page 6: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 5 J. Bautista, G. López

Juegos con suma constante (4)

§ Ejemplo 9: Juegos con suma constante (2 jugadores). Resolución

-20

-40

0 0

Valor del juego: ! 20 " v " 0

Para J1 J2

y1 y2

J1 x1 -20 0

x2 0 -40

v =a11!a

22" a

12!a

21

a11+ a

22" a

12" a

21

=800

"60= "

40

3

x1=!40

-60=2

3x2=!20

-60=1

3

y1=!40

-60=2

3y2=!20

-60=1

3

Page 7: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 6 J. Bautista, G. López

Juegos con suma general (1)

§ Juegos no cooperativos:

•  Se pueden resolver fácilmente si hay un único punto de equilibrio para cada jugador y los puntos de equilibrio coinciden

•  El jugador utiliza la estrategia como un juego de suma nula

•  Se consideran todas las estrategias sin aplicar dominancias.

•  Comunicación indirecta. Si se repite se tiene información de las partidas anteriores.

•  Posibilidad:

•  Política inicialmente bondadosa.

•  Política simple (si J1 coopera, J2 también coopera).

Page 8: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 7 J. Bautista, G. López

Juegos con suma general (2)

§ Ejemplo 10: El dilema del prisionero

Dos estafadores cometen un fraude fiscal y son interrogados por separado.

Pueden darse los siguientes casos durante el interrogatorio:

•  Ningún estafador delata al otro y no confiesa la autoría del fraude:

•  Pena: 1 año de cárcel para cada uno.

•  Un estafador delata al otro sobre la autoría del fraude y el otro no lo hace:

•  Pena: Libertad para el delator y 10 años de cárcel para el delatado.

•  Los dos estafadores se delatan mutuamente sobre la autoría del fraude:

•  Pena: 3 años de cárcel para cada uno.

… ¿Qué hacer?

Page 9: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 8 J. Bautista, G. López

Juegos con suma general (3)

Ejemplo 10: El dilema del prisionero

Estrategias de los jugadores:

-  No delatar (σ1, µ1)

-  Delatar (σ2, µ2)

-  Utilidad: sentencia (-1 = 1 año de cárcel)

Para (J1,J2) J2

µ1 µ2

J1 σ1 (-1,-1) (-10,0)

σ2 (0,-10) (-3,-3)

Para J1 µ1 µ2

σ1 -1 -10

σ2 0 -3

-10

-3

0 -3

Para J2 µ1 µ2

σ1 -1 0

σ2 -10 -3

0

-3

-10 -3

Max Min

Max Min Min Max

Min Max

Planteo como juego suma 0

Page 10: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 9 J. Bautista, G. López

Juegos con suma general (4)

§ Ejemplo 11: Guerra de socios

Dos socios no se deciden por la ubicación del edificio central de su negocio: J1 quiere que se construya en BCN, J2 quiere la ubicación en Madrid.

… ¿Qué harán los socios?

Preferencias de J1: 1º Los dos eligen BCN. 2º Los dos eligen Madrid. 3º J1 elige BCN y J2 elige Madrid. 4º J1 elige Madrid y J2 elige BCN.

Preferencias de J2: 1º Los dos eligen Madrid. 2º Los dos eligen BCN. 3º J2 elige Madrid y J1 elige BCN. 4º J2 elige BCN y J1 elige Madrid.

Page 11: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 10 J. Bautista, G. López

Juegos con suma general (5)

§ Ejemplo 11: Guerra de socios

Estrategias de los jugadores:

-  BCN (σ1, µ1)

-  Madrid (σ2, µ2)

-  Utilidad de (+2) a (-1) prioridad

Para (J1,J2) J2

µ1 µ2

J1 σ1 (2,1) (-1,-1)

σ2 (-1,-1) (1,2)

Para J1 µ1 µ2

σ1 2 -1

σ2 -1 1

-1

-1

2 1

Max Min

Min Max

Para J2 µ1 µ2

σ1 1 -1

σ2 -1 2

1

2

-1 -1 Max Min

Min Max

§ Ejemplo 11: MaxMin / MinMax

Page 12: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 11 J. Bautista, G. López

Juegos con suma general (6) § Ejemplo 11: Guerra de socios Planteo Suma 0 sin colaboración

Para J1 y1 y2

x1 2 -1

x2 -1 1

Para J2 y1 y2

x1 1 -1

x2 -1 2

Valor del juego J1: -1! v !1

v =a11 !a22 " a12 !a21

a11 + a22 " a12 " a21=2 !1" ("1) ! ("1)

5=1

5

x1 =1! (!1)

5=2

5, x2 =

2! (!1)

5=3

5

y1 =1! (!1)

5=2

5, y2 =

2! (!1)

5=3

5

Valor del juego J2: -1! w !1

w =b11 !b22 " b12 !b21

b11 + b22 " b12 " b21=1!2" ("1) ! ("1)

5=1

5

y1 =2! (!1)

5=3

5, y2 =

1! (!1)

5=2

5

x1 =2! (!1)

4=3

5, x2 =

1! (!1)

5=2

5

Page 13: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 12 J. Bautista, G. López

Juegos con suma general (7) § Ejemplo 11: Guerra de socios Planteo con posible colaboración

Para J1 y1 y2

x1 2 -1

x2 -1 1

Para J2 y1 y2

x1 1 -1

x2 -1 2

Valor del juego J1 Suma 0: v = 0.20

v =x1[ ] 2!0.5+ ("1)!0.5= 0.5

x2[ ] ("1)!0.5+1!0.5= 0

#$%

&%

'(%

)%= 0.5!0.5+ 0!0.5= 0.25

w =y1[ ] 1!0.5+ ("1)!0.5= 0

y2[ ] ("1)!0.5+ 2!0.5= 0.5

#$%

&%

'(%

)%= 0!0.5+ 0.5!0.5= 0.25

Hipótesis:

x1 =1

2, x2 =

1

2

y1 =1

2, y2 =

1

2

!

"##

$##

%

&##

'##

Valor del juego J2 Suma 0: w = 0.20

Page 14: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 13 J. Bautista, G. López

(2,1)

(1, 2)

(1 5,1 5)

(!1,!1)

(1 5,1 5)

(1, 2)

(2,1)

Zona de cooperación

Juegos con suma general (8)

(3 2,3 2)

§ E11: Guerra de socios.

Page 15: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 14 J. Bautista, G. López

Juegos cooperativos (1)

§ Juegos con suma no nula:

•  Ambos jugadores ganan o ambos pierden:

•  Duopolios (Oligopolios).

•  Negociaciones

•  Divergencia entre juegos cooperativos y juegos no cooperativos:

•  En los juegos no cooperativos, prevalece el criterio de emplear estrategias de conveniencia individual. En los juegos cooperativos, se abandonan las estrategias individualistas para conseguir un mayor beneficio para ambos jugadores.

Dado un criterio, un punto silla se detecta a partir de una pareja de estrategias, una para cada jugador, para las que si cualquier jugador la abandona, sale perdiendo. Puede haber un punto de silla, más de uno o ninguno.

Page 16: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 15 J. Bautista, G. López

Juegos cooperativos (2)

§ Ejemplo 12: Juego con suma no nula. Posibilidad de cooperación

Para (J1,J2) J2

A’ B’

J1 A (2,6) (5,10)

B (8,4) (0,0)

•  Caso J1: Lo mejor : (B,A’) Valor (8,4) Lo peor: (B,B’) Valor (0,0)

•  Caso J2: Lo mejor : (A,B’) Valor (5,10) Lo peor: (B,B’) Valor (0,0)

1. Estrategia prudencial de J: La que más conviene a J resolviendo su juego de suma nula.

2. Estrategia contra-prudencial de J: La que más conviene a J contra la mejor estrategia prudencial de J’.

3. Óptimos en Frente de Pareto: Dado un conjunto de soluciones, se dice que una solución es Pareto-óptima si domina al resto de soluciones para ambos jugadores.

Colaboración

Page 17: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 16 J. Bautista, G. López

Juegos cooperativos (3) § Ejemplo 12: Juego con suma no nula. Criterio individualista (suma nula)

Para (J1,J2) J2

A’ B’

J1 A (2,6) (5,10)

B (8,4) (0,0)

Para J1 A’ B’

A 2 5

B 8 0

2

0

8 5

Max Min

Min Max

Para J2 A’ B’

A 6 10

B 4 0

10

4

4 0 Max Min

Min Max

v =a11!a

22" a

12!a

21

a11+ a

22" a

12" a

21

=2 !0"8 !5

2+ 0"8" 5=40

11= 3.63

xA=8

11, x

B=3

11

w = 4 (Punto de silla)

y !A =1

Page 18: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 17 J. Bautista, G. López

§ Ejemplo 12: Juego con suma no nula. Representación gráfica

Pagos laterales por acuerdo:

-  Si J1 y J2 actúan individualmente, las ganancias son (40/11, 4)

-  Si (B,A’), J1 puede dar 2 a J2 con ganancias (6,6).

-  Si (A,B’), J2 puede dar 2.5 a J1 con ganancias (7.5,7.5).

Condiciones de la solución:

-  Ser Pareto-óptima.

-  Mejor en competencia: Valor del juego > Nivel de seguridad. Valor J1

Valor J2

(A, !A )

(B, !A )

(B, !B )

(A, !B )

10

10

(2, 6)

(5,10)

(8, 4)

(0, 0)

Frente de Pareto

5

5

(40 11, 4)

Juegos cooperativos (4)

Page 19: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 18 J. Bautista, G. López

Juegos cooperativos (5)

§ Solución según Arbitraje de Nash:

Se parte de 2 elementos:

1.  El poliedro de soluciones Pareto-óptimas del Juego. 2.  El Status Quo inicial: solución a la que se llega actuando individualmente

!(v,w) , SQ0 " (v0,w0 )

Partiendo de SQ y del Poliedro Pareto-óptimo, NASH propone que la solución óptima forme parte del conjunto de negociaciones atendiendo al siguiente PM.

Max !! = (v " v0 )(w "w0 )s.a. :v # v0w # w0(v,w)$%(v,w)

Page 20: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 19 J. Bautista, G. López

Juegos cooperativos (6)

J2

A’ B’

J1 A (2,6) (5,10)

B (8,4) (0,0)

§ Ejemplo 12: Juego cooperativo. Arbitraje de Nash.

Max !! = (v " v0 )(w "w0 )s.a. :v # v0w # w0w = mv + b

Valor J1

Valor J2

(A, !A )

(B, !A )

(B, !B )

(A, !B )

10

10

(2, 6)

(5,10)

(8, 4)

(0, 0)

Frente de Pareto

5

5

(40 11, 4)

w = !2v + 20Max !! = (v " 40 /11)(w " 4)s.a. :v # 40 /11w # 4w = "2v + 20

v* = 6411

! 5.82; w* = 9211

! 8.36

Page 21: Fundamentos de Teoría de Juegos - Parte IIIocw.upc.edu/sites/ocw.upc.edu/files/materials/240EO023/2014/1/54… · Fundamentos de Teoría de Juegos - III UNIVERSITAT POLITÈCNICA

MHD’15 - FTJ: 20 J. Bautista, G. López

Allegro ma non troppo

LAS LEYES FUNDAMENTALES DE LA ESTUPIDEZ HUMANA

L1: Siempre e inevitablemente cada uno de nosotros subestima el número de individuos estúpidos que circulan por el mundo. L2: La probabilidad de que una persona determinada sea estúpida es independiente de cualquier otra característica de la misma persona. L3: Una persona estúpida es una persona que causa un daño a otra persona o grupo de personas sin obtener, al mismo tiempo, un provecho para sí, o incluso obteniendo un perjuicio. L4: Las personas no estúpidas subestiman siempre el potencial nocivo de las personas estúpidas. L5: La persona estúpida es el tipo de persona más peligrosa que existe. Corolario: El estúpido es más peligroso que el malvado.

Carlo M. CIPOLLA (1922-2000) Allegro ma non troppo (1988)