Teoría de Juego
Teoría de Juego
Teoría de Juego
I-2011
TEORIA DE JUEGOS
DEFINICIN Y FORMULACIN
La teora de los juegos es una rama de la matemtica con aplicaciones a la economa,
sociologa, biologa y psicologa, que analiza las interacciones entre individuos que toman
decisiones en un marco de incentivos formalizados (juegos). En un juego, varios agentes
buscan maximizar su utilidad eligiendo determinados cursos de accin. La utilidad final
obtenida por cada individuo depende de los cursos de accin escogidos por el resto de los
individuos.
La teora de juegos tiene una relacin muy lejana con la estadstica. Su objetivo no es el
anlisis del azar o de los elementos aleatorios sino de los comportamientos estratgicos de
los jugadores. En el mundo real, tanto en las relaciones econmicas como en las polticas o
sociales, son muy frecuentes las situaciones en las que, al igual que en los juegos, su
resultado depende de la conjuncin de decisiones de diferentes agentes o jugadores. Se dice
de un comportamiento que es estratgico cuando se adopta teniendo en cuenta la influencia
conjunta sobre el resultado propio y ajeno de las decisiones propias y ajenas.
La tcnica para el anlisis de estas situaciones fue puesta a punto por un matemtico, John
Von Neumann. A comienzos de la dcada de 1940 trabaj con el economista Oskar
Morgenstern en las aplicaciones econmicas de esa teora. El libro que publicaron en
1944, "Theory of Games and Economic Behavior", abri un insospechadamente amplio
campo de estudio en el que actualmente trabajan miles de especialistas de todo el mundo.
Luego, John Nash, A.W. Tucker y otros hicieron grandes contribuciones a la teora de juegos.
Juego es un trmino
particular. En estas situaciones, el xito de una de las partes tiende a estar a expensa de las
otras, por lo que tienen una relacin de conflicto o competitiva. Sin embargo, desde el punto
de vista de todos los involucrados, es
posibles que no lograr ningn acuerdo, por lo cual la cooperacin es de mutuo inters.
Los modelos de juegos sin transferencia de utilidad suelen ser bipersonales, es decir, con
slo dos jugadores. Pueden ser simtricos o asimtricos segn que los resultados sean
1
TEORIA DE JUEGOS
I-2011
idnticos desde el punto de vista de cada jugador. Pueden ser de suma cero, cuando el
aumento en las ganancias de un jugador implica una disminucin por igual cuanta en las del
otro, o de suma no nula en caso contrario, es decir, cuando la suma de las ganancias de los
jugadores puede aumentar o disminuir en funcin de sus decisiones. Cada jugador puede
tener opcin slo a dos estrategias, en los juegos biestratgicos, o a muchas. Las
estrategias pueden ser puras o mixtas; stas consisten en asignar a cada estrategia pura
una probabilidad dada. En el caso de los juegos con repeticin, los que se juegan varias
veces
seguidas
por
los
mismos
jugadores,
las
estrategias
pueden
ser
TEORIA DE JUEGOS
I-2011
Como los juegos tienen su base en el conflicto de intereses, la solucin ptima escoge una o
ms estrategias para cada jugador, de tal modo que cualquier cambio en las estrategias
elegidas no mejore la recompensa para cualquiera de los jugadores. Esta soluciones pueden
tener estrategias pura o estrategias mixta de acuerdo con probabilidades predeterminadas.
1. Punto de silla
El punto de silla se aplica a matrices del orden m*n. Para cada una de las estrategias del
Jugador 1 se encuentra la ganancia mnima que se obtendra de enfrentarse a la mejor
estrategia del Jugador 2 (los mnimos de las filas) y para cada estrategia del Jugador 2 se
encuentra la ganancia mxima del Jugador 1 (que es tambin la prdida mxima del Jugador
2), la cual se presenta como mximo de la columna. El Jugador 1 escoger el mayor de los
valores mnimos de las filas (criterio maximin) y el Jugador 2 escoger el valor menor de los
mximos de las columnas (criterio minimax). Si el maximin iguala al minimax hay equilibrio,
en consecuencia existe estrategia pura, es decir cada uno de los jugadores elige slo una
estrategia. No obstante, a este punto se le llama punto de silla. La estrategia seleccionada
por ambos jugadores tiene probabilidad de 1 y las dems estrategias tienen valor de cero.
Las estrategias de los jugadores:
Estrategia del Jugador 1: X = (X1, X2,, Xi,, Xm) = (0, 0, 1, 0,..., 0)
Estrategia del Jugador 1: Y = (Y1, Y2,, Yj,, Yn) = (0, 0, 1, 0,, 0)
El valor del juego es el valor minimax o maximin.
Xi: es la probabilidad de que el Jugador 1 tome la estrategia i.
Yj: es la probabilidad de que el Jugador 2 tome la estrategia j.
TEORIA DE JUEGOS
I-2011
TEORIA DE JUEGOS
I-2011
3. Mtodo grfico
Los mtodos con estrategias mezcladas cuyos juegos son del orden (2*n) o (m*2) y que no
tengan puntos de silla se pueden resolver usando el mtodo grfico.
Caso: (2*n)
El jugador 1 tiene dos estrategias A1 y A2
Y1
Yj
X1
A1
1- X1
A2
Yn
El juego supone que el jugador 1 mezcla las estrategias A1 y A2 con las respectivas
probabilidades x1 y 1-x1, 0 x1 1.
El pago esperado del jugador 1 cuando el jugador 2 toma la j-sima estrategia es:
(
X1
Y1
1-Y2
A1
Xi
Ai
Xm
Am
El juego supone que el jugador 2 mezcla las estrategias B1 y B2 con las respectivas
probabilidades y1 y 1-y1, 0 y1 1.
El pago esperado del jugador 2 cuando el jugador 1 toma la i-sima estrategia es:
(
TEORIA DE JUEGOS
I-2011
Una fila es relevante si y solo si todos los elementos de la fila i es mayor o igual a los
elementos de la fila k, es decir, aij akj. En este caso la fila i es relevante y su probabilidad
de ocurrencia es diferente de cero. La fila k es no relevante y su probabilidad de ocurrencia
es igual a cero. De la matriz de pago se elimina la fila no relevante.
Una columna es relevante si y solo si todos los elementos de la columna i es menor o igual a
los elementos de la columna k, es decir,
TEORIA DE JUEGOS
I-2011
Las probabilidades ptimas x1, x2, , xm del Jugador 1 se pueden determinar resolviendo el
siguiente problema maximin:
)}
TEORIA DE JUEGOS
I-2011
Sujeto a
Sujeto a
Las probabilidades ptimas y1, y2, , ym del Jugador 2 se pueden determinar resolviendo el
siguiente problema maximin:
)}
TEORIA DE JUEGOS
I-2011
Sujeto a
Sujeto a
TEORIA DE JUEGOS
I-2011
EJEMPLO 1. Dos empresas anuncian dos productos (uno cada uno) que compiten. En la
actualidad, cada producto controla el 50% del mercado. Debido a las mejoras recientes en
los dos productos, cada empresa se prepara para lanzar una campaa publicitaria. Si
ninguna empresa anuncia, seguirn las partes iguales en el mercado. Si cualquiera de ellas
lanza una campaa ms intensa, es seguro de la otra perder un porcentaje proporcional de
sus clientes. El estudio de mercado indica que con televisin se puede llegar al 50% de los
clientes potenciales, con peridicos al 30%, y con la radio al 20%.
1. Formule el problema como un juego entre dos personas con suma cero y seleccione
los medios publicitarios adecuados, para cada una de las dos empresas.
2. Determine un intervalo del valor del juego, Puede operar cada empresa con una sola
estrategia pura?
Formulacin
1. Estrategias de la Empresa A
A1: no anunciar en ningn medio.
A2: anunciar en TV.
A3: anunciar en peridicos.
A4: anunciar en radio.
A5: anunciar en TV y peridico.
A6: anunciar en TV y radio.
A7: anunciar en radio y peridico.
A8: anunciar en TV, radio y peridico.
2. Estrategias de la Empresa B
B1: no anunciar en ningn medio.
B2: anunciar en TV.
B3: anunciar en peridicos.
B4: anunciar en radio.
B5: anunciar en TV y peridico.
B6: anunciar en TV y radio.
B7: anunciar en radio y peridico.
B8: anunciar en TV, radio y peridico.
10
TEORIA DE JUEGOS
I-2011
B2
B3
B4
B5
B6
B7
B8
MIN
A1
-50
-30
-20
-80
-70
-50
-100
-100
A2
50
20
30
-30
-20
-50
-50
A3
30
-20
10
-50
-40
-20
-70
-70
A4
20
-30
-10
-60
-50
-30
-80
-80
A5
80
30
50
60
10
30
-20
-20
A6
70
20
40
50
-10
20
-30
-30
A7
50
20
30
-30
-20
-50
-50
A8
100
50
70
80
20
30
50
MAX
100
50
70
80
20
30
50
Estrategia de la empresa A:
X = (X1, X2, X3, X4, X5, X6, X7, X8) = (0, 0, 0, 0, 0, 0, 0, 1). La empresa A debe anunciar en
TV, peridico y radio.
Estrategia de la empresa B:
Y = (Y1, Y2, Y3, Y4, Y5, Y6, Y7, Y8) = (0, 0, 0, 0, 0, 0, 0, 1). La empresa B debe anunciar en
TV, peridico y radio. El valor esperado es cero,
11
TEORIA DE JUEGOS
I-2011
B2
Min
A1
-1
-1
A2
-2
-2
Max
Mtodo algebraico
(
(
)
)
(
(
)
)
Valor del juego: 3*0.6*0.5 + (-1)*0.6*0.5 + (-2)0.4*0.5 + 4*0.4*0.5 = 0.9 0.3 0.4 + 0.8 = 1.
Gana el Jugador 1.
Estrategia del Jugador 1: X = (X1, X2) = (0.6, 0.4).
Estrategia del Jugador 2: Y = (Y1, Y2) = (0.5, 0.5).
12
TEORIA DE JUEGOS
I-2011
B2
-1
4
4
Min
-1
-2
Sujeto a
Sujeto a
Jugador 1. La estrategia del Jugador 2 es el modelo dual del Jugador 1. La estrategia del
Jugador 2 es y1 = 0.5, y2 = 0.5, y3 = 1. El valor del juego es
13
= 1- 0 = 1.
TEORIA DE JUEGOS
I-2011
Sujeto a
TEORIA DE JUEGOS
I-2011
y1 = 0.5, y2 = 0.5.
Las probabilidades ptimas y1, y2,, yn del Jugador 2 se pueden determinar resolviendo el
siguiente problema lineal:
Sujeto a
Sujeto a
Jugador 1. La estrategia del Jugador 1 es el modelo dual del Jugador 2. La solucin del
juego del Jugador 2 es x1 = 0.6, x2 =0.4.
15
TEORIA DE JUEGOS
I-2011
B2
2
3
3
B3
3
2
3
B4
-1
6
6
Min
-3
-6
El juego supone que el jugador 1 mezcla las estrategias A1 y A2 con las respectivas
probabilidades x1 y 1-x1, 0 x1 1.
El pago esperado del jugador 1 cuando el jugador 2 toma la j-sima estrategia es:
1
2
3
4
1
2
3
4
16
TEORIA DE JUEGOS
I-2011
Punto maximin
6
Valor
del
Juego
(4)
(1)
(2)
(3)
0.5
1
X1
0
-1
1
Regin de Factibilidad
-1
Para obtener las estrategias del Jugador 2, se aplica el mtodo algebraico con las rectas que
forman el punto maximin.
B3
B4
MIN
A1
-1
-1
A2
MAX
17
TEORIA DE JUEGOS
I-2011
Mtodo algebraico
(
(
18
)
)
TEORIA DE JUEGOS
I-2011
B2
-1
4
-6
4
B3
-3
-1
2
2
Min
-3
-2
-6
Las probabilidades ptimas x1, x2, , xm del Jugador 1 se pueden determinar resolviendo el
siguiente problema lineal:
Sujeto a
Sujeto a
19
TEORIA DE JUEGOS
I-2011
La estrategia del Jugador 2 es el modelo dual del Jugador 1. La solucin del juego del
Jugador 2 es y1 = 0.3211, y2 =0.0826, y3 = 0.5963, y4 = -0.9083, y5 = 0.
es v = y4 - y5 = 0 0.9083 = - 0.9083.
20
TEORIA DE JUEGOS
I-2011
Ejemplo 5. Dos cadenas de supermercados se proponen construir, cada una, una tienda en
una regin rural en donde se encuentran tres pueblos. Las distancias entre los pueblos se
muestran en la figura. Aproximadamente 45% de la poblacin de la regin vive cerca del
pueblo A, 35% vive cerca del pueblo B y 20% vive cerca del pueblo C. debido a que la
cadena I es ms grande y tiene ms prestigio que la cadena II, la cadena I controlar la
mayora de los negocios, siempre que sus ubicaciones sean comparativas. Ambas cadenas
conocen los intereses de la otra en la regin y ambas han terminado estudios de mercado
que dan proyecciones idnticas. Si ambas cadenas se sitan en el mismo pueblo o
equidistantes de un pueblo, la cadena I controlar el 65% de los negocios en ese pueblo. Si
la cadena I est ms cercana a un pueblo que la cadena II, la cadena I controlar 90% de los
negocios en este pueblo. Si la cadena I est ms alejada de un pueblo que la cadena II,
atraer a 40% de los negocios de este pueblo. El resto de las operaciones, bajo cualquier
circunstancia, irn a la cadena II. Adems, ambas cadenas saben que la poltica de la
cadena I es no ubicarse en pueblos que sean demasiado pequeos y el pueblo C cae dentro
de esta categora.
1. Formule el problema como un juego entre dos personas con suma cero y seleccione
las estrategias adecuadas, para cada una de las dos cadenas de supermercados.
2. Determine un intervalo del valor del juego, Puede operar cada cadena de
supermercado con una sola estrategia pura?
Formulacin
1. Estrategias de la Empresa A
A1: ubicarse en el pueblo A.
A2: ubicarse en el pueblo B.
21
TEORIA DE JUEGOS
I-2011
2. Estrategias de la Empresa B
B1: ubicarse en el pueblo A.
B2: ubicarse en el pueblo B.
B3: ubicarse en el pueblo C.
3. La matriz de pago representa el porcentaje capturado por la cadena I.
22
TEORIA DE JUEGOS
B3
I-2011
B1
B2
MIN
A1
65
62.5
80
62.5
A2
67.5
65
80
65
MAX 67.5
65
80
Estrategia de la Cadena I:
X = (X1, X2,) = (0, 1). La Cadena I debe construir la tienda en el pueblo B.
Estrategia de la Cadena II:
Y = (Y1, Y2, Y3) = (0, 1, 0). La Cadena II debe construir la tienda en el pueblo B.
El valor
esperado es 65, esto es, la Cadena I capturar el 65% de los negocios en el pueblo B.
23
TEORIA DE JUEGOS
I-2011
24
TEORIA DE JUEGOS
I-2011
B1
B2
MIN
A1
A2
MAX
Mtodo algebraico
25
TEORIA DE JUEGOS
Sujeto a
I-2011
Sujeto a
el Jugador 1.
La estrategia del Jugador 2 es el modelo dual del Jugador 1. La solucin del juego del
Jugador 2 es y1 = 0.5, y2 =0.5.
Estrategia del Jugador 1:
26
TEORIA DE JUEGOS
I-2011
Sospechoso
confiesa
Sospechoso B
confiesa
Sospechoso B
no confiesa
(3 , 3)
(0 , 10)
(10 , 0)
(1 , 1)
Sospechoso A no
confiesa
Sospechoso B
confiesa
Sospechoso
confiesa
MAXMIN = 0
Sospechoso B
no confiesa
MIN
-10
-10
Sospechoso A no
confiesa
0
10
MAX
10
MINMAX = 0.
TEORIA DE JUEGOS
I-2011
pena de 10 aos. Si B no confiesa, A preferir confesar, ya que de este modo ser liberado,
y si no confesara obtendr una pena de un ao. Entonces, A va a confesar,
independientemente de lo que haga B. Anlogamente, B tambin va a confesar
independientemente de lo que haga A. Es decir, ambos sospechosos van a confesar y
obtener entonces una pena de tres aos de prisin cada uno. Este es el equilibrio del juego,
que es ineficiente en el sentido de Pareto, ya que se puede reducir la condena de ambos si
ninguno confesara.
28
TEORIA DE JUEGOS
I-2011
PCPS
PCAS
ACPS
ACAS
MAX
Retirarse
C
S
(1/2)*(-1) + (1/2)*(-1)=-1
C
S
(1/2)*(-1) + (1/2)*(-2)=-1.5
C
S
(1/2)*(2) + (1/2)*(-1)=0.5
C
S
(1/2)*(2) + (1/2)*(-2)=0
0.5
Seguir
C
S
(1/2)*(-1) + (1/2)*(-1)=-1
C
S
(1/2)*(-1) + (1/2)*(1)=0
C
S
(1/2)*(1) + (1/2)*(-1)=0
C
S
(1/2)*( 1) + (1/2)*(1)= 1
1
29
MIN
-1
-1.5
0
0
TEORIA DE JUEGOS
I-2011
PCPS
PCAS
ACPS
ACAS
Retirarse
-1
-1.5
0.5
0
Seguir
-1
0
0
1
A1
A2
A3
A4
B1
-1
-1.5
0.5
0
B2
-1
0
0
1
). La fila A3 es
). La fila A4 es
B1
0.5
0
30
B2
0
1
TEORIA DE JUEGOS
I-2011
2/3 B1
1/3 B2
2/3 A3
0.5
1/3 A4
(2/3, 1/3).
El Jugador 2
31