Juegos Dinámicos Con Información Incompleta
Juegos Dinámicos Con Información Incompleta
Juegos Dinámicos Con Información Incompleta
Agosto 2020
Índice
1. Outline 2
1.1. Principales conceptos que serán abordados . . . . . . . . . . . . . 2
1.2. Bibliografı́a recomendada . . . . . . . . . . . . . . . . . . . . . . 2
2. Introducción 2
3. ENBP vs ENPS 3
3.1. Un primer juego bayesiano dinámico . . . . . . . . . . . . . . . . 3
3.2. Un segundo juego bayesiano dinámico . . . . . . . . . . . . . . . 5
3.3. Inexistencia del ENBP (estrategias puras) . . . . . . . . . . . . . 7
4. Aplicaciones económicas 8
4.1. Competencia dinámica con información asimétrica . . . . . . . . 8
4.2. Señalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2.1. Desarrollo y representación del juego . . . . . . . . . . . . 10
4.2.2. ENBP en el modelo de señales . . . . . . . . . . . . . . . 12
4.2.3. Equilibrio agrupador . . . . . . . . . . . . . . . . . . . . . 13
4.2.4. Equilibrio separador . . . . . . . . . . . . . . . . . . . . . 15
6. Summary 17
7. Ejercicios 18
1
1. Outline
1.1. Principales conceptos que serán abordados
Equilibrio de Nash Bayesiano Perfecto
Aprendizaje bayesiano
Información incompleta
Señalización
Problemas de transmisión de información, ineficiencia y second-bests
Bibliografı́a Ampliatoria:
Mas Collel, A.; Whinston, M.D & Green, J.R.(1995). Microeconomic Theory.
Oxford: Oxford university press. Capı́tulo 8.
Tirole J. y Fundenberg D. (1991). Game Theory. MIT press. Capı́tulos III
(pág 207-226) y IV (pág 319-324).
2. Introducción
En el estudio de los juegos dinámicos con información incompleta, debemos
establecer una serie de condiciones que diferencian el equilibrio de éstos respecto
del de los juegos estáticos con información incompleta. La noción es similar a la
diferenciación que hicimos entre los juegos estáticos y los dinámicos con infor-
mación completa. Especı́ficamente, un Equilibrio de Nash Bayesiano Perfecto
debe satisfacer las siguientes condiciones:1
1. Para cada conjunto informativo el jugador se forma una conjetura sobre
el nodo del conjunto de información al que ha arribado.
2. Las estrategias de los jugadores deben ser sucesivamente racionales (dadas
sus conjeturas).
3. En aquellos conjuntos informativos sobre la trayectoria de equilibrio (se
alcanzan con probabilidad no nula), las conjeturas se forman según la
Regla de Bayes y las estrategias de equilibrio de los jugadores.
4. En conjuntos informativos por fuera de la trayectoria de equilibrio (que
no son alcanzados o, análogamente, su probabilidad de ser alcanzados es
nula), las conjeturas resultan ser impuestas.
1 Se recomienda consultar Gibbons[1992(1958)] para una explicación exhaustiva.
2
Si bien puede parecer confuso a primera vista, estos conceptos serán clarifi-
cados con los ejercicios de las próximas secciones.
3. ENBP vs ENPS
3.1. Un primer juego bayesiano dinámico
Se presenta el siguiente juego dinámico2 con información imperfecta en donde
el jugador 1 primero elige entre tres posibles estrategias (L,M y R) y, luego, el
jugador 2 desconociendo la decisión del jugador 1 debe elegir entre dos
posibles estrategias (L0 y R0 ).
1 R
(2, 2)
L M
2
L0 R0 L0 R0
3
se recurre a la representación normal del juego que viene dada por:
Jugador 2
L’ R’
L 4;1 0;0
Jugador 1 M 3;0 0;1
R 2;2 2;2
P2 (nL )P (R | nL )
P2 (nL | R) = (4)
P (R)
P2 (nL )P (R | nL )
P2 (nL | R) = (5)
P2 (nL )P (R | nL ) + P2 (nM )P (R | nM )
1∗1
P2 (nL | R) = =1 (6)
1∗1+0∗1
Si el jugador 1 elige R, tiene que ser cierto que el jugador 2 elige R0 ; el ju-
gador 2 considerará óptimo elegir R0 en base a ciertas creencias impuestas.
Como la acción del jugador 1 es R, el conjunto infromativo del jugador 2
4 Probabilidad de que el jugador 2 se encuentre en uno u otro nodo del conjunto infor-
mativo.
5 El denominador se descompone por teorema de la probabilidad total.
4
es visitado con probabilidad nula por lo que sus creencias no pueden obte-
nerse a partir de la Regla de Bayes sino que se derivan del hecho de que la
acción del jugador 2 debe ser R0 . En este sentido, el jugador 2 encontrará
más atractivo elegir R0 en lugar de L0 en la medida que el pago esperado
de elegir R0 sea al menos tan bueno como el pago esperado de elegir L0 ,
es decir:
Tal que:
P2 (nM ) = 1 − P2 (nL )
1 R
(2, 2)
L M
2
L0 R0 L0 R0
0 0
M M
5
Jugador 2
L’ M’ R’
L 1;3 1;2 4;0
Jugador 1 M 4;0 0;2 3;3
R 2;2 2;2 2;2
EN = EN P S = (R, M 0 ) (9)
1 2
EN BP = (A1 = R, A2 = M 0 , ≤ P2 (nL ) ≤ ) : P2 (nM ) = 1 − P2 (nL )
3 3
En ambos casos resultó que el EN BP es igual al EN P S (salvo por el compo-
nente de conjeturas). Sin embargo, esto no necesariamente es ası́ en todo juego.
El EN BP implica un criterio de resolución más poderoso dado que incluye las
creencias de los jugadores y puede muy bien diferir del EN P S.
6
3.3. Inexistencia del ENBP (estrategias puras)
Se presenta un esquema muy similar al del primer juego bayesiano dinámico
estudiado, cuya representación extensiva está dada por:
1 R
(2, 2)
L M
2
0 0
L R L0 R0
Por otro lado, si el jugador 1 elige R no existe una única estrategia candidata
a ser la mejor respuesta del jugador 2 sino que este último debe elegir el perfil
estratégico (R0 , L0 ) como plan completo de acción frente al perfil estratégico
(L, M ) del jugador 17 .
7
4. Aplicaciones económicas
4.1. Competencia dinámica con información asimétrica
El mercado de alcohol en gel se encuentra dominado por la empresa Porta
Hermanos. De todos modos, la situación sanitaria provocada por el COVID-19
ha incentivado a varias empresas a explotar los beneficios extraordinarios que
presenta este mercado. Tal es ası́ que el laboratorio Elea Phoenix está analizan-
do la posibilidad de obtener mayor participación en el mercado en detrimento
del market share de la empresa Porta. A este contexto, se suma el hecho de que
Elea Phoenix no conoce los costos en los que incurre Porta. Sin embargo, gracias
al Data Mining del área de IT , se sabe que los costos de Porta son bajos con
probabilidad 21 .
En caso de paz, Porta cede parte de su market share tal que si sus costos
son bajos, recibe un pago de 2 y Elea Phoenix un pago de 32 ; y si sus costos
son altos, recibe un pago de 1 y Elea Phoenix un pago de 2. En caso de guerra,
Elea Phoenix recibe siempre un pago de −19 mientras que Porta Hermanos reci-
be un pago de 3 si sus costos son bajos10 y un pago de −1 si sus costos son altos.
8
N
0,5 0,5
NE Cb EP Ca NE
(0,4) (0,3)
E E
PH PH
P G P G
Porta Hermanos
PP PG GP GG
E 1,75 ; 1,5 0,25 ; 0,5 0,5 ; 2 -1 ; 1
Elea Phoenix
NE 0 ; 3,5 0 ; 3,5 0 ; 3,5 0 ; 3,5
Por lo tanto,
9
Hermanos, en el escenario de costos altos, nunca elegirı́a inicar una guerra de
precios ya que ello implicarı́a un pago de −1 cuando podrı́a obtener un pago
mayor de 1 actuando pacı́ficamente. Como el EN BP descarta las amenazas no
creı́bles, luego:
EN BP = (E, GP ) (12)
4.2. Señalización
4.2.1. Desarrollo y representación del juego
Un juego de señalización convencional sigue un desarrollo del siguiente tipo:
1. El azar determina un tipo (ti ) del conjunto de tipos posibles, T = {t1 , ..., tI },
que asigna al emisor según una distribución de probabilidad p(ti ), donde
PI
p(ti ) > 0 ∀i y i=1 p(ti ) = 1
2. El emisor observa el tipo (ti ) y elije un mensaje (mj ) del conjunto de
mensajes posibles: M = {m1 , ..., mI }
3. El receptor observa el mensaje, pero desconoce el tipo de emi-
sor11 . A partir de dicha observación, el receptor decide qué tipo de acción
(ak ) de un conjunto de acciones posibles, A = {a1 , ..., aK }, llevará a cabo.
12
4. Las ganancias vienen dadas por UE (ti , nj , ak ) y UR (ti , nj , ak ).
Nótese que en un juego de señalización de la presente estructura, una estra-
tegia pura del emisor es una función m(ti ) que especifica qué mensaje eligirá
para cada tipo que el azar pueda determinar. En el caso del receptor, una es-
trategia pura serı́a una función a(mj ), que especifica qué acción realizará según
cada mensaje que el emisor pueda, valga la redundancia, emitir (obviamente,
sin conocer el tipo de emisor).
Ahora bien, antes de analizar los tipos de equilibrios, vale la pena estudiar
estos juegos en su representación extensiva. Para facilitar la comprensión de la
representación extensiva analizaremos una aplicación económica especı́fica del
modelo de señales donde el emisor desea emitir un certificado que le brinde
11 Esta es la clave de la información asimétrica en el juego.
12 Donde UE y UR son las utilidades del emisor y receptor, respectivamente.
10
información al receptor. ¿Qué clase de información? El emisor deseará trans-
mitirle información al receptor respecto del tipo de emisor que es.
(1 − CB , 2) Emisor (1, 2)
Co Co
t=B
C NC
(−CB , 0) N Co N Co (0, 0)
p
Receptor N Receptor
1−p
(1 − CM , −1) (1, −1, 5)
Co Co
C NC
Emisor
(−CM , 0) N Co t=M N Co (0, 0)
11
El hecho de que se tengan conjuntos informativos en las decisiones del re-
ceptor denota la información incompleta que éste posee: desconoce el tipo de
emisor, no puede diferenciar entre uno bueno y uno malo. Incluso, el trabajador
de baja productividad (malo en el ejemplo) tendrá incentivos a transmitirle una
señal (falsa) respecto de su productividad16 . La señal (emisión del certificado)
tiene un costo económico: el costo de transmitir información. Especı́fi-
camente, el costo de emitir un certificado bueno (malo) será de CB (CM ), donde
asumiremos que CM > CB 17 .
1. La decisión de emitir una señal, para cada tipo de emisor, debe ser óptima
dado el comportamiento de quien recibe la señal;
2. El comportamiento del receptor es óptimo dadas sus creencias, para cada
conjunto informativo que tenga; y
3. Las creencias deben ser actualizadas según la regla de Bayes siempre que
sea posible.
16 ¿Cómo esperarı́a que sea el costo de transmitir la señal en este caso respecto del caso
en que el trabajador es de productividad alta?
17 ¿Por qué es más costoso el malo que el bueno? Si el emisor desea transmitir una infor-
mación, sea por ejemplo su elevada productividad como trabajador, le resultará más sencillo
realizarlo cuando efectivamente es más productivo (t = B) que cuando no lo es (t = M ).
18 Pooling and separating equilibriums como usalmente se los conoce en la literatura.
19 Por esto se dice que el equilibrio es separador: una conducta u otra según el tipo.
12
M ensaje(tipo)
Creencias Acción(mensaje)
m1 (B) = N C m1 (M ) = N C (13)
13
A partir de (16) y (19) se puede apreciar que:
a2 (C) = Co ∧ a2 (N C) = Co (20)
P (B) · P (N C/B)
P (B | N C) = (21)
P (B) · P (N C/B) + P (M ) · P (N C/M )
0, 5(1)
P (B | N C) = = 0, 5 (22)
0, 5(1) + 0, 5(1)
P (B | C) → No se puede derivar a partir de la regla de Bayes (23)
Ahora bien, ¿es este equilibrio agrupador un ENBP? Para ello debemos
analizar si los comportamientos de ambos jugadores son óptimos y las creencias
correctas:
1. ¿Es óptimo el comportamiento del emisor? N C es óptimo ya que24 :
14
Podemos afirmar que el equilibrio agrupador en N C es un Equilibrio de Nash
Bayesiano Perfecto. Sin embargo, nótese que este ENBP es ineficiente: no se
agotan todas las ganancias del intercambio. Nótese que si se tuviera un
modelo de mercado de trabajo donde el emisor de tipo bueno es un trabajador
de productividad alta (y viceversa), el de productividad alta no podrı́a emitir
la señal y diferenciarse del de productividad baja26 . El equilibrio es claramente
ineficiente27 . Existirı́a una mejora paretiana si el emisor de tipo bueno pudiera
transmitirle la señal al receptor que revele su tipo, mientras que el de tipo malo
no lo harı́a28 . A su vez, el receptor quisiera únicamente comprar la señal cuando
el emisor es de tipo bueno y no cuando es de tipo malo29 . Precisamente éste
serı́a un equilibrio separador, objetivo de la próxima sección.
m1 (B) = C m1 (M ) = N C (27)
Ahora bien, para que esta estrategia sea óptima debe ser cierto que:
P (B | C) = 1 ∧ P (B | N C) = 0 (31)
26 Si bien siguiendo a rajatabla la lógica del juego aquı́ planteado, el trabajador no recibirı́a
beneficio alguno inemediato por la transmisión (más bien incurrirı́a en el costo), el beneficio de
diferenciarse puede dar lugar a beneficios en el mediano plazo en su relación con el empleador,
beneficios no monetarios en su contrato laboral, etc.
27 Puede pensárselo no solo como un problema de información incompleta, sino también
como uno de selección adversa. Es notoria la falla de mercado en la asignación de recursos y,
por ello, la ineficiencia de este equilibrio agrupador.
28 Nótese que en caso de contratar uno de baja productividad sin haber recibido la señal,
la utilidad del receptor es de -1,5 en lugar de -1, situación en la que conocerı́a la baja produc-
tividad gracias a la señal)
29 Lo cual puede ser justificado en la medida en que los empleadores solo busquen tra-
bajadores de productividad alta pero no puedan diferenciarlos producto de la información
incompleta
30 ¿Cómo demostrarı́a esto?
15
¿Es un ENBP? El comportamiento del receptor es óptimo, dado que no
tiene desviaciones unilaterales beneficiosas. Si eligiera N Co al recibir la señal,
su utilidad serı́a de 0 en lugar de 2. Si eligiera Co al no haber recibido la señal,
su utilidad serı́a -1,5 en lugar de 0. Las probabilidades no deben cumplir ningún
requisito en particular, como sı́ lo eran en la sección anterior. Por último, será
óptima la estrategia del emisor sı́ y solo sı́ se cumple (28), lo cual es análogo a
decir que: CM > 1 > CB . Siempre que el costo de emitir el certificado
malo sea mayor que el bueno, la estrategia de separación aquı́ plantea-
da será óptima para el emisor.. ¿Por qué surge esta condición? Especificar
las decisiones de los jugadores en la representación extensiva puede facilitarnos
el análisis:
(1 − CB , 2) Emisor (1, 2)
Co Co
t=B
C NC
(−CB , 0) N Co N Co (0, 0)
p
Receptor N Receptor
1−p
(1 − CM , −1) (1, −1, 5)
Co Co
C NC
Emisor
(−CM , 0) N Co t=M N Co (0, 0)
¿Por qué 1 − CB > 0? El emisor sabe que la acción óptima del receptor será
N Co cuando no recibe la señal, pero no solo para el caso en que es de tipo malo
sino también para el caso contrario. Entonces, si 1 − CB < 0, el emisor jamás
tendrı́a incentivos a emitir la señal cuando es de tipo bueno y no emitirla cuando
es tipo malo, porque sabe que el receptor elegiriá N Co y su utilidad serı́a mayor
por no emitir la señal. El mismo análisis aplica para la condición sobre CM y
en rojo se destacan los senderos de equilibrios y el plan completo de acción del
receptor para facilitar la comprensión.
16
5. Breve disgresión sobre tipos de equilibrios
A lo largo del estudio de la teorı́a de juegos, hemos ido especificando diversos
tipos de equilibrio para los juegos según la información con la que cuenten los
jugadores y el timing del juego.
6. Summary
Para el Equilibrio de Nash Bayesiano Perfecto, tener en cuenta que:
Se ignoran las amenazas o promesas no creı́bles;
Las acciones elegidas en cada conjunto informativo son óptimas, dados los
comportamientos de equilibrio y las creencias;
En equilibrio, las creencias se modifican en función del comportamiento
de equilibrio observado; y
En equilibrios distintos, la evolución de las creencias (aprendizaje) cambia.
En el Equilibrio de Nash Bayesiano Perfecto en juegos de señales,
recordar que:
La decisión de emitir una señal es óptima, dado el comportamiento de
quien recibe la señal;
31 Juego de continuación es el equivalente a subjuego dentro del mundo de la información
17
El comportamiento de quien recibe la señal es óptimo, dadas sus creencias;
Las creencias son actualizadas según la Regla de Bayes, cuando es posible;
Tanto el equilibrio agrupador como el equilibrio separador cumplen dichas
condiciones y se deben verificar para cada tipo de jugador 1 y para cada
conjunto informativo del jugador 2; y
La asignación del equilibrio agrupador es ineficiente y la del equilibrio
separador, si bien se trata de un second-best, es eficiente.
7. Ejercicios
Ejercicio 1. Demuestre que no existe un EN P S, al menos en estrategias puras,
en el ejercicio de la sección (3.3).
Ejercicio 2. Encuentre el EN BP del ejercicio de la sección (4.1) aplicando
los conceptos de Backward Induction y pagos esperados vs pagos ciertos.
18