Juegos Dinámicos Con Información Incompleta

Juegos dinámicos con información incompleta
Juan Pablo Albornoz & Agustı́n Cucchiaro*
Agosto 2020
Índice
1. Outline 2
1.1. Principales conceptos que serán abordados . . . . . . . . . . . . . 2
1.2. Bibliografı́a recomendada . . . . . . . . . . . . . . . . . . . . . . 2
2. Introducción 2
3. ENBP vs ENPS 3
3.1. Un primer juego bayesiano dinámico . . . . . . . . . . . . . . . . 3
3.2. Un segundo juego bayesiano dinámico . . . . . . . . . . . . . . . 5
3.3. Inexistencia del ENBP (estrategias puras) . . . . . . . . . . . . . 7
4. Aplicaciones económicas 8
4.1. Competencia dinámica con información asimétrica . . . . . . . . 8
4.2. Señalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2.1. Desarrollo y representación del juego . . . . . . . . . . . . 10
4.2.2. ENBP en el modelo de señales . . . . . . . . . . . . . . . 12
4.2.3. Equilibrio agrupador . . . . . . . . . . . . . . . . . . . . . 13
4.2.4. Equilibrio separador . . . . . . . . . . . . . . . . . . . . . 15
5. Breve disgresión sobre tipos de equilibrios 17
6. Summary 17
7. Ejercicios 18
* La presente nota de clase fue escrita para el curso Microeconomı́a II de la Facultad

de Ciencias Económicas (Universidad de Buenos Aires) dictado por el Dr. Aromı́. Todos los
errores y omisiones son exclusiva responsabilidad de los autores.
1
1. Outline
1.1. Principales conceptos que serán abordados
Equilibrio de Nash Bayesiano Perfecto
Aprendizaje bayesiano
Información incompleta
Señalización
Problemas de transmisión de información, ineficiencia y second-bests
1.2. Bibliografı́a recomendada

Bibliografı́a principal: Gibbons, R.(1958). Un primer curso de teorı́a de jue-
gos. Barcelona: Antoni Bosch. Capı́tulo 4.
Bibliografı́a Ampliatoria:
Mas Collel, A.; Whinston, M.D & Green, J.R.(1995). Microeconomic Theory.
Oxford: Oxford university press. Capı́tulo 8.
Tirole J. y Fundenberg D. (1991). Game Theory. MIT press. Capı́tulos III
(pág 207-226) y IV (pág 319-324).
2. Introducción
En el estudio de los juegos dinámicos con información incompleta, debemos
establecer una serie de condiciones que diferencian el equilibrio de éstos respecto
del de los juegos estáticos con información incompleta. La noción es similar a la
diferenciación que hicimos entre los juegos estáticos y los dinámicos con infor-
mación completa. Especı́ficamente, un Equilibrio de Nash Bayesiano Perfecto
debe satisfacer las siguientes condiciones:1
1. Para cada conjunto informativo el jugador se forma una conjetura sobre
el nodo del conjunto de información al que ha arribado.
2. Las estrategias de los jugadores deben ser sucesivamente racionales (dadas
sus conjeturas).
3. En aquellos conjuntos informativos sobre la trayectoria de equilibrio (se
alcanzan con probabilidad no nula), las conjeturas se forman según la
Regla de Bayes y las estrategias de equilibrio de los jugadores.
4. En conjuntos informativos por fuera de la trayectoria de equilibrio (que
no son alcanzados o, análogamente, su probabilidad de ser alcanzados es
nula), las conjeturas resultan ser impuestas.
1 Se recomienda consultar Gibbons[1992(1958)] para una explicación exhaustiva.
2
Si bien puede parecer confuso a primera vista, estos conceptos serán clarifi-
cados con los ejercicios de las próximas secciones.
Como se mencionaba, las conjeturas y la regla de aprendizaje en general es

la Regla de Bayes:
P (X ∩ Y )
P (X ∩ Y ) = P (X)P (Y | X) → P (Y | X) = si P (X) 6= 0 (1)
P (X)
Dada la fórmula, se puede ver con facilidad por qué la regla solo vale para con-
juntos informativos visitados con probabilidad no nula: el denominador debe ser
distinto de 0 tal que la Regla de Bayes pueda ser aplicada.
Los juegos dinámicos con información incompleta pueden interpretarse como

juegos dinámicos con información completa pero imperfecta tal que el Equili-
brio de Nash Bayesiano Perfecto refuerza el criterio de Equilibrio de Nash Per-
fecto en Subjuegos. Los equilibrios de estos juegos (bayesianos) permiten que
exista aprendizaje (en el equilibrio) y que los agentes modifiquen sus creencias
en equilibrio (noción similar a la idea de reputación).
Nuevamente, ahondaremos en esta temática a lo largo de la nota y, especı́fi-

camente, en la sección (5). En la próxima sección estudiaremos unos juegos
iniciales para reforzar estos nuevos conceptos.
3. ENBP vs ENPS
3.1. Un primer juego bayesiano dinámico
Se presenta el siguiente juego dinámico2 con información imperfecta en donde
el jugador 1 primero elige entre tres posibles estrategias (L,M y R) y, luego, el
jugador 2 desconociendo la decisión del jugador 1 debe elegir entre dos
posibles estrategias (L0 y R0 ).
1 R
(2, 2)
L M
2
L0 R0 L0 R0
(4, 1) (0, 0) (3, 0) (0, 1)
Debido a la existencia de información imperfecta, el jugador 2 enfrenta un

conjunto informativo que hace que exista un único subjuego, que es el juego
en sı́ mismo. Por lo tanto, el EN P S coincidirá con el EN 3 . Para encontrarlo,
2 Ejercicio 1, inciso b.
3 Equilibrio de Nash Perfecto en Subjuegos y Equilibrio de Nash, respectivamente.
3
se recurre a la representación normal del juego que viene dada por:
Jugador 2
L’ R’
L 4;1 0;0
Jugador 1 M 3;0 0;1
R 2;2 2;2
Se concluye entonces que,
EN = EN P S = {(L, L0 ), (R, R0 )} (2)
Ahora bien, para encontrar el EN BP es necesario definir,

La acción del jugador 1 dado lo que hace el jugador 2;
La acción del jugador 2 dado lo que hace el jugador 1; y
Las creencias4 del jugador 2 de manera tal que todo ello sea consistente.
Esquemáticamente, esto se puede expresar como:
EN BP = {A1 , A2 , P2 (nL )} : P2 (nM ) = 1 − P2 (nL ) (3)
Para computar el EN BP , la metodologı́a de trabajo consiste en plantear las

distintas posibilidades y analizar su consistencia:
Si el jugador 1 elige L, tiene que ser cierto que el jugador 2 elige L0 ;
el jugador 2, en base a sus creencias, considera casi con certeza que se
encuentra en nL (lo cual es equivalente a decir que toma como dado que
la acción del jugador 1 es elegir L) por lo cual encuentra óptimo elegir L0 .
Como la acción del jugador 1 es L, el conjunto informativo del jugador
2 es visitado con probabilidad positiva por lo que sus creencias pueden
obtenerse a partir de la Regla de Bayes 5 :
P2 (nL )P (R | nL )
P2 (nL | R) = (4)
P (R)
P2 (nL )P (R | nL )
P2 (nL | R) = (5)
P2 (nL )P (R | nL ) + P2 (nM )P (R | nM )
1∗1
P2 (nL | R) = =1 (6)
1∗1+0∗1
Si el jugador 1 elige R, tiene que ser cierto que el jugador 2 elige R0 ; el ju-
gador 2 considerará óptimo elegir R0 en base a ciertas creencias impuestas.
Como la acción del jugador 1 es R, el conjunto infromativo del jugador 2
4 Probabilidad de que el jugador 2 se encuentre en uno u otro nodo del conjunto infor-
mativo.
5 El denominador se descompone por teorema de la probabilidad total.
4
es visitado con probabilidad nula por lo que sus creencias no pueden obte-
nerse a partir de la Regla de Bayes sino que se derivan del hecho de que la
acción del jugador 2 debe ser R0 . En este sentido, el jugador 2 encontrará
más atractivo elegir R0 en lugar de L0 en la medida que el pago esperado
de elegir R0 sea al menos tan bueno como el pago esperado de elegir L0 ,
es decir:
0 ∗ P2 (nL ) + 1 ∗ [1 − P2 (nL )] ≥ 1 ∗ P2 (nL ) + 0 ∗ [1 − P2 (nL )] (7)

1
1 − P2 (nL ) ≥ P2 (nL ) → P2 (nL ) ≤ (8)
2
Si el jugador 1 elige M , tiene que ser cierto que el jugador 2 elige L0 ; pero
el jugador 2, en base a sus creencias, considera casi con certeza que se
encuentra en nM por lo cual encontrarı́a óptimo elegir R0 en lugar de L0 .
Luego, los EN BP están dados por:

0 0 1
(A1 = L, A2 = L , P2 (nL ) = 1), (A1 = R, A2 = R , P2 (nL ) ≤ )
2
Tal que:
P2 (nM ) = 1 − P2 (nL )
3.2. Un segundo juego bayesiano dinámico

Se presenta el siguiente juego6 dinámico con información imperfecta en donde
el jugador 1 primero elige entre tres posibles estrategias (L,M y R) y, luego, el
jugador 2 desconociendo la decisión del jugador 1 debe elegir entre otras tres
posibles estrategias (L0 , M 0 y R0 ).
1 R
(2, 2)
L M
2
L0 R0 L0 R0
0 0
M M
(1, 3) (1, 2) (4, 0) (4, 0) (0, 2) (3, 3)
Al igual que en el juego anterior, el jugador 2 presenta un conjunto infor-

mativo que hace que exista un único subjuego, que es el juego en sı́ mismo por
lo cual el EN P S coincide con el EN mientras que la representación normal del
juego está dada por:
6 Ejercicio 1, inciso b.
5
Jugador 2
L’ M’ R’
L 1;3 1;2 4;0
Jugador 1 M 4;0 0;2 3;3
R 2;2 2;2 2;2
De ello resulta que,
EN = EN P S = (R, M 0 ) (9)
Para encontrar el EN BP se realiza el siguiente análisis:

Si el jugador 1 elige L, tiene que ser cierto que el jugador 2 elige R0 ;
pero si el jugador 2, dadas sus creencias, considera casi con certeza que
se encuentra en nL nunca encontrará óptimo elegir R0 cuando puede estar
mejor eligiendo cualquiera de las otras dos estrategias.
Si el jugador 1 elige M , tiene que ser cierto que el jugador 2 elige L0 ;
pero si el jugador 2, dadas sus creencias, considera casi con certeza que se
encuentra en nM nunca encontrará óptimo elegir L0 cuando puede estar
mejor eligiendo cualquiera de las otras dos estrategias.
Si el jugador 1 elige R, tiene que ser cierto que el jugador 2 elige M 0 tal que
el jugador 2 encontrará óptimo elegir M 0 en base a ciertas creencias im-
puestas. Ası́, dado que la acción del jugador 1 es R, los nodos del conjunto
informativo nunca son visitados (son visitados con probabilidad nula) por
lo que las creencias del jugador 2 no se pueden computar a partir de la
Regla de Bayes sino que responden a los incentivos necesarios para que el
jugador 2 elija M 0 y no L0 o R0 tal que,
1
2 ∗ P2 (nL ) + 2 ∗ [1 − P2 (nL )] ≥ 0 ∗ P2 (nL ) + 3 ∗ [1 − P2 (nL )] → P2 (nL ) ≥
3
2
2 ∗ P2 (nL ) + 2 ∗ [1 − P2 (nL )] ≥ 3 ∗ P2 (nL ) + 0 ∗ [1 − P2 (nL )] → P2 (nL ) ≤
3
Luego,
1 2
≤ P2 (nL ) ≤
3 3
De ello resulta que el EN BP queda definido por,
1 2
EN BP = (A1 = R, A2 = M 0 , ≤ P2 (nL ) ≤ ) : P2 (nM ) = 1 − P2 (nL )
3 3
En ambos casos resultó que el EN BP es igual al EN P S (salvo por el compo-
nente de conjeturas). Sin embargo, esto no necesariamente es ası́ en todo juego.
El EN BP implica un criterio de resolución más poderoso dado que incluye las
creencias de los jugadores y puede muy bien diferir del EN P S.
6
3.3. Inexistencia del ENBP (estrategias puras)
Se presenta un esquema muy similar al del primer juego bayesiano dinámico
estudiado, cuya representación extensiva está dada por:
1 R
(2, 2)
L M
2
0 0
L R L0 R0
(3, 0) (0, 1) (0, 1) (3, 0)
La metodologı́a de análisis es análoga a la anterior, es decir, encontrar la

acción del jugador 1 (dada la acción del jugador 2), la acción del jugador 2
(dada la acción del jugador 1) y las creencias del jugador 2 de manera tal que
todo sea consistente.
Si el jugador 1 elige L, tiene que ser cierto que el jugador 2 elige L0 .
Pero el jugador 2 considera, dadas sus creencias, que se encuentra casi con
certeza en el nodo nL , por lo cual nunca verı́a óptimo elegir L0 sino que
tiene incentivos para elegir R0 .
Si el jugador 1 elige M , tiene que ser cierto que el jugador 2 elige R0 .
Pero el jugador 2 considera, dadas sus creencias, que se encuentra casi con
certeza en el nodo nM , por lo cual nunca verı́a óptimo elegir R0 sino que
tiene incentivos para elegir L0 .
En estos dos casos previos, las acciones del jugador 2 no son una mejor res-
puesta dadas sus creencias.
Por otro lado, si el jugador 1 elige R no existe una única estrategia candidata
a ser la mejor respuesta del jugador 2 sino que este último debe elegir el perfil
estratégico (R0 , L0 ) como plan completo de acción frente al perfil estratégico
(L, M ) del jugador 17 .
Entonces, no existe un EN BP en estrategias puras para este juego y se

puede demostrar que el juego cuenta con un EN BP en estrategias mixtas
definido como:

0 0 1
A1 = R, A2 = (Rp= 1,L 1 ), P2 (nL ) =
p= 2 : P2 (nM ) = 1 − P2 (nL ) (10)
2 2
Además, se destaca que las creencias del jugador 2 no se pueden calcular por
Regla de Bayes sino que son impuestas ya que si el jugador 1 elige R, el juego
nunca se desarrolla en el conjunto informativo.
7 No confundir con el hecho de que el jugador 1 elige R como acción.
7
4. Aplicaciones económicas
4.1. Competencia dinámica con información asimétrica
El mercado de alcohol en gel se encuentra dominado por la empresa Porta
Hermanos. De todos modos, la situación sanitaria provocada por el COVID-19
ha incentivado a varias empresas a explotar los beneficios extraordinarios que
presenta este mercado. Tal es ası́ que el laboratorio Elea Phoenix está analizan-
do la posibilidad de obtener mayor participación en el mercado en detrimento
del market share de la empresa Porta. A este contexto, se suma el hecho de que
Elea Phoenix no conoce los costos en los que incurre Porta. Sin embargo, gracias
al Data Mining del área de IT , se sabe que los costos de Porta son bajos con
probabilidad 21 .
La presente situación se puede describir como un juego dinámico con infor-

mación incompleta que tiene la siguiente secuencia temporal:
1. El laboratorio Elea Phoenix decide si aumentar o no su participación en

el mercado de alcohol en gel.
2. La empresa Porta Hermanos decide si iniciar o no una guerra de precios
para defender su market share.
Si Elea Phoenix decide no expandirse, el juego finaliza con un pago de 4
y de 3 para Porta Hermanos si sus costos son bajos y altos, respectivamente,
mientras que el laboratorio no recibe nada. En cambio, si Elea Phoenix decide
expandirse, pueden suceder dos escenarios: que haya paz o que haya guerra8 .
En caso de paz, Porta cede parte de su market share tal que si sus costos
son bajos, recibe un pago de 2 y Elea Phoenix un pago de 32 ; y si sus costos
son altos, recibe un pago de 1 y Elea Phoenix un pago de 2. En caso de guerra,
Elea Phoenix recibe siempre un pago de −19 mientras que Porta Hermanos reci-
be un pago de 3 si sus costos son bajos10 y un pago de −1 si sus costos son altos.
La representación extensiva del juego viene dada por:

8 Lo cual puede pensarse como una competencia por precio que lleva a las dos empresas a
reducir fuertemente sus márgenes de ganancias quizás hasta el punto de competencia perfecta.
9 Este resultado puede pensarse como consecuencia de los costos incurridos en el intento
frustrado de ampliar su participación en el mercado de alcohol en gel como consecuencia de
la guerra de precios.
10 A su vez, el hecho de que Porta Hermanos obtenga un pago de 3 en caso de tener una
estructura de costos bajos puede pensarse como la diferencia entre esta firma y Elea Phoenix
en términos de que ya esté establecida en el mercado, tenga el know-how de producción y
ventas e, incluso, una estructura de costos más eficiente que la rival a la hora de comenzar la
guerra de precios.
8
N
0,5 0,5
NE Cb EP Ca NE
(0,4) (0,3)
E E
PH PH
P G P G
( 32 ,2) (-1,3) (2,1) (-1,-1)
Dado que un subjuego es un subconjunto de cualquier juego que incluye un

nodo inicial, independiente de cualquier conjunto informativo, y todos sus nodos
sucesores, en este juego en particular se presentan tres subjuegos considerando
al juego en sı́ mismo como un subjuego. Sin considerar al juego en sı́ mismo, los
otros dos subjuegos se pueden representar en forma normal como:
Escenario de costo bajo (1/2)

Porta Hermanos
P G
E 1,5 ; 2 -1 ; 3
Elea Phoenix
NE 0;4 0;4
Escenario de costo alto (1/2)

Porta Hermanos
P G
E 2 ; 1 -1 ; -1
Elea Phoenix
NE 0 ; 3 0;3
A partir de estas matrices de pagos, es posible construir la matriz de pagos

que constituye la representación normal del juego en términos bayesianos,
Porta Hermanos
PP PG GP GG
E 1,75 ; 1,5 0,25 ; 0,5 0,5 ; 2 -1 ; 1
Elea Phoenix
NE 0 ; 3,5 0 ; 3,5 0 ; 3,5 0 ; 3,5
Por lo tanto,
EBN = {(E, GP ), (N E, GG)} (11)

A fines del análisis dinámico, el problema del EBN es que incluye el perfil
estratégico (N E, GG) que es una amenaza no creı́ble. Esto se debe a que Porta
9
Hermanos, en el escenario de costos altos, nunca elegirı́a inicar una guerra de
precios ya que ello implicarı́a un pago de −1 cuando podrı́a obtener un pago
mayor de 1 actuando pacı́ficamente. Como el EN BP descarta las amenazas no
creı́bles, luego:
EN BP = (E, GP ) (12)
4.2. Señalización
4.2.1. Desarrollo y representación del juego
Un juego de señalización convencional sigue un desarrollo del siguiente tipo:
1. El azar determina un tipo (ti ) del conjunto de tipos posibles, T = {t1 , ..., tI },
que asigna al emisor según una distribución de probabilidad p(ti ), donde
PI
p(ti ) > 0 ∀i y i=1 p(ti ) = 1
2. El emisor observa el tipo (ti ) y elije un mensaje (mj ) del conjunto de
mensajes posibles: M = {m1 , ..., mI }
3. El receptor observa el mensaje, pero desconoce el tipo de emi-
sor11 . A partir de dicha observación, el receptor decide qué tipo de acción
(ak ) de un conjunto de acciones posibles, A = {a1 , ..., aK }, llevará a cabo.
12
4. Las ganancias vienen dadas por UE (ti , nj , ak ) y UR (ti , nj , ak ).
Nótese que en un juego de señalización de la presente estructura, una estra-
tegia pura del emisor es una función m(ti ) que especifica qué mensaje eligirá
para cada tipo que el azar pueda determinar. En el caso del receptor, una es-
trategia pura serı́a una función a(mj ), que especifica qué acción realizará según
cada mensaje que el emisor pueda, valga la redundancia, emitir (obviamente,
sin conocer el tipo de emisor).
Como se ha mencionado a lo largo de esta nota, en el juego de señalización

también habrá aprendizaje. Especı́ficamente, se trata de un juego de apren-
dizaje bayesiano. Aquı́, los agentes observan y modifican sus creencias. Los
aprendizajes serán distintos según el tipo de equilibrio. ¿Por qué hablamos de
tipos de equilibrios? En la siguiente sección veremos que hay dos grandes tipos
de equilibrios en estos juegos: agrupadores y separadores o pooling and separa-
ting equilibriums como usualmente se los conoce.
Ahora bien, antes de analizar los tipos de equilibrios, vale la pena estudiar
estos juegos en su representación extensiva. Para facilitar la comprensión de la
representación extensiva analizaremos una aplicación económica especı́fica del
modelo de señales donde el emisor desea emitir un certificado que le brinde
11 Esta es la clave de la información asimétrica en el juego.
12 Donde UE y UR son las utilidades del emisor y receptor, respectivamente.
10
información al receptor. ¿Qué clase de información? El emisor deseará trans-
mitirle información al receptor respecto del tipo de emisor que es.
Un ejemplo tradicional es el del mercado de trabajo con información

incompleta y/o selección adversa. Los empleadores desconocen la pro-
ductividad de los postulantes y no tienen forma de discernir entre uno de
productividad alta y uno de productividad baja. Solo podrán saberlo si los con-
tratan al ver su desempeño en el puesto de trabajo13 . Aquellos trabajadores de
productividad alta desearán transmitirle información a los empleadores acerca
de su alta productividad relativa respecto del resto de los trabajadores para
aumentar sus probabilidades de ser empleados. Las “credenciales”14 (diplomas,
tı́tulos de estudios académicos, certificados de exámenes, cartas de recomenda-
ción, verificación por parte de colegas respecto a las aptitudes que ostentan en el
CV, etc.) que puedan ostentar actúan como un mecanismo de transmisión de in-
formación que facilita la selección de personal que llevan a cabo los empleadores.
Ya comentado el problema económico, analizemos la representación extensiva

de un juego de señales:
(1 − CB , 2) Emisor (1, 2)
Co Co
t=B
C NC
(−CB , 0) N Co N Co (0, 0)
p
Receptor N Receptor
1−p
(1 − CM , −1) (1, −1, 5)
Co Co
C NC
Emisor
(−CM , 0) N Co t=M N Co (0, 0)
La secuencia del juego comienza por el nodo central. La naturaleza (N ) de-

termina el tipo (t) de emisor. Con probabilidad p el emisor será del tipo bueno
(B) y con probabilidad 1−p será del tipo malo (M ). En función de ello, el emisor
tiene dos alternativas: emitir el certificado (C) o no emitirlo (N C). El receptor,
que desconoce el tipo de emisor pero sabe si se emitió o no el certificado15 anali-
zará la utilidad esperada de contratar (Co) y no contratar (N Co) al trabajador.
13 En caso de que no exista un mecanismo de señalización que resuelva este problema de

transmisión de información, ¿cuáles serı́an los efectos de dicho problema informativo sobre la
eficiencia en la asignación de recursos y el bienestar económico?
14 Certificado de aquı́ en más.
15 Dicho de otro modo, si el emisor le transmitió o no información.
11
El hecho de que se tengan conjuntos informativos en las decisiones del re-
ceptor denota la información incompleta que éste posee: desconoce el tipo de
emisor, no puede diferenciar entre uno bueno y uno malo. Incluso, el trabajador
de baja productividad (malo en el ejemplo) tendrá incentivos a transmitirle una
señal (falsa) respecto de su productividad16 . La señal (emisión del certificado)
tiene un costo económico: el costo de transmitir información. Especı́fi-
camente, el costo de emitir un certificado bueno (malo) será de CB (CM ), donde
asumiremos que CM > CB 17 .
Nótese una cuestión de no menor importancia acerca de las consecuencias de

la transmisión de la señal. Hemos destacado la consecuencia que tiene sobre los
costos. Sin embargo, serı́a razonable pensar que la transmisión de información
podrı́a tener un impacto sobre el bienestar del emisor. En el modelo aquı́
planteado descartamos este efecto y asumimos que la señal solo tiene un
costo de transmisión, mientras que no tiene un valor intrı́nseco que
impacte sobre el bienestar del receptor. ¿Cómo notarlo en la representa-
ción extensiva? Véase, por ejemplo, que cuando el emisor es “bueno”, sea que
emita o no emita el certificado y la acción del receptor sea contratarlo (Co),
en ambos casos su utilidad será de 2 (independientemente de que reciba o no
la señal, el certificado). Si tuviera un valor intrı́nseco, la recepción de la señal
aumentarı́a la utilidad del receptor en el caso en que éste la reciba.
4.2.2. ENBP en el modelo de señales

En la resolución del juego de señales planteado abordaremos dos tipos de
equilibrios: agrupadores y separadores18 . En el primer caso, el emisor realizará
una única acción: emitir o no emitir el certificado. En el segundo caso se tiene
el resultado “ideal” de la transmisión de la señal: el emisor emite el certifica-
do cuando es bueno, mientras que no lo hace cuando es malo19 . Para que los
equilibrios mencionados sean ENBP deben cumplirse 3 requisitos:
1. La decisión de emitir una señal, para cada tipo de emisor, debe ser óptima
dado el comportamiento de quien recibe la señal;
2. El comportamiento del receptor es óptimo dadas sus creencias, para cada
conjunto informativo que tenga; y
3. Las creencias deben ser actualizadas según la regla de Bayes siempre que
sea posible.
16 ¿Cómo esperarı́a que sea el costo de transmitir la señal en este caso respecto del caso
en que el trabajador es de productividad alta?
17 ¿Por qué es más costoso el malo que el bueno? Si el emisor desea transmitir una infor-
mación, sea por ejemplo su elevada productividad como trabajador, le resultará más sencillo
realizarlo cuando efectivamente es más productivo (t = B) que cuando no lo es (t = M ).
18 Pooling and separating equilibriums como usalmente se los conoce en la literatura.
19 Por esto se dice que el equilibrio es separador: una conducta u otra según el tipo.
12
M ensaje(tipo)
Creencias Acción(mensaje)
En las próximas secciones abordaremos estas cuestiones, que a priori pueden

resultar confusas, a partir del juego planteado.
4.2.3. Equilibrio agrupador

Asumiremos que las probabilidades de que el emisor sea del tipo bueno o
malo serán de 0, 5 para ambos casos. Solo se analizará el equilibrio agrupador
donde el emisor no logra transmitir información, independientemente del
tipo. Recuérdese que el emisor elige un mensaje que es función de su tipo.
Entonces, en el equilibrio agrupador donde no emite el certificado se tendrá
(por hipótesis) que:
m1 (B) = N C m1 (M ) = N C (13)
El receptor sabe que el emisor no emitió un certificado, pero desconoce el

tipo de emisor20 . Ası́, comparará las utilidades esperadas de contratar o no
contratar al trabajador, dado que no se emitió una señal, para ası́ decidir su
acción óptima: a2 (N C)
U2e [Co | N C] = 0, 5(2) + 0, 5(−1, 5) = 0, 25 (14)

U2e [N Co | N C] = 0, 5(0) + 0, 5(0) =0 (15)
U2e [Co | N C] > U2e [N Co | N C] (16)
Se puede ver que la utilidad esperada de contratarlo condicional a no haber

recibido una señal es mayor que la de no contratarlo dado que no recibió el
certificado21 . Pero la estrategia de un jugador debe ser un plan completo de
acción, entonces también tiene que considerar qué acción realizarı́a en función
de que se emitió el certificado: a2 (C)
U2e [Co | C] = 0, 5(2) + 0, 5(−1) = 0, 5 (17)

U2e [N Co | C] = (0, 5)0 + (0, 5)0 = 0 (18)
U2e [Co | C] > U2e [N Co | C] (19)
20 Nos encontramos en la sección derecha de la representación extensiva del juego.
21 Este resultado puede ser interpretado como la necesidad de los demandantes de trabajo
de cubrir una vacante laboral. La consecuencia sobre la eficiencia en la asignación de recursos
es que dicha demanda de trabajo puede resultar en la contratación de un trabajador de baja
productividad producto del problema de informacón, lo cual es ineficiente ya que de haberlo
sabido los empleadores podrı́an haber pagado un menor salario (u ofrecido uno mayor para
los de productividad alta).
13
A partir de (16) y (19) se puede apreciar que:
a2 (C) = Co ∧ a2 (N C) = Co (20)
Por útlimo, para poder determinar si existe o no un ENBP agrupador en N C

debemos computar las probabilidades condicionales de que el emisor sea del tipo
“bueno” dado que se emitió y no se emitió el certificado respectivamente: 22
P (B) · P (N C/B)
P (B | N C) = (21)
P (B) · P (N C/B) + P (M ) · P (N C/M )
0, 5(1)
P (B | N C) = = 0, 5 (22)
0, 5(1) + 0, 5(1)
P (B | C) → No se puede derivar a partir de la regla de Bayes (23)
¿Por qué P (B | C) no se puede derivar a partir de la regla de Bayes? Esto se

debe a que P (C) = 0 por (13): dicha rama del juego se alcanza con probabilidad
nula. P (B | C) será una elección arbitraria. Podrá tomar distintos valores sı́ y
solo sı́ no modifica los resultados de equilibrio. Debe ser cierto que:23
U2e [Co] > U2e [N Co] (24)

2 · P (B | f) + (−1)[1 − P (B | f)] > 0 (25)
1 1
P (B | f) > ⇒ P (B | C) > (26)
3 3
Donde P (B | f) es la probabilidad de que el emisor sea bueno dado el conjun-
to de información disponible que tiene el receptor en el momento de decisión (f).
Ahora bien, ¿es este equilibrio agrupador un ENBP? Para ello debemos
analizar si los comportamientos de ambos jugadores son óptimos y las creencias
correctas:
1. ¿Es óptimo el comportamiento del emisor? N C es óptimo ya que24 :
U1 [C | Co] = 1 − CB ó 1 − CM < U1 [N C | Co] = 1 ∀t = B, M
2. ¿Es óptimo el comportamiento del receptor? Sı́, dado que en promedio su

utilidad esperada por contratar será mayor a la de no contratar25 .
1
3. ¿Son estas creencias creı́bles? Lo son sı́ y solo sı́ P (B | C) > 3
22 ¿Por qué P (N C/B) = 1 y P (N C/M ) = 1?
23 Nótese que es la utilidad esperada no condicional al mensaje emitido por el emisor, a
diferencia de lo planteado anteriormente.
24 Lo cual puede pensarse como una consecuencia de que el emisor sepa que será contratado
independientemente de su tipo, motivo por el cual no tendrı́a incentivo alguno a transmitir
información.
25 No debe pasar por desapercibido el hecho de que en promedio su utilidad será mayor,
lo cual elimina las consecuencias del desafortunado evento de contratar un trabajador de baja
productividad en una situación puntual.
14
Podemos afirmar que el equilibrio agrupador en N C es un Equilibrio de Nash
Bayesiano Perfecto. Sin embargo, nótese que este ENBP es ineficiente: no se
agotan todas las ganancias del intercambio. Nótese que si se tuviera un
modelo de mercado de trabajo donde el emisor de tipo bueno es un trabajador
de productividad alta (y viceversa), el de productividad alta no podrı́a emitir
la señal y diferenciarse del de productividad baja26 . El equilibrio es claramente
ineficiente27 . Existirı́a una mejora paretiana si el emisor de tipo bueno pudiera
transmitirle la señal al receptor que revele su tipo, mientras que el de tipo malo
no lo harı́a28 . A su vez, el receptor quisiera únicamente comprar la señal cuando
el emisor es de tipo bueno y no cuando es de tipo malo29 . Precisamente éste
serı́a un equilibrio separador, objetivo de la próxima sección.
4.2.4. Equilibrio separador

Analicemos el equilibrio separador donde el emisor de tipo bueno emite el
certificado, mientras que el de tipo malo no lo hace:
m1 (B) = C m1 (M ) = N C (27)
Ahora bien, para que esta estrategia sea óptima debe ser cierto que:
1 − CB > 0 1 − CM < 0 (28)
Ahora el receptor observa la señal únicamente cuando el emisor es de ti-

po bueno. En este caso no tendrá que computar las utilidades esperadas. En
términos gráficos, podrá “romper” ese conjunto informativo, ya que no tiene la
incertidumbre respecto al tipo. La señal (si es que luego comprobamos que se
trata de un ENBP) resolverı́a el problema informativo. Entonces, las acciones
óptimas del receptor serán:
a2 (C) = Co (2 > 0) (29)

a2 (N C) = N Co (0 > −1, 5) (30)
30
Por último, las probabilidades serán:
P (B | C) = 1 ∧ P (B | N C) = 0 (31)
26 Si bien siguiendo a rajatabla la lógica del juego aquı́ planteado, el trabajador no recibirı́a
beneficio alguno inemediato por la transmisión (más bien incurrirı́a en el costo), el beneficio de
diferenciarse puede dar lugar a beneficios en el mediano plazo en su relación con el empleador,
beneficios no monetarios en su contrato laboral, etc.
27 Puede pensárselo no solo como un problema de información incompleta, sino también
como uno de selección adversa. Es notoria la falla de mercado en la asignación de recursos y,
por ello, la ineficiencia de este equilibrio agrupador.
28 Nótese que en caso de contratar uno de baja productividad sin haber recibido la señal,
la utilidad del receptor es de -1,5 en lugar de -1, situación en la que conocerı́a la baja produc-
tividad gracias a la señal)
29 Lo cual puede ser justificado en la medida en que los empleadores solo busquen tra-
bajadores de productividad alta pero no puedan diferenciarlos producto de la información
incompleta
30 ¿Cómo demostrarı́a esto?
15
¿Es un ENBP? El comportamiento del receptor es óptimo, dado que no
tiene desviaciones unilaterales beneficiosas. Si eligiera N Co al recibir la señal,
su utilidad serı́a de 0 en lugar de 2. Si eligiera Co al no haber recibido la señal,
su utilidad serı́a -1,5 en lugar de 0. Las probabilidades no deben cumplir ningún
requisito en particular, como sı́ lo eran en la sección anterior. Por último, será
óptima la estrategia del emisor sı́ y solo sı́ se cumple (28), lo cual es análogo a
decir que: CM > 1 > CB . Siempre que el costo de emitir el certificado
malo sea mayor que el bueno, la estrategia de separación aquı́ plantea-
da será óptima para el emisor.. ¿Por qué surge esta condición? Especificar
las decisiones de los jugadores en la representación extensiva puede facilitarnos
el análisis:
(1 − CB , 2) Emisor (1, 2)
Co Co
t=B
C NC
(−CB , 0) N Co N Co (0, 0)
p
Receptor N Receptor
1−p
(1 − CM , −1) (1, −1, 5)
Co Co
C NC
Emisor
(−CM , 0) N Co t=M N Co (0, 0)
¿Por qué 1 − CB > 0? El emisor sabe que la acción óptima del receptor será
N Co cuando no recibe la señal, pero no solo para el caso en que es de tipo malo
sino también para el caso contrario. Entonces, si 1 − CB < 0, el emisor jamás
tendrı́a incentivos a emitir la señal cuando es de tipo bueno y no emitirla cuando
es tipo malo, porque sabe que el receptor elegiriá N Co y su utilidad serı́a mayor
por no emitir la señal. El mismo análisis aplica para la condición sobre CM y
en rojo se destacan los senderos de equilibrios y el plan completo de acción del
receptor para facilitar la comprensión.
Por último, nótese la diferencia en términos de eficiencia en la asignación

de recursos en comparación con el equilibrio agrupador de la sección anterior.
Este equilibrio sı́ es eficiente. No existe mejora paretiana posible. Ahora bien,
nótese que no se trata de una asignación completamente eficiente. Esto
se debe a que existen costos asociados a transmitir la información. En
una asignación Pareto-eficiente sin problemas de información, la transmisión
de información serı́a inmediata sin costo alguno. Aquı́ hay un costo explı́cito
que recae sobre el emisor, que desea diferenciarse del tipo malo en caso de
ser bueno. Por este motivo tenemos una “asignación de segundo mejor ”: el
equilibrio separador aquı́ planteado es un second-best.
16
5. Breve disgresión sobre tipos de equilibrios
A lo largo del estudio de la teorı́a de juegos, hemos ido especificando diversos
tipos de equilibrio para los juegos según la información con la que cuenten los
jugadores y el timing del juego.
A modo de resumen, los tipos de equilibrios hasta aquı́ estudiados pueden

resumirse en la siguiente tabla:
Información Completa EN ENPS

(payoffs) Incompleta EBN ENBP
Simultáneo Secuencial
Timing
Introductoriamente presentamos el Equilibrio de Nash (EN) para los juegos

estáticos de información completa, ya sea en estrategias puras o mixtas. Luego,
impusimos condiciones extras para los juegos dinámicos con información com-
pleta: la perfección en subjuegos (ENPS). Con el levantamiento del supuesto
de información completa, surgió la necesidad de emplear un concepto aún más
amplio para la noción de equilibrio: el Equilibrio Bayesiano de Nash, debido a
la introducción de tipos de jugadores, creencias y la asimetrı́a en la información
de unos respecto a otros. Finalmente, y de forma análoga al ENPS, aquı́ hemos
presentado el ENBP para eliminar las amenazas y promesas no creı́bles que sur-
girı́an si no contemplamos la perfección (bayesiana) en subjuegos que implica el
concepto de EBN en cada juego de continuación31 .
6. Summary
Para el Equilibrio de Nash Bayesiano Perfecto, tener en cuenta que:
Se ignoran las amenazas o promesas no creı́bles;
Las acciones elegidas en cada conjunto informativo son óptimas, dados los
comportamientos de equilibrio y las creencias;
En equilibrio, las creencias se modifican en función del comportamiento
de equilibrio observado; y
En equilibrios distintos, la evolución de las creencias (aprendizaje) cambia.
En el Equilibrio de Nash Bayesiano Perfecto en juegos de señales,
recordar que:
La decisión de emitir una señal es óptima, dado el comportamiento de
quien recibe la señal;
31 Juego de continuación es el equivalente a subjuego dentro del mundo de la información
incompleta, que puede comenzar en un nodo o en un conjunto informativo.
17
El comportamiento de quien recibe la señal es óptimo, dadas sus creencias;
Las creencias son actualizadas según la Regla de Bayes, cuando es posible;
Tanto el equilibrio agrupador como el equilibrio separador cumplen dichas
condiciones y se deben verificar para cada tipo de jugador 1 y para cada
conjunto informativo del jugador 2; y
La asignación del equilibrio agrupador es ineficiente y la del equilibrio
separador, si bien se trata de un second-best, es eficiente.
7. Ejercicios
Ejercicio 1. Demuestre que no existe un EN P S, al menos en estrategias puras,
en el ejercicio de la sección (3.3).
Ejercicio 2. Encuentre el EN BP del ejercicio de la sección (4.1) aplicando
los conceptos de Backward Induction y pagos esperados vs pagos ciertos.
Ejercicio 3. ¿Por qué debe satisfacerse la condición expresada en la ecuación

(28) para que la estrategia de la sección 4.2.4 (ecuación 27) sea óptima?
Ejercicio 4. A partir del ejercicio planteado en la sección (4.2), analice el
equilibrio agrupador donde el emisor sı́ transmite información. Luego, estudie
el equilibrio separador no planteado en la sección (4.2.4). ¿Son ENBP? Si lo
son, ¿qué puede comentar respecto a la eficiencia en la asignación?
18

Juegos Dinámicos Con Información Incompleta

Cargado por

Copyright:

Formatos disponibles

Juegos Dinámicos Con Información Incompleta

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Juegos Dinámicos Con Información Incompleta

Cargado por

Copyright:

Formatos disponibles

Juegos dinámicos con información incompleta

Juan Pablo Albornoz & Agustı́n Cucchiaro*

5. Breve disgresión sobre tipos de equilibrios 17

* La presente nota de clase fue escrita para el curso Microeconomı́a II de la Facultad

1.2. Bibliografı́a recomendada

Como se mencionaba, las conjeturas y la regla de aprendizaje en general es

Los juegos dinámicos con información incompleta pueden interpretarse como

Nuevamente, ahondaremos en esta temática a lo largo de la nota y, especı́fi-

(4, 1) (0, 0) (3, 0) (0, 1)

Debido a la existencia de información imperfecta, el jugador 2 enfrenta un

Se concluye entonces que,

EN = EN P S = {(L, L0 ), (R, R0 )} (2)

Ahora bien, para encontrar el EN BP es necesario definir,

EN BP = {A1 , A2 , P2 (nL )} : P2 (nM ) = 1 − P2 (nL ) (3)

Para computar el EN BP , la metodologı́a de trabajo consiste en plantear las

0 ∗ P2 (nL ) + 1 ∗ [1 − P2 (nL )] ≥ 1 ∗ P2 (nL ) + 0 ∗ [1 − P2 (nL )] (7)

3.2. Un segundo juego bayesiano dinámico

(1, 3) (1, 2) (4, 0) (4, 0) (0, 2) (3, 3)

Al igual que en el juego anterior, el jugador 2 presenta un conjunto infor-

De ello resulta que,

Para encontrar el EN BP se realiza el siguiente análisis:

(3, 0) (0, 1) (0, 1) (3, 0)

La metodologı́a de análisis es análoga a la anterior, es decir, encontrar la

Entonces, no existe un EN BP en estrategias puras para este juego y se

La presente situación se puede describir como un juego dinámico con infor-

1. El laboratorio Elea Phoenix decide si aumentar o no su participación en

La representación extensiva del juego viene dada por:

( 32 ,2) (-1,3) (2,1) (-1,-1)

Dado que un subjuego es un subconjunto de cualquier juego que incluye un

Escenario de costo bajo (1/2)

Escenario de costo alto (1/2)

A partir de estas matrices de pagos, es posible construir la matriz de pagos

EBN = {(E, GP ), (N E, GG)} (11)

Como se ha mencionado a lo largo de esta nota, en el juego de señalización

Un ejemplo tradicional es el del mercado de trabajo con información

Ya comentado el problema económico, analizemos la representación extensiva

La secuencia del juego comienza por el nodo central. La naturaleza (N ) de-

13 En caso de que no exista un mecanismo de señalización que resuelva este problema de

Nótese una cuestión de no menor importancia acerca de las consecuencias de

4.2.2. ENBP en el modelo de señales

En las próximas secciones abordaremos estas cuestiones, que a priori pueden

4.2.3. Equilibrio agrupador

El receptor sabe que el emisor no emitió un certificado, pero desconoce el

U2e [Co | N C] = 0, 5(2) + 0, 5(−1, 5) = 0, 25 (14)

Se puede ver que la utilidad esperada de contratarlo condicional a no haber

U2e [Co | C] = 0, 5(2) + 0, 5(−1) = 0, 5 (17)

Por útlimo, para poder determinar si existe o no un ENBP agrupador en N C

¿Por qué P (B | C) no se puede derivar a partir de la regla de Bayes? Esto se

U2e [Co] > U2e [N Co] (24)

U1 [C | Co] = 1 − CB ó 1 − CM < U1 [N C | Co] = 1 ∀t = B, M

2. ¿Es óptimo el comportamiento del receptor? Sı́, dado que en promedio su

4.2.4. Equilibrio separador

1 − CB > 0 1 − CM < 0 (28)

Ahora el receptor observa la señal únicamente cuando el emisor es de ti-

a2 (C) = Co (2 > 0) (29)

Por último, nótese la diferencia en términos de eficiencia en la asignación

A modo de resumen, los tipos de equilibrios hasta aquı́ estudiados pueden

Información Completa EN ENPS