Juegos Dinámicos Con Información Incompleta

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

Juegos dinámicos con información incompleta

Juan Pablo Albornoz & Agustı́n Cucchiaro*

Agosto 2020

Índice
1. Outline 2
1.1. Principales conceptos que serán abordados . . . . . . . . . . . . . 2
1.2. Bibliografı́a recomendada . . . . . . . . . . . . . . . . . . . . . . 2

2. Introducción 2

3. ENBP vs ENPS 3
3.1. Un primer juego bayesiano dinámico . . . . . . . . . . . . . . . . 3
3.2. Un segundo juego bayesiano dinámico . . . . . . . . . . . . . . . 5
3.3. Inexistencia del ENBP (estrategias puras) . . . . . . . . . . . . . 7

4. Aplicaciones económicas 8
4.1. Competencia dinámica con información asimétrica . . . . . . . . 8
4.2. Señalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2.1. Desarrollo y representación del juego . . . . . . . . . . . . 10
4.2.2. ENBP en el modelo de señales . . . . . . . . . . . . . . . 12
4.2.3. Equilibrio agrupador . . . . . . . . . . . . . . . . . . . . . 13
4.2.4. Equilibrio separador . . . . . . . . . . . . . . . . . . . . . 15

5. Breve disgresión sobre tipos de equilibrios 17

6. Summary 17

7. Ejercicios 18

* La presente nota de clase fue escrita para el curso Microeconomı́a II de la Facultad


de Ciencias Económicas (Universidad de Buenos Aires) dictado por el Dr. Aromı́. Todos los
errores y omisiones son exclusiva responsabilidad de los autores.

1
1. Outline
1.1. Principales conceptos que serán abordados
Equilibrio de Nash Bayesiano Perfecto
Aprendizaje bayesiano
Información incompleta
Señalización
Problemas de transmisión de información, ineficiencia y second-bests

1.2. Bibliografı́a recomendada


Bibliografı́a principal: Gibbons, R.(1958). Un primer curso de teorı́a de jue-
gos. Barcelona: Antoni Bosch. Capı́tulo 4.

Bibliografı́a Ampliatoria:
Mas Collel, A.; Whinston, M.D & Green, J.R.(1995). Microeconomic Theory.
Oxford: Oxford university press. Capı́tulo 8.
Tirole J. y Fundenberg D. (1991). Game Theory. MIT press. Capı́tulos III
(pág 207-226) y IV (pág 319-324).

2. Introducción
En el estudio de los juegos dinámicos con información incompleta, debemos
establecer una serie de condiciones que diferencian el equilibrio de éstos respecto
del de los juegos estáticos con información incompleta. La noción es similar a la
diferenciación que hicimos entre los juegos estáticos y los dinámicos con infor-
mación completa. Especı́ficamente, un Equilibrio de Nash Bayesiano Perfecto
debe satisfacer las siguientes condiciones:1
1. Para cada conjunto informativo el jugador se forma una conjetura sobre
el nodo del conjunto de información al que ha arribado.
2. Las estrategias de los jugadores deben ser sucesivamente racionales (dadas
sus conjeturas).
3. En aquellos conjuntos informativos sobre la trayectoria de equilibrio (se
alcanzan con probabilidad no nula), las conjeturas se forman según la
Regla de Bayes y las estrategias de equilibrio de los jugadores.
4. En conjuntos informativos por fuera de la trayectoria de equilibrio (que
no son alcanzados o, análogamente, su probabilidad de ser alcanzados es
nula), las conjeturas resultan ser impuestas.
1 Se recomienda consultar Gibbons[1992(1958)] para una explicación exhaustiva.

2
Si bien puede parecer confuso a primera vista, estos conceptos serán clarifi-
cados con los ejercicios de las próximas secciones.

Como se mencionaba, las conjeturas y la regla de aprendizaje en general es


la Regla de Bayes:
P (X ∩ Y )
P (X ∩ Y ) = P (X)P (Y | X) → P (Y | X) = si P (X) 6= 0 (1)
P (X)
Dada la fórmula, se puede ver con facilidad por qué la regla solo vale para con-
juntos informativos visitados con probabilidad no nula: el denominador debe ser
distinto de 0 tal que la Regla de Bayes pueda ser aplicada.

Los juegos dinámicos con información incompleta pueden interpretarse como


juegos dinámicos con información completa pero imperfecta tal que el Equili-
brio de Nash Bayesiano Perfecto refuerza el criterio de Equilibrio de Nash Per-
fecto en Subjuegos. Los equilibrios de estos juegos (bayesianos) permiten que
exista aprendizaje (en el equilibrio) y que los agentes modifiquen sus creencias
en equilibrio (noción similar a la idea de reputación).

Nuevamente, ahondaremos en esta temática a lo largo de la nota y, especı́fi-


camente, en la sección (5). En la próxima sección estudiaremos unos juegos
iniciales para reforzar estos nuevos conceptos.

3. ENBP vs ENPS
3.1. Un primer juego bayesiano dinámico
Se presenta el siguiente juego dinámico2 con información imperfecta en donde
el jugador 1 primero elige entre tres posibles estrategias (L,M y R) y, luego, el
jugador 2 desconociendo la decisión del jugador 1 debe elegir entre dos
posibles estrategias (L0 y R0 ).
1 R
(2, 2)
L M
2
L0 R0 L0 R0

(4, 1) (0, 0) (3, 0) (0, 1)

Debido a la existencia de información imperfecta, el jugador 2 enfrenta un


conjunto informativo que hace que exista un único subjuego, que es el juego
en sı́ mismo. Por lo tanto, el EN P S coincidirá con el EN 3 . Para encontrarlo,
2 Ejercicio 1, inciso b.
3 Equilibrio de Nash Perfecto en Subjuegos y Equilibrio de Nash, respectivamente.

3
se recurre a la representación normal del juego que viene dada por:

Jugador 2
L’ R’
L 4;1 0;0
Jugador 1 M 3;0 0;1
R 2;2 2;2

Se concluye entonces que,

EN = EN P S = {(L, L0 ), (R, R0 )} (2)

Ahora bien, para encontrar el EN BP es necesario definir,


La acción del jugador 1 dado lo que hace el jugador 2;
La acción del jugador 2 dado lo que hace el jugador 1; y
Las creencias4 del jugador 2 de manera tal que todo ello sea consistente.
Esquemáticamente, esto se puede expresar como:

EN BP = {A1 , A2 , P2 (nL )} : P2 (nM ) = 1 − P2 (nL ) (3)

Para computar el EN BP , la metodologı́a de trabajo consiste en plantear las


distintas posibilidades y analizar su consistencia:
Si el jugador 1 elige L, tiene que ser cierto que el jugador 2 elige L0 ;
el jugador 2, en base a sus creencias, considera casi con certeza que se
encuentra en nL (lo cual es equivalente a decir que toma como dado que
la acción del jugador 1 es elegir L) por lo cual encuentra óptimo elegir L0 .
Como la acción del jugador 1 es L, el conjunto informativo del jugador
2 es visitado con probabilidad positiva por lo que sus creencias pueden
obtenerse a partir de la Regla de Bayes 5 :

P2 (nL )P (R | nL )
P2 (nL | R) = (4)
P (R)
P2 (nL )P (R | nL )
P2 (nL | R) = (5)
P2 (nL )P (R | nL ) + P2 (nM )P (R | nM )
1∗1
P2 (nL | R) = =1 (6)
1∗1+0∗1
Si el jugador 1 elige R, tiene que ser cierto que el jugador 2 elige R0 ; el ju-
gador 2 considerará óptimo elegir R0 en base a ciertas creencias impuestas.
Como la acción del jugador 1 es R, el conjunto infromativo del jugador 2
4 Probabilidad de que el jugador 2 se encuentre en uno u otro nodo del conjunto infor-
mativo.
5 El denominador se descompone por teorema de la probabilidad total.

4
es visitado con probabilidad nula por lo que sus creencias no pueden obte-
nerse a partir de la Regla de Bayes sino que se derivan del hecho de que la
acción del jugador 2 debe ser R0 . En este sentido, el jugador 2 encontrará
más atractivo elegir R0 en lugar de L0 en la medida que el pago esperado
de elegir R0 sea al menos tan bueno como el pago esperado de elegir L0 ,
es decir:

0 ∗ P2 (nL ) + 1 ∗ [1 − P2 (nL )] ≥ 1 ∗ P2 (nL ) + 0 ∗ [1 − P2 (nL )] (7)


1
1 − P2 (nL ) ≥ P2 (nL ) → P2 (nL ) ≤ (8)
2
Si el jugador 1 elige M , tiene que ser cierto que el jugador 2 elige L0 ; pero
el jugador 2, en base a sus creencias, considera casi con certeza que se
encuentra en nM por lo cual encontrarı́a óptimo elegir R0 en lugar de L0 .
Luego, los EN BP están dados por:
 
0 0 1
(A1 = L, A2 = L , P2 (nL ) = 1), (A1 = R, A2 = R , P2 (nL ) ≤ )
2

Tal que:

P2 (nM ) = 1 − P2 (nL )

3.2. Un segundo juego bayesiano dinámico


Se presenta el siguiente juego6 dinámico con información imperfecta en donde
el jugador 1 primero elige entre tres posibles estrategias (L,M y R) y, luego, el
jugador 2 desconociendo la decisión del jugador 1 debe elegir entre otras tres
posibles estrategias (L0 , M 0 y R0 ).

1 R
(2, 2)
L M
2

L0 R0 L0 R0
0 0
M M

(1, 3) (1, 2) (4, 0) (4, 0) (0, 2) (3, 3)

Al igual que en el juego anterior, el jugador 2 presenta un conjunto infor-


mativo que hace que exista un único subjuego, que es el juego en sı́ mismo por
lo cual el EN P S coincide con el EN mientras que la representación normal del
juego está dada por:
6 Ejercicio 1, inciso b.

5
Jugador 2
L’ M’ R’
L 1;3 1;2 4;0
Jugador 1 M 4;0 0;2 3;3
R 2;2 2;2 2;2

De ello resulta que,

EN = EN P S = (R, M 0 ) (9)

Para encontrar el EN BP se realiza el siguiente análisis:


Si el jugador 1 elige L, tiene que ser cierto que el jugador 2 elige R0 ;
pero si el jugador 2, dadas sus creencias, considera casi con certeza que
se encuentra en nL nunca encontrará óptimo elegir R0 cuando puede estar
mejor eligiendo cualquiera de las otras dos estrategias.
Si el jugador 1 elige M , tiene que ser cierto que el jugador 2 elige L0 ;
pero si el jugador 2, dadas sus creencias, considera casi con certeza que se
encuentra en nM nunca encontrará óptimo elegir L0 cuando puede estar
mejor eligiendo cualquiera de las otras dos estrategias.
Si el jugador 1 elige R, tiene que ser cierto que el jugador 2 elige M 0 tal que
el jugador 2 encontrará óptimo elegir M 0 en base a ciertas creencias im-
puestas. Ası́, dado que la acción del jugador 1 es R, los nodos del conjunto
informativo nunca son visitados (son visitados con probabilidad nula) por
lo que las creencias del jugador 2 no se pueden computar a partir de la
Regla de Bayes sino que responden a los incentivos necesarios para que el
jugador 2 elija M 0 y no L0 o R0 tal que,
1
2 ∗ P2 (nL ) + 2 ∗ [1 − P2 (nL )] ≥ 0 ∗ P2 (nL ) + 3 ∗ [1 − P2 (nL )] → P2 (nL ) ≥
3
2
2 ∗ P2 (nL ) + 2 ∗ [1 − P2 (nL )] ≥ 3 ∗ P2 (nL ) + 0 ∗ [1 − P2 (nL )] → P2 (nL ) ≤
3
Luego,
1 2
≤ P2 (nL ) ≤
3 3
De ello resulta que el EN BP queda definido por,

1 2
EN BP = (A1 = R, A2 = M 0 , ≤ P2 (nL ) ≤ ) : P2 (nM ) = 1 − P2 (nL )
3 3
En ambos casos resultó que el EN BP es igual al EN P S (salvo por el compo-
nente de conjeturas). Sin embargo, esto no necesariamente es ası́ en todo juego.
El EN BP implica un criterio de resolución más poderoso dado que incluye las
creencias de los jugadores y puede muy bien diferir del EN P S.

6
3.3. Inexistencia del ENBP (estrategias puras)
Se presenta un esquema muy similar al del primer juego bayesiano dinámico
estudiado, cuya representación extensiva está dada por:

1 R
(2, 2)
L M
2
0 0
L R L0 R0

(3, 0) (0, 1) (0, 1) (3, 0)

La metodologı́a de análisis es análoga a la anterior, es decir, encontrar la


acción del jugador 1 (dada la acción del jugador 2), la acción del jugador 2
(dada la acción del jugador 1) y las creencias del jugador 2 de manera tal que
todo sea consistente.
Si el jugador 1 elige L, tiene que ser cierto que el jugador 2 elige L0 .
Pero el jugador 2 considera, dadas sus creencias, que se encuentra casi con
certeza en el nodo nL , por lo cual nunca verı́a óptimo elegir L0 sino que
tiene incentivos para elegir R0 .
Si el jugador 1 elige M , tiene que ser cierto que el jugador 2 elige R0 .
Pero el jugador 2 considera, dadas sus creencias, que se encuentra casi con
certeza en el nodo nM , por lo cual nunca verı́a óptimo elegir R0 sino que
tiene incentivos para elegir L0 .
En estos dos casos previos, las acciones del jugador 2 no son una mejor res-
puesta dadas sus creencias.

Por otro lado, si el jugador 1 elige R no existe una única estrategia candidata
a ser la mejor respuesta del jugador 2 sino que este último debe elegir el perfil
estratégico (R0 , L0 ) como plan completo de acción frente al perfil estratégico
(L, M ) del jugador 17 .

Entonces, no existe un EN BP en estrategias puras para este juego y se


puede demostrar que el juego cuenta con un EN BP en estrategias mixtas
definido como:
 
0 0 1
A1 = R, A2 = (Rp= 1,L 1 ), P2 (nL ) =
p= 2 : P2 (nM ) = 1 − P2 (nL ) (10)
2 2
Además, se destaca que las creencias del jugador 2 no se pueden calcular por
Regla de Bayes sino que son impuestas ya que si el jugador 1 elige R, el juego
nunca se desarrolla en el conjunto informativo.
7 No confundir con el hecho de que el jugador 1 elige R como acción.

7
4. Aplicaciones económicas
4.1. Competencia dinámica con información asimétrica
El mercado de alcohol en gel se encuentra dominado por la empresa Porta
Hermanos. De todos modos, la situación sanitaria provocada por el COVID-19
ha incentivado a varias empresas a explotar los beneficios extraordinarios que
presenta este mercado. Tal es ası́ que el laboratorio Elea Phoenix está analizan-
do la posibilidad de obtener mayor participación en el mercado en detrimento
del market share de la empresa Porta. A este contexto, se suma el hecho de que
Elea Phoenix no conoce los costos en los que incurre Porta. Sin embargo, gracias
al Data Mining del área de IT , se sabe que los costos de Porta son bajos con
probabilidad 21 .

La presente situación se puede describir como un juego dinámico con infor-


mación incompleta que tiene la siguiente secuencia temporal:

1. El laboratorio Elea Phoenix decide si aumentar o no su participación en


el mercado de alcohol en gel.
2. La empresa Porta Hermanos decide si iniciar o no una guerra de precios
para defender su market share.
Si Elea Phoenix decide no expandirse, el juego finaliza con un pago de 4
y de 3 para Porta Hermanos si sus costos son bajos y altos, respectivamente,
mientras que el laboratorio no recibe nada. En cambio, si Elea Phoenix decide
expandirse, pueden suceder dos escenarios: que haya paz o que haya guerra8 .

En caso de paz, Porta cede parte de su market share tal que si sus costos
son bajos, recibe un pago de 2 y Elea Phoenix un pago de 32 ; y si sus costos
son altos, recibe un pago de 1 y Elea Phoenix un pago de 2. En caso de guerra,
Elea Phoenix recibe siempre un pago de −19 mientras que Porta Hermanos reci-
be un pago de 3 si sus costos son bajos10 y un pago de −1 si sus costos son altos.

La representación extensiva del juego viene dada por:


8 Lo cual puede pensarse como una competencia por precio que lleva a las dos empresas a
reducir fuertemente sus márgenes de ganancias quizás hasta el punto de competencia perfecta.
9 Este resultado puede pensarse como consecuencia de los costos incurridos en el intento
frustrado de ampliar su participación en el mercado de alcohol en gel como consecuencia de
la guerra de precios.
10 A su vez, el hecho de que Porta Hermanos obtenga un pago de 3 en caso de tener una
estructura de costos bajos puede pensarse como la diferencia entre esta firma y Elea Phoenix
en términos de que ya esté establecida en el mercado, tenga el know-how de producción y
ventas e, incluso, una estructura de costos más eficiente que la rival a la hora de comenzar la
guerra de precios.

8
N

0,5 0,5
NE Cb EP Ca NE
(0,4) (0,3)

E E
PH PH

P G P G

( 32 ,2) (-1,3) (2,1) (-1,-1)

Dado que un subjuego es un subconjunto de cualquier juego que incluye un


nodo inicial, independiente de cualquier conjunto informativo, y todos sus nodos
sucesores, en este juego en particular se presentan tres subjuegos considerando
al juego en sı́ mismo como un subjuego. Sin considerar al juego en sı́ mismo, los
otros dos subjuegos se pueden representar en forma normal como:

Escenario de costo bajo (1/2)


Porta Hermanos
P G
E 1,5 ; 2 -1 ; 3
Elea Phoenix
NE 0;4 0;4

Escenario de costo alto (1/2)


Porta Hermanos
P G
E 2 ; 1 -1 ; -1
Elea Phoenix
NE 0 ; 3 0;3

A partir de estas matrices de pagos, es posible construir la matriz de pagos


que constituye la representación normal del juego en términos bayesianos,

Porta Hermanos
PP PG GP GG
E 1,75 ; 1,5 0,25 ; 0,5 0,5 ; 2 -1 ; 1
Elea Phoenix
NE 0 ; 3,5 0 ; 3,5 0 ; 3,5 0 ; 3,5

Por lo tanto,

EBN = {(E, GP ), (N E, GG)} (11)


A fines del análisis dinámico, el problema del EBN es que incluye el perfil
estratégico (N E, GG) que es una amenaza no creı́ble. Esto se debe a que Porta

9
Hermanos, en el escenario de costos altos, nunca elegirı́a inicar una guerra de
precios ya que ello implicarı́a un pago de −1 cuando podrı́a obtener un pago
mayor de 1 actuando pacı́ficamente. Como el EN BP descarta las amenazas no
creı́bles, luego:

EN BP = (E, GP ) (12)

4.2. Señalización
4.2.1. Desarrollo y representación del juego
Un juego de señalización convencional sigue un desarrollo del siguiente tipo:
1. El azar determina un tipo (ti ) del conjunto de tipos posibles, T = {t1 , ..., tI },
que asigna al emisor según una distribución de probabilidad p(ti ), donde
PI
p(ti ) > 0 ∀i y i=1 p(ti ) = 1
2. El emisor observa el tipo (ti ) y elije un mensaje (mj ) del conjunto de
mensajes posibles: M = {m1 , ..., mI }
3. El receptor observa el mensaje, pero desconoce el tipo de emi-
sor11 . A partir de dicha observación, el receptor decide qué tipo de acción
(ak ) de un conjunto de acciones posibles, A = {a1 , ..., aK }, llevará a cabo.
12
4. Las ganancias vienen dadas por UE (ti , nj , ak ) y UR (ti , nj , ak ).
Nótese que en un juego de señalización de la presente estructura, una estra-
tegia pura del emisor es una función m(ti ) que especifica qué mensaje eligirá
para cada tipo que el azar pueda determinar. En el caso del receptor, una es-
trategia pura serı́a una función a(mj ), que especifica qué acción realizará según
cada mensaje que el emisor pueda, valga la redundancia, emitir (obviamente,
sin conocer el tipo de emisor).

Como se ha mencionado a lo largo de esta nota, en el juego de señalización


también habrá aprendizaje. Especı́ficamente, se trata de un juego de apren-
dizaje bayesiano. Aquı́, los agentes observan y modifican sus creencias. Los
aprendizajes serán distintos según el tipo de equilibrio. ¿Por qué hablamos de
tipos de equilibrios? En la siguiente sección veremos que hay dos grandes tipos
de equilibrios en estos juegos: agrupadores y separadores o pooling and separa-
ting equilibriums como usualmente se los conoce.

Ahora bien, antes de analizar los tipos de equilibrios, vale la pena estudiar
estos juegos en su representación extensiva. Para facilitar la comprensión de la
representación extensiva analizaremos una aplicación económica especı́fica del
modelo de señales donde el emisor desea emitir un certificado que le brinde
11 Esta es la clave de la información asimétrica en el juego.
12 Donde UE y UR son las utilidades del emisor y receptor, respectivamente.

10
información al receptor. ¿Qué clase de información? El emisor deseará trans-
mitirle información al receptor respecto del tipo de emisor que es.

Un ejemplo tradicional es el del mercado de trabajo con información


incompleta y/o selección adversa. Los empleadores desconocen la pro-
ductividad de los postulantes y no tienen forma de discernir entre uno de
productividad alta y uno de productividad baja. Solo podrán saberlo si los con-
tratan al ver su desempeño en el puesto de trabajo13 . Aquellos trabajadores de
productividad alta desearán transmitirle información a los empleadores acerca
de su alta productividad relativa respecto del resto de los trabajadores para
aumentar sus probabilidades de ser empleados. Las “credenciales”14 (diplomas,
tı́tulos de estudios académicos, certificados de exámenes, cartas de recomenda-
ción, verificación por parte de colegas respecto a las aptitudes que ostentan en el
CV, etc.) que puedan ostentar actúan como un mecanismo de transmisión de in-
formación que facilita la selección de personal que llevan a cabo los empleadores.

Ya comentado el problema económico, analizemos la representación extensiva


de un juego de señales:

(1 − CB , 2) Emisor (1, 2)
Co Co
t=B
C NC

(−CB , 0) N Co N Co (0, 0)
p

Receptor N Receptor

1−p
(1 − CM , −1) (1, −1, 5)
Co Co
C NC

Emisor
(−CM , 0) N Co t=M N Co (0, 0)

La secuencia del juego comienza por el nodo central. La naturaleza (N ) de-


termina el tipo (t) de emisor. Con probabilidad p el emisor será del tipo bueno
(B) y con probabilidad 1−p será del tipo malo (M ). En función de ello, el emisor
tiene dos alternativas: emitir el certificado (C) o no emitirlo (N C). El receptor,
que desconoce el tipo de emisor pero sabe si se emitió o no el certificado15 anali-
zará la utilidad esperada de contratar (Co) y no contratar (N Co) al trabajador.

13 En caso de que no exista un mecanismo de señalización que resuelva este problema de


transmisión de información, ¿cuáles serı́an los efectos de dicho problema informativo sobre la
eficiencia en la asignación de recursos y el bienestar económico?
14 Certificado de aquı́ en más.
15 Dicho de otro modo, si el emisor le transmitió o no información.

11
El hecho de que se tengan conjuntos informativos en las decisiones del re-
ceptor denota la información incompleta que éste posee: desconoce el tipo de
emisor, no puede diferenciar entre uno bueno y uno malo. Incluso, el trabajador
de baja productividad (malo en el ejemplo) tendrá incentivos a transmitirle una
señal (falsa) respecto de su productividad16 . La señal (emisión del certificado)
tiene un costo económico: el costo de transmitir información. Especı́fi-
camente, el costo de emitir un certificado bueno (malo) será de CB (CM ), donde
asumiremos que CM > CB 17 .

Nótese una cuestión de no menor importancia acerca de las consecuencias de


la transmisión de la señal. Hemos destacado la consecuencia que tiene sobre los
costos. Sin embargo, serı́a razonable pensar que la transmisión de información
podrı́a tener un impacto sobre el bienestar del emisor. En el modelo aquı́
planteado descartamos este efecto y asumimos que la señal solo tiene un
costo de transmisión, mientras que no tiene un valor intrı́nseco que
impacte sobre el bienestar del receptor. ¿Cómo notarlo en la representa-
ción extensiva? Véase, por ejemplo, que cuando el emisor es “bueno”, sea que
emita o no emita el certificado y la acción del receptor sea contratarlo (Co),
en ambos casos su utilidad será de 2 (independientemente de que reciba o no
la señal, el certificado). Si tuviera un valor intrı́nseco, la recepción de la señal
aumentarı́a la utilidad del receptor en el caso en que éste la reciba.

4.2.2. ENBP en el modelo de señales


En la resolución del juego de señales planteado abordaremos dos tipos de
equilibrios: agrupadores y separadores18 . En el primer caso, el emisor realizará
una única acción: emitir o no emitir el certificado. En el segundo caso se tiene
el resultado “ideal” de la transmisión de la señal: el emisor emite el certifica-
do cuando es bueno, mientras que no lo hace cuando es malo19 . Para que los
equilibrios mencionados sean ENBP deben cumplirse 3 requisitos:

1. La decisión de emitir una señal, para cada tipo de emisor, debe ser óptima
dado el comportamiento de quien recibe la señal;
2. El comportamiento del receptor es óptimo dadas sus creencias, para cada
conjunto informativo que tenga; y
3. Las creencias deben ser actualizadas según la regla de Bayes siempre que
sea posible.
16 ¿Cómo esperarı́a que sea el costo de transmitir la señal en este caso respecto del caso
en que el trabajador es de productividad alta?
17 ¿Por qué es más costoso el malo que el bueno? Si el emisor desea transmitir una infor-
mación, sea por ejemplo su elevada productividad como trabajador, le resultará más sencillo
realizarlo cuando efectivamente es más productivo (t = B) que cuando no lo es (t = M ).
18 Pooling and separating equilibriums como usalmente se los conoce en la literatura.
19 Por esto se dice que el equilibrio es separador: una conducta u otra según el tipo.

12
M ensaje(tipo)

Creencias Acción(mensaje)

En las próximas secciones abordaremos estas cuestiones, que a priori pueden


resultar confusas, a partir del juego planteado.

4.2.3. Equilibrio agrupador


Asumiremos que las probabilidades de que el emisor sea del tipo bueno o
malo serán de 0, 5 para ambos casos. Solo se analizará el equilibrio agrupador
donde el emisor no logra transmitir información, independientemente del
tipo. Recuérdese que el emisor elige un mensaje que es función de su tipo.
Entonces, en el equilibrio agrupador donde no emite el certificado se tendrá
(por hipótesis) que:

m1 (B) = N C m1 (M ) = N C (13)

El receptor sabe que el emisor no emitió un certificado, pero desconoce el


tipo de emisor20 . Ası́, comparará las utilidades esperadas de contratar o no
contratar al trabajador, dado que no se emitió una señal, para ası́ decidir su
acción óptima: a2 (N C)

U2e [Co | N C] = 0, 5(2) + 0, 5(−1, 5) = 0, 25 (14)


U2e [N Co | N C] = 0, 5(0) + 0, 5(0) =0 (15)
U2e [Co | N C] > U2e [N Co | N C] (16)

Se puede ver que la utilidad esperada de contratarlo condicional a no haber


recibido una señal es mayor que la de no contratarlo dado que no recibió el
certificado21 . Pero la estrategia de un jugador debe ser un plan completo de
acción, entonces también tiene que considerar qué acción realizarı́a en función
de que se emitió el certificado: a2 (C)

U2e [Co | C] = 0, 5(2) + 0, 5(−1) = 0, 5 (17)


U2e [N Co | C] = (0, 5)0 + (0, 5)0 = 0 (18)
U2e [Co | C] > U2e [N Co | C] (19)
20 Nos encontramos en la sección derecha de la representación extensiva del juego.
21 Este resultado puede ser interpretado como la necesidad de los demandantes de trabajo
de cubrir una vacante laboral. La consecuencia sobre la eficiencia en la asignación de recursos
es que dicha demanda de trabajo puede resultar en la contratación de un trabajador de baja
productividad producto del problema de informacón, lo cual es ineficiente ya que de haberlo
sabido los empleadores podrı́an haber pagado un menor salario (u ofrecido uno mayor para
los de productividad alta).

13
A partir de (16) y (19) se puede apreciar que:

a2 (C) = Co ∧ a2 (N C) = Co (20)

Por útlimo, para poder determinar si existe o no un ENBP agrupador en N C


debemos computar las probabilidades condicionales de que el emisor sea del tipo
“bueno” dado que se emitió y no se emitió el certificado respectivamente: 22

P (B) · P (N C/B)
P (B | N C) = (21)
P (B) · P (N C/B) + P (M ) · P (N C/M )
0, 5(1)
P (B | N C) = = 0, 5 (22)
0, 5(1) + 0, 5(1)
P (B | C) → No se puede derivar a partir de la regla de Bayes (23)

¿Por qué P (B | C) no se puede derivar a partir de la regla de Bayes? Esto se


debe a que P (C) = 0 por (13): dicha rama del juego se alcanza con probabilidad
nula. P (B | C) será una elección arbitraria. Podrá tomar distintos valores sı́ y
solo sı́ no modifica los resultados de equilibrio. Debe ser cierto que:23

U2e [Co] > U2e [N Co] (24)


2 · P (B | f) + (−1)[1 − P (B | f)] > 0 (25)
1 1
P (B | f) > ⇒ P (B | C) > (26)
3 3
Donde P (B | f) es la probabilidad de que el emisor sea bueno dado el conjun-
to de información disponible que tiene el receptor en el momento de decisión (f).

Ahora bien, ¿es este equilibrio agrupador un ENBP? Para ello debemos
analizar si los comportamientos de ambos jugadores son óptimos y las creencias
correctas:
1. ¿Es óptimo el comportamiento del emisor? N C es óptimo ya que24 :

U1 [C | Co] = 1 − CB ó 1 − CM < U1 [N C | Co] = 1 ∀t = B, M

2. ¿Es óptimo el comportamiento del receptor? Sı́, dado que en promedio su


utilidad esperada por contratar será mayor a la de no contratar25 .
1
3. ¿Son estas creencias creı́bles? Lo son sı́ y solo sı́ P (B | C) > 3
22 ¿Por qué P (N C/B) = 1 y P (N C/M ) = 1?
23 Nótese que es la utilidad esperada no condicional al mensaje emitido por el emisor, a
diferencia de lo planteado anteriormente.
24 Lo cual puede pensarse como una consecuencia de que el emisor sepa que será contratado
independientemente de su tipo, motivo por el cual no tendrı́a incentivo alguno a transmitir
información.
25 No debe pasar por desapercibido el hecho de que en promedio su utilidad será mayor,
lo cual elimina las consecuencias del desafortunado evento de contratar un trabajador de baja
productividad en una situación puntual.

14
Podemos afirmar que el equilibrio agrupador en N C es un Equilibrio de Nash
Bayesiano Perfecto. Sin embargo, nótese que este ENBP es ineficiente: no se
agotan todas las ganancias del intercambio. Nótese que si se tuviera un
modelo de mercado de trabajo donde el emisor de tipo bueno es un trabajador
de productividad alta (y viceversa), el de productividad alta no podrı́a emitir
la señal y diferenciarse del de productividad baja26 . El equilibrio es claramente
ineficiente27 . Existirı́a una mejora paretiana si el emisor de tipo bueno pudiera
transmitirle la señal al receptor que revele su tipo, mientras que el de tipo malo
no lo harı́a28 . A su vez, el receptor quisiera únicamente comprar la señal cuando
el emisor es de tipo bueno y no cuando es de tipo malo29 . Precisamente éste
serı́a un equilibrio separador, objetivo de la próxima sección.

4.2.4. Equilibrio separador


Analicemos el equilibrio separador donde el emisor de tipo bueno emite el
certificado, mientras que el de tipo malo no lo hace:

m1 (B) = C m1 (M ) = N C (27)

Ahora bien, para que esta estrategia sea óptima debe ser cierto que:

1 − CB > 0 1 − CM < 0 (28)

Ahora el receptor observa la señal únicamente cuando el emisor es de ti-


po bueno. En este caso no tendrá que computar las utilidades esperadas. En
términos gráficos, podrá “romper” ese conjunto informativo, ya que no tiene la
incertidumbre respecto al tipo. La señal (si es que luego comprobamos que se
trata de un ENBP) resolverı́a el problema informativo. Entonces, las acciones
óptimas del receptor serán:

a2 (C) = Co (2 > 0) (29)


a2 (N C) = N Co (0 > −1, 5) (30)
30
Por último, las probabilidades serán:

P (B | C) = 1 ∧ P (B | N C) = 0 (31)
26 Si bien siguiendo a rajatabla la lógica del juego aquı́ planteado, el trabajador no recibirı́a
beneficio alguno inemediato por la transmisión (más bien incurrirı́a en el costo), el beneficio de
diferenciarse puede dar lugar a beneficios en el mediano plazo en su relación con el empleador,
beneficios no monetarios en su contrato laboral, etc.
27 Puede pensárselo no solo como un problema de información incompleta, sino también
como uno de selección adversa. Es notoria la falla de mercado en la asignación de recursos y,
por ello, la ineficiencia de este equilibrio agrupador.
28 Nótese que en caso de contratar uno de baja productividad sin haber recibido la señal,
la utilidad del receptor es de -1,5 en lugar de -1, situación en la que conocerı́a la baja produc-
tividad gracias a la señal)
29 Lo cual puede ser justificado en la medida en que los empleadores solo busquen tra-
bajadores de productividad alta pero no puedan diferenciarlos producto de la información
incompleta
30 ¿Cómo demostrarı́a esto?

15
¿Es un ENBP? El comportamiento del receptor es óptimo, dado que no
tiene desviaciones unilaterales beneficiosas. Si eligiera N Co al recibir la señal,
su utilidad serı́a de 0 en lugar de 2. Si eligiera Co al no haber recibido la señal,
su utilidad serı́a -1,5 en lugar de 0. Las probabilidades no deben cumplir ningún
requisito en particular, como sı́ lo eran en la sección anterior. Por último, será
óptima la estrategia del emisor sı́ y solo sı́ se cumple (28), lo cual es análogo a
decir que: CM > 1 > CB . Siempre que el costo de emitir el certificado
malo sea mayor que el bueno, la estrategia de separación aquı́ plantea-
da será óptima para el emisor.. ¿Por qué surge esta condición? Especificar
las decisiones de los jugadores en la representación extensiva puede facilitarnos
el análisis:

(1 − CB , 2) Emisor (1, 2)
Co Co
t=B
C NC

(−CB , 0) N Co N Co (0, 0)
p

Receptor N Receptor

1−p
(1 − CM , −1) (1, −1, 5)
Co Co
C NC

Emisor
(−CM , 0) N Co t=M N Co (0, 0)

¿Por qué 1 − CB > 0? El emisor sabe que la acción óptima del receptor será
N Co cuando no recibe la señal, pero no solo para el caso en que es de tipo malo
sino también para el caso contrario. Entonces, si 1 − CB < 0, el emisor jamás
tendrı́a incentivos a emitir la señal cuando es de tipo bueno y no emitirla cuando
es tipo malo, porque sabe que el receptor elegiriá N Co y su utilidad serı́a mayor
por no emitir la señal. El mismo análisis aplica para la condición sobre CM y
en rojo se destacan los senderos de equilibrios y el plan completo de acción del
receptor para facilitar la comprensión.

Por último, nótese la diferencia en términos de eficiencia en la asignación


de recursos en comparación con el equilibrio agrupador de la sección anterior.
Este equilibrio sı́ es eficiente. No existe mejora paretiana posible. Ahora bien,
nótese que no se trata de una asignación completamente eficiente. Esto
se debe a que existen costos asociados a transmitir la información. En
una asignación Pareto-eficiente sin problemas de información, la transmisión
de información serı́a inmediata sin costo alguno. Aquı́ hay un costo explı́cito
que recae sobre el emisor, que desea diferenciarse del tipo malo en caso de
ser bueno. Por este motivo tenemos una “asignación de segundo mejor ”: el
equilibrio separador aquı́ planteado es un second-best.

16
5. Breve disgresión sobre tipos de equilibrios
A lo largo del estudio de la teorı́a de juegos, hemos ido especificando diversos
tipos de equilibrio para los juegos según la información con la que cuenten los
jugadores y el timing del juego.

A modo de resumen, los tipos de equilibrios hasta aquı́ estudiados pueden


resumirse en la siguiente tabla:

Información Completa EN ENPS


(payoffs) Incompleta EBN ENBP
Simultáneo Secuencial
Timing

Introductoriamente presentamos el Equilibrio de Nash (EN) para los juegos


estáticos de información completa, ya sea en estrategias puras o mixtas. Luego,
impusimos condiciones extras para los juegos dinámicos con información com-
pleta: la perfección en subjuegos (ENPS). Con el levantamiento del supuesto
de información completa, surgió la necesidad de emplear un concepto aún más
amplio para la noción de equilibrio: el Equilibrio Bayesiano de Nash, debido a
la introducción de tipos de jugadores, creencias y la asimetrı́a en la información
de unos respecto a otros. Finalmente, y de forma análoga al ENPS, aquı́ hemos
presentado el ENBP para eliminar las amenazas y promesas no creı́bles que sur-
girı́an si no contemplamos la perfección (bayesiana) en subjuegos que implica el
concepto de EBN en cada juego de continuación31 .

6. Summary
Para el Equilibrio de Nash Bayesiano Perfecto, tener en cuenta que:
Se ignoran las amenazas o promesas no creı́bles;
Las acciones elegidas en cada conjunto informativo son óptimas, dados los
comportamientos de equilibrio y las creencias;
En equilibrio, las creencias se modifican en función del comportamiento
de equilibrio observado; y
En equilibrios distintos, la evolución de las creencias (aprendizaje) cambia.
En el Equilibrio de Nash Bayesiano Perfecto en juegos de señales,
recordar que:
La decisión de emitir una señal es óptima, dado el comportamiento de
quien recibe la señal;
31 Juego de continuación es el equivalente a subjuego dentro del mundo de la información

incompleta, que puede comenzar en un nodo o en un conjunto informativo.

17
El comportamiento de quien recibe la señal es óptimo, dadas sus creencias;
Las creencias son actualizadas según la Regla de Bayes, cuando es posible;
Tanto el equilibrio agrupador como el equilibrio separador cumplen dichas
condiciones y se deben verificar para cada tipo de jugador 1 y para cada
conjunto informativo del jugador 2; y
La asignación del equilibrio agrupador es ineficiente y la del equilibrio
separador, si bien se trata de un second-best, es eficiente.

7. Ejercicios
Ejercicio 1. Demuestre que no existe un EN P S, al menos en estrategias puras,
en el ejercicio de la sección (3.3).
Ejercicio 2. Encuentre el EN BP del ejercicio de la sección (4.1) aplicando
los conceptos de Backward Induction y pagos esperados vs pagos ciertos.

Ejercicio 3. ¿Por qué debe satisfacerse la condición expresada en la ecuación


(28) para que la estrategia de la sección 4.2.4 (ecuación 27) sea óptima?
Ejercicio 4. A partir del ejercicio planteado en la sección (4.2), analice el
equilibrio agrupador donde el emisor sı́ transmite información. Luego, estudie
el equilibrio separador no planteado en la sección (4.2.4). ¿Son ENBP? Si lo
son, ¿qué puede comentar respecto a la eficiencia en la asignación?

18

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy