Alvaro J. Riascos Villegas Universidad de los Andes y Quantil · Ejemplo 1.6 (Paradoja de los...

72
Juegos Estáticos de Información Completa 1 Alvaro J. Riascos Villegas Universidad de los Andes y Quantil 1 Notas de clase basadas en Mas-Colell et.al [1995], Myerson , R. [1990] y Vega - Redondo,F [2003], Maschler, M., Solan, E. y S. Zamir [2013].

Transcript of Alvaro J. Riascos Villegas Universidad de los Andes y Quantil · Ejemplo 1.6 (Paradoja de los...

Juegos Estáticos de Información Completa1

Alvaro J. Riascos VillegasUniversidad de los Andes y Quantil

1Notas de clase basadas en Mas-Colell et.al [1995], Myerson , R. [1990] y Vega -Redondo,F [2003], Maschler, M., Solan, E. y S. Zamir [2013].

Índice general

Capítulo 1. Juegos estratégicos v1.1. Introducción v1.2. Juegos en forma normal v1.3. Teoría de la decisión vii1.4. Soluciones de un juego viii

Capítulo 2. Extensión mixta xix2.1. Extensión mixta de un juego xix2.2. Aspectos normativos xxvi2.3. Juegos bilaterales de suma cero xxvii

Capítulo 3. Otros conceptos xxxi3.1. Otros conceptos de solución xxxi3.2. Equilibrio perfecto xxxi3.3. Equilibrio fuerte y equilibrio inmune a coaliciones xxxiii3.4. Equilibrio correlacionado xxxv

Capítulo 4. Juegos generalizados y con un continuo de agentes xli4.1. Juegos generalizados y juegos con un continuo de jugadores xli

Capítulo 5. Aplicaciones xlv5.1. Aplicaciones xlv5.2. Oligopolio xlv5.3. Asignación eficiente de bienes públicos lx5.4. Diseño de Mecanismos lxii5.5. Existencia del Equilibrio Walrasiano lxviii

iii

Capítulo 1

Juegos estratégicos

1.1. Introducción

La teoría de juegos es el estudio de las interacciones estratégicas entreagentes racionales con diferentes objetivos. Con agentes racionales nos refe-rimos a individuos, firmas, países e inclusive animales. La principal caracte-rística en teoría de juegos es que reconoce que las decisiones de un agentepueden afectar de forma directa los objetivos de los demás agentes. Podemosdividir la teoría en dos grandes ramas; la teoría de juegos estratégicos (ojuegos no cooperativos) y la teoría de juegos coalicionales (o juegos coope-rativos). Las principales diferencias entre estos juegos son que en los juegosestratégicos los jugadores actuan en forma independiente mientras que en losjuegos coalicionales se supone que los jugadores pueden hacer coaliciones oarreglos sostenidos mediante algún mecanismo no explícito.

En la primera parte de este libro nos vamos a concentrar en la teoría dejuegos estratégicos. Estos se pueden representar de dos formas.

1. Forma normal, para juegos estáticos.12. Forma extensiva, para juegos dinámicos.

Los juegos en forma normal, a su vez, se pueden clasificar en juegos deinformación completa e incompleta. Los juegos en forma extensiva, en cam-bio, se clasifican en juegos de información perfecta y juegos de informaciónimperfecta.La representación de un juego en forma extensiva es la forma másgeneral de representar un juego. En estas notas vamos a comenzar estudiandolos juegos estratégicos en su representación normal.

1.2. Juegos en forma normal

Definición 1.1 (Juego en forma normal). Un juego en forma normal esuna estructura G = (N , Sii=1,...,N , πii=1,...,N ) donde

1. N es un conjunto de jugadores, N = 1, ...n .2. Si es un conjunto de acciones o estrategias puras para cada jugador.

3. πi :nΠi=1Si → R es la utilidad (pago neto) de cada jugador.

1También se donominan juegos en forma estratégica. Sin embargo, reservamos estenombre para toda la clase de juegos estratégicos (en forma normal y extensiva).

v

vi 1. JUEGOS ESTRATÉGICOS

Ejemplo 1.2 (Dilema de los prisioneros). Sea n = 2, S1 = S2 = A,C .El pago neto de cada agente lo representamos mediante la siguiente tabla.La convención que vamos a utilizar es que la estrategia del jugador 1 larepresentan las filas y las del jugador 2 las columnas. El pago neto del primerjugador es el primer número de cada celda. Del segundo jugador, el segundo.

1\2 A CA -10,-10 0,-12C -12,0 -1,-1

Ejemplo 1.3 (Batalla de los sexos). Supongamos que hay dos agentesn = 2, S1 = S2 = B,S , π1, π2 : S1 × S2 → R

M\H B SB 3,2 1,1S 0,0 2,3

Ejemplo 1.4 (Juego de conducción). Supongamos que hay dos conduc-tores que en ausencia de normas de tránsito deben decidir todos los díaspor cuál carril conducir su carro. Entonces n = 2, S1 = S2 = D, I ,π1, π2 : S1 × S2 → R

M\H D ID 1,1 0,0I 0,0 1,1

Obsérvese que la batalla de los sexos y el juego de conducción son juegosen lo que los agentes quisieran coordinar en sus acciones para obtener unpago óptimo.

Ejemplo 1.5 (Juego de revelación). Los dos jugadores son un ser supe-rior (SB) y una persona (P ).2 Las estrategias para SB son SSB = RE,NRE,SP = CE,NCE donde RE y NRE significan respectivamente que SBrevela su existencia y que no revela su existencia y CE, NCE significanrespectivamente que P cree o no cree en su existencia.

SB\P CE NCERE 3,4 1,1NRE 4,2 2,3

Notación 1. Sea S =nΠi=0Si y para cualquier jugador i sea S−i =

nΠj 6=iSj .

Dada una estrategia conjunta s = (s1, ..., sn) ∈ S y cualquier jugador itambién denotamos la estrategia conjunta s como s = (si, s−i) donde si ∈ Sies la estrategia del jugador i y s−i es la estrategia conjunta de todos losjugadores con excepción del jugador i.

2Basado en S. Brams [2007]. Superior Beings: If they exist, how should we know?

1.3. TEORÍA DE LA DECISIÓN vii

1.3. Teoría de la decisión

Todo juego plantea un problema de toma de decisión para los agentesinvolucrados. Queremos estudiar y modelar el razonamiento detrás de laselecciones de los agentes. Un problema de decisión consiste en la especifica-ción de:

1. Un conjunto de acciones.2. Un conjunto de estados de la naturaleza3. Un conjunto de consecuencias sobre las cuales el agente tienen pre-

ferencias.4. Unas preferencias del agente sobre el conjunto de consecuencias.5. Una hipótesis de comportamiento.

Decimos que un problema de decisión está bien puesto cuando el con-junto de acciones, expectativas, consecuencias y preferencias sobre las con-secuencias son todos completamente independientes el uno del otro (i.e.,preferencias intrínsecas).

El concepto de estados encierra muchas posibilidades: crencias sobre elconjunto de acciones de los demás, sobre las creencias de los demás (incluidolas creencias de los demás sobre el agente), creencias sobre la hipótesis decomportamiento de los demás, estados exógenos al problema de decisiónque lo afectan (incetidumbre), etc. La relevancia del conjunto de creenciaso expectativas se explora informalmente en la siguiente sección y será unaconstante a lo largo de este libro. Más adelante introduciremos un modeloformal de las expectativas de los agentes.

1.3.1. Conocimiento común e inconsciencia. En el siguiente ejem-plo se pone de manifiesto la importancia que tiene el conocimiento que supo-nemos tiene un agente sobre el conocimiento que tienen los demás y viceversa.

Ejemplo 1.6 (Paradoja de los sombreros). Supongamos que hay trespersonas sentadas en un salón. Cada una de ellos tiene un sombrero quesaben que puede ser blanco o rojo. Cada una de ellos puede observar elsombrero que los demás tienen en su cabeza pero no el que él tiene en sucabeza. Supongamos que los tres son rojos. Lo único que saben las personases que el sombrero puede ser blanco o rojo y lo único que pueden hacer esver el color del sombrero de los demás. Si preguntaramos uno a uno, cual esel color del sombrero que ellos tienen en su cabeza, todos responderían no sé.Ahora, supongamos que les hacemos el siguiente anuncio. Existe por lo menosun sombrero rojo en la cabeza de ustedes y volvemos y les preguntamos unoa uno si saben con certeza cuál es el sombrero que tienen en la cabeza. Cadauno de ellos puede oir lo que responden los anteriores. En esta ocasión los dosprimeros a quienes se les pregunta responden no sé, pero el último deberíade responder que su sombrero es con seguridad rojo.

viii 1. JUEGOS ESTRATÉGICOS

Para ver esto obsérvese que antes del anuncio, las tres personas saben quehay por lo menos un sombrero rojo entre los tres. Más aún, el tercero sabeque el segundo sabe que hay por lo menos un sombrero rojo. Sin embargo,antes del anuncio, el tercero no sabe que el segundo sabe que el primerosabe que hay por lo menos un sombrero rojo entre los tres. Ahora, una vezhecho el anuncio, saber que hay por lo menos un sombrero rojo entre lostres se convierte en conocimiento común: todos saben que los demás saben ytodos saben que los demás saben que los otros saben, etc. En particular, eltercero sabe que el segundo sabe que el primero sabe que hay por lo menos unsombrero rojo entre los tres. Por lo tanto, dado que el primero y el segundoafirmaron no saber de qué color era el sombrero, el tercero puede deducir quesu sombrero es rojo. Para ver esto suponga que una vez hecho el anuncio,los dos primeros responden no sé. Ahora el tercero puede argumentar así.Si mi sombrero no fuera rojo, como el segundo jugador sabe que el primerorespondió no sé, entonces es porque el segundo sabe que el primero estáviendo un sobrero rojo. Si el mío no es rojo, entonce el segundo jugadordebería deducir que el sombrero rojo que está viendo el primer jugador es eldel jugador dos, luego el jugador dos debió responder que su sombrero erarojo. Como no lo hizo, eso quiere decir que mi sombrero es rojo. Obsérveseque la clave de este argumento es que después de hecho el anuncio, el jugadortres sabe que el jugador dos sabe que el jugador uno sabe que hay por lomenos un sombrero rojo entre los tres.

Existen muchas formas de relajar el supuesto de conocimiento común.Puede ser en el sentido de que el juego no es conocimiento común (un juga-dor desconoce que existe un tercero, desconoce todas las estrategias de susoponentes, etc.) o puede tener una inteligencia limitada (sabe algo sobre suoponente pero no sabe que su oponente sabe que él sabe), etc. Las conse-cuencias formales de este tipo de limitaciones serán discutidas más adelante.La relajación de este supuesto se conoce en la literatura como juegos coninconsciencia.

1.4. Soluciones de un juego

Una solución de un juego es una descripción sistemática del resultadoque podríamos esperar de la interacción de los jugadores en el juego. Haytres conceptos claves que unifican las ideas principales relacionadas con lasolución de un juego. Se trata de los conceptos de dominancia, estabilidad yseguridad.

El primero está relacionado con la identificación de estrategias que unagente racional no jugaría. La segunda representa un concepto de equilibrioy busca identificar estrategias en las cuales no existen incentivos a desviarsey la tercera, identifica estrategias que garantizan cierta utilidad para losjugadores en el peor de los casos.

1.4. SOLUCIONES DE UN JUEGO ix

Supongamos que todos los jugadores son racionales, es decir, buscanmaximizar su pago esperado (más adelante consideraremos otras formas deracionalidad como por ejemplo que un jugador no juege una estrategia domi-nada). A lo largo de este libro utilizaremos el concepto de inteligencia parahablar del conocimiento que tienen los jugadores del juego, de las conjeturasde los demás, etc.

Los jugadores escogen su estrategia de forma independiente de los demás.Además supongamos todos los jugadores conocen todos los elementos deljuego G. Más precisamente, en el juego la racionalidad de los jugadores yla inteligencia de los mismos es conocimiento común. A lo largo de estelibro estudiaremos diferentes niveles de inteligencia y racionalidad de losjugadores. Es decir, qué tipo de racionalidad e inteligencia se supone sobrelos demás y si es conocimiento común o no.

La pregunta más fundamental de la teoría de juegos es: ¿Cuál es nuestramejor predicción de la interación de los agentes en el juego? Es decir, da-das las hipótesis mencionadas anteriormente ¿qué estrategias consideramosrazonables para cada jugador? Esto es lo que denominamos una solución deun juego.

Todo concepto de solución de un juego está basado en un supuesto sobrela racionalidad, el nivel de inteligencia de los agentes y las restricciones sobrelas estrategias.

1.4.1. Dominancia.

Definición 1.7 (Dominancia). Una estrategia si ∈ Si domina débilmen-te una estrategia si ∈ Si, o si es una estrategia débilmente dominada por si,si para todo s−i ∈ S−i:

πi(si, s−i) ≥ πi(si, s−i)con desigualdad estricta por lo menos para un s−i. Cuando en la definiciónanterior podemos sustituir la desigualdad débil por una estricta para todos−i ∈ S−i decimos que si ∈ Si domina (estricatmente) la estrategia si, oequivalentemente que si es una estrategia dominada (estrictamente) por si.

Nota técnica 1.8. Mientras no se diga lo contrario, el término dominao dominada se utiliza en un sentido estricto.

Ejemplo 1.9. En el siguiente juego, para el agente 1, Y domina a Z.1\2 A B CX 2,7 2,0 2,2Y 7,0 1,1 3,2Z 4,1 0,4 1,3

Definición 1.10 (Estrategias dominantes). Una estrategia si ∈ Si esuna estrategia dominante débilmente si domina débilmente a toda estrategia.Decimos que es dominante (estrictamente) si domonina (estrictamente) atoda estrategia.

x 1. JUEGOS ESTRATÉGICOS

Definición 1.11 (Equilibrio en estrategias dominantes). Cuando cadajugador tiene una estrategia dominante estrictamente (débilmente) decimosque el juego tiene un equilibrio en estrategias dominantes estrictamente (dé-bilmente).

Ejemplo 1.12 (Dilema de los prisioneros). En el dilema de los prisioneroscada uno de los agentes tiene una estrategia dominante.

Ejemplo 1.13 (Batalla de los sexos). En la batalla de los sexos ningúnjugador tiene una estrategia dominante.

Ejercicio 1.14. Demostrar que si existe un equilibrio en estrategiasdominantes (estrictamente o débilmente) entonces es único.

El equilibrio en estrategias dominantes es un concepto de equilibrio muyfuerte desde el punto de vista estratégico, ya que requiere de la existencia deestrategias dominantes para cada jugador. Sin embargo, es muy débil desde elpunto de vista de la racionalidad e inteligencia que se supone de los jugadores.El equilibrio en estrategias dominantes estrictamente se basa en una hipótesisde comportamiento débil: los individuos no juegan estrategias dominadasestrictamente. Luego, al existir una estrategia dominante estrictamente, éstaes la única a considerar como racional (la hipótesis en el caso de estrategiasdominates débilmente es más discutible como veremos más adelante).

Estas características hacen que este concepto de solución sea muy fuertey que no exista en muchos ejemplos. La tensión entre los diferentes conceptosde solución, las exigencias desde el punto de vista estratégico de un juego y laraionalidad o inteligencia que se supone de los jugadores, será una constantea lo largo de este libro.

Para estudiar más a fondo la idea de condiciones mínimas que debesatisfacer un concepto de solución introduciremos el concepto de estrategiasno dominadas iterativamente. El concepto de dominancia sugiere una formade identificar un conjunto de estrategias en las cuales cualquier resultado deun juego debería de estar.

Definición 1.15 (Estrategias no dominadas estrictamente de forma ite-rativa). Sea S0

i = Si y definamos Ski , k > 0 de la siguiente forma:

Sk+1i =

si ∈ Ski : No existe si ∈ Ski tal queπi(si, s−i) > πi(si, s−i), ∀s−i ∈ Sk−i

y S∞i =

∞∩k=1

Ski . El conjunto S∞i se denomina el conjunto de estrategias no

dominadas estrictamente de forma iterativa del agente i y el conjunto S∞ =NΠi=1S∞i el conjunto de estrategias conjuntas no dominadas estrictamente de

forma iterativa del juego G.

Definición 1.16 (Juegos solucionables en estrategias no dominadas ite-rativamente). Si S∞ consiste de un sílo elemento, decimos que el juego es

1.4. SOLUCIONES DE UN JUEGO xi

solucionable en estrategias no dominadas estrictamente de forma iterativa-mente.

Ejemplo 1.17. Consideremos el juego:

1\2 A B CX 2,7 2,0 2,2Y 7,0 1,1 3,2Z 4,1 0,4 1,3

El proceso de eliminación arroja: S01 = x, y, z, S1

1 = x, y, S21 =

x, y, S31 = y, S4

1 = y, S02 = A,B,C, S1

2 = A,B,C, S22 = A,C,

S32 = A,C y S4

2 = C.

Mientras no se diga lo contrario, nos referiremos con estrategia no domi-nada a cualquier estrategia no dominada en un sentido estricto.

Observemos que el concepto de estrategias no dominadas iterativamentede un juego lo hemos definido únicamente como un proceso de eliminaciónsecuencial de estrategias dominadas estríctamente. Un ejemplo que ilustralos problemas de utilizar estrategias no dominadas débilmente será discutidomás adelante.

La definición de dominancia iterativa supone que en cada iteración seeliminan todas las estrategias dominadas estríctamente. Esto no es esencialen la definición. En efecto, se puede demostrar que el resultado final es inde-pendiente de si se eliminan algunas o todas y del orden en el que se eliminan.3

De forma análoga a la definición anterior, podemos definir W ki , W

∞i

y W∞ utilizando el concepto de estrategias dominadas débilmente. De ladefinición es implícito que en cada iteración todas las estrategías dominadasdébilmente se deberían de eliminar. Ahora, a diferencia de la dominanciaestricta, el concepto de supervivencia de estrategías débilmente dominadasiterativamente sí depende de si se eliminan todas las estrategias o no y delorden en el que se eliminan. Los siguientes ejemplos ponen en evidencia estacaracterística.

Ejemplo 1.18 (Eliminación de estrategias dominadas débilmente). Con-sidere el siguiente ejemplo:

L RU 5,1 4,0M 6,0 3,1D 6,4 4,4

3véase Osborne y Rubinstein página 60, para una definición que sólo supone que seeliminan algunas estrategias en cada iteración.

xii 1. JUEGOS ESTRATÉGICOS

Ejemplo 1.19 (Eliminación de estrategias dominadas débilmente). . Elorden de eliminación es importante. Considere el siguiente ejemplo:

A B CA 1,2 2,3 0,3B 2,2 2,1 3,2C 2,1 0,0 1,0

Estas características del proceso de eliminación iterativa débil hacen másdifícil de racionalizar este proceso como hipótesis de comportamiento. Sinembargo una forma de hacerlo es la siguiente: Suponga que los jugadoressuponen que sus adversarios pueden tener una mano temblorosa. Vamos ailustrar esto a través de un ejemplo muy sencillo. Considere el siguiente juego:

A BA 1,2 2,3B 2,2 2,0

La estrategia A es dominada débilmente para el jugador 1. Ahora siel jugador 1 piensa que su adversario va jugar con probabilidad positivacada una de sus acciones (mano temblorosa) entonces en valor esperado laestrategia A es dominada estrictamente. Observemos que la hipótesis deracionalidad de no jugar estrategias dominadas débilmente es una hipótesismás fuerte que suponer que los jugadores no juegan estrategias dominadasestrictamente.

Ejercicio 1.20. Demostrar que W∞ ⊆ S∞. Dar un ejemplo que mues-tre que en general la contenencia es estricta. Sea EW y ES el conjunto deequilibrios en estrategias dominantes débilmente y estríctamente respectiva-mente. Demostrar que:

ES ⊆ EW ⊆W∞ ⊆ S∞

El concepto de estrategias no dominadas iterativamente enmarca los re-querimientos mínimos que debe tener cualquier candidato a solución de unjuego. Sin embargo, no es un concepto de equilibrio estrictamente estricta-mente hablando, en el sentido de que no existen incentivos unilaterales adesviarse. En cambio, se trata de un conjunto de estrategias que deberíancontener a cualquier concepto de solución de un juego.

El concepto de estrategias no dominadas iterativamente es un conceptomuy débil y en ocasiones no provee de ninguna información adicional sobrecómo se comportarían los jugadores en un juego. Por ejemplo, en la batallade los sexos, ningún jugador tiene una estrategia dominada y, por lo tanto,S∞ es el mismo conjunto de estrategias del juego original.

En este orden de ideas, aunque la idea de eliminación de estrategias do-minadas iterativamente es un concepto muy débil desde el punto de vistaestratégico, supone algo más de inteligencia por parte de los jugadores. Esta

1.4. SOLUCIONES DE UN JUEGO xiii

inteligencia está relacionada con qué conoce uno sobre lo que los demás ha-cen. Específicamente, la hipótesis de comportamiento es que ningún jugadorjuega una estrategia dominada y se supone una forma débil de inteligencia, laidea de que todo jugador sabe que el otro no jugará una estrategia dominaday a su vez, cada uno de ellos sabe que el otro sabe, etc.

Las hipótesis de racionalidad y conocimiento común sobre la inteligenciade los jugadores permiten, en principio, considerar como irracionales algunasotras estrategias que no son eliminadas por el proceso de eliminación deestrategias dominadas estrictamente. Esto nos conduce al siguiente concepto;el de estrategias racionalizables.

Ejercicio 1.21 (Subasta al segundo precio con información completa).Considere una subasta al segundo precio de un único bien, valores privadose información completa. Mostrar que la eliminación débil de estrategias do-minadas débilmente tiene una predicción muy precisa. Ganan los jugadorfesque tienen la valoraación más alta del objeto.

1.4.2. Estrategias racionalizables.

Definición 1.22 (Mejor respuesta). Una estrategia si es mejor respuestapara el jugador i cuando las estrategias de los demás son s−i si:

πi(si, s−i) ≥ πi(si, s−i)

para todo si. Una estrategia si nunca es una mejor respuesta si no existe s−ital que si sea mejor respuesta cuando las estrategias de los demás son s−i.

La hipótesis de racionalidad sugiere que un jugador sólo jugará una es-trategia que sea mejor respuesta a algún perfil de estrategias de los demásjugadores (esta es una hipótesis de racionalidad más fuerte que suponer quelos jugadores no jugarían estrategias dominadas). Es intuitivo pensar en lamisma línea que la definición de eliminación de estrategias dominadas estric-tamente y extender a una definición de eliminación iterativa de estrategiasque nunca son mejor respuesta.

Definición 1.23 (Estrategias racionalizables). Las estrategias que so-breviven el proceso de eliminación iterativo de estrategias que nunca sonmejor respuesta, lo denominamos el conjunto de estrategias racionalizablesR∞.

Se puede demostrar que el proceso de eliminación es independiente delorden.

Ejercicio 1.24. Mostrar que una estrategia estríctamente dominadanunca es una mejor respuesta y demostrar que R∞ ⊆ S∞.

Ejercicio 1.25. Demostrar o dar un contraejemplo de la afirmaciónS∞ ⊆ R∞.

xiv 1. JUEGOS ESTRATÉGICOS

Paradójicamente, una estrategia dominada débilmente puede ser una me-jor respuesta. Este es el caso con las estrategias que son dominadas débilmen-te pero no lo son estríctamente. Esta observación muestra que el conceptode eliminación iterativa de estrategias débilmente dominadas no tiene basesracionales tan sólidas cuanto el concepto basado en eliminación estricta. Sinembargo, como veremos más adelante, este tipo de eliminación puede even-tualmente eliminar equilibrios de Nash lo cuál resulta atractivo en presenciade múltiples equilibrios.

1.4.3. Equilibrio de Nash - Cournot.

Definición 1.26 (Equilibrio de Nash - Cournot). Una estrategia con-junta s ∈ S es un equilibrio de Nash - Cournot si para todo jugador i y paratoda estrategia si ∈ Si :

πi(si, s−i) ≥ πi(si, s−i)

Notemos que este concepto de solución tiene como eje central una ideade estabilidad. De ahora en adelante nos referiremos a estos equilibrios sim-plemente como equilibrios de Nash.

Ejercicio 1.27. Demostrar que todo equilibrio en estrategias dominan-tes débilmente es un equilibrio de Nash.

En el dilema de los prisioneros, el equilibrio en estrategias dominanteses un equilibrio de Nash. De igual forma, la batalla de los sexos tiene dosequilibrios de Nash ninguno de los cuales es un equilibrio en estrategiasdominantes.

Ejemplo 1.28 (Tragedia de los comunes). N jugadores desean compartiruna banda de transmisión de información. La capacidad máxima es unoy cada agente debe escoger qué cantidad xi ∈ [0, 1] desea transmitir. Elbeneficio para cada agente es:

xi

(1−

∑jxj

)Un equilibrio de Nash de este ejemplo es:

xi =1

N + 1

El problema es que el valor individual y social de esta solución es muy bajo:1

(1+n)2y n

(1+n)2∼ 1

n respectivamente.

Ahora, si maximizamos el valor social suponiendo que cada agente usala misma proporción x de la banda entonces:∑

ixi

(1−

∑jxj

)= nx (1− nx)

1.4. SOLUCIONES DE UN JUEGO xv

y obtenemos la solución socilamente eficiente x = 12n que implica un beneficio

social igual a 14 , el cual es muy superior al beneficio social en la solución

descentralizada.

El dilema de los prisioneros y la tragedia de los comunes llaman la aten-ción sobre el costo social de la descentralización (i.e., el costo de la competen-cia o racionalidad individual). Esto se conoce como el precio de la anarquía(price of anarchy).

Ejemplo 1.29 (Paradoja de Braess). Este ejemplo se le atribuye a Die-trich Braess, ingeniero civil quien llamó la atención sobre sus característicasparadójicas a comienzos de los años 50. Considere la figura 1 en la cual serepresenta esquemíticamente las posibles formas de ir en carro de la ciudadA a la ciudad B utilizando las dos carreteras que se muestran en la figura.

Debido a las características de las mismas, el tiempo que dura el trayectode A hasta la ciudad intermedia 1 depende del tráfico mientras que, de laciudad intermedia 1 hasta la ciudad B, es independiente del tráfico y siempretoma la misma cantidad de minutos. De forma similar, el trayecto de A a laciudad intermedia 2 es independiente del tráfico mientras que de la ciudadintermedia 2 hasta la ciudad B depende del tráfico de la misma forma que deA hasta la ciudad intermedia 1. No es difícil convencerse que, dado un ciertonúmero de carros que debe viajar desde el A hasta B, si cada uno de ellostiene conocimiento sobre los detalles mencionados anteriormente y cada unoevalúa de forma independiente e individualista cuál carretera va utilizar, elflujo esperado es que la mitad de los carros utilizarán un trayecto y la otramitad el otro. Concretamente supongamos que el número de carros es 4000.En el trayecto sujeto a congestión, el tiempo es igual al número de carrosdividido por 100, los trayectos que no están sujetos a congestión el tiempoes 45. En el equilibrio de Nash el tiempo de traslado es 65 minutos. Ahora,supongamos que las autoridades competentes deciden construir una carreteraentre las ciudades intermedias 1 y 2 con el fin de mitigar los problemas decongestión de viajar de A a B (véase figura 2).

Más aún, supongamos que el tiempo de desplazamiento entre 1 y 2 esprácticamente cero. Ahora, la pregunta sobre el flujo vehicular esperado dadoque cada individuo actúa de forma individual, conocen las características delproblema mencionadas y suponen que los demás actúan de la misma forma,requiere un poco más de esfuerzo. Es fácil de ver que todos los carros tomaranla ruta A - 1 pues si todos hacen esto el tiempo de desplazamiento hasta 1es 40 minutos. Estando en 1, lo óptimo es hacer 1 - 2 - B, pues el tiempo deesta última parte sería 40 minutos y la alternativa sería 45. En conclusiónel nuevo equilibriuo implica un tiempo de desplazamiento de 80 minutos. Elresultado es sorprendente dado que el número de carros que viaja de A haciaB es exactamente el mismo, y que las mismas rutas que estaban a disposiciónanteriormente siguen estándolo una vez construida la variante que comunica

xvi 1. JUEGOS ESTRATÉGICOS

1 y 2. En conclusión, el comportamiento individualista en el segundo casotiene como consecuencia un resultado ineficiente para la sociedad.

Proposición 1. Todo equilibrio de Nash sobrevive el proceso de elimi-nación de estrategias dominadas estrictamente.

Prueba. Suponga que tenemos una estrategia conjunta que es Nash pero noestá en S∞. Eso quiere decir que para algín i, la estrategia que le correspondeen Nash no está en S∞i , luego fue eliminada en alguna iteración k. Sea k elmenor k para el cual existe un i tal que estrategia que le corresponde a i en elequilibrio de Nash es eliminada en la iteración k. Entonces esto implica queexiste una estrategia en Sk−1

i que domina estrictamente en Sk−1−i la estrategia

de Nash que le corresponde a i. Sin embargo, todas las estrategias de losdemás jugadores pertenecen a Sk−1

−i (por la definición de k, además k 6= 0)luego esto implicaría que la estrategia que le corresponde a i en el equilibriode Nash no sería una mejor respuesta.

Proposición 2. Si un juego tiene un equilibrio en estrategias no domina-das iterativamente (es resoluble en estrategias no dominadas iterativamente)entonces esa estrategia conjunta es un equilibrio de Nash y además es elúnico equilibrio de Nash.

Prueba. Para ver esto supongamos que no es Nash. Entonces algún agen-te no está optimizando dadas las estrategias de los demás. Escojamos unaestrategia que sí sea mejor respuesta en S−i. Como esta estrategia no sobre-vivió el proceso de eliminación, ya que sólo una lo hizo, entonces tuvo que sereliminada en algun momento. Como fue eliminada quiere decir que fue do-minada estrictamente en algín momento en Sk−1

i . Ahora, Sk−1i ⊇ S∞ luego

en particular, existiría una estrategia que domina estrictamente a la mejorrespuesta cuando los demás juegan lo que les corresponde en el equilibrio enestrategias no dominadas iterativamente. Una contradicción. La unicidad sesigue de que el proceso de eliminación de estrategias dominadas no eliminaningún equilibrio de Nash.

El converso no es cierto como lo muestra el siguiente ejemplo.

Ejemplo 1.30. En este ejemplo S∞i = A,B,C, i = 1, 2; pero tiene unúnico equilibrio de Nash (A,A) .

1\2 A B CA 1,1 1,0 1,0B 0,1 2,-2 -2,2C 0,1 -2,2 2,-2

El concepto de equilibrio de Nash es más débil que el concepto de equi-librio en estrategias dominantes, un ejemplo de esto son los equilibrios en laBatalla de los sexos.

1.4. SOLUCIONES DE UN JUEGO xvii

Ejemplo 1.31. Nash no sobrevive eliminación iterativa de estrategiasdominadas débilmente. Considere el siguiente ejemplo

1\2 A BA 1,1 0,-3B -3,0 0,0

No todos los juegos tienen un equilibrio de Nash, esto se puede observarcon el siguiente ejemplo:

Ejemplo 1.32 (Cara y Sello). Considere el siguiente juego.

1\2 C SC 1,-1 -1,1S -1,1 1,-1

En este caso no existe un equilibrio de Nash - Cournot en estrategias puras.

El equilibrio de Nash - Cournot es un concepto más débil en términosestratégicos que el equilibrio en estrategias dominantes pero más fuerte entérminos de la inteligencia que se supone tienen los jugadores. En éste esnecesario que los agentes tengan una expectativa correcta sobre lo que losdemás van a jugar y viceversa. Más aún, es una condición natural y porlo tanto, una condición mínima que impondremos a cualquier concepto deequilibrio.

1.4.4. Seguridad.

Ejemplo 1.33. En este ejemplo queremos resaltar la idea de seguridaden un juego:

1\2 A BX 2,1 2,-20Y 3,0 -10,1Z -100,2 3,3

El único equilibrio de Nash de este juego es un poco peligroso para el jugador1. Observemos que si el jugador 2 comete un error y no juega Nash entonces1 se ve muy perjudicado. Alternativamente él podría jugar una estrategiaque le garantizara el mejor pago posible en el peor de los casos. Esto seríajugar X. Esto es lo que se conoce como la estrategia maxmin del jugador 1.

Formalmente el valor maxmin o valor de seguridad de un jugador, enestrategias puras, se define como la utilidad para el jugador i cuando eljugador i resuelve:

maxsi∈Si

mıns−i∈S−i

πi (si, s−i)

Notemos que este valor supone que todos los adversarios de i actúanconcertadamente para minimizar el pago de i.

Ejercicio 1.34. Demostrar las siguientes proposiciones:

xviii 1. JUEGOS ESTRATÉGICOS

1. La estrategia maxmin de un jugador no es única.2. Una estrategia dominante (estricta o débilmente) es maxmin.3. La eliminación de estrategias dominates (estricta o débilmente) no

cambia el valor de seguridad de un juego para ningun jugador.

Capítulo 2

Extensión mixta

2.1. Extensión mixta de un juego

Una forma de enriquecer considerablemente la teoría es generalizandoel concepto de estrategia. Existen por lo menos dos formas de motivar elconcepto de estrategias mixtas. A lo largo de los ejemplos que estudiaremos,una u otra forma de justificar éste concepto tendrá más relevancia.

El concepto de estrategias mixtas surge de forma natural cuando es delinterés de los diferentes jugadores seguir estrategias impredecibles para losdemás jugadores y viceversa. Ahora, la mejor forma de generar estrategiasimpredecibles es justamente hacerlo de tal forma que para cada jugadorinclusive su propia estrategia sea impredecible. Esta situación es típica dejuegos en el que los jugadores tienen intereses opuestos.

De otro lado, cuando los jugadores tienen implícitamente el interés decolaborar, ya que resulta mejor desde el punto de vista individual, la impo-sibilidad de forzar una coordinación entre las partes hace que éstos formenexpectativas sobre lo que los demás jugadores van a escoger. Estas expectati-vas se pueden modelar como distribuciones de probabilidad sobre el conjuntode estrategias puras de cada jugador.1

Una interpretación posible es que cada jugador recibe una señal privadaindependiente y sus estrategias no son más que funciones de la señal en elespacio de estrategias puras (véase Mas Colell et. al. página 232). Borel [1921]fue el precursor de la idea de estrategias mixtas.

Definición 2.1 (Estrategias mixtas). Para el jugador i, una estrategiamixta σi sobre el espacio de estrategias puras es un distribución de proba-bilidad sobre Si. Denotamos esto por σi ∈ Σi donde Σi es el conjunto dedistribuciones de probabilidad sobre Si y σi(si) es la probabilidad que laestrategia σi le asigna a la acción si ∈ Si. Una estrategia mixta conjunta

es un vector de σ ∈ Σ =NΠi=1

Σi, σ = (σ1, ..., σN ) donde σi ∈ Σi. Adicional-mente, suponemos que los jugadores escogen las estrategias mixtas de formaestadísticamente independiente.

1véase sección 3.2.4, página 41 de [OR] para la formalización de esta intepretación

xix

xx 2. EXTENSIÓN MIXTA

Notación 2. En ocasiones haremos explícito el conjunto de estrategiaspuras sobre el cual se define la estrategias mixtas Σi y utilizaremos la nota-ción, Σ(Si).

Definición 2.2 (Extensión mixta de un juego en forma normal). SeaG = (N ,

Si)i=1,...,N , πii=1,...,N

⟩un juego en forma normal. La extensión

mixta del juego es el juego en forma estratégica:

G = (N , Σii=1,...,N , πii=1,...,N )

donde el pago neto de cada jugador es una extensión del pago neto πidefinido por πi : Σ→ R donde:

πi(σ1, ..., σN ) = Σs1∈S1,...sN∈SN

σ1(s1)...σN (sN )πi(s1, ..., sN )

Notemos que hemos utilizado el hecho de que los jugadores escogen lasestrategias de forma independiente. Con algunas consideraciones adiciona-les las definiciones que hemos hecho anteriormente pueden extenderse a laextensión mixta del juego.

Notación 3. Por simplicidad en la notación escribiremos πi simplemen-te como πi.

2.1.1. Dominancia.

Definición 2.3 (Dominancia de estrategias puras por mixtas). Decimosque para el agente i ∈ N una estrategia si ∈ Si es dominada (estrictamente)por una estrategia σi ∈ Σi si para todo σ−i ∈ Σ−i:

πi(σi, σ−i) > πi(si, σ−i)

El concepto de dominancia débil es completamente análogo. Decimos que sies dominada (débilmente) si es dominada (débilmente) por alguna estrategiamixta.

Esta definición es más débil que la definición que dimos en el caso deestrategias puras. Es decir, si una estrategia es dominada (débilmente) poruna estrategia pura, entonces es dominada (débilmente) por una estrategiamixta. El converso claramente no es cierto como muestra el siguiente ejemplo.

Ejemplo 2.4. Considere el siguiente juego en forma estratégica (los pa-gos del jugador 2 son irrelevantes para el ejemplo).

1\2 A BX 1,* 1,*Y 3,* 0,*Z 0,* 3,*

En este juego, ninguna estrategia pura del jugador 1 es dominada en estrate-gias puras. Sin embargo, la estrategia X es dominada por la estrategia mixta(0, 1

2 ,12

).

2.1. EXTENSIÓN MIXTA DE UN JUEGO xxi

Implícitamente en esta definición suponemos que las estrategias mixtasde los demás jugadores se escogen de forma independiente. 2 Utilizando estanueva definición de dominancia es natural definir un nuevo concepto de elimi-nación iterativa de estrategias puras dominadas (estrictamente o débilmente)por estrategias mixtas. Más aún, podemos definir un concepto de eliminacióniterativa de estrategias (mixtas) dominadas (estrictamente o débilmente) porestrategias mixtas. Denotamos este conjunto Σ∞.

Ejercicio 2.5. Una definición equivalente es la siguiente. Para el agentei ∈ N una estrategia si ∈ Si es dominada (estrictamente) por una estrategiaσi ∈ Σi si para todo s−i ∈ Σ−i:

πi(σi, s−i) > πi(si, s−i)

Esta equivalencia depende de la forma explícita como se ha definido laextensión mixta del juego.

2.1.2. Estrategias racionalizables. Cuando introdujimos el concep-to de estrategias mixtas llamamos la atención sobre la posibilidad de exten-der el concepto de estrategias no dominadas (S∞) al concepto de estrategiasmixtas no dominadas iterativamente (Σ∞). Vamos a explorar un poco másesta extensión usando el concepto de estrategias racionalizables.

La idea básica es que los jugadores basan su análisis exclusivamente sobrela hipótesis de racionalidad (en el sentido del equilibrio de Nash - Cournotde que juegan estrategias que son mejores respuesta a las estrategias delos demás) pero supone menos inteligencia que en el equilibrio de Nash -Cournot (en el sentido de que no se supone que las expectativas que losagentes tienen sobre las estrategias de los demás se realizan). Además, estahipótesis de racionalidad es conocimiento común.

Definición 2.6 (Niveles de inteligencia). Supongamos que cada jugadores racional en el sentido de que juega mejores respuestas. Decimos que lascreencias de un jugador son de grado 1 si este cree que los demás jugadoresson racionales. Son de grado 2 si el cree que los demás creen que los demásjugadores son racionales (i.e., si el cree que los demás tienen creencias degrado 1), etc.

Definición 2.7 (Estrategias racionalizables). Sea G un juego en formaestratégica. Para cada jugador i ∈ N definamos la siguiente secuencia deestrategias mixtas (Σq

i )i=0,...,∞. Intuitivamente q denota el grado de racio-nalidad que se asume de cada jugador en la definición de cada conjunto deestrategias mixtas Σq

i .

1. Sea Σ0i = Σi.

2. Σq+1i = σi ∈ Σq

i : ∃σ−i ∈ Σq−i tal que ∀σi ∈ Σq

i , πi (σi, σ−i) ≥πi (σi, σ−i).

2para un caso más general véase Osborne y Rubinstein página 54

xxii 2. EXTENSIÓN MIXTA

Esto es, Σq+1i son las estrategias que pueden ser racionalizadas

como mejor respuesta a alguna creencia de orden q (i.e., σ−i ∈ Σq−i)

que el agente i tenga sobre los demás jugadores.

Ri =∞∩q=1

Σqi se llama el conjunto de estrategias racionalizables del jugador

i. Un estrategia conjunta σ se llama racionalizable si la estrategia que le

corresponde a cada jugador es racionalizable: σ ∈ R =NΠi=1Ri

También está implícito en la definición de estrategia racionalizable elhecho de que los agentes escogen sus estrategias de forma independiente yesto restringe las expectativas que los agentes se forman de las estrategiasde los demás.

Teorema 2.8 (Bernheim, 1984 y Pearce, 1984). El conjunto de estra-tegias conjuntas racionalizables es no vacio. Más aún para cada jugador,el proceso de eliminación de estrategias no racionalizables termina en unnúmero finito de iteraciones.

No es difícil convencerse que cualquier estrategia que forma parte de unequilibrio de Nash - Cournot es racionalizable. Luego ser racionalizable esmás débil que ser un equilibrio de Nash - Cournot.

En la Batalla de los Sexos, el conjunto de estrategias racionalizableses la totalidad del conjunto de estrategias, luego el concepto de estrategiaracionalizable es estrictamente más débil que el de Nash - Cournot. Esteejemplo pone en evidencia que el concepto de estrategia racionalizables puedeser un concepto muy débil y con poco poder predictivo en muchos casos.

Mencionamos anteriormente que íbamos a profundizar sobre la idea deeliminación de estrategias mixtas dominadas iterativamente. En efecto, siuna estrategia mixta es dominada, ciertamente no puede ser la respuestaóptima a ninguna estrategia conjunta que los demás jugadadores jueguen.Se sigue que el conjunto de estrategias mixtas no dominadas iterativamen-te contiene al conjunto de estrategias racionalizables. En el caso de juegosbilaterales, estos dos conjuntos coinciden (Perace, 1984) pero, en general, lacontenencia es estricta. Si permitieramos que los agentes se formaran expec-tativas correlacionadas sobre las estrategias de los demás ambos conceptoscoincidirían (esto explica por qué en juegos bilaterales no es necesario haceresta extensión).

Parece intutivo que una estrategia racionalizable le asigne probabilidadpositiva solo a aquellas estrategias que se juegan con probabilidad positivaen algun equilibrio de Nash. Sin embargo esto no es cierto como lo demuestraun ejemplo de Bernheim (véase Vega - Redondo, tabla 2.10). Por lo tanto elconcepto de estrategia racionalizable, así como el concepto de estrategias nodominadas iterativamente, no es propiamente un concepto de equilibrio enel sentido de que no existan incentivos a desviaciones unilaterales.

2.1. EXTENSIÓN MIXTA DE UN JUEGO xxiii

2.1.3. Equilibrio de Nash - Cournot.

Definición 2.9 (Equilibrio de Nash - Cournot). Una estrategia mixtaconjunta σ ∈ Σ es un equilibrio de Nash - Cournot si para todo jugador i ypara toda estrategia σi ∈ Σi :

πi(σi, σ−i) ≥ πi(σi, σ−i)

Teorema 2.10 (Nash 1950). Todo juego finito (i.e., el número de juga-dores y conjunto de estrategias de cada jugador es finito) tiene un equilibriode Nash en estrategias mixtas.

Prueba. Defina la correspondencia de mejor respuesta Bi : Σ−i → Σi como:

B(σ−i) = argmaxσ∈Σi(πi(σ, σ−i))

y sea B : Σ→ Σ definida como B =∏Bi. Por el teorema del punto fijo de

Kakutani, B tiene un punto fijo σ∗ (es decir, σ∗ ∈ Σ tal que σ∗ ∈ B(σ∗).Por definición éste es un equilibrio de Nash.

Nota técnica 2.11. Es elemental extender el anterior teorema al si-guiente caso. Suponga que el espacio de estrategias son conjuntos no vacíos,compactos, convexos, las funciones de utilidad de cada agente son continuasy cuasicóncavas como función de su propia estrategia. Entonces existe unequilibrio de Nash. La prueba es idéntica a la anterior.

Ejercicio 2.12. Encontrar el equilibiro de Nash en estrategias mixtasde la Batalla de los Sexos.

Ejercicio 2.13. Dar algunos ejemplos para demostrar que ninguna delas hipótesis de este teorema puede ser eliminada.

Nota técnica 2.14. El concepto de equilibrio Nash se remonta a Cour-not [1838]. La formalización y primera demostración se debe a Nash [1950]en la que utiliza el teorema del punto fijo de Kakutani. En Nash [1951] semuestra como sustituir el teorema de Kakutani por el de Brower.

Ejercicio 2.15. Si se supone que las funciones de utilidad son estric-tamente cuasi-cóncavas en la propia estrategia, se puede aplicar Brower yobtener una demostración muy sencilla.

Ejercicio 2.16. La siguiente es una representación muy útil de la utili-dad πi en la versión extendida de un juego. Demostrar que para todo jugadory para toda estrategia conjunta:

πi(σi, σ−i) =∑si∈Si

σi(si)πi(si, σ−i)

Proposición 3. Las siguinetes afirmaciones son equivalentes:

1. σ es un equilibrio de Nash.2. Para todo i, πi(σi, σ−i) ≥ πi(si, σ−i) para todo si.

xxiv 2. EXTENSIÓN MIXTA

3. Para todo jugador, πi(σi, σ−i) = πi(si, σ−i) para todo si en el soportede σi y πi(σi, σ−i) ≥ πi(si, σ−i) para todo si por fuera del soportede σi.3

Nota técnica 2.17. Esta proposición es útil para calcular equilibriosde Nash en estrategias mixtas. En particular el numeral tres afirma que enun equilibrio de Nash en estrategias mixtas todas las estrategias puras conprobabilidad positiva arrojan la misma utilidad que la utilidad en equilibrio.

Ejemplo 2.18 (Cara y sello). En el ejemplo de cara y sello donde noexiste un equilibrio de Nash - Cournot en estrategias puras es fácil ver quela estrategia mixta σi = (1

2 ,12) para cada jugador es un equilibrio Nash -

Cournot en estrategias mixtas.

Ejemplo 2.19 (Encuentro en NY). Considere el siguiente juego:

1\2 E GE 100,100 0,0G 0,0 1000,1000

Este juego tiene dos equilibrio de Nash en estrategias puras y un equili-brio de Nash en estrategias mixtas. Es fácil ver que la estrategia mixta paracada jugador (10/11, 1/11) satisface las condiciones del numeral tres de laproposición anterior.

Ejemplo 2.20 (Batallla de los sexos). En este ejemplo hay, adicional-mente, un equilibrio en estrategias mixtas: σ = (

(34 ,

14

),(

14 ,

34

))

Ejemplo 2.21 (Entrada de una firma). Considere el siguiente juego:

1\2 F CN 0,2 0,2E -1,-1 1,1

Este juego tiene un equilibrio de Nash en estrategias puras (E,C) y uncontinuo de equilibrios en estrategias mixtas. Todas las estrategias mixtasde la forma σ = ((σ1N , σ1E) , (σ2F , σ2C)), σ1N = 1 y σ2F ≥ 1

2 son equilibriode Nash en estrategias mixtas. Obsérvese que este equilibrio puede interpre-tarse como sustentado por la amenaza de que la firma incumbente peleará(estrategia F ) en caso de que la firma 1 decida entrar. Esta amenaza es,sin embargo, poco creible pues, dado que la firma 1 decide entrar, cierta-mente no es la mejor estrategia para la firma 2 pelear. Este ejemplo sirvecomo motivación para el concepto de equilibrio perfecto en subjuegos queestudiaremos más adelante.

Ejercicio 2.22 (Equilibrios simétricos). Hacer ejercicio 20.4, página 20de [OR]

3Una estrategia pura esta en el soporte de una estrategia mixta si tiene probabilidadpositiva.

2.1. EXTENSIÓN MIXTA DE UN JUEGO xxv

Teorema 2.23 (Glicksberg 1952). Dado un juego G en forma estratégicadonde el espacio de estrategias de cada jugador es un subconjunto compactode Rm y las funciones de utilidad son continuas, se tiene que G tiene unequilibrio de Nash en estrategias mixtas.4

La extensión es importante pues introduce juegos en el que el espaciode acciones es un continuo. Sin embargo, la hipótesis de continuidades fuerte. Por ejemplo, no se cumple en el modelo de competenciaoligopolística de Bertrand.

Teorema 2.24 (Debreu 1952, Fan 1952 y Glicksberg 1952). Bajo lascondiciones del teorema anterior, si el espacio de estratgeias es convexo ylas funciones de utilidad son cuasi-cóncavas en la estrategia de cada jugadorentonces el juego tiene un equilibrio Nash en estrategias puras.

Nota técnica 2.25. La demostración de este teorema es una aplicacióninmediata del teorema de punto fijo de Kakutani (véase la proposición 20.3de [OR]. El teorema de Nash es un corolario inmediato: un equilibrio deestrategias mixtas es un equilibrio en estrategias puras de la extensión mixtadel juego. Es fácil ver que la extensión mixta satisface todas las propiedadesdel teorema anterior.

Ejemplo 2.26 (No existencia del equilibrio de Nash). Supongamos quedos jugadores pueden venderle un producto a tres posibles compradores. Loscompradores A y C tienen acceso a sólo un vendedor. B tiene acceso a losdos vendedores. Los tres compradores tienen una restricción presupuestalde una unidad. Los vendedores escogen el precio de venta de su productopero no pueden discriminar entre los compradores. Ellos escogen de formasimultánea un precio pi ∈ [0, 1]. Supongamos que en caso de que los preciossean idénticos el comprador B compra del vendedor 1.

Este juego no tiene un equilibrio, aún en estrategias mixtas. Supongaque existe un equilibrio en estrategias puras tal que p1 > 1

2 . El jugador2 va escoger un precio ligeramente inferior p1 > p2 > 1

2 . En este caso eljugador 1 va querer disminuir su precio y así sucesivamente. Luego no existeun equilibrio con p1 >

12 . Si p1 ≤ 1

2 , la única mejor respuesta del jugador 1es p2 = 1. Pero en este caso 1 tiene un incentivo a aumentar su precio. La noexistencia de un equilibrio en estrategias mixtas se deja como ejercicio parael lector.

Notación 4. En lo que sigue siempre que hablemos de estrategia nosreferiremos a una estrategia mixta.

Ejercicio 2.27. Dilema de los viajeros. Sean S1 = S2 = 2, 3, ..., 99, 100.Si s1 < s2, π1(s1, s2) = s1 + 2, π2(s1, s2) = s1 − 2. Si s1 > s2, π1(s1, s2) =s2 − 22, π2(s1, s2) = s2 + 2. Mostrar que el único equilibrio de Nash es (2, 2)

4Este teorema requiere introducir el concepto de estrategia mixta sobre un espacio deestrategias continuo y además extender el juego y definir una noción de continuidad en elespacio de estrategias mixtas.

xxvi 2. EXTENSIÓN MIXTA

Ejercicio 2.28. (Seven Puzzles You Think You Must Not Have HeardCorrectly with solutions: Peter Winkler). The names of 100 prisoners areplaced in 100 wooden boxes, one name to a box, and the boxes are linedup on a table in a room. One by one, the prisoners are led into the room;each may look in at most 50 boxes, but must leave the room exactly as hefound it and is permitted no further communication with the others. Theprisoners have a chance to plot their strategy in advance, and they are goingto need it, because unless every single prisoner finds his own name all willsubsequently be executed. Find a strategy for them which has probability ofsuccess exceeding 30 %.

2.1.4. Seguridad.

Ejemplo 2.29. Considere el siguiente juego:A B

a 2,1 0,0b 0,0 1,2

Mostrar que el valor maxmin para cada jugador es 23 .

2.2. Aspectos normativos

Definición 2.30. En un juego en forma normal, una estrategia conjuntaτ domina débilmente a σ en el sentido de Pareto si, para todo i :

πi(τ) ≥ πi(σ)

con desigualdad estricta para por lo menos un agente. Domina estrictamentesi la desigualdad anterior la podemos cambiar por una desigualdad estricta.

Definición 2.31 (Eficiencia de Pareto). En un juego en forma normal,una estrategia conjunta σ es eficiente en un sentido fuerte (o débil) si noexiste una estrategia que la domine en un sentido débil (fuerte).

Definición 2.32. Un juego es un dilema del prisionero generalizado siexisten dos estrategias conjuntas σ = (σ1, ..., σN ) y τ = (τ1, ..., τN ) tal que:

1. σ es un equilibrio en estrategias dominantes débilmente.2. τ domina débilmente a σ en el sentido Pareto.

Considere un juego en que cada jugador tiene una valoración privada deun mismo objeto. Suponga que cada jugador conoce la valoración privadadel objeto de cada jugador. Los agentes hacen una oferta por el objeto, ganael objeto el que más oferta y paga el segundo valor más alto de todas lasofertas. La utilidad para el ganador es su valoración menos lo que paga. Paralos demás jugadores es cero. Por simplicidad supongamos que no existen unpar de jugadores con la misma valoración. Este juego es un caso especial deuna subasta al segundo precio de un único bien en el que hemos hecho elsupuesto de que hay información completa. El subastador es quién recibe el

2.3. JUEGOS BILATERALES DE SUMA CERO xxvii

pago y asigna el objeto. En este caso suponemos que el subastador no haceparte del conjunto de jugadores.

Es fácil ver que esta subasta tiene un equilibrio en estrategias dominantes(débilmente) que consiste en ofertar la verdadera valoración.

Proposición 4. Una subasta al segundo precio es un dilema del prisio-nero generalizado (Note que excluimos al subastador del conjunto de juga-dores).

Prueba. Considere una estrategia para cada jugador que sea ofertar la mitadde su valoración.

En teoría de subastas se muestra que la subasta al segundo precio eseficiente en el sentido de que el objeto se le asigna al jugador con la mayorvaloración (incluso cuando el conjunto de jugadores incluye al subastadory éste tiene un precio de reserva del objeto mayor o igual a cero). Estasdos formas de estudiar la eficiencia de la subasta al segundo precio no soncontradictorias pues la subasta al segundo precio es un dilema del prisionerogeneralizado solo en la medida en que se excluya al subastador del conjuntode jugadores.

2.3. Juegos bilaterales de suma cero

Un juego de bilateral de suma cero es un juego con dos jugadores en elcual todo resultado del juego representa pagos opuestos para los jugadores.Esto es, los jugadores tienen intereses opuestos.

Un ejemplo de juego de suma cero es el juego de cara y sello. Hay otrosejemplos más complejos e interesantes como el juego del ajedrez. Sin embar-go, como veremos más adelante, se pueden obtener resultados bastante másfuertes para este caso que los que se obtienen del teorema de Von Neumann(??) que exponemos en esta sección.

Definición 2.33. Un juego bilateral de suma cero es un juego G =〈1, 2 , Sii=1,2, πii=1,2〉 tal que para todo s ∈ S, π1(s) + π2(s) = 0.

El requerimiento de sumar cero es una simplificación no fundamental,basta con que la suma sea constante. Por eso en ocasiones se llaman juegosbilaterales de suma constante. Es fácil ver que si la suma de los pagos es ceropara las estrategias puras, también lo es para las estrategias mixtas (y viceversa).5

Teorema 2.34 (von Neumann, 1928). Sea G una juego bilateral de sumacero. Entonces:

5Algunos autores consideran una generalización de juegos de suma cero que denomi-nan juegos estrictamente competitivos. Estos son juegos en los que los dos jugadore tienepreferencias opuestas por las alternativas (en estrategias puras). Estos juegos compartenmuchas de la propiedades de los juegos de suma cero pero en general, la característica deser competitivo no se extiende a estrategias mixtas.

xxviii 2. EXTENSIÓN MIXTA

1. maxσ1∈Σ1

mınσ2∈Σ2

π1 (σ1, σ2) = mınσ2∈Σ2

maxσ1∈Σ1

π1 (σ1, σ2) . El primer valor lo de-

nominamos el valor maxmin del jugador 1 y lo denotamos por v1,el segundo lo denominamos el valor minmax del jugador 1 y lo de-notamos por v2. Luego el teorema afirma que en un juego de sumacero estos dos valores son iguales y denotamos el valor común por v∗1denominado el valor del juego para el jugador 1.

2. Para todo equilibrio de Nash - Cournot (σ∗1, σ∗2) tenemos v∗1 = π1 (σ∗1, σ

∗2)

y viceversa, si σ∗1, σ∗2 son estrategias maxmin para cada jugador en-tonces (σ∗1, σ

∗2) es un equilibrio de Nash - Cournot. En particular,

todos los equilibrios de Nash - Cournot generan la misma utilidad.

Este teorema es equivalente al teorema Minmax de von Neumann queestudiaremos más adelante. Sin embargo, la demostración que se presenta enesta sección se basa en el teorema de existencia del equilibrio de Nash. Elteorema Minmax y el teorema anterior son bastante anteriores al teorema deNash. De la demostración del teorema es fácil darse cuenta que el teoremase puede enunciar para cualquier juego en forma normal para el cual existaun equilibrio de Nash, sin apelar a estrategias mixtas.

La estrategia maxmin para el jugador i refleja la estrategia de maximizarel pago para el jugador i bajo el supuesto de que el otro siempre va tratar deminimizar el pago de i. Intuitivamente, es lo máximo que el jugador i puedegarantizar de utilidad para el mismo (en el peor caso).

El segundo resultado establece una relación muy particular en los juegosde suma cero. La estrategia maxmin, el resultado de una estrategia individua-lista, la máxima utilidad en el peor caso, coincide coincide con el equilibriode Nash. Esto le da solidez al concepto de equilibrio de Nash en juegos desuma cero.Prueba. Primero demostramos que:

v1 = maxσ1∈Σ1

mınσ2∈Σ2

π1 (σ1, σ2) ≤ v2 = mınσ2∈Σ2

maxσ1∈Σ1

π1 (σ1, σ2) .

mınσ′2∈Σ2

π1 (σ1, σ′2) ≤ π1 (σ1, σ2) , luego

v1 ≤ maxσ1∈Σ1

π1 (σ1, σ2)⇒ v1 ≤ v2

Para demostar que v1 ≥ v2, sea (σ∗1, σ∗2) un equilibrio de Nash - Cournot.

Por definición:

∀σ1 ∈ Σ1, π1 (σ∗1, σ∗2) ≥ π1 (σ1, σ

∗2)

∀σ2 ∈ Σ2, π1 (σ∗1, σ∗2) ≤ π1 (σ∗1, σ2)

Ahora, v1 = maxσ1∈Σ1

mınσ2∈Σ2

π1 (σ1, σ2) ≥ mınσ2∈Σ2

π1 (σ∗1, σ2) = π1 (σ∗1, σ∗2) (por-

que σ∗2 es una mejor respuesta para el segundo jugador dado que el primerojuega σ∗1) luego v1 ≥ π1 (σ∗1, σ

∗2) .

2.3. JUEGOS BILATERALES DE SUMA CERO xxix

Por otro lado, como σ∗1 es una mejor respuesta para el primer jugadordado que el primero juega σ∗2,

π1 (σ∗1, σ∗2) = max

σ1∈Σ1

π1 (σ1, σ∗2)⇒

v1 ≥ maxσ1∈Σ1

π1 (σ1, σ∗2)⇒

v1 ≥ mınσ2∈Σ2

maxσ1∈Σ1

π1 (σ1, σ2) = v2

La segunda parte se sigue de la demostración anterior.El teorema anterior implica que el valor del juego para cada jugador es

el mismo para cada jugador independientemente de qué equilibrio de Nashjueguen. En efecto, no es necesario que los jugadores jueguen un equilibriode Nash para que que se realice ese valor. Basta con que cada jugador utilicecomo estrategia alguna que sea perteneciente a una estrategia conjunta quesea un equilibrio y que él espere que los demás hagan lo mismo y viceversa.Esta propiedad se conoce como intercambiabilidad del equilibrio en juegosbilaterales de suma cero. 67

Ejercicio 2.35. Demostrar la propiedad de intercambiabildad del equi-librio para juegos de suma cero.

6Formalmente la intercambiabilidad implica que el conjunto de estrategias conjun-tas que son equilibrios tiene la estructura de un producto cartesiano entre conjuntos deestrategias mixtas.

7El teorema de von Neumann puede verse como un caso particular del teorema dedualidad en la teoría de optimización (véase Myerson, página 125). En efecto, existe unaequivalencia entre juegos de suma cero y problemas de programación lineal.

Capítulo 3

Otros conceptos

3.1. Otros conceptos de solución

3.2. Equilibrio perfecto

La eliminación de estrategias dominadas débilmente es dificil de justi-ficar sobre la base del comportamiento puramente racional: una estrategiadominada débilmente puede ser un mejor respuesta a alguna estrategia deotro jugador. Luego, sólo si estamos seguros de que el otro jugador no vautilizar esa estrategia se justifica eliminarla. El concepto de equilibrio deNash tampoco elimina estrategias dominadas débilmente: Puede existir unequilibrio de Nash tal que un jugador está utilizando un estrategia dominadadébilmente. Para mayor ilustración consideremos el siguiente juego.1

Ejemplo 3.1 (Equilibrio de Nash dominado).

1\2 A Ba 1,1 0,-3b -3,0 0,0

La estrategia bB es un equilibrio de Nash en el cual ambas estrategias sondébilmente dominadas.

Vamos a ver que si suponemos cierta cautela por parte de los jugadores,en la medida que estos reconozcan que con cierta probabilidad sus adversariospueden no jugar Nash, entonces es posible racionalizar la eliminación deestrategias dominadas débilmente.

Quisiéramos definir un concepto de equilibrio que sea robusto a ciertotipo de perturbaciones del juego que reflejan la posibilidad de que los ju-gadores puedan cometer errores. La definición que captura esta idea es lasiguiente:

Definición 3.2 (Equilibrio perfecto en forma normal). Sea εi : Si →(0, 1) tal que

∑s∈Si εi(s) < 1 y ∆εi = σi ∈ Σ(Si) : σi(s) ≥ εi(s)∀s ∈ Si. Es

decir, ∆εi es el conjunto de todas las estrategias mixtas con soporte completoy determinado por εi. Denotamos por Gε =

(N, (∆εi)i=1,...,N , (πi)

)el juego

perturbado por (εi)i=1,...,N

1Esta sección está basada en Mas-Colell et. al. [1995].

xxxi

xxxii 3. OTROS CONCEPTOS

Decimos que σ es un equilibrio perfecto en forma normal si es un equili-brio de Nash y si existen sucesiones

(εki)k=1,...,

y equilibrios de Nash σk delos juegos perturbados Gεk

(σki)k=1,...,

tal que:

1. lımk→∞ εki (s) = 0 ∀i, s ∈ Si

2. lımk→∞ σki = σi

Esta definición solo requiere que exista una sucesión de juegos perturba-dos. Intuitivamente la definición captura la idea de que los agentes puedencometer errores (trembling hand) y por lo tanto evalúan juegos ligeramenteperturbados donde los agentes le asignan probabilidad positiva a todas laestrategias puras.

Proposición 5. SeaG = (N, (Si)i=1,...,N , (πi)i=1,..,N ) un juego en formanormal. Una estrategia conjunta de

(σ1, ..., σn

)es un equilibrio perfecto (en

forma normal) del juego G si y solamente si para cada jugador i existe(σik)k=1,.....

sucesión de estrategias mixtas de soporte completo tal que:

1. σik → σi

2. Para todo i y k, σi es la mejor respuesta ante σ−ik .

Ejemplo 3.3. Considere el juego:

1\2 X YAa 0,1 0,1Ab 0,1 0,1Ba -1,2 1,0Bb -1,2 2,3

(A,X) es un equilibrio perfecto en forma normal. Considere las siguien-tes estrategias de comportamiento (soporte completo). Para el jugador 1 :(1− 2/k, 1/k, 1/k)k=3,4,5,... donde la primera componente es la probabilidadde jugar A, la segunda componente es la probabilidad de jugar Ba, y la ter-cera es la probabilidad de jugar Bb. Para el jugador 2 considere la estrategiade comportamiento que es jugar X con probabilidad cerca a 1.

Ejercicio 3.4. Considere el juego:

1\2 X YAa 0,2 0,2Ab 0,2 0,2Ba -1,0 3,0Bb -1,-1 -1,-1

Calcular los equilibrios perfectos en formal normal.

Ejercicio 3.5. Mostrar que en todo equilibrio perfecto en forma normalninguna estrategia débilmente dominada es jugada con probabilidad positiva.

3.3. EQUILIBRIO FUERTE Y EQUILIBRIO INMUNE A COALICIONES xxxiii

Ejercicio 3.6. Mostrar que en un juego con únicamente dos jugadorestodo equilibrio de Nash en el no se juegan estrategias débilmente dominadascon probabilidad positiva es un equilibrio perfecto en forma normal (véaseKreps, página 439).

Ejercicio 3.7. Considere el juego:

1\2 X YA 2,2 2,2BC 4,1 1,0BD 0,0 0,1

Este juego tiene un equilibrio perfecto en formal normal pero no extensiva(véase capítulo sobre juegos dinámicos).

Selten [1975] demostró que todo juego finito tiene un equilibrio perfectoen forma normal. En particular, todo juego finito tiene un equilibrio de Nashen el que ninguna estrategia débilmente dominada se juega con probabilidadpositiva.

3.3. Equilibrio fuerte y equilibrio inmune a coaliciones

Definición 3.8 (Equilibrio fuerte). Una estrategia conjunta σ es unequilibrio fuerte si para todo C ⊂ N no existe una estrategia conjunta (σi)i∈Ctal que:

πi((σi)i∈C , σN\C) > πi(σ), ∀i ∈ C

Podemos deducir inmediatamente de la definición que un equilibrio fuertees eficiente débilmente en el sentido de Pareto.

Ejemplo 3.9. Este juego tiene un único equlibrio fuerte pero dos equi-librios de Nash.

1\2 A BA 1,1 0,0B 0,0 4,4

Este es un concepto de equilibrio muy fuerte (no existe en el caso delDilema de los Prisioneros) y pueden darse otro tipo de dificultades como loilustra el siguiente ejemplo.

Ejemplo 3.10 (Bernheim, Peleg y Whinston 1987). Considere el siguien-te juego entre tres individuos.

1\2 A BX 0,0,10∗ -5,-5,0Y -5,-5,0 1,1,43 M

1\2 A BX -2,-2,0 -5,-5,0Y -5,-5,0 -1,-1,5∗

3 N

xxxiv 3. OTROS CONCEPTOS

En este juego existen dos equilibrios de Nash - Cournot y uno de ellosdomina al otro. Ninguno de los dos equilibrios de Nash - Cournot son unequilibrio fuerte pero el equilibrio dominado tiene algunas característicasque motivan el próximo concepto de equilibrio que introduciremos.

Para ver que el primer equilibrio (X,A,M) no es un equilibrio fuerteobsérvese que 1 y 2 tienen un incentivo a desviarse. El segundo equilibrioclaramente no es un equilibrio fuerte. Ahora, considere los incentivos a des-viarse del segundo equilibrio (dominado) al primero. Si los jugadores 1 y 2creen que el jugador 3 va jugar M , la misma idea del equilibrio fuerte nossuigiere que 1 y 2 no deberían de tener incentivos para desviarse juntos desus estrategias X y A respectivamente. Sin embargo, este no es el caso, ellostendrían el incentivo a desviarse juntos y jugar Y , B respectivamente. Pe-ro si el jugador 3 internaliza ese argumento entonces preferiría jugar N yvolvemos al equilibrio ineficiente.

El problema de tipo conceptual identificado en el anterior ejemplo motivala introducción de un concepto más débil.

Definición 3.11 (Equilibrio inmune a coaliciones informalmente). Unaestrategia conjunta es un equilibrio inmune a coaliciones si:

1. Es un equilibrio de Nash - Cournot.2. No existen incentivos a desviaciones bilaterales admisibles. Una desviación

bilateral es admisible si es un equilibrio de Nash - Cournot del juego reducidode dos jugadores donde todos los demás jugadores tienen sus estrategias fijas.

3. No existen desviaciones trilaterales admisibles. Una desviación trilateral esadmisible si no existen incentivos a desviaciones bilaterales admisibles ni adesviaciones unilaterales admisibles.

4. Así sucesivamente ad infinitum.

Ciertamente este es un concepto de equilibrio más débil que el conceptode equilibrio fuerte (menos desviaciones estratégicas del candidato a equili-brio son admisibles). Notemos que, por ejemplo, en el dilema de los prisione-ros no existe un equilibrio fuerte pero el equilibrio en estrategias dominadassí es un equilibrio inmune a coaliciones.

En el último ejemplo de las anteriores notas el equilibrio (Y,B,N) es unequilibrio inmune a coaliciones. Para ver esto verifiquemos las condiciones dela definición anterior. (Y,B,N) es un equilibrio de Nash y no existen incenti-vos bilaterales a desviarse (menos aún a desviaciones bilaterales admisibles).Ahora, considere los incentivos a una desviación de la coalición de todos losjugadores. Claramente existe un incentivo a moverse al equilibrio de Nash -Cournot (X,A,M).

Preguntémonos entonces si esta desviación es admisible. Para ser admi-sible no debería de haber ningún incentivo a desviaciones bilaterales admi-sibles. Sin embargo, los jugadors 1 y 2 si tiene un incentivo a desviarse y

3.4. EQUILIBRIO CORRELACIONADO xxxv

esta desviación sí es admisible pues es un equilibrio de Nash - Cournot delsubjuego que definen ellos dos.

Este es un concepto muy fuerte de equilibrio y deja de existir en muchascircunstancias. Un resultado interesante de Moreno y Wooders (1996) afirmaque si en el conjunto de estrategias no dominadas iterativamente existe unaque domina débilmente a todas las demás, entonces esta estrategia es unequilibrio inmune a coaliciones.

3.4. Equilibrio correlacionado

Considere el siguiente juego.

1\2 A BX 5,1 0,0Y 4,4 1,5

Este juego tiene dos equilibrios de Nash en estrategias puras: (X,A) y(Y,B) . Además existe un equilibrio simétrico en estrategias mixtas

(12 ,

12

)cuyo pago esperado es 5

2 para cada jugador. Este último es ineficiente puesla estrategia (Y,A) tiene un mayor pago para ambos jugadores. Obsérveseque este equilibrio en estrategias mixtas le asigna una probabilidad positivaa (X,B) . Vamos a ver que esta ineficiencia en parte se le puede atribuira la selección aleatoria independiente que hacen los dos jugadores en susestrategia mixtas.

Suponga que existe un mecanismo que permite coordinar las accionesde los jugadores en este juego con base en un mecanismo del tipo: al tiraruna moneda al aire si cae cara jugamos (X,A) si cae sello (Y,B), el valoresperado de cada jugador sería 3 mejor que la estrategia mixta pero aúnineficiente pues (Y,A) sigue teniendo un mayor pago para ambos jugadores.Si ambos acordaran la utilización de este mecanismo éste sería un equilibrioen el sentido de que no existen incentivos a desviarse.

¿Es posible acordar un mecanismo que sea un equilibrio y el pago espe-rado sea aún mejor? Si el mecanismo permite dar señales privadas a cadajugador la respuesta es sí. Vamos a demostrar que si se utiliza un mecanismode coordinación con señales privadas, existe un equilibrio (que definimos másadelante) en el cual la utilidad de cada individuo es 3,3.

La diferencia entre un mecanismo con señales privado o públicas quedaráclaro más adelante una vez definamos formalmente el concepto de recomen-daciones. Por el momento notemos que en el mecanismo descrito los agentespodrían intentar desviaciones de la recomendación condicionales a las reco-mendaciones que el mecanismo le hace a los demás jugadores. En un meca-nismo privado las posibles desviaciones son condicionales a la recomendaciónprivada que el jugador recibe.

xxxvi 3. OTROS CONCEPTOS

Definición 3.12 (Mecanismo de coordinación estocástico). Un meca-nismo de coordinación estocásticoM para un juego en forma estratégica Ges un espacio de probabilidad (Ω, Pii=1,...N , p) donde Ω es un universo deeventos, Pii=1,...N es una partición de Ω y p es una probabilidad sobre laσ− álgebra generada por la partición Pii=1,...N .

El mecanismo de coordinación estocástica tiene como objeto permitir lacoordinación de las estrategias con base en recomendaciones a cada juga-dor γi : Ω → Σi y donde cada jugador conoce la distribución conjunta delas funciones de recomendación. Más precisamente, los jugadores conocenel mecanismo de coordinación estocástico y por lo tanto pueden deducir ladistribución conjunta de las funciones de recomendación.

Definición 3.13 (Equilibrio correlacionado). Dado un mecanismo decoordinación estocástico M, un equilibrio correlacionado es un recomenda-ción para cada jugador γi : Ω → Σi, medible con respecto Pi tal que paratodo γi : Ω→ Σi medible con respecto a Pi:∑

ω∈Ω

p(ω)πi (γ(ω)) ≥∑ω∈Ω

p(ω)πi (γi (ω) , γ−i (ω))

Sin pérdida de generalidad se puede suponer que las recomendacionestienen como dominio el conjunto de las estrategias mixtas.

Ejemplo 3.14. Considere el juego anterior y el siguiente mecanismode coordinación estocástico, M = (ω1, ω2, ω3, P1, P2, p) donde P1 =ω1 , ω2, ω3, P2 = ω3 , ω1, ω2 y p es la distribución de proba-bilidad uniforme sobre Ω = ω1, ω2, ω3 (obsérvese que la σ− álgebra gene-rada por la partición es partes de Ω). Ahora considere las siguientes re-comendaciones: γ1(ω1) = X y γ1(ω2) = γ1(ω3) = Y ; y γ2(ω3) = B yγ2(ω1) = γ2(ω2) = A. Entonces la recomendación conjunta (γ1, γ2) es unequilibrio correlacionado para el mecanismo de coordinación estocásticoM.Para ver esto mostremos que ningun jugador tiene incentivos a desviarse.Para el jugador 1, sea γ una recomendación medible con respecto a P1. Esfácil verificar para las diferentes alternativas de γ que no existen incentivosa desviarse. Para el jugador 2 se hace una verificación similar.

La condición que define el concepto de equilibrio correlacionado se puedeescribir de la siguiente forma:

EP [πi (γ)] ≥ EP [πi (γi, γ−i)] ,

donde el valor esperado se calcula con respecto a la distribución P .Observemos también que la siguiente definición es equivalente a la defi-

nición anterior lo que sugiere que el espacio de eventos Ω no es esencial.

Definición 3.15 (Mecanismo de coordinación estocástico en forma re-ducida). Un mecanismo de coordinación estocástico (en forma reducida)

3.4. EQUILIBRIO CORRELACIONADO xxxvii

para un juego en forma normal es una distribución de probabilidad p :Σ1 × ... × ΣN → [0, 1]. Por simplicidad vamos a considerar únicamente elcaso en el que la distribución es de soporte finito.

Definición 3.16 (Equilibrio correlacionado en forma reducida). Un equi-librio correlacionado es un mecanismo de coordinación estocástico p : Σ1 ×... × Σn → [0, 1] tal que para toda función de recomendaciones para cadajugador γi : Σi → Σi se tiene:∑

σ∈Σ

p(σ)πi (σ) ≥∑σ∈Σ

p(σ)πi (γi (σi) , σ−i)

Ejercicio 3.17. Demostrar la equivalencia de las dos definiciones deequilibrio correlacionado.

Observemos que para verificar que no hay incentivos a desviarse en unequilibrio correlacionado, basta con verificar que no existen incentivos a des-viarse con recomendaciones con valores en estrategias puras. Podemos inter-pretar este concepto de equilibrio de la siguiente forma; cada jugador recibede forma privada una recomendación para jugar σi y todos saben que laprobabilidad con la que el mecanismo recomienda cualquier estrategia con-junta es p : Σ1 × ... × Σn → [0, 1]. Luego un equilibrio correlacionado esuno en el que ningún jugador tiene un incentivo a utilizar una función derecomendación distinta a la función identidad.

Todo equilibrio de Nash es un equilibrio correlacionado. Sea σ∗ = (σ∗1, ..., σ∗N )

un equilibrio de Nash. Entonces si definimos Ω =∏i Si y p = σ∗1×...×σ∗N es-

te es un mecanismo de coordinación que soporta el equilibrio correlacionadodonde la recomendación es la función constante γi = σ∗i .

Hay otra forma de representar un equilibrio de Nash como un equilibriocorrelacionado (considere el espacio de estados como las estrategias mixtasconjuntas y suponga que el mecanismo de coordinación se concentra en elequilibrio de Nash). Cuando existen varios equilibrios de Nash, cualquier dis-tribución sobre estos es un equilibrio correlacionado. Cuando el mecanismode coordinación es público estos son los únicos equilibrios correlacionadosque existen.2

Ejemplo 3.18. Reescribamos el ejemplo anterior como un equilibrio co-rrelacionado en forma reducida. Para esto, basta con deducir la distribuciónconjunta de las dos recomendaciones (variable aleatorias) sobre el conjuntode estrategias mixtas. Esa distribución conjunta es el equilibrio correlaciona-do en forma reducida. En este caso le asigna probabilidad 1

3 a ((1, 0), (1, 0)),((0, 1), (1, 0)), ((0, 1), (0, 1)) y probabilidad cero a ((1, 0), (0, 1)).

2La idea de un equilibrio correlacionado con señales privadas es idéntica a la definiciónanterior excepto que a los jugadores se les permite utilizar recomendaciones de la formaγi : Σ→ Σi

xxxviii 3. OTROS CONCEPTOS

Ejercicio 3.19 (Equilibrios correlacionados batalla de los sexos). Con-sidere la siguiente versión de la batalla de los sexos.

H\M B SB 3,2 0,0S 0,0 2,3

Este juego tiene tres equilibrios de Nash, 2 en estrategias puras y uno enestrategias mixtas.

1. Considere las siguientes distribuciones de probabilidad: p((1, 0), (1, 0)) =27 , p((1, 0), (0, 1)) = 3

7 y p((0, 1), (0, 1)) = 27 (todo lo demï¿s cero) y p((1, 0), (1, 0)) =

38 , p((0, 1), (1, 0)) = 1

4 y p((0, 1), (0, 1)) = 38 (todo lo demï¿s cero). Demostrar

que ambos son equilibrios correlacionados.2. Demostrar que el conjunto de equilibrios correlacionados es conjunto conve-

xo.3. Mostrar que la intersección de este conjunto con el conjunto de las distribu-

ciones de probabilidad correlacionadas es igual al conjunto de equilibrios deNash.Este ejercicio pone en evidencia dos propiedades geométricas genéricas delos equilibrios correlacionados.

Una característica sobresaliente de la definición de equilibrio correla-cionado es que le da un papel importante a las asimetrías de información.Específicamente, en un equilibrio correlacionado todos los jugadores usanuna recomendación distinta. El siguiente ejemplo resalta el papel que jue-gan las asimetrías de información en situaciones estratégicas. En particular,vamos a ver que perder información expost puede tener como consecuenciauna ganancia en eficiencia.

Ejemplo 3.20 (Valor de la información). Considere el juego de la si-guiente figura.60 Strategic-form analysis: theory

Table 2.9: A three-player strategic-form game with a correlated equilibriumPareto dominating Nash equilibria

21 A B

X 0, 0, 3 0, 0, 0Y 1, 1, 1 0, 0, 0

3 M

21 A B

X 2, 2, 2 0, 0, 0Y 0, 0, 0 2, 2, 2

N

21 A B

X 0, 0, 0 1, 1, 1Y 0, 0, 0 0, 0, 3

Q

mechanism that might allow them to obtain the higher payoff of 2 available inthe middle box. As explained, if such a mechanism exists, its details need not begiven explicitly. That is, its performance may be compactly summarized througha (stochastic) pattern of incentive-compatible recommendations as formalized byDefinition 2.7.

Consider therefore the probability density p : 1 ×2 ×3 → [0, 1], whichdistributes all positive probability equally over the following two (pure) strategyprofiles: (X, A, N ) and (Y, B, N ). That is,

p(X, A, N ) = p(Y, B, N ) = 1/2. (2.19)

Then, if each player is communicated only her respectively recommended strategy(but is aware of the way the whole pattern of recommendations is stochasticallychosen), it is immediate to check that such a strategy will be willingly followed inevery case. In other words, the probability density p(·) given by (2.19) defines acorrelated equilibrium.

Now, suppose player 3 is given the option of modifying the nature of the under-lying mechanism, so that she may decide whether to access the recommendationsprovided to her opponents. Will she want to exercise this option for more infor-mation? If, as it is natural to assume, what player 2 decides in this respect will beknown by players 1 and 3, the answer must be negative: she will prefer to forego thispossibility. For, if she were to accept it, the above set of recommendations would notdefine a correlated equilibrium any longer. Her opponents would understand that, ifplayer 3 were to trust that others will behave according to these recommendations,she herself will react as follows: M when the recommendation to the other players is (X, A); Q when the recommendation to the other players is (Y, B).

This, of course, destroys the incentives of players 1 and 2 to behave as recom-mended, leading to the collapse of the coordination device that allowed every playerto achieve a payoff equal to 2.

To end our discussion of correlated equilibrium, we address two pending butcrucial issues: its existence and its interpretation. Concerning existence, the problemis particularly straightforward in this case. Simply note that every Nash equilibriumof a strategic-form game trivially defines a correlated equilibrium in whichplayers’ recommendations are not correlated. That is, if σ ∗ = (σ ∗

i )ni=1 defines a

Este juego tiene dos equilibrios de Nash en estrategias puras: (Y,A,M)y (X,B,Q) . Ambos equilibrios tiene un pago neto de 1 para cada jugador.Existen sin embargo estrategias conjuntas que domina a ambos equilibrios:(X,A,N) , (Y,B,N) . Consideremos ahora el siguiente mecanismo de coor-dinación estocástico (en forma reducida): p (X,A,N) = p (Y,B,N) = 1

2 .

3.4. EQUILIBRIO CORRELACIONADO xxxix

Entonces p soporta un equilibrio correlacionado con pago esperado 2 paracada jugador.

Ahora supongamos que 3 se le da la opción de pagar por conocer larecomendación puntual que el mecanismo le hace a los otros dos jugadores.En este caso 3 respondería de la siguiente forma: Si los otros dos juegan(X,A) el juega M y si juegan (Y,B) el juega Q. Luego si los otros dosjugadores son informados de que 1 ha comprado esta opción ciertamente nojugaran las estrategias recomendadas y no habrá coordinación impidiendoque los jugadores obtuvieran un pago de 2. Luego la opción de obtener másinformación para 3 no tiene ningún valor.

Capítulo 4

Juegos generalizados y con un continuo de agentes

4.1. Juegos generalizados y juegos con un continuo de jugadores

En esta sección exploraremos conceptos más avanzados en comparacióncon el resto de las notas y supondremos conocimientos básicos de teoría dela medida. Este capítulo no es necesario para comprender el resto del libro,y está bien si es omitido por lectores menos familiarizados. El modelo quese va a plantear está basado en Riascos, A. y Torres Martinez, J.P (2012):On the existence of pure strategy equilibria in large generalized games withatomic players.

En esta sección consideramos dos generalizaciones importantes de la teo-ría de juegos estratégicos en forma normal. De una parte permitimos que elespacio de acciones de cada jugador dependa de las acciones de los demás(juego generalizado) y de otra parte permitimos que además de un númerofinito de jugadores (llamados atómicos) exista un continuo de jugadores (ju-gadores no-atómicos). Sin embargo, las acciones del continuo de jugadoressolo tiene influencia sobre los pagos de los demás (atómicos y no-atómicos) através de un mensaje que agrega las acciones de los jugadores no-atómicos.1

Sea G(T, (Kt,Γt, ut)t∈T , h) un juego generalizado con un número infinitode jugadores T = T1∪T2, donde T1 ⊂ R es un conjunto compacto de medidafinita de jugadores no atómicos con respecto a la medida de Lebesgue λ, y T2

es un conjunto finito de jugadores.2 Cada jugador t ∈ T1 tiene un conjuntocompacto no vacio de acciones Kt ⊂ K, donde K ⊂ Rn es un conjuntocompacto y

⋂t∈T1 Kt 6= ∅. De otra parte cada jugador t ∈ T2 tiene un

conjunto compacto, no vacío de acciones Kt ⊂ Rnt , con nt ∈ N.Un estrategia conjunta para los jugadores en T1 está dada por una función

f : T1 → K tal que f(t) ∈ Kt, para todo t ∈ T1. Como T2 es finito, unaestrategia conjunta para los jugadores en T2 es un vector a := (ai; i ∈ T2) ∈Πt∈T2Rnt tal que at ∈ Kt, para todo t ∈ T2. Sea F(Ti) el espacio de todaslas estrategias conjuntas de los jugadores Ti, con i ∈ 0, 1. Dado t ∈ T2,sea F−t(T2) el conjunto de acciones a−t := (aj ; j ∈ T2 \ t) que toman losdemás jugadores j ∈ T2 \ t.

1Cada una de las generalizaciones se podría presentar de forma independiente y adap-tar la misma prueba para cada caso.

2En otras palabras, (T1,B(T1), λ) es un espacio de medida, donde B(T1) es la σ−algebra de conjuntos de Borel de T1.

xli

xlii 4. JUEGOS GENERALIZADOS Y CON UN CONTINUO DE AGENTES

En el juego G(T, (Kt,Γt, ut)t∈T , h) los jugadores no necesariamente in-corporan las acciones de los otros jugadores en T1, en otras palabras, losjugadores no necesariamente toman en cuenta las acciones de los otros juga-dores no-atómicos para determinar su estrategia óptima. Sin embargo, cuan-do los jugadores toman su decisión, estos consideran información agregadade las acciones de los jugadores. Formalmente, dado un perfil de accionesde jugadores no-atómicos f ∈ F(T1), el agente t ∈ T1 toma en cuenta lasacciones de los jugadores no-atómicos solo por medio del mensaje dado porla función h : T1 × K → Rl. En otras palabras, cada jugador T va a teneren cuenta la información agregada mediante el mensaje dado por la funciónm(f) =

∫T1

h(t, f(t))dλ para incorporar a sus estrategias.

Ahora, nos vamos a concentrar en los perfiles de acciones para los cualeslos mensajes están bien definidos, decimos que f es un perfil de estrategias delos jugadores en T1 si tanto f ∈ F(T1) como h(·, f(·)) es una función medibledesde T1 hasta Rl.3 Sobre el comportamiento de los jugadores atómicos noson necesarias restricciones de medibilidad. Por estó razón, el conjunto deestrategias de los jugadores en T2 es idóntico al espacio de perfiles de accionesF(T2).

El conjunto de mensajes asociados con el perfil de estrategias de jugado-res no-atómicos estó dado por

(4.1) M =

∫T1

h(t, f(t))dλ : f ∈ F(T1) ∧ h(·, f(·)) es medible

⊂ Rl,

que es no vacío dado que⋂t∈T1 Kt es un conjunto no-vacóo y h es una

función continua. También, dado que los conjuntos K y T1 son compactos,para cualquier perfil de acciones f : T1 → K, la función h(·, f(·)) : T1 → Rles acotada. Por lo que, si esta es medible entonces también es integrable. Porestas razones, en la definición del conjunto de mensajes M solo se requeríaque h(·, f(·)) fuera medible.

En nuestro juego, los mensajes acerca de los perfiles de estrategias de losjugadores en T1 junto con los perfiles de estrategias de los jugadores en T2

pueden restringir el conjunto de estrategias admisibles disponibles para unjugador t ∈ T . Esto es, dado un vector (m, a) ∈ M × F(T2) las estrategiasdisponibles para un jugador t ∈ T1 están dadas por un conjunto Γt(m, a) ⊂Kt, donde Γt : M×F(T2) Kt es una correspondencia continua con valoresno vacíos y compactos. De forma análoga, dado (m, a−t) ∈M ×F−t(T2), elconjunto de estrategias para el jugador t ∈ T2 es Γt(m, a−t) ⊂ Kt, donde

3En Schmeidler (1973) and Rath (1992), los jugadores son no-atómicos y toman encuenta solamente el promedio de las acciones escogidas por los otros jugadores. Entonces,siguiendo nuestra notación, l = n y h(t, x) = x. Por lo tanto, ellos definen los perfiles deestrategias como funciones medibles desde el conjunto de jugadores hasta el conjunto deacciones.

4.1. JUEGOS GENERALIZADOS Y JUEGOS CON UN CONTINUO DE JUGADORESxliii

Γt : M×F−t(T2) Kt es un correspondencia continua con valores no-vacóos,compactos y convexos. Nos referimos a las correspondencias (Γt; t ∈ T ) comocorrespondencias de estrategias admisibles.

Dado un conjunto A ⊂ Rk, definimos U(A) como una colección de fun-ciones continuas u : A → R. Supongamos que U(A) esta dotada con la to-pologóa de la norma del supremo. Suponemos que cada jugador t ∈ T1tieneuna función objetivo ut ∈ U(K ×M × F(T2)) y que cada jugador t ∈ T2

tiene una función objetivo ut ∈ U(M × F(T2)) que se supone son cuasi-cóncavas en las estrategias. Finalmente, suponemos que la correspondenciaU : T1 → U(K ×M × F(T2)) definida por U(t) = ut es medible.4

Definición. Un equilibrio de estrategias puras de Nash de un juego ge-neralizado G(T, (Kt,Γt, ut)t∈T , h) esta dado por los perfiles de estrategias(f∗, (a∗t ; t ∈ T2)) tales que, para cualquier jugador no-atómico t ∈ T1,

(4.2) ut(f∗(t),m(f∗), a∗) ≥ ut(f(t),m(f∗), a∗), ∀f(t) ∈ Γt(m

∗, a∗),

y para cualquier jugador atómico t ∈ T2, ut(m(f∗), a∗) ≥ ut(m(f∗), at, a∗−t), ∀at ∈

Γt(m∗, a∗−t), donde el mensaje m(f∗) :=

∫T1h(t, f∗(t))dλ pertenece al con-

junto M .

En nuestra definición de equilibrio de Nash, cada agente maximiza sufunción objetivo, mientras que en Balder (1999) y Rath (1992), en el equi-librio, casi todos maximizan su función objetivo. Sin embargo, teniendo encuenta que las funciones objetivo son continuas y los espacios de accionescompactos, dado un equilibrio para cualquiera de los juegos estudiados enestos artóculos, siempre es posible cambiar las asignaciones asociadas con elconjunto de los jugadores no-atómicos que no maximizan, dóndoles a cadauno de ellos una estrategia óptima, sin cambiar la integrabilidad de los per-files de acciones o el valor de los mensajes. De este modo, el Teorema 2 enRath (1992) y el Teorema 2.1 de Balder (1999) aseguran la existencia delequilibrio de Nash donde todos los jugadores maximizan su función objetivo.

Teorema. Considere un juego generalizado G(T, (Kt,Γt, ut)t∈T , h) donde,

1. El conjunto de los jugadores es T1∪T2, donde T1 es un conjunto com-pacto de medida finita de jugadores no-atómicos, y T2 es un conjuntofinito de jugadores atómicos.

2. Para cualquier t ∈ T, los espacios de acciones Kt son no-vacóosy compactos, las correspondencias de estrategias admisibles Γt son

4Supongamos que hay un número finito de tipos en el conjunto de agentes no-atómicos,T1. Esto es, hay una partición finita de T1 en conjuntos Lebesgue-Medibles I1, . . . , Ir talque, dos jugadores t y t′ pertenecientes al mismo elemento de la partición son idénticos.En este caso, la restricción acerca de la medibilidad de U se satisface de forma trivial.

xliv 4. JUEGOS GENERALIZADOS Y CON UN CONTINUO DE AGENTES

continuas y tienen valores no-vacóos y compactos, y las funcionesobjetivo ut son continuas.

3. Cada jugador atómico tiene un conjunto convexo de acciones, unacorrespondencia con valores convexos de estrategias admisibles, y unafunción objetivo cuasi-concava en su propia estrategia.

4. Existe un conjunto compacto K tal que, para cualquier t ∈ T1, Kt ⊂K y ∩

t∈T1Kt este es no vacio.

5. La función h : T1 × K → Rl es continua.6. La correspondencia U : T1 → U(K ×M × F (T2)), que asocia con

cualquier t ∈ T1 la función objetivo ut, es medible.

Entonces, existe un equilibrio de estrategias puras de Nash.

Capítulo 5

Aplicaciones

5.1. Aplicaciones

El propósito de este capítulo es presentar aplicaciones de la teoría dejuegos a cuatro problemas clásicos en economía: la teoría de competenciaimperfecta entre firmas (monopolio y oligopolio), la provisión de bienes pú-blicos, el problema de implementación o diseño institucional, y la existenciadel equilibrio Walrasiano en una economía de intercambio.

En estas aplicaciones vamos a discutir tres características importantessobre los problemas a modelar:

1. Homogeneidad del bien producido.2. Heterogeneidad de las firmas3. La existencia de restricciones de capacidad.

5.2. Oligopolio

En esta sección suponemos que se produce un bien homogéneo, las firmasson heterogéneas y no hay restricciones de capacidad. A saber, tenemos nfirmas que producen un bien homogéneo. Vamos a denotar con F : R → Rla demanda agregada. Y suponemos que satisface la ley de la demanda. Lafunción inversa la denotamos por P : R → R. Adicionalmente suponemosque cada firma tiene una función de costos creciente Ci : R+ → R+.

5.2.0.1. Cournot. Para modelar el problema de oligopolio según Cour-not vamos a suponer que el conjunto de estrategias de cada firma es el nivelde producción qi. El pago neto Πi(qi, q−i) = P (Q)qi − Ci(qi), donde Q es laoferta total que suponemos se agota completamente en el mercado.

En un equilibrio de Nash (interior) (q∗1, ..., q∗n) se cumple:

C ′i(q∗i )− P (Q∗) = P ′(Q∗)q∗i

Competencia es un caso particular de competencia a la Cournot dondela demanda agregada es perfectamente elástica. En este caso la demandaagregada inversa es completamente inelástica (el precio no responde a lascantidades vendidas). Notemos entonces que la diferencia entre costo margi-nal y el precio de equilibrio depende de:

xlv

xlvi 5. APLICACIONES

1. La elasticidad de la demanda con respecto al precio (entre más inelás-tica mayor la diferencia).

2. El nivel de producción q∗i de la firma.

Las consideraciones anteriores las podemos resumir en la siguiente rela-ción. Sea α∗i =

q∗iQ la participación del mercado de cada firma y definamos el

índice de Lerner L como:

L (q∗) =n∑i=1

α∗iP (Q∗)− C ′i(q∗i )

P (Q∗).

Esta es una medida ponderada de las desviaciones de competencia perfecta.Definimos el índice de Herfindhal H como:

H(α∗) =n∑i=1

α∗2i

y la elasticidad de la demanda agregada inversa como λ como:

λ(Q) = −P ′(Q)Q

P.

Es fácil demostrar que:L (q∗) = λ(Q)H(α∗)

Nota técnica 5.1. Obsérvese que H(α∗) es un índice de concentraciónde mercado (su máximo lo alcanza cuando α∗i = 1). En conclusión, entremás inelástica sea la función de demanda (o más elástica sea la función dedemanda inversa) y exista mayor concentración de mercado, mayor es ladesviación del equilibrio competitivo.

El resultado anterior se obtuvo bajo la hipótesis de homogeneidad delbien producido, más no de las firmas que lo producen. En el caso de unduopolio, si adicionalmente suponemos firmas homogéneas, costos marginalesconstantes y demanda agregada lineal, el equilibrio de Nash es una predicciónmuy bien fundada pues es el único resultado de la eliminación iterativa deestrategias dominadas luego, es un equilibrio de Nash y, además, es único.Es decir, es un juego soluble en estrategias iterativamente no dominadas.

Ejemplo 5.2.Supongamos que J firmas idénticas compiten en un mercado por un bien

homogéneo. Vamos a suponer que sus costos marginales son constantes:

(5.1) c(qj) = cqj

donde c ≥ 0 y qj es el nivel de producción de la firma j.Supongamos que la demanda agregada inversa es lineal y la podemos

escribir como:

(5.2) p = a− bJ∑j=1

qj

5.2. OLIGOPOLIO xlvii

donde a y b son positivos. Por lo tanto, los beneficios de una firma j son:

(5.3) Πj(q1, ...qJ) =

a− b J∑j=1

qj

qj − cqj .

Es fácil demostrar que el equilibrio de Nash (Cournot - Nash) de estejuego es:

(5.4) q =a− c

b(J + 1).

Esto implica que los valores de equilibrio de la demanda (oferta) agrega-da, precio y beneficios son respectivamente:

J∑j=1

qj =J (a− c)b(J + 1)

c < p = a− J a− c(J + 1)

< a

Πj =(a− c)2

b(J + 1)2

Vale la pena resaltar que cuando J = 1 tenemos el caso de una firmamonopolísta y cuando J →∞ obtenemos competencia perfecta.

Ejercicio 5.3. Competencia imperfecta, muchas firmas en la industria1.Supongamos que J firmas identicas compiten en un mercado por un bienhomogéneo.

Vamos a suponer que los costos de las firmas son:

(5.5) c(qj) = cqj + F

donde c ≥ 0 y qj es el nivel de producción de la firma j y F es un costo fijo.Supongamos que la demanda agregada inversa es lineal y la podemos

escribir como:

(5.6) p =1

2− 1

2

J∑j=1

qj

donde a y b son positivos.Por lo tanto, los beneficios de una firma j son:

(5.7) Πj(q1, ...qJ) =

1

2− 1

2

J∑j=1

qj

qj − cqj − F.

1. Calcualr el equilibrio (simétrico) de Nash en Competencia a la Cournot.

1Tomado de Motta, M. (2004). Competition Theory and Policy. Page 54

xlviii 5. APLICACIONES

2. Calcular los beneficios individuales en equilibrio de cada firma y los beneficiosagregados.

3. Mostrar que los beneficios agregados de las firmas disminuyen con el númerode firmas.

4. Cuál es su intepretación de este fenómeno.

Ejercicio 5.4. Competencia por la extracción de rentas de un merca-do.2) Considere n firmas idénticas que compiten por obtener el derecho aexplotar como un monopolio un mercado específico. Cada firma decide deforma simultánea su gasto xi para ganarse el derecho. La probabilidad deganarse el derecho es xi∑

j=1,...n xjSea Π (i.e., esta es una constante y su valor

no importa para los fines del ejercicio) las rentas monopolístas en caso deobtener el derecho a explotar el mercado. Entonces el pago esperado πi dela firma i es:

πi =xi∑

j=1,...n xjΠ− xi

1. Encontrar el equilibrio de Nash simétrico (i.e., las acciones de cada firma sonelegir xi).

2. Calcular el el beneficio esperado de cada firma en equilibrio.3. Mostrar que cuando n tiende a infinito el gasto agregado hecho por todas

las empresas es igual al beneficio del monopolista Π.

5.2.0.2. Bertrand: Bienes homogéneos. El modelo de oligopolio de Ber-trand consideramos el caso en el que el bien es homogéneo y las firmas sonsimétricas. Consideremos el caso particular de la economía anterior en elque las firmas tienen costos marginales constantes e iguales entre si (firmashomogéneas) y mantenemos la hipótesis un bien homogéneo.

En el contexto del modelo anterior si las firmas compiten en precios en-tonces el equilibrio coincide con el equilibrio en competencia perfecta y todaslas firmas tienen beneficios cero; Para ver esto primero obsérvese que si elmenor precio ofertado es inferior al costo marginal este no puede ser un equi-librio de Nash. Ahora suponga que el menor precio oferta es estrictamentesuperior al costo marginal (y la función de demanda agregada es continua).Es fácil de ver que existe por lo menos una firma que no está atendiendotoda la demanda. O bien es una firma que no está ofreciendo el menor precioo bien es una firma que está ofreciendo el menor precio pero debe compartirel mercado con otra que tambén a ofrecido el menor precio.

Es fácil de ver que esta firma (que no atiende todo el mercado) tieneincentivos a desviarse (una reducción suficientemente pequeña del preciomínimo ofertado por todas las firmas resulta en un aumento en su beneficio).

2Tomado de Motta, M. (2004). Competition Theory and Policy. Page 89

5.2. OLIGOPOLIO xlix

Luego el precio de equilibrio debe ser igual al costo marginal. Finalmente,no es difícil verifica que si por lo menos dos firmas ofertan el costo marginalentonces este es un equilibrio de Nash.

5.2.0.3. Bertrand: Bienes no homogéneos. Ahora relajemos únicamenteel supuesto de bienes homogéneos. Supongamos que tenemos dos firmas si-métricas que producen dos bienes diferenciados pero tiene los mismos costosmarginales. Las funciones de costos son:

Ci(qi) = cqi

La función inversa de demanda de cada producto es de la forma:

Pi (q1, q2) = max0,M − qi − bqj, i, j = 1, 2 i 6= j

lo cual refleja que los productos son percibidos como distintos por los con-sumidores y las demandas no son independientes.

Las funciones de demanda son:

Fi (p1, p2) = max0, M

1 + b− 1

1− b2pi +

b

1− b2pj

El parámetro b refleja el grado de sustitución entre los dos bienes. Elpago neto de cada jugador es:

πi (p1, p2) = (pi − c) max0, M

1 + b− 1

1− b2pi +

b

1− b2pj

Es fácil demostrar que un equilibrio (interior) simétrico es:

p∗1 = p∗2 =M(1− b)

2− b+

c

2− b.

Cuando b ↑ 1 los bienes son menos heterogéneos y el resultado tiende alos precios de competencia perfecta. 3

5.2.0.4. Bertrand: Restricciones de capacidad. En esta sección estudia-mos los efectos de cierto tipo de mecanismos de sesiones y compensacionesen un mercado de commoddities. Este es un modeo simplificado del mercadodel azúcar o el aceite de palma en Colombia. Supongamos que n productoresvenden un producto homogéneo, costos de producción son cero y existen dosmercados para el producto: un mercado interno y un mercado externo. Enambos la demanda es inelástica. Sea D la demanda interna por el bien (lademanda externa es residual, todo lo que no se venda internamente se vendeen el mercado externo a un precio pE), θ(pM ) = mınpM1 , ...pMn donde n esel número de productores y pMi es el precio de venta que fija el productor ien el mercado interno. Vamos a suponer que:

1. Ninguna firma es capaz de suplir la totalidad de la demanda interna(i.e., existen restricciones de capacidad).

3Otro caso interesante para estudiar es cuando existen restricciones de capacidad.

l 5. APLICACIONES

2. Las n − 1 firmas mas pequeñas (en capacidad) sí pueden suplir latotalidad de la demanda interna.

3. Las firmas que fijan el menor precio participan en el mercado pro-porcionalmente a su producción.

Con estas hipótesis los beneficios de la firmas son:

πi = pE ×Qi, si pMi > θ(pM )(5.8)

πi = θ(pM )× xiQi + pE × (1− xi)Qi, si pMi = θ(pM )(5.9)

donde pE es el precio de exportación, Qi es la producción de la firma i yxi = D∑

j∈k:pMk

=θ(pM )Qj. Obsérvese que por las hipótesis anteriores xi < 1.

Además xi es igual para todos los productores que fijan el menor precio.

Ejercicio 5.5. Demostrar que el equilibrio de Bertrand en este caso esθ(pM ) = pE

Ahora suponga que existe la posibilidad de importar el bien a un preciopI > pE (debido a aranceles que buscan proteger el sector). Es claro quelos aranceles no tiene ningún efecto sobre el equilibrio. Este sigue siendoθ(pM ) = pE .

Ahora suponga que los productores crean un mecanismo de sesiones ycompensaciones que, utilizando las cantidades vendidas por cada productor(reportadas por estos y debidamente auditadas) y los precios de exportacióne importación (públicamente disponibles), hacen las siguientes transferenciasa cada productor:

(pI − pE)× xQi, si pMi > θ(pM )(5.10)

(pI − pE)× (x− xi)Qi, si pMi = θ(pM )(5.11)

Después de recibir las transferencias los beneficios de las empresas son,cuando xi < 1, son:

pQi, si pMi > θ(pM )(5.12)

(θ(pM )− pI)× xiQi + pQi, si pMi = θ(pM )(5.13)

donde p = pI DQ + pE × (1− DQ ) y Q es la capacidad total de producción

de las firmas.Ahora vamos a demostrar que, si θ(pM ) = pI y todos los productores

que empatan en el menor precio pueden atender más que la demanda interna(xi < 1, para todo i que fijan el menor precio) entonces este es un equilibriode Nash. Además los beneficios de equilibrio son pQi para todas las firmas(vendan o no internamente).

5.2. OLIGOPOLIO li

Para ver esto primero suponga que θ(pM ) < pI . En este caso las firmascon el menor precio ganan menos que pQi. Una de estas firmas subiendo elprecio lograría un beneficio igual a pQi. Ahora suponga que θ(pM ) > pI .Por hipótesis ninguna firma puede atender la totalidad del mercado. Escojaun productor de estos y cambie el precio pMi por θ(pM ) − ε donde ε essuficientemente pequeño. Entonces su beneficio sería (θ(pM )−pI−ε)Qi+pQi.Si no cambiara su precio el beneficios sería pQi o (θ(pM )− pI)×xiQi + pQi.Ahora observemos que si ε es lo suficientemente pequeño y teniendo en cuentaque xi < 1 entonces:

pQi(5.14)

< (θ(pM )− pI)× xiQi + pQi(5.15)

< (θ(pM )− pI − ε)×Qi + pQi(5.16)

luego existirían incentivos unilaterales a desviarse.En conclusión, θ(pM ) = pI es un candidato a equilibrio cuando la oferta

agregada de todos los que fijan el menor precio excede la demanda (es decir,cuando todos los que fijan el menor precio tienen xi < 1). Ahora mostremosque en efecto es un equilibrio. Vamos a mostrar dos cosas. Que aquellos queempatan en el menor precio no tiene incentivos unilaterales a desviarse yque lo mismo sucede con aquellos que fijan un precio mayor al menor precio.Supongan que i es tal que pMi = θ(pM ). Si i cambia su precio por θ(pM )− εentonces su beneficio después del mecanismo de compensación es:

(θ(pM )− ε)×Qi + (pI − pE)(x− 1)(5.17)

= (θ(pM )− pI − ε+ p)×Qi(5.18)= (−ε+ p)×Qi(5.19)

porque θ(pM ) = pI . Pero obsérvese que este beneficio es menor que p×Qi,que es el beneficio antes de intentar desviarse de forma unilateral.

De otra parte, si el productor fija un precio superior a θ(pM ) = pI en-tonces sus beneficios se mantiene iguales (no existen incentivo a desviarse).

Por último supongamos que un productor que fija precios superiores alprecio θ(pM ) = pI e intenta desviarse. Si este disminuye su precio hastaigualar el menor precio, sus beneficios no cambian. Y si lo disminuye pordebajo del precio pI sus beneficios disminuyen.

En resumen, el mecanismo de sesiones y compensaciones logra sostenerun precio interno más alto que en ausencia del mecanismo y observacional-mente el resultado es como si actuaran como un monopolio.

5.2.0.5. Hotelling.

Véase presentación: Location Models: Examples

lii 5. APLICACIONES

5.2.0.6. Cuantificación del daños de prácticas anticompetitivas. Estasección es preliminar pero da una buena idea de como utilizar la teoría dejuegos para atacar un problema de teoría de la competencia.4

La evaluación cuantitativa de daños monetarios provenientes de presun-tas prácticas no competitivas es una tarea central en las investigaciones sobrecompetencia. Para determinar una compensación justa se requiere una es-timación del daño. Para esto se requeriría tener información sobre lo quehubiera sucedido en un mundo paralelo en el que no hubieran existido prác-ticas anticompetitivas. Dicho escenario es conocido como el contrafactualy dicha información no existe. Es por esto que es necesario utilizar algúnmodelo que permita reconstruir y describir el escenario contrafactual de lamejor forma. A pesar de la dificultad metodológica para estimarlo con exac-titud, distintos métodos económicos han sido desarrollados y utilizados enlas cortes para poder cuantificarlo. El grado de complejidad de los modelosy su precisión varía, y se encuentra íntimamente ligado a restricciones deinformación, tiempo y otros recursos (Komninos, Assimakis; Oxera, 2010).

Antes de presentar las principales técnicas junto con sus ventajas y des-ventajas se definirá el daño desde el punto de vista económico. Para lograrestimar el daño se debe definir una medida objetiva y rigurosa que permitacuantificarlo monetariamente. Desde el punto de vista económico, el objetivoes la cuantificación del cambio en el bienestar del consumidor. Si se conside-ran dos restricciones presupuestales (p0,m0) y (p1,m1) donde p es un vectorde precios y m son los ingresos que enfrenta un consumidor en una situacióninicial 0 y una posterior 1, una medida ideal del cambio en bienestar de pasarde la situación 0 a la situación 1 sería la diferencia en las utilidades indi-rectas, es decir v(p1,m1)− v(p0,m0) donde v(p,m) es la función de utilidadindirecta. No obstante la anterior medida de utilidad es sólo ordinal y nopermite tener una medida monetaria del cambio en bienestar. Si definimosu(q, p,m) como el ingreso que el consumidor necesitaría con los precios qpara tener el mismo bienestar que tendría con los precios p y el ingreso m,podemos medir monetariamente el cambio en bienestar como la diferenciau(q, p1,m1)− u(q, p0,m0).

La cuestión pendiente es definir cuáles son los precios bases q, para loque se tiene dos opciones. Una alternativa es tomar los precios iniciales p0

como base, en cuyo caso se calcularía la variación equivalente, que respondela siguiente pregunta: ¿Cuánto es el cambio en ingreso necesario para alcan-zar, con los precios iniciales, el bienestar de la situación posterior? En otraspalabras, cuánto es lo máximo que un consumidor estaría dispuesto a pagarpara evitar el cambio de precios:

V E = u(p0, p1,m1)− u(p0, p0,m0)

4Con la colaboración de Miguel Bernal.

5.2. OLIGOPOLIO liii

Si se toma como precios base los de la situación posterior p1, se calcularíala variación compensada que responde la pregunta: cuánto es el cambio en elingreso necesario para alcanzar, con los precios posteriores, el bienestar de lasituación inicial Alternativamente, cuánto se debe compensar al consumidorpor el cambio de precios.

V C = u(p1, p1,m1)− u(p1, p0,m0)

La medida clásica de cambio en bienestar es el cambio en el excedentedel consumidor, que es el área bajo la curva de la demanda Marshallianax(p) entre los precios p0 y p1:

∆EC =

∫ p1

p0x(t)dt(5.20)

Es importante notar que las tres medidas son útiles para cuantificar loscambios en el bienestar de los consumidores, pero tienen diferencias con-ceptuales. Sin embargo están íntimamente relacionadas pues siempre tienenel mismo signo. Los bienes normales son aquellos cuya demanda aumentacuando el ingreso de los consumidores aumenta. Para este tipo de bienesante un incremento en precios se tiene que las tres medidas se relacionan dela siguiente forma:

V C ≥ ∆EC ≥ V E

Teniendo en cuenta lo anterior, para el presente análisis se definiría elmundo observado como la situación 0 y el mundo contrafactual como la si-tuación 1. De esta manera se podría estimar monetariamente el cambio enel bienestar del consumidor utilizando distintas metodologías que se presen-tarían en seguida. En el ámbito de prácticas anticompetitivas es importanteseñalar que una de las técnicas más utilizadas es utilizar el sobrecosto resul-tante de la práctica anticompetitiva y multiplicarlo por las unidades que sevendieron, que corresponde al rectángulo A de la Ilustración 1. Esta técnicasubestima el daño real, pues sólo tiene en cuenta lo que habrían ahorradoquienes efectivamente adquirieron el producto, sin embargo desconoce que aun precio menor se hubiera vendido una mayor cantidad de producto, quecorresponde al triángulo B de la misma ilustración. Por lo tanto no se tendríaen cuenta el daño para este grupo de consumidores. Las medidas presentadasanteriormente sí tienen en cuenta este daño.

Existen múltiples modelos que pueden servir para determinar el escenariocontrafactual y estimar los daños. Sin embargo, la robustez de los modelosdepende crucialmente de la validez de los supuestos sobre los que se construyey qué tan razonables son, dado el contexto particular. Se pueden clasificarlos modelos de varias formas, sin embargo siguiendo a Komninos(2010) seplantean modelos basados en 3 grandes categorías:

1. Comparaciones

liv 5. APLICACIONES

2. Análisis Financiero3. Estructura de Mercado

Los métodos basados en comparaciones se caracterizan por utilizar datosde fuentes ajenas al periodo de la presunta infracción. Cuando se cuenta condatos de corte transversal (todos de un mismo periodo de tiempo) se pue-den hacer comparaciones con agentes en otros mercados geográficos, otrosproductos comparables en donde no hubo prácticas anticompetitivas paraasí construir un contrafactual. Los modelos pueden tener en cuenta facto-res observables para controlar por diferencias entre los mercados para asíaislar el efecto de la práctica anticompetitiva, de lo contrario otros facto-res que coinciden con el periodo pero que no se tienen en cuenta a la horade modelar pueden sesgar los resultados. La fortaleza de estas comparacio-nes transversales depende crucialmente en qué tan parecidos y comparablesson los mercados. La principal desventaja de este método es que puede serdifícil encontrar un mercado alternativo comparable y de encontrarlo es posi-ble que características no observadas sesguen los resultados (Brander Ross,2006). Otra opción es realizar comparaciones en el tiempo, específicamentecomparar el mismo mercado en un periodo en el que existió la práctica anti-competitiva con otro periodo en el que no existió. En general se utilizan dostécnicas para utilizar los datos de un mercado en el tiempo, los pronósticos

5.2. OLIGOPOLIO lv

de series de tiempo y utilizar una variable indicadora. Para utilizar la varia-ble indicadora se toman datos para todos los periodos en los que hay datosdisponibles, incluyendo periodos donde no existieron prácticas anticompeti-tivas. Se construye una variable indicadora It que toma el valor de 1 si enel periodo t existieron dichas prácticas y 0 de lo contrario y se estima unmodelo en el que el precio en el periodo t , Pt es función de dicha variable yotras exógenas Xt: Pt = f(It, Xt). Suponiendo una relación lineal, se tendría:

Pt = α+ βXt +t +γItXt + εt

Se estiman los parámetros con los datos y se estudia la significanciaestadística y la magnitud de los parámetros que acompañan a la variableindicadora y con esto se determina la magnitud del daño, pues se puede es-timar el precio contrafactual. Esta técnica presenta una dificultad, pues sedebe decidir si el diferencial del precio se asumirá constante o no, lo que di-ficulta obtener una estimación del daño. Alternativamente se puede estimarun modelo utilizando periodos en dónde no existieron prácticas anticompe-titivas y así lograr descubrir los determinantes de los precios y luego utilizarese modelo para predecir precios contrafactuales en el periodo de interés. Enalgunos casos ambas aproximaciones pueden arrojar las mismas predicciones(McCrary Rubinfeld, 2014). Una desventaja de estos modelos es que puedenexistir tendencias estacionales y autocorrelación temporal que de no ser con-trolados pueden generar estimaciones sesgadas. Finalmente, cuando se tienetanto el componente transversal como el temporal, se cuenta con datos panelque permite controlar por más factores y tener estimaciones más precisas. Latécnica de diferencias en diferencias es un ejemplo de lo que se puede hacercon estos datos. La mayor dificultad radica en que, en general, es comple-jo adquirir datos de estas características. Por otra parte se encuentran losmétodos basados en análisis financieros. Estos modelos utilizan informaciónde otras firmas e industrias para tener puntos de referencia sobre tasas deretorno y costos. Utilizando los costos de producción, de capital, márgenesde ganancia, rentabilidades entre otros, se puede estimar precios del escena-rio contrafactual. En general se usa el desempeño financiero de las firmas.Por ejemplo, un cambio en la rentabilidad de una firma demandante puedeser utilizado para estimar el daño causado. Igualmente resultados financierosexcepcionales pueden proporcionar medidas cuantificables del beneficio porparte de las firmas que utilizaron prácticas anticompetitivas.

Otra técnica utilizada para construir el precio contrafactual es analizan-do la estructura de costos de la firma, así se puede obtener un costo deproducción y al aplicarle un margen de referencia se puede establecer unprecio contrafactual. Además de las anteriores, en mercados desarrollados sepuede utilizar datos sobre los movimientos de las acciones y los bonos deuna empresa como insumos en el análisis. Una de las ventajas de estos mé-todos es que los datos generalmente se encuentran disponibles, al menos enlos estados financieros de las empresas. Algo que se debe tener en cuenta es

lvi 5. APLICACIONES

que dicha información corresponde a la empresa como un todo, y es posibleque las prácticas correspondan exclusivamente a un área de la compañía.Adicionalmente existen varias desventajas de usar estos métodos. En primerlugar, es difícil distinguir el efecto de factores ajenos a la práctica anticom-petitiva que afectan el desempeño financiero de las empresas. Asimismo, loscostos observados pueden ser engañosamente altos pues es posible que exis-tan ineficiencias en el proceso productivo como consecuencia de la falta decompetencia, o que no se están aprovechando totalmente las economías deescala al restringir los volúmenes de producción.

La tercera categoría son los métodos basados en la estructura de merca-do y la teoría. Estas metodologías se basan principalmente en la teoría de laorganización industrial, utilizando una combinación entre modelos teóricosy estimaciones empíricas para así determinar un escenario contrafactual. Elenfoque consiste en identificar los modelos de organización industrial quemejor se ajustan al mercado relevante. Existe un gran espectro de modelosque explican todo el rango de competencia en un mercado, desde competen-cia perfecta hasta monopolio. Los modelos utilizados para estimar el dañotambién están en un rango que va desde totalmente teóricos hasta absolu-tamente empíricos, sin embargo, en general se utiliza una combinación demodelos teóricos, supuestos y estimaciones empíricas que permiten estimary simular el mercado bajo diversas circunstancias. Una de las partes másimportantes para determinar el modelo a usar son las características delmercado y para determinar esto hay que tener en cuenta varias cosas. Pri-mero, es importante determinar si se compite en precios o cantidades. Silas firmas son tomadoras de precio, con pocas barreras de entrada y salida,y muchos participantes, se presenta un caso de competencia perfecta. Si lacompetencia es en precio, modelos de Bertrand, o competencia monopolísticapodrían ser los adecuados. Si se compite en cantidades, modelos tipo Cour-not son los adecuados. Cuando la localización de un producto es relevante,o como una forma de modelar las diferencias en calidad de los productos,se puede usar el modelo Hotelling. Si los precios se determinan en subastas,se deben estudiar los modelos de subastas relevantes para estudiar el tipode competencia. Otra característica relevante son los bienes, se debe utilizarmodelos diferentes si los bienes son homogéneos o diferenciados y si existeuna diferenciación horizontal o vertical. En la primera no existe un ordena-miento objetivo entre los bienes, mientras que en la segunda sí. Asimismo elnúmero de firmas y las barreras de entrada y salida pueden ser determinan-tes a la hora de definir la estructura de mercado. Además de los anteriores,otros factores como la estructura de costos pueden ser relevantes. Todo loanterior permite identificar cuál es el modelo teórico más apropiado parael mercado en cuestión. En general, para estimar el daño, la primera y latercera categoría utilizan modelos econométricos. Dentro de éstos modelosexisten dos grandes categorías, los modelos estructurales y los modelos enforma reducida. En los modelos estructurales se utiliza la teoría económica

5.2. OLIGOPOLIO lvii

y supuestos matemáticos que explican cómo un conjunto de variables endó-genas se relacionan a un conjunto de variables explicativas observables. Parahacer esto se debe especificar en detalle todas las relaciones entre los agentesque llevan a un resultado económico final. Para lograr estimar estos mode-los se deben utilizar supuestos estadísticos razonables sobre la distribuciónde algunas de las variables (Reiss Wolak, 2007). Como su nombre lo dice,estos modelos desarrollan minuciosamente toda la estructura de las relacio-nes económicas por lo que es posible realizar algunos cambios para construirescenarios contrafactuales de manera robusta. Por su parte, los modelos enforma reducida son aquellos que relacionan las distintas variables pero só-lo en su resultado final, sin especificar en detalle la estructura que llevó aeste resultado. Lo modelos en forma reducida son generalmente más fácilesde estimar que los estructurales de los cuales se derivan. Por ejemplo, enun modelo en forma reducida puede ser difícil distinguir entre la demanday la oferta. En muchas ocasiones las estimaciones en forma reducida pue-den ser muy útiles para responder preguntas relevantes. No obstante, susrelaciones no se derivan de un conjunto de ecuaciones estructurales lo quepuede generar el riesgo de producir resultados engañosos. Dada la comple-jidad de los modelos estructurales, éstos requieren una mayor cantidad dedatos. En general se prefiere utilizar modelos estructurales, sin embargo enmuchas circunstancias no existe suficiente información para caracterizar laestructura subyacente de la complejidad de la interacción entre agentes. Enestos casos modelos en forma reducida pueden ser una alternativa confia-ble al usarlos correctamente (Rubinfeld, 2008). Si los consumidores puedensustituir fácilmente los productos en cuestión, el ejercicio de poder de mer-cado tiene un efecto mucho menor, pues los consumidores pueden adquirirotros productos cuyos precios y cantidades no hayan sido modificados. Espor esto que es fundamental estimar tanto las elasticidades propias comolas cruzadas con otros productos para analizar los efectos en un mercado.Uno de los modelos estructurales más utilizados para realizar esta tarea fueintroducido por (Berry, Levinsohn, Pakes, 1995). Este modelo busca esti-mar tanto la demanda como la oferta en un mercado y caracterizar amboslados del mercado. Para estimarla se requieren datos desagregados de com-pras que permitan identificar las preferencias de los consumidores y a su vezcalcular participaciones de mercado. Por el lado de la demanda las decisio-nes de los individuos se modelan como elecciones discretas entre un conjuntofinito de bienes. Con base en los precios, cantidades vendidas por localiza-ción y año, las cantidades agregadas de estas (participaciones de mercadopor producto) y características básicas agregadas de los individuos como ladistribución del ingreso, se estima la utilidad de los agentes, la demanda ylas elasticidades cruzadas y con respecto a las características. Por el lado dela oferta se supone que las firmas compiten en precios (Bertrand). Con baseen las participaciones de mercado de cada producto se recuperan los costosmarginales y el markup (medida de poder de mercado). Utilizando los datosobservados del mercado durante el periodo en que existió presuntamente un

lviii 5. APLICACIONES

cartel se pueden estimar los markups y costos marginales. Estos permiteninferir el grado de competencia imperfecta observado. Finalmente usando loscostos marginales se pueden inferir los precios del contrafactual bajo otrasestructuras de mercado. Con los precios de competencia perfecta se puedeestimar las nuevas demandas y excedente del consumidor entre el escenarioobservado y el de competencia perfecta.

Para ilustrar algunas de las ideas mencionadas sobre los modelos estruc-turales, a continuación estudiamos un modelo de competencia a la Betrandcon miras a resolver un problema de cuantificación del daño de una presuntapráctica anticompetitiva.

Esta metodologï¿a se basa en Nevo. Considere i = 1, ..., N firmas en elmercado. Cada firma ofrece un conjunto Fj de productos diferenciados. SeaJ el número total de productos que se ofrecen. La demanda del producto jviene dada por

(5.21) Qj = Q(p1, ..., pJ , Z;α), j = 1, ..., J

donde Z es un vector de variables exógenas y α es un vector de parámetrosque deben ser estimados.

Los beneficios de la firma i son:

(5.22) Πi =∑j∈Fi

(pj −mc(Wj , β))Qj − Ci

donde mc(Wj , β)) es el costo marginal de producir el bien j,Wj es un vectorde variables exógenas, β es un vector de parámetros que deben ser estimados,Ci es el costo fijo. Obsérvese que esta especificación implica que los costosmarginales son constantes.

Las condiciones de primer orden (en forma matricial) es:

(5.23) p = mc+ Ω−1Q(p)

donde Ω ≡ Θ · ∂Qr(p)/∂pj y Θ es una matriz de unos y ceros que obedece avarios tipos de competencia.

En particular Θ puede representar tres diferentes tipos de competencia:

1. Matriz identidad: Bertrand con firmas uni-producto.2. Matriz con bloques de unos: Bertrand con firmas multi-producto.3. Matriz de unos: Bertrand con firmas en colusión.

La especificación econométrica se completa añadiendo un término deerror a la demanda y la ecuación de fijación de precios. Los parámetros α, βestán identificados porque en ambas ecuaciones hay variables exógenas ex-cluidas. Este modelo puede utilizarse para estimar qué tipo de competenciaes más apropiada entre un menú de posibilidades. Formalmente esto se pue-de hacer como sugieren algunos artículos: Bresnahan (1987) y Gasami et.al(1992). También puede utilizarse para constuir escenarios contrafactuales:competencia perfecta, colusión, etc.

5.2. OLIGOPOLIO lix

El modelo de variaciones conjeturales es idéntico pero excepto que lamatriz Θ no se supone de ceros y unos sino parámetros generales (estosrepresentan una medida de poder de mercado). Usualmente se interpretancomo las conjeturas que las firmas tiene sobre el comportamiento de lasdemás. Suponiendo que los parámetros de la demanda están identificados sise tienen J productos entonces se necesitan por lo menos un vector Z dedimensión J . Usualmente esto es difícil cuando se tiene muchos productosdiferenciados.

Como una aplicación considere las siguientes funciones de demanda:

(5.24) Qg1 = α10 + α11pg1 + α12p

g2 + α13p

c1 + α14p

c2 + Zγg + εg

(5.25) Qc1 = α20 + α21pg1 + α22p

g2 + α23p

c1 + α24p

c2 + Zγc + εc

Donde Qg1 y Qc1 son las cantidades demandadas, y p1 y p2 denotan respec-tivamente los precios. Además Z es un grupo de controles macroeconómicoscomo el PIB per cápita, etc. Al término de error econométrico se le denominaε.

Resolviendo la condición de primer orden se puede escribir como:

(5.26) [pg1 pc1] = [mcg1 mcc1] + [Qg1 Qc1]Ω−1

donde Ω es una matriz con las derivadas cruzadas:

(5.27) Ωj,r = −∂Qr1(p)

∂pj1= −αrj , r, j ∈ g, c

y los costos marginales se suponen que tiene una especificación lineal.Las estimaciones se realizan en 2 etapas:

1. Se estiman Qg1 y Qc1 por variables instrumentales2. Se calculan mcg1 y mcc1 empleando los estimados de αjr y se estiman

los parámetros por mínimos cuadrados.

Algunas desventajas generales que aplican a cualquier metodología sonproblemas inherentes a algunas practicas anticompetitivas. Por ejemplo, loscarteles son difíciles de coordinar. Hacer trampa dentro de un mercado oli-gopólico cartelizado puede traer enormes beneficios, por lo que las firmastienen incentivos a desviarse de los acuerdos pactados. Algunas veces facto-res externos en las condiciones de la demanda también pueden hacer difícil lacoordinación dentro del cartel. De esta forma, los datos observados puedenno reflejar claramente una práctica anticompetitiva. Igualmente es impor-tante tener claro a quién se le está causando el daño. Las estructuras delas cadenas productivas hacen posible que entre el generador del daño y elconsumidor final haya varios intermediarios que pueden afectar la direccióny el tamaño del cambio en los precios. La estimación del daï¿o en los distin-tos niveles de acuerdo a la cadena de suministro es en general complicada yrequiere otros modelos, supuestos y especialmente muchos datos .

lx 5. APLICACIONES

5.2.0.7. Resumen.

Si las firmas producen un bien homogéneo en competencia oligopolís-tica a la Corunot, la desviación de competencia perfecta depende dela elasticidad de la demanda agregada con respecto al precio (entremï¿s inelástica más poder de mercado) y el nivel de producción dela firma. Una medida de qué tan distante está el mercado de compe-tencia perfecta es el índice de Lerner que es un promedio ponderadode las desviaciones relativas del precio de equilibrio en competenciaimperfecta del costo marginal (con respecto al precio de equilibrio)ponderado por la participación de mercado de cada firma. Este sepuede expresar como el producto del índice de Herfindahl y la elas-ticidad de la demanda inversa.Cuando las firmas producen un bien homogéneo y además sus cos-tos marginales son constantes e iguales entre ellas, competencia ala Bertrand implica que el equilibrio de Nash simétrico coincide concompetencia perfecta. En presencia de restriciones de capacidad pue-de no existir un equilibrio.Si los costos marginales no son iguales, con restricciones de capacidadpuede no existir un equilibrio. Si las n− 1 firmas más pequenñas, entérminos de capacidad, no pueden atender la totalidad del mercado,no existe necesariamente un equilibrio.Si los bienes producidos son diferenciados pero los costos marginalesson constantes e iguales entre firmas, competencia a la Bertrand im-plica que el equilibrio se desvia de competencia perfecta. Entre másdiferenciados los bienes (menor sustitución entre ellos) más distantees el equilibrio de competencia perfecta.

5.3. Asignación eficiente de bienes públicos

Consideremos una comunidad de n individuos que debe determinar elnivel x de provisión de un bien público para ellos. Cada individuo determinasu contribución individual ci. La contribución total C financia una cantidadx = C del bien público. Adicionalmente, consideremos que cada individuotiene una dotación inicial wi de un bien privado.

Las preferencias de los individuos son de la forma:

Ui : R+ × (−∞, wi]→ R

donde Ui es creciente en el primer argumento (consumo del bien público),decreciente en el segundo (contribución individual) y estrictamente cóncava.

5.3. ASIGNACIÓN EFICIENTE DE BIENES PÚBLICOS lxi

El problema que tendría que resolver un planificador central es:

maxn∑i=1αiUi

s.a

x ≤ C, x ≥ 0, wi ≥ ci.

Suponiendo una solución interior, es fácil demostrar que la suma entreindividuos de las tasas marginales de sustitución entre bienes públicos yprivados es igual a la tasa marginal de transformación (condición de Bowen-Lindahl-Samuelson).

Ejercicio 5.6. Deducir la condición análoga de Bowen-Lindahl-Samuelsoncuando la tecnología para producir el bien público es de la forma f(C) = xdonde f tiene las propiedades usuales.

Es fácil demostrar que un mecanismo descentralizado en el cual los indi-viduos juegan un equlibrio de Nash es ineficiente. Una forma de reestablecerla eficiencia se basa en el concepto de equilibrio de Lindahl.

La estrategia (p∗i , c∗i , x∗) define un equilibrio de Lindahl para el problema

en consideración si:

1. Maximización individual:

maxUi

p∗ix = ci

ci, x ≥ 0

2.n∑i=1p∗i = 1

3.n∑i=1c∗i = x

Ejercicio 5.7. Demostrar que todo equilibrio de Lindahl es eficiente.

Un mecanismo descentralizado alterno que reestablece la eficiencia esel mecanismo de Walker. Para ejemplificar, consideremos el siguiente jue-go. Cada jugador tiene como espacio de estrategias puras al conjunto delos números reales R. Las estrategias de los agentes son mensajes. Si m esel mensaje conjunto de todos los agentes la provisión del bien público sedetermina como:

x = ψ(m) = max

n∑i=1mi

n, 0

donde m =

n∑i=1mi.

lxii 5. APLICACIONES

La contribución que le corresponde a cada agente es:

ci =

(1

n+mi+1 −mi+2

)ψ(m)

donde los jugadores se identifican modulo n (esto sugiere una interpretacióndel juego en el que los agentes forman un círculo).

Las funciones de pago son:

π(m1, ...,mn) = U(ψ(m),

(1

n+mi+1 −mi+2

)ψ(m))(5.28)

Para determinar si este mecanismo está bien definido es necesario verifi-car que dado cualquier mensaje, la contribución agregada es suficiente paraproducir ψ(m) del bien público (ejercicio).

Ejercicio 5.8. Demostrar que (p∗i , c∗i , x∗) es un equilibrio de Lindahl

sí y sólo si m∗ es un equilibrio de Nash donde: p∗i =(

1n +m∗i+1 −m∗i+2

),

x∗ = ψ(m∗) y c∗i = p∗ix∗.

5.4. Diseño de Mecanismos

La teoría del diseño de mecanismos es una teoría dual de la teoría dejuegos. Informalmente su principal problema es, dada una asignación de re-cursos o resultado sobre el que un conjunto de agentes tiene preferencias,encontrar y estudiar el mecanismo (reglas de juego) tales que nuestra mejorpredicción del resultado de la interacción de este conjunto de agentes (solu-ción del juego) sea la asignación o resultado dado. Este se llama el problemade implementación.

El principal ejemplo que utilizaremos de un mecanismo son las subastasy también veremos otros ejemplos importantes como lo son: el mecanismode Walker introducido anteriormente, el mecanismo de Vickrey, Clarke yGrooves y el mecanismo de compensación de Varian.

Inicialmente comenzaremos estudiando mecanismos de información com-pleta.

5.4.0.1. Elementos básicos. Sea I = 1, 2, ..., I un conjunto de agen-tes.

Definición 5.9 (Mecanismos). Un mecanismo es (M ii∈I , F, Y ), dondepara cada agente i, M i es un conjunto de mensajes posibles del agente i,M =

∏M i es el conjunto de los mensajes posibles de todos los agentes, Y

es un espacio de resultados y F : M −→ Y es una regla de asignación delespacio de mensajes en los resultados.

Suponemos que las preferencias de cada agente se pueden representarpor funciones de utilidad ui : Y −→ R y definimos Ui el conjunto de todas

5.4. DISEÑO DE MECANISMOS lxiii

las funciones de utilidad posibles de cada agente. Cuando los resultados soninciertos, restringimos el conjunto de utilidades a aquellas que tiene unarepresentación en forma de utilidad esperada. Sea T ⊆

∏Ui. T se llama el

espacio de tipos. Notemos que no hemos supuesto que T tiene una estructurade producto.

Vamos a suponer que los agentes observan t ∈ T lo cual les revela suspreferencias individuales y las de todos los demás. Por eso decimos que laestructura de información es una de información completa, por lo menos pa-ra los agentes aunque no lo sea para el centro (diseñador, o principal). Lafunción de utilidad de cada agente es una función ui : Y −→ R. Alterna-tivamente, la función de utilidad de cada agente es: ui : M −→ R dondeui(m) = ui(F (m)).

Definición 5.10 (Correspondencia de elección social). Una correspon-dencia (o regla) de elección social es una FS : T ⇒ 2Y .

Intuitivamente, si el tipo de los agentes es t ∈ T un planificador buscaimplementar un resultado en FS(t). Típicamente vamos a estar interesadosen correspondencias sociales que son eficientes o óptimas en algún sentido.

Definición 5.11 (Eficiencia ex-post). Una correspondencia FS es efi-ciente ex-post si para todo t ∈ T , FS(t) es un conjunto de resultados eficien-tes (en el sentido de Pareto).

Todo mecanismo define un conjunto de juegos estáticos de informacióncompleta. Para cada t ∈ T, t = (u1, ..., uI), sea Gt = (I, (M i)i∈I , (u

i)i∈I).Suponemos que todos los juegos Gt son conocimiento común de todos losagentes. Notemos que ui dependen del tipo t. Cuando sea necesario vamos ahacer explícita la dependencia escribiendo uit y uit.

La característica fundamental de un mecanismo en un ambiente de infor-mación completa es que cuando un agente es informado de su tipo tambiénes informado del tipo de todos los demás. Esto determina la forma de lasestrategias de los agentes. Para que el problema de implementación sea in-teresante, suponemos que el planificador central no es informado de ningúntipo.

Definición 5.12 (Estrategia). Una estrategia para el jugador i es unafunción si : T →M i.

La estrategia depende del tipo de todos los agentes. Esto es la caracte-rística fundamental del juego de información completa inducido.

5.4.0.2. Conceptos de solución.

Definición 5.13 (Dominancia). Una estrategia si domina débilmente asi si:

uit(F

(si (t) ,m−i

))≥ uit

(F

(si (t) ,m−i

))∀m−i ∈M−i and ∀t ∈ T con desigualdad estricta para algun t y m−i.

lxiv 5. APLICACIONES

Una estrategia es débilmente dominante si domina débilmente a cualquierotra estrategia.

Definición 5.14 (Equilibrio en estrategias dominantes débilmente). Unequilibrio estrategias dominantes débilmente del mecanismo 〈M,F, Y 〉 es unaestrategia conjunta s =

(s1, ..., sI

), si : T −→M i, tal para cada i, si es una

estrategia débilmente dominante.

Definición 5.15 (Equilibrio ex-post o Nash). Un equilibrio ex-post delmecanismo 〈M,F, Y 〉 es una estrategia conjunta s =

(s1, ..., sI

), si : T −→

M i, tal que:uit (F s (t)) ≥ uit

(F (si

(t), s−i (t)

))∀i ∈ I, ∀t ∈ T para todas las estrategias si : T −→M i.

Este es un equilibrio de Nash del juego de información completa una vezrevelada la información de todos los jugadores.

5.4.0.3. Implementación.

Definición 5.16 (Implementación). Una correspondencia social F s esimplementable en estrategias dominantes (débilmente) o estrategias ex-post,si existe un mecanismo (M,F, Y ) y un equilibrio s tal que F (s) es consistentecon FS (i.e., F s es una selección de FS : Para todo t, F (s(t)) ∈ FS(t)). Sipara todo equilibrio s del mecanismo, F (s(t)) ∈ FS(t) decimos que es fuer-temente implementable. Decimos que la implementación es completa cuandotodas las elecciones sociales de una correspondecia de elección se puedenobtener como un equilibrio de un mecanismo.

Nota técnica 5.17. Implementación en estrategias dominantes tam-bién se denomina strategy proof implementation.

Dado t ∈ T , t = (u1, ..., uI) y y ∈ FS(t) decimos que t′ ∈ T , t′ =(u′1, ..., u′I) no aumenta los resultados preferibles a y con respecto a t si paratodo i:

y′ ∈ Y : ui(y′) ≤ ui(y) ⊆ y′ ∈ Y : u′i(y′) ≤ u′i(y)(5.29)

Definición 5.18 (Monotonicidad de la función de elección social). Unafunción de elección social es monótona si se cumple la siguiente condición.Sea t ∈ T , y y ∈ Y arbitrarios. Supongamos que t′ ∈ T no aumenta losresultados preferibles a y con respecto a t entonces y ∈ FS(t′).

Teorema 5.19 (Maskin (1977)). Si una función de elección social esfuertemente y completamente implementable entonces es monótona.

5.4.0.4. El problema del Rey Salomón: No monotonicidad de la funciónde elección social. El Rey Salomón debe decidir a quién entregarle un niñoentre dos mujeres, A y B que lo reclaman como su hijo. Su objetivo es

5.4. DISEÑO DE MECANISMOS lxv

entregárselo a la verdadera madre y amenaza con matarlo si no hay consensoentre la mujeres. Formalmente, sea Y = a, b, c, que representan tres estadosdel niño si se lo entregan a A, B o lo matan.

El espacio es T = (uAα , uBα ), (uAβ , uBβ ) donde uA(a, α) > uA(b, α) >

uA(c, α) y uB(b, α) > uB(c, α) > uB(a, α). Las preferencias cuando el tipoes β son análogas. Por simplicidad escribimos T = α, β. Intuitivamenteel espacio de tipos indica si A es la verdadera madre (tipo α) o B es laverdadera madre (tipo β).

Notemos que este es un problema de información completa: claramentecada mujer sabe quién es la verdadera madre. El que no sabe es el ReySalomón. La regla de elección social que desea implementar el Rey Salomónes FS(α) = a y FS(β) = b, y esta función de elección social no es monótona.Luego, por el teorema de Maskin (1977) no es implementable (en un sentidofuerte y completo).

Para ver esto sea t = α y y = a. Ahora observemos que t′ = β noaumenta los resultados preferibles a a con respecto a α (en el estado α, aes el resultado preferible para A lo cual no cambia cuando el estado es βy, en el estado α, a es el peor resultado para B. Cuando el estado es α lospreferibles al resultado a disminuyen para B). Por lo tanto, monotonicidadimplicaría α ∈ FS(β) lo cual es una contradicción. Más adelante veremosque un mecanismo dinámico sí podría implementar.5

5.4.0.5. El problema del Rey Salomón: Espacio de mensajes enumera-ble. Supongamos que el espacio de mensajes de cada mujer es de la formaM i = 1, 2, 3, ..... y que existe una regla de asignación F : M1×M2 → b, cque determinará un mecanismo que resuelve el problema del Rey Salomón.La función F se puede representar como una matriz M = M1 ×M2 dondeel elemento Mi,j = F (i, j). Supongamos además que el verdadero estado esα. Entonces a debe aparecer en la matriz en alguna parte.

Si suponemos que en el equilibrio de Nash cualquier desviacion de B debearrojar la misma o mayor utilidad. El estado es α, para B es mejor b o c.Luego en la fila donde esta a solo hay a-es (o d en caso de que supusieramosun escenario que es matar a todos: A,B e hijo). Ahora supongamos que queel verdadero tipo es β. Entonces con esos mismo mensajes se tendría unequilibrio de Nash con resultado a. Una contradicción.

En conclusión esto muestra que no existe un mecanismo que resuelva elproblema de implementación fuerte del Rey Salomón.

Ahora, si enriquecemos el espacio de mensajes (Palfrey y Srivastara(1991)) muestra que el problema del Rey Salomón si es implementable fuer-temente en equilibrios de Nash no domindaos débilmente. Supongamos que

5Maskin (1977, 1999) prueba que si la función de elección social satisface la propiedadde no existencia de poder de veto y hay tres o más individuos, entonces es implementable.

lxvi 5. APLICACIONES

permitimos el resultado d matar a todos: A,B e hijo. El esapcio de men-sajes de cada mujer es: M = (t, n) : t = α, β, n = 1, 2, 3, ... La segundacomponente del mensaje puede interpretarse como qué tan fuerte habla lamujer.

Los pagos son los siguientes. Si se contradicen sobre cuál es la verdaderamadre el resultados es d (el peor resultado posible para todos). Caso contrariolos pagos son:

INTRODUCIR TABLAS DE PAGOS.Las siguientes estrategias son un equilibrio de Nash en estrategias no

dominadas débilmente: revelar quién es la verdadera madre y n = 1.

Ejercicio 5.20. Competencia a la Bertrand y diseño de mecanismos (elmundo real!). Considere un mercado oligopolista donde n empresas idénticas,con costos marginales iguales a cero, que producen un bien homogéneo per-fectamente divisible, donde es prohibido la entrada de más firmas, y supongaque compiten por suplir dos mercados. El mercado E tiene una demanda infi-nita al precio exógeno pE . En el mercadoD las firmas enfrentan una demandainelástica D. Piense en el mercado E como un mercado de exportación y Dcomo un mercado interno. El precio de importación es exógeno e igual a pIademás pI > pE (es decir es más caro importar que exportar y ambos preciosson exógenos para las firmas).

La capacidad de producción agregada de las firmas es Q, que suponemoses superior a la demanda D interna. Denotamos por Qi = Q/n la capacidadde producción de cada firma.

1. Suponga que las firmas compiten en precios a la Bertrand. Cuál es el equi-librio de Nash en precios en el mercado D y cuál es la particpación de cadafirma en el mercado interno. Ayuda: El precio de equilibrio es único y esuno de los precios ya introducidos arriba. Existen muchas participacionesque soportan el único precio. Todas ellas debe satisfacer una condición deequilibrio agregado.

2. Cuál es el beneficio de las firmas en este caso?3. Sea x = D/Q y suponga que la firmas se ponen de acuerdo verbalmente para

vender en el mercado interno a un precio pI . Luego ï¿stas suplen la demandadel mercado D y el resto lo venden en el mercado E. Suponiendo que estearreglo es sostenible, cuï¿l es el beneficio de las firmas en este caso? Es estearreglo estable (recuerde que en ausencia de un mecanismo coercitivo cadafirma procurarï¿a maximizar su propio beneficio)? Ayuda: Si el arreglo essostenible las firmas venderian todo su producto, promedio, al precio:

p = x× pI + (1− x)pE(5.30)

= pE +D

Q(pI − pE)(5.31)

5.4. DISEÑO DE MECANISMOS lxvii

4. Considere ahora el siguiente mecanismo. Suponga que un productor i vendeuna proporción xi de su producción en el mercado nacional al precio deimportación pI . Su beneficio πi antes de las cesiones y compensaciones delmecanismo es (esta es la función de beneficios de las firmas en ausencia demecanismo):

πi = pD × xiQi + pE × (1− xi)Qi(5.32)

donde pD es el precio de venta en el mercado interno. La compensación netadel mecanismo, CM se define como:

CM = pI × (x− xi)Qi + pE × ((1− x)− (1− xi))Qi(5.33)

La lógica de esta compensación neta es que si el productor vende más que laproporción x en el mercado interno, debe cederle al fondo que implementael mecanismo: pI × (xi − x)Qi y el fondo lo compensará con pE × ((1− x)−(1− xi))Qi.Por lo tanto, el beneficio del productor πi, post compensaciones y cesionesnetas del mecanismo es:

πi = πi + pI × (x− xi)Qi + pE × ((1− x)− (1− xi))Qi

y sustituyendo πi se obtiene:

πi = p×Qi

En conclusión, con este mecanismo, expost el productor es indiferente delmercado en que venda y todas sus unidades se venden en promedio al preciop.Suponiendo que la anterior descripción del mercado constituye un equilibriode Bertrand muestre que los beneficios y precios coinciden con el resultadoen que las firmas acuerdan vender a ciertos precios bajo el supuesto de queel arreglo entre ellas es sostenible (item (c) arriba).El ejemplo siguiente demuestra que el mecanismo anterior en efecto imple-menta el areglo colusivo discutido en este ejercicio.

Ejercicio 5.21. Escribir formalmente el problema anterior como un pro-blema de diseño de mecanismos. Más específicamente sea el espacio de tiposT = (q1, ..., qn, p

I , pE) :∑

i qi = D yMi = R+, Y = (pM1 , ..., pMn , pI , pE).

1. Escribir la regla de asignación del mecanismo.2. Escribir las funciónes de beneficios de los agentes en presencia del mecanismo.3. Escribir la función de elección social que este mecanismo implementa.

lxviii 5. APLICACIONES

5.5. Existencia del Equilibrio Walrasiano

In this section we extend Aumann (1966) to economies with incomple-te asset markets. The main point is to show that, even in economies withincomplete asset markets, one can get rid of the convexity assumption onpreferences as long as there are many traders (a continuum of traders).

Consider an economy with two periods, t ∈ 0, 1, and uncertainty aboutthe realization of the state of nature in the second period, t = 1. There isa finite set S of possible states of nature that can be realized at t = 1,S = 1, ..., S and s = 0 denotes the only state of nature at period t = 0.Let S∗ = S ∪ 0.

There is a finite set L = 1, ..., L of perfectly divisible and perishablecommodities that can be demanded for consumption in spot markets at eachstate of nature in the second period. We denote by ps ∈ RL+ the commodityprice vector at s ∈ S and by p ∈ RL×S+ the vector of commodity spot pricesin the economy.

There exists a finite set J = 1, ..., J of numerarie assets that pay inunits of the first commodity. One unit of asset j ∈ J deliver an amount Ns,j

units of commodity 1 if state of nature s ∈ S is reached. Assets are availablein a perfectly competitive asset spot market in the first period. Let q ∈ RJbe the unitary asset price vector at t = 0 and assume all assets are in zeronet supply. An allocation for any agent is a vector (x, z) ∈ RL×S+ ×RJ wherex denotes de demand for commodities in the second period in every stateand z denotes the demand for financial assets in first period.

There is a continuum and measurable set of agents [0, 1] (endowed withthe Lebesgue measure) that want to reallocate their income through timeusing financial assets. Therefore, given prices (p, q), each agent t ∈ [0, 1]

wants to maximize an objective function U t : RL×S+ → R (that representhis preferences over consumption) choosing an allocation in his budget setBt(p, q), which is defined as the set of consumption and financial allocation(x, z) ∈ RL×S+ × RJ that satisfy,∑

j∈Jqjzj ≤ 0; psxs ≤ pswts +

∑j∈J

ps,1Ns,jzj , ∀s ∈ S.

where wt := (wts; s ∈ S) ∈ RL×S+ is the initial endowment of commodities ofagent t ∈ [0, 1].

Since restrictions on consumption and financial trade are homogenous ofdegree zero in (p, q), we will assume, without loss of generality, that (p, q) ∈4S × Q, where 4 =

p ∈ RL+ : ‖p‖ = 1

, Q =

q ∈ RJ+ : ‖q‖ = 1

, where,

given x ∈ Rm, ‖x‖ ≡m∑i=1|xi|.

Let U(RL×S+ ) be the space of all real valued continuous utility functionsover RL×S+ with the sup norm topology.

5.5. EXISTENCIA DEL EQUILIBRIO WALRASIANO lxix

Definition. An equilibrium for the economy E is given by a vector of prices(p, q) ∈ 4S×Q, jointly with consumption and financial allocations

(xt, zt

)∈

RL×S+ for each agent t ∈ [0, 1], such that,

(1) For any agent t ∈ [0, 1],(xt, zt

)∈ argmax(x,z)∈Bt(p,q)U

t(x);

(2) Commodity and financial markets clear. That is,∫[0,1]

xtsdt =

∫[0,1]

wtsdt, ∀s ∈ S;

∫[0,1]

ztjdt = 0, ∀j ∈ J.

Now, a standard technique for proving the existence of competitive equi-librium with incomplete asset markets is to truncate the space of assets andcommodities (see Geanakoplos and Polemarchakis (1986)), prove existence ofequilibrium for this truncated economy and then, by relaxing these bounds,show that the sequence of equilibriums of the bounded economies convergeto an equilibrium of the orginal (unbounded) economy. In order to focus onthe application of the generalized continuum game theorem of the previoussection, we will show how to apply the theorem to a truncated economy. LetK ⊂ RS×L × RA.

For each individual t ∈ [0, 1], consider the truncated budget constraintBt(p, q;K) = Bt(p, q) ∩K.

A K-truncated competitive equilibrium for the economy E is given by avector of prices (p, q) ∈ 4S×Q, jointly with consumption and financial allo-cations

(xt, zt

)∈ RL×S+ for each agent t ∈ [0, 1], such that, agents maximize

on the truncated budget constraints and commodity and financial marketsclear.

The most important point of the next theorem is that, although utilityfunctions are not necessarily quasi-concave, we can prove the existence of anequilibrium using our main result about existence of pure strategy equilibriain non-convex continuous generalized games with atomic players. Our proveis in the same spirit of Debreu (1952) prove of the existence of competitiveequilibrium in the standard Arrow - Debreu model.

Consider an economy E and let K = [−k1, k1]S×L × [−k0, k0]J be acompact rectangle centered at the origin. Assume the following conditionshold:

For all t ∈ [0, 1], wt >> 0 and there is W ∈ R such that∥∥wt∥∥ ≤W .

For any agent t ∈ [0, 1], the utility function U t is continuous andstrictly increasing (i.e., U t ∈ U(RL×S+ )) and the map t → U t ismeasurable.Non negative payoffs N > 0 (Ns,j ≥ 0;Ns,j 6= 0).k0 > W and k1 > W + ‖N‖ k0.

lxx 5. APLICACIONES

Then, there exists a K-truncated equilibrium for the economy E .

Proof. We divide the proof in three steps.Step 1. Equilibrium existence in an abstract generalized game.

Consider a game GK(T, (Kt,Γt, ut)t∈T , h) where the set of players is T =[0, 1] ∪ S∗. For each player t ∈ [0, 1], the space of actions is Kt = K. Foratomic player s = 0, let K0 = Q and for s 6= 0, let Ks = 4. We denote by(xt, zt) the actions of a player t ∈ [0, 1], by q the actions of s = 0, and by psthe actions of player s, with s ∈ S.

Let h : K → K be the identity function thus, the space of messages is:

M =

∫[0,1]

(xt, zt)dt; (xt, zt) : [0, 1]→ K, is measurable

.

The correspondence of admissible strategies of a player t ∈ [0, 1], Γt :M ×4S ×Q K is defined by Γt(m, p, q) = Bt(p, q;K). For s = 0 defineΓs : M×4S K0 by Γs(m, p) = K0 and for s 6= 0 define Γs : M×4(S−1)×Q Ks by Γt(m, p−s, q) = Ks where p−s stands for the vector p with psdeleted.

To finish the description of our game we define utilities for atomic players.Define:

Us(m, p, q) = q ·∫

[0,1]ztjdt, if s = 0;

Us(m, p, q) = ps ·∫

[0,1](xts − wts)dt, if s ∈ S.

By definition, players’ action spaces are non-empty and compact. Assum-ption (a) on the statement of the Theorem 2 assure that for any t ∈ [0, 1]the correspondence of admissible strategies Γt is continuous with non-emptyand compact values. Since 4 and Q are non-empty, compact and convex, itfollows that, for any s ∈ S∗, the correspondence Γs is continuous and havenon-empty, convex and compact values. Objective functions are by hypot-hesis continuous and, for any s ∈ S∗, Us is linear in its own strategy and,therefore, quasi-concave on this strategy. Therefore, conditions (i) and (ii) ofTheorem 1 hold. Conditions (iii) and (iv) of Theorem 1 are trivially satisfied,because all players in [0, 1] have the same action space. Also, by assumption(b), the map t→ Ut is measurable. Thus, condition (v) of Theorem 1 holds.

We conclude that the game G(T, (Kt,Γt, ut)t∈T , h) has a pure strategyNash equilibria.

Step 2. Given K that satifies condition (iv), in any pure strategy Nash equi-libria of G(T, (Kt,Γt, ut)t∈T , h), each player t ∈ [0, 1] has binding budgetconstraints.

5.5. EXISTENCIA DEL EQUILIBRIO WALRASIANO lxxi

If for some player t ∈ [0, 1] the first period budget constraint is non-binding, then zt = (k0, ..., k0) ∈ RJ . In fact, in other case, player t mayincrease his consumption t = 1 (as a consequence of the non-triviality ofasset payments, i.e., condition (c) on the statement of the Theorem). Itfollows that, if some agent t has first-period budget constraint non-binding,then

W = W (‖q‖) <∑j∈J

qjk0 ≤ 0,

a contradiction.Analogously, if for some player t ∈ [0, 1] the budget constraint at some

state of nature s ∈ S is non-binding, then xt = (k1, ..., k1) ∈ RL×S . In othercase, player t may increase his consumption of some commodity improvinghis utility. Therefore, if some agent t has the budget constraint at s ∈ Snon-binding, then

k1 = ps ·xts < ps ·wts+∑j∈J

Ns,jztj ≤ max

l∈Lwts,l+

∑j∈J

Ns,jk0 ≤W+‖Ns‖ k0 < k1,

a contradiction.

Step 3. Given K that satifies condition (iv), any pure strategy Nash equili-bria of the game G(T, (Kt,Γt, ut)t∈T , h) is a K truncated equilibrium of theeconomy E.

Let((p, q); ((xt, zt); t ∈ [0, 1])

)be a pure strategy Nash equilibrium of

G(T, (Kt,Γt, ut)t∈T , h).As a consequence of the previous steps, it follows from inequality (2)

that,

q

∫[0,1]

ztdt ≤ 0, ∀q ∈ Q.(5.34)

Evaluating inequality above in the canonical vectors of RJ+ (which belongsto Q), we have that, ∫

[0,1]ztjdt ≤ 0, ∀j ∈ J.

Also for s ∈ S,

ps ·∫

[0,1](xts − wts)dt =

∑j∈J

Ns,j

∫[0,1]

ztjdt ≤ 0, ∀j ∈ J.

It follows from inequality that,

ps ·∫

[0,1](xθs − wθs)dt ≤ 0, ∀s ∈ S, ∀ps ∈ 4,

which implies that, for any (l, s) ∈ L× S,∫[0,1]

(xts,l − wts,l)dt ≤ 0.

lxxii 5. APLICACIONES

Since, for any t ∈ [0, 1], the utility function U t is strictly increasing,commodity and asset prices are strictly positive. In fact, if there exists acommodity l ∈ L such that ps,l = 0, for some s ∈ S∗, then each playert ∈ [0, 1] set xts,l = k1 and, therefore,

k1 =

∫[0,1]

xts,ldt ≤∫

[0,1]wts,ldt ≤W < k1,

a contradiction. Analogously, if qj = 0, for some j ∈ J, then each agentt ∈ [0, 1] choses ztj = k0 and, therefore, k0 =

∫[0,1] z

tjdt ≤ 0, a contradiction.

Since (p, q) 0 and individuals’ budget constraints are binding at eachstate of nature s ∈ S∗, it follows that,∫

[0,1](xts,l − wts,l)dt = 0, ∀(s, l) ∈ S∗ × L(5.35) ∫

[0,1]ztjdt = 0, ∀j(5.36)

From conditions (1), (5) and (6) we conclude that the pure strategyequilibrium of the generalized game G(T, (Kt,Γt, ut)t∈T , h) is K truncatedequilibrium for the economy E .