Teoría de Juegos
Modelos Rectangulares
Agosto 2016
Índice UNIDAD 3. MODELOS RECTANGULARES O ESTRATÉGICOS
3.1. Presentación del modelo y definición
3.2. Juegos simétricos y asimétricos
3.3. Equilibrio de Nash en estrategias puras
3.4. Estrategias conservadoras y máximo asegurable en
juegos de una sola tirada
3.5. Juegos exhaustivos o antagónicos en estrategias puras
3.6. Equilibrio de subjuego perfecto. Generalización del
algoritmo de Zermelo
2
3.1. Presentación del modelo y definición
Existen dos tipos de modelos para los juegos no
cooperativos, el de los llamados juegos rectangulares o
estratégicos y el de los juegos extensivos.
Los juegos rectangulares resultan más fáciles de definir
que los extensivos, pero hacer un modelo de este tipo
sobre un conflicto real es más difícil
3
Definición 3.1.
Un juego rectangular consta de un conjunto N, de una colección de conjuntos Dj, uno para cada j en N, y de una colección de funciones fj una para cada j en N, donde fj : piDj – R
A N le llamaremos el conjunto de jugadores, a cada Dj, el conjunto de estrategias puras del jugador j. (N,{Dj}jN,{j}
jN) denotará el juego que tiene el conjunto de jugadores N, los conjuntos de estrategias puras Dj y las funciones de pago j. Usaremos la letra D para denotar al producto cartesiano
DjjN(𝑖𝑔𝑢𝑎𝑙 𝑎 D1xD2x…xDN si N es finito y tiene n
elementos)a los elementos de D les llamaremos perfiles de estrategias puras
4
Definición 3.2.
Si N y los conjuntos Dj son finitos, se dice que el juego es
finito.
“cada jugador solo puede tener un número finito de
estrategias”
5
Juegos en Forma Normal
Esta manera de describir un juego se basa sólo en
estrategias: codifica toda la información de la forma
extensiva en una matriz de pagos.
6
Representación de Juegos de dos
jugadores en forma normal
Se hace un listado con las estrategias posibles de cada
jugador.
Se colocan las estrategias en una matriz.
Las filas de la matriz corresponden a las estrategias del
jugador 1, las columnas a las estrategias del jugador 2.
Las ganancias de las ramas terminales se colocan en las
casillas correspondientes de la matriz.
7
Representación de Juegos de dos
jugadores en forma normal
8
Función de coalición
La función de coalición es una tercer forma de
representar un juego, especialmente útil en juegos de
caracter cooperativo.
Bajo esta forma, solamente se necesita responder las
siguientes dos cuestiones:
¿Cuánto es lo mínimo que puede conseguir cada
jugador actuando en forma unilateral?
¿Cuánto es lo mínimo que pueden obtener los dos
jugadores cooperando?
9
Función de coalición (2)
La forma Función de Coalición se usa principalmente para
estudiar cómo se reparten las ganancias de la
cooperación entre los participantes en un acuerdo.
10
Juegos simétricos y asimétricos
Juegos simétricos
Un juego simétrico es un juego en el que las recompensas
por jugar una estrategia en particular dependen sólo de
las estrategias que empleen los otros jugadores y no de
quién las juegue.
Si las identidades de los jugadores pueden cambiarse sin
que cambien las recompensas de las estrategias, entonces
el juego es simétrico.
11
Juegos simétricos (2)
Muchos de los juegos 2×2 más estudiados son simétricos.
Las representaciones estándar del juego de la gallina, el
dilema del prisionero y la caza del ciervo son juegos
simétricos.
E F
E -9, -9 0, -10
F -10, 0 -1, -1
12
Juegos asimétricos
Los juegos asimétricos más estudiados son los juegos
donde no hay conjuntos de estrategias idénticas para
ambos jugadores.
Por ejemplo, el juego del ultimátum y el juego del
dictador tienen diferentes estrategias para cada jugador;
no obstante, puede haber juegos asimétricos con
estrategias idénticas para cada jugador.
13
Juegos asimétricos (2)
Por ejemplo, el juego mostrado es asimétrico a pesar de
tener conjuntos de estrategias idénticos para ambos
jugadores.
E F
E 1, 2 0, 0
F 0, 0 1, 2
14
Para N=2
Sea un juego finito donde N={A,B}
Sea
un juego m x n de dos jugadores A (ej. nosotros) y B (por ej,
adversario)
con estrategias Ai y Bj donde i: {1, 2, 3, …,n} y j: {1, 2, 3, …,m}
15
Ganancias y Valor Medio
16
Sí, el juego se compone solo de jugadas personales, la elección
de la estrategia Ai, Bj determina de una sola manera el término
del juego, nuestra victoria – se designará por las ganancias
medias aij
Si el juego contiene jugadas de azar, además de las personales,
entonces las ganancias que producen las dos estrategias Ai, Bj
es una magnitud aleatoria que depende de los términos de
todas las jugadas de azar. En este caso el valor natural de la
ganancia esperada es su valor medio (esperanza matemática)
Se emplea entonces:
1. aij para las ganancias medias (en los juegos sin jugadas de azar)
2. El valor medio (en los juegos con jugadas de azar)
Matriz del Juego
17
Supongamos que conocemos el valor aij de la ganancia (o
ganancia media) en cada par de estrategias
Entonces se pueden expresar los valores aij en forma de una
tabla (matriz) en las que la líneas corresponden a nuestras
estrategias (Ai) y las columnas, a las estrategias del adversario
(Bj)
Esta tabla se denomina matriz de pago o simplemente
matriz del juego (juego en su forma normal)
Matriz del Juego
18
La matriz del juego m x n tiene la forma siguiente:
Esta matriz se abrevia por la notación 𝑎𝑖𝑗
Bj B1 B2 . . . Bn
Ai
A1 a11 a12 . . . a1n
A2 a21 a21 . . . a2n
. . . . . . .
. . . . . . .
. . . . . . .
Am am1 am2 . . . amn
Valor de un juego
El valor de un juego se encuentra a través de las ganancias
medias identificando el conjunto de estrategias
dominantes.
En el caso de estrategias puras la estrategia dominante
será solo una estrategia con (P=1).
El valor del juego va a coincidir con el conjunto de
equilibrios del juego.
El equilibrio va a estar asociado al valor inferior y
superior de un juego.
19
Valor inferior de un juego
𝛼 = max𝑖min𝑗𝛼𝑖𝑗
20
Bj B1 B2 . . . Bn 𝛼𝑖
Ai
A1 a11 a12 . . . a1n 𝛼1
A2 a21 a21 . . . a2n 𝛼2
. . . . . . . ...
. . . . . . . ...
. . . . . . . ...
Am am1 am2 . . . amn 𝛼𝑚
Valor superior de un juego
𝛽 = mix𝑗max𝑖𝛼𝑖𝑗
21
Bj B1 B2 . . . Bn 𝛼𝑖
Ai
A1 a11 a12 . . . a1n 𝛼1
A2 a21 a21 . . . a2n 𝛼2
. . . . . . . .
. . . . . . . .
. . . . . . . .
Am Am1 am2 . . . amn 𝛼𝑚
𝛽𝑗 𝛽1 𝛽2 . . . 𝛽𝑚
Valor puro de un juego
Cuando el valor inferior de un juego es igual al valor
superior entonces encontramos el valor puro de un juego
= = v
Esto quiere decir que las estrategias min-max son
estables
Este equilibrio es un punto de silla
22
Punto de silla
23
Dilema del prisionero
Con c > a > d > b
24
Bj C2
D2
Ai
C1
a, a b, c
D2
c, b d, d
Ejemplos
25
Ejemplo 1.
Dos jugadores, A y B, sin mirarse el uno al otro colocan
en la mesa una moneda cada uno en posición de sol
arriba o de aguila arriba, según su propio parecer. Si
eligieron la misma posición (los dos pusieron cara o los
dos pusieron cruz) entonces el jugador A se queda con
las dos monedas, en caso contrario el jugador B se queda
con ellas.
Se debe analizar el juego, componer su matriz y encontrar
su valor puro.
Ejemplos
26
Resolución
El juego consta sólo de dos jugadas: la nuestra y la del adversario. Las dos son personales. Este juego no pertenece a los juegos con información perfecta puesto que en el momento en el cual se hace la jugada el jugador no sabe lo que ha hecho el otro.
Como cada jugador tiene sólo una jugada personal, su estrategia es la elección en esta única jugada personal.
«Nosotros» tenemos dos estrategias:
1. A1 que es elegir el sol
2. A2 elegir águila
El adversario tiene también las mismas dos estrategias
1. B1 que es elegir el sol
2. B2 elegir águila
Ejemplos
27
Resolución
Entonces tenemos un juego de 2x2
Consideremos que la ganancia de una moneda se expresa con
+1. La matriz del juego se representa como sigue
Bj B1
(sol)
B2
(águila) Ai
A1
(sol) 1 -1
A2
(águila) -1 1
Ejemplos
28
Este juego a pesar de ser elemental, puede aclarar ideas
escenciales en teoría de juegos:
1. Si suponemos que este juego se hace una vez, se puede
apreciar que no tiene sentido hablar de tales o cuales
«estrategias» de unos jugadores más razonables que
otros.
2. Elegir siempre una jugada, por ejemplo A1 supone que el
adversario podrá adivinar que jugada vamos a utilizar y
esto representará pérdidas. Esto deriva en utilizar de
manera alternada las estrategias.
Dilema del prisionero
29
Bj NC2
C2
Ai
NC1
-1, -1 -4, 0
C1
0, -4 -3, -3
30
El juego de la gallina
31
La batalla de los sexos
B:ballet, F:futbol
32
Piedra, papel y tijeras
Mejor respuesta
33
Si sabes lo que los demás van a hacer, sería fácil escoger
tu propia acción
Sea 𝑎−𝑖 = 𝑎1, … , 𝑎𝑖−1, 𝑎𝑖+1, … , 𝑎𝑛
Entonces 𝑎 = (𝑎−𝑖 , 𝑎𝑖)
Definición (Mejor Respuesta)
𝑎∗𝑖 ∈ 𝑀𝑅 𝑎∗𝑖 𝑠𝑠𝑠 ∈ 𝐴𝑖 , 𝑢𝑖(𝑎
∗𝑖 , 𝑎−𝑖) ≥ 𝑢𝑖(𝑎𝑖 , 𝑎−𝑖)
3.2. Equilibrio de Nash en estrategias
puras
Realmente los agentes no conocen lo que van a hacer los
otros.
Definición (Equilibrio de Nash)
𝑎 = 𝑎1, … , 𝑎𝑛 es un Equilibrio de Nash (en estrategias
puras) si y solo si ∀𝑖 , 𝑎𝑖 ∈ 𝑀𝑅(𝑎−𝑖)
34
Dominancia
35
Sean 𝑆𝑖 y 𝑆𝑖′ dos estrategias para el jugador i, y sea 𝑆−𝑖el
conjunto de todas las posibles estrategias de los otros
jugadores.
¿Qué es una estrategia?
Por ahora, solo elijamos una accion (estrategia pura)
Equilibrio y dominancia
36
Si una de las estrategias domina a todas las otras,
entonces decimos que es dominante.
Un perfil de estrategia que consiste en estrategias
dominantes para cada jugador debe ser un equilibrio de
Nash. Un equilibrio en estrategias dominantes
estrictamente debe ser único.
Optimalidad de Pareto
37
38
Top Related