89
Teoría de los Juegos – Equilibrio de Nash // @JackFlash Conceptos Solución: El Equilibrio de Nash J.C.Segura Ms.Sc. Universidad de La Salle Facultad de Ciencias Económicas y Sociales Escuela Colombiana de Ingeniería Facultad de Economía [email protected] / [email protected] / [email protected] URL: http://microeconomica.googlepages.com / twitter: @JackFlash Bogotá, D.C., Abril de 2013

Segura 2013 -- equilibrio de nash - 28 abril 2013

Embed Size (px)

DESCRIPTION

Conceptos Solución: El Equilibrio de Nash

Citation preview

Page 1: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Conceptos Solución: El Equilibrio de Nash

J.C.Segura Ms.Sc.

Universidad de La Salle Facultad de Ciencias Económicas y Sociales

Escuela Colombiana de Ingeniería

Facultad de Economía

[email protected] / [email protected] / [email protected] URL: http://microeconomica.googlepages.com / twitter: @JackFlash

Bogotá, D.C., Abril de 2013

Page 2: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Page 3: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Presentación La Noción de Equilibrio de Nash es la pieza central, el criterio de solución nuclear en la Teoría Clásica de los Juegos. Su relevancia tiene que ver con la potencia de este criterio en el momento de encontrar soluciones a juegos, conflictos en los que los individuos involucrados actúan estratégicamente, una potencia que muchas veces se echa de menos cuando se aplican otros criterios esenciales como aquél asociado a los nombres de Von Neumann y Morgenstern (MinMax) o aquel otro de la eliminación iterada de estrategias estrictamente dominadas. La mayoría de los juegos pueden no ser resueltos mediante el principio de dominancia estricta iterada. En la otra mano, el concepto solución de Nash supone una posibilidad para una gran variedad de juegos [ Fundenberg & Tirole (1991): 11) ] En efecto, el reconocer que en un equilibrio de un juego no cooperativo de N personas en el cual no es necesario limitarse al principio de common knowledge1 y ningún jugador tiene nada que ganar al cambiar su estrategia en forma unilateral, i.e., si un jugador ha elegido una estrategia y ningún jugador puede beneficiarse del cambio de estrategia, mientras los demás permanecen en sus estrategias elegidas, el concepto de solución así definido termina capturando soluciones que los otros criterios suelen normalmente omitir.

1 “El conocimiento común de los pagos de un juego no es condición ni necesaria ni suficiente para justificar un Equilibrio de Nash. En particular, en algunas justificaciones es suficiente que los jugadores simplemente conozcan su propios pagos” [ Fundenberg and Tirole (1992): 5 ]

Page 4: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Definición. Estrategias Mixtas [ Fundenberg & Tirole (1992): 5 ]

Una estrategia mixta, notada con 𝜎𝑖 es una distribución de probabilidades sobre las estrategias puras de un jugador. La aleatorización de cada jugador es independiente de la de sus oponentes y el pago correspondiente a un perfil de estrategias mixtas es el valor esperado de los pagos correspondientes a cada estrategia pura.

El espacio de estrategias mixtas del i-ésimo jugador se representa mediante Σ𝑖 y 𝜎𝑖(𝑠𝑖) es la probabilidad

𝜎𝑖 que se le asigna a 𝑠𝑖 . El espacio de perfiles de estrategias mixtas se nota con Σ = ∏ Σ𝑖𝑖 . El pago

correspondiente al perfil 𝜎 del jugador 𝑖 está dado por:

𝑢𝑖(𝜎) ≡∑(∏𝜎𝑗(𝑠𝑗)

𝐼

𝑗=1

)𝑢𝑖(𝑠)

𝑠∈𝑆

Page 5: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Definición. Utilidad Esperada [ Manrique et. al. (1999:180) ] La utilidad esperada de un jugador es el pago que podría recibir como resultado de las distintas loterías que sobre estrategias puras pueda enfrentar un jugador, i.e. cuando se introduce aleatoriedad en el comportamiento del individuo. Con base en la definición anterior ( Estrategia Mixta ), dada por ejemplo

𝜎 = (𝜎1, 𝜎2, … , 𝜎𝑁) ∈ ∏ Δ𝑖𝑁𝑖=1

𝑢𝑖(𝜎) ≡∑(∏𝜎𝑗(𝑠𝑗)

𝐼

𝑗=1

)𝑢𝑖(𝑠)

𝑠∈𝑆

Page 6: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo [ Manrique et. al. Tirole (1999:180) ] Considere el siguiente Juego:

Jugador 2 x2 y2

Jugador 1 x1 3, 2 5, 1

y2 4, 1 2, 3

Suponga que no hay certeza para ningún jugador acerca de lo que su contraparte hará. En este caso cada

jugador aleatoriza sus decisiones asignando probabilidades de acuerdo con sus estimaciones. Si p𝑇 =(𝑝1, 𝑝2) y q𝑇 = (𝑞1, 𝑞2) son estrategias mixtas para los jugadores 1 y 2, respectivamente, entonces, las utilidades esperadas por jugador son como sigue:

Jugador 1: 𝑢1(𝜎) = 𝑝1(3𝑞1 + 5𝑞2) + 𝑝2(4𝑞1 + 2𝑞2)

Jugador 2: 𝑢2(𝜎) = 𝑞1(2𝑝1 + 𝑝2) + 𝑞2(𝑝1 + 3𝑝2)

Page 7: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo [ Fundenberg and Tirole (1992:5) ]: Considere el siguiente juego:

Columna L M R

Fila

U 4, 3 5, 1 6, 2

M 2, 1 8, 4 3, 6

D 3, 0 9, 6 2, 8

Suponga que una estrategia mixta para el jugador 1 es un vector (𝜎1(𝑈), 𝜎1(𝑀), 𝜎1(𝐷)) con

probabilidades todas mayores que cero y tales que 𝜎1(𝑈) + 𝜎1(𝑀) + 𝜎1(𝐷) = 1. Por otra parte, una

estrategia mixta para el jugador 2 es un vector (𝜎2(𝐿), 𝜎2(𝑀), 𝜎2(𝑅)) con probabilidades todas mayores

que cero y tales que 𝜎2(𝐿) + 𝜎2(𝑀) + 𝜎2(𝑅) = 1. Entonces los pagos para los perfiles 𝜎1 = (1

3, 13, 13) y

𝜎2 = (0,1

2, 12) son:

𝑢1(𝜎1) =1

3(0 ∙ 4 +

1

2∙ 5 +

1

2∙ 6) +

1

3(0 ∙ 2 +

1

2∙ 8 +

1

2∙ 3) +

1

3(0 ∙ 3 +

1

2∙ 9 +

1

2∙ 2) =

11

2

𝑢2(𝜎2) = 0 (1

3∙ 3 +

1

3∙ 1 +

1

3∙ 0) +

1

2(1

3∙ 1 +

1

3∙ 4 +

1

3∙ 6) +

1

2(1

3∙ 2 +

1

3∙ 6 +

1

3∙ 8) =

27

6

Page 8: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: La Batalla de los Sexos [ (sic) Varian (1993:313) ] Felisa Fila y Carlos Columna no saben si estudiar microeconomía o macroeconomía este semestre. Felisa obtiene la utilidad 2 y Carlos la utilidad 1 si ambos estudian micro; las ganancias son inversas si ambos estudian macro. Si asisten a cursos diferentes, ambos obtienen utilidad 0. El juego, puesto en forma estratégica adquiere la siguiente forma:

Carlos Micro Macro

Felisa Micro 2, 1 0, 0

Macro 0, 0 1, 2

Si Carlos cree que Felisa elegirá estudiar micro, obtendrá 1 eligiendo Micro y 0 escogiendo Macro: Micro es la mejor respuesta de Carlos a la elección de Felisa cuando ella elige Micro. Al mismo tiempo, si Carlos elige Micro, lo óptimo para Felisa es elegir también Micro.

Page 9: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

El problema es susceptible de ponerse y resolverse como un problema de optimización. Sean (𝑝𝑎, 𝑝𝑏) las probabilidades de que Felisa elija “Micro” y “Macro” respectivamente y sean (𝑝𝑖 , 𝑝𝑑) las probabilidades de que Carlos elija “Micro” y “Macro” respectivamente. El problema de Felisa es:

max(𝑝𝑎,𝑝𝑏)

𝑝𝑎[𝑝𝑖2 + 𝑝𝑑0] +𝑝𝑏[𝑝𝑖0 + 𝑝𝑑1] 𝑠. 𝑎. {

𝑝𝑎 + 𝑝𝑏 = 1𝑝𝑎 ≥ 0𝑝𝑏 ≥ 0

La función de Lagrange es:

Φ(𝑝𝑎, 𝑝𝑏; 𝜆, 𝜇𝑎, 𝜇𝑏) = 2𝑝𝑎𝑝𝑖 + 𝑝𝑏𝑝𝑑 − 𝜆(𝑝𝑎 + 𝑝𝑏 − 1) − 𝜇𝑎𝑝𝑎 − 𝜇𝑏𝑝𝑏

Las condiciones de Kuhn-Tucker son:

[𝑝𝑎]: 2𝑝𝑖 − 𝜆 − 𝜇𝑎 = 0[𝑝𝑏]: 𝑝𝑑 − 𝜆 − 𝜇𝑏 = 0

Supondremos 𝑝𝑎 > 0, 𝑝𝑏 > 0 luego 𝜇𝑎 = 𝜇𝑏 = 0 por tanto igualando las CPO:

2𝑝𝑖 = 𝑝𝑑

Page 10: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Y dado 𝑝𝑖 + 𝑝𝑑 = 1

𝑝𝑖 + 2𝑝𝑖 = 1 ∴ (𝑝𝑖∗, 𝑝𝑑

∗) = (1

3,2

3)∎

En el caso de Felisa se obtiene (𝑝𝑎∗ , 𝑝𝑏

∗) = (23, 13). Reemplazando estos valores en su función objetivo:

2𝑝𝑎∗𝑝𝑖∗ + 𝑝𝑏

∗𝑝𝑑∗ = 2 × (

2

3×1

3) + (

1

3×2

3) =

2

3

Que representa la ganancia esperada tanto para Carlos como para Felisa: “Obsérvese que cada uno de ellos preferiría los equilibrios de la estrategia pura a la estrategia mixta, ya que las ganancias son mayores para los dos jugadores” [ Varian (1993): 315 ].

Page 11: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Definición. Dominancia Estricta en Estrategias Mixtas Considere el juego finito en forma normal Γ = [𝑁, (𝐶𝑖)𝑖=1

𝑁 , (𝑢𝑖)𝑖=1𝑁 ]. Se dice que una estrategia mixta

𝜎𝑖 ∈ ∆𝑖 es estrictamente dominante si y solo si existe otra estrategia mixta 𝜎𝑖′ ∈ ∆𝑖 tal que:

𝑢𝑖(𝜎𝑖 , 𝜎−𝑖) > 𝑢𝑖(𝜎𝑖

′, 𝜎−𝑖) para toda 𝜎−𝑖 ∈ ∆−𝑖

En este caso, la estrategia 𝜎𝑖′ ∈ ∆𝑖 es una estrategia estrictamente dominada.

* * *

Page 12: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Proposición 1

Una estrategia mixta de un jugador que asigna una probabilidad no negativa a una estrategia pura estrictamente dominada, también es estrictamente dominada. En otros términos: si una estrategia pura es eliminada por ser estrictamente dominada, esta no puede hacer parte de ninguna estrategia mixta estrictamente dominante.

Demostración [Según Manrique et. al. (1999: 183)]: Sean 𝑁 = {1,2}, 𝐶1 = {𝐴, 𝐵}, 𝐶2 = {𝐶,𝐷}. Suponga

que 𝐴 ≻1 𝐵. Sean además las estrategias mixtas 𝜎1 = (𝑝, 1 − 𝑝) siendo 𝑝 la probabilidad asociada a la

estrategia 𝐵, y 𝜎2 = (𝑞, 1 − 𝑞), donde 𝑞 es la probabilidad asociada a la estrategia 𝐷. En este caso:

𝑢1(𝜎1, 𝜎2) = 𝑝𝐸(𝐵) + (1 − 𝑝)𝐸(𝐴) donde: {𝐸(𝐵) = 𝑞 ∙ 𝑢1(𝐵, 𝐷) + (1 − 𝑞) ∙ 𝑢1(𝐵, 𝐶)

𝐸(𝐴) = 𝑞 ∙ 𝑢1(𝐴, 𝐷) + (1 − 𝑞) ∙ 𝑢1(𝐴, 𝐶)

Puesto que 𝑢1(𝐴, ∗) > 𝑢1(𝐵, ∗) → 𝐸(𝐴) > 𝐸(𝐵). Entonces:

𝑢1(𝜎1, 𝜎2) = 𝑝𝐸(𝐵) + (1 − 𝑝)𝐸(𝐴) < 𝑝𝐸(𝐴) + (1 − 𝑝)𝐸(𝐴)

∴ 𝑢1(𝜎1, 𝜎2) = 𝑝𝐸(𝐵) + (1 − 𝑝)𝐸(𝐴) < 𝐸(𝐴) = [0 ∙ 𝐸(𝐵) + 1 ∙ 𝐸(𝐴)] = 𝑢1(𝜎1′, 𝜎2)

Siendo 𝜎1′ = (0,1) ≻1 (𝑝, 1 − 𝑝) = 𝜎1. En este caso 𝜎1

′ es estrategia (mixta) fuertemente dominante∎

Page 13: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

El Equilibrio de Nash El concepto solución del Equilibrio de Nash se basa en el postulado según el cual “la combinación de estrategias que los jugadores predeciblemente escogerán es aquella en la cual ningún jugador podría mejorar su pago escogiendo unilateralmante una estrategia diferente, si supone que los otros continuarán jugando la estrategia previamente escogida” [Manrique, Villa, Junca, Monsalve (1999:184)]. En consecuencia un equilibrio de Nash constituye un perfil de estrategias tal que cada una de las estrategias de los jugadores involucrados es una respuesta óptima a las estrategia de los otros jugadores. [ Fundenberg & Tirole (1991): 11 ]

Equilibrio de Nash en Estrategias Puras2 (Manrique et.al. (1999): 184)

En un juego en forma estrategia Γ = [𝑁, (𝐶𝑖)𝑖=1𝑁 , (𝑢𝑖)𝑖=1

𝑁 ] se dice que un Equilibrio de Nash en

estrategias puras para el juego finito Γ es una estrategia 𝑐∗ = (𝑐𝑖∗)𝑖=1𝑁 siempre que

𝑢𝑖(𝑐1∗, … , 𝒄𝒊

∗, … , 𝑐𝑁∗ ) ≥ 𝑢𝑖(𝑐1

∗, … , 𝒄𝒊, … , 𝑐𝑁∗ ) toda 𝑐𝑖 , todo 𝑖 = 1,… , 𝑁

2 Cfr. Manrique et al (1999:184), Fundenberg and Tirole (1991:11), Monsalve y Arévalo (2005:55) y Barron (2008:111) entre otros.

Page 14: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo [Manrique et. al. (1999:185)] En el juego a continuación hay un único Equilibrio de Nash en estrategias puras constituido por el par (m,t) con pagos 𝑢𝑖 = (5,5) en el cual ningún jugador tiene incentivos para desviarse de dicha estrategia:

II t s

I k 3, 1 1, 3

m 5, 5 4, 2

i. En efecto, si II piensa que el I jugará m su mejor respuesta es jugar t. Si II juega t, no tiene incentivo para desviarse a la estrategia s, caso en el cual recibiría un pago menor e igual a $4.

ii. Si, el Jugador I piensa que el Jugador II ha de jugar t su mejor respuesta es jugar m que implica un pago de $5 respecto de la alternativa (k), que le reportaría un pago de $3: en este caso, el Jugador I no ve atractivo elegir otra estrategia, dadas los menores retornos asociados.

iii. Considere sin embargo el par (s, m) que supone los pagos (4,2). Si el Jugador I piensa que II jugará s estará bien quedarse en m; sin embargo si el Jugador II piensa que I jugará m, entonces su mejor respuesta sería moverse a t, caso en el cual recibiría $3 más. No es un Equilibrio de Nash

iv. Considere además el par (k, t) que reporta pagos (3,2). Empezando con II, note que si supone que I jugará k, entonces tendrá incentivo para moverse a s (+$2). En la otra mano, si I supone que II jugará t lo mejor para él sería moverse a m (+$2). Tampoco es un Equilibrio de Nash.

Page 15: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo [Manrique et. al. (1999: 185)]:

En el juego a continuación hay dos (2) Equilibrios de Nash en estrategias puras: (𝐴, 𝐶) y (𝐵, 𝐷)

II C D

I A 10, 10 0, 0

B 0, 0 1, 1

Observaciones:

Note que si bien 𝑂1 = (𝐴, 𝐶) y 𝑂2 = (𝐵,𝐷) son Equilibrios de Nash estos observan una relación

de dominancia específica: 𝑂1 ≻𝑖 𝑂2 , es decir, 𝑂1 es Pareto Superior a 𝑂2 ∀𝑖 = {𝐼, 𝐼𝐼} y cabría esperarse (en el mundo real) alguna suerte de cooperación entre los dos jugadores, para alcanzar dicho resultado.

Se dice entonces que 𝑂1 = (𝐴, 𝐶) es un “Equilibrio Focal” pues resulta naturalmente preferido a los demás equilibrios.

Note además que la Focalidad del Equilibrio no supone que un equilibrio que pueda caracterizarse así, sea efectivamente la solución del juego. [e.g. TexPLORE vs. Clampett ]

Page 16: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo Peatón y Conductor [Manrique et. al. (1999: 177)]

Conductor sc ac Cc

Peatón

sc 50, -3 -99, -2 -100, -3

ac -2, -99 -51, -51 -101, -3

c -50, -100 -3, -101 -3, -3

El Peatón no presenta estrategias estricta (o aún débilmente) dominantes. Para el Conductor “cc” domina [ débilmente ] “sc”. Su eliminación deja al juego de la siguiente forma:

ac cc

sc -99, -2 -100, -3

ac -51, -51 -101, -3

cc -3, -101 -3, -3

En la siguiente ronda, la estrategia “cc” del peatón domina estrictamente a las demás. Eliminando las estrategias restantes, el único resultado viable es (cc,cc), que es un equilibrio de Nash (por qué?)

ac cc

c -3, -101 -3, -3

Page 17: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: Caza del Ciervo [ Pérez, Jimeno, Cerdá (2004: 66, 93) ]

Dos cazadores acuerdan salir a buscar presa. Cada individuo enfrenta la disyuntiva de permanecer en el

puesto de observación asignado (convenido) con el objetivo de cazar un ciervo (𝑉), o bien intentar cazar

el ciervo pero estar atento a las liebres que ocasionalmente salen (𝑊). Los dos cazadores serán capaces de cazar un ciervo si permanecen en el puesto asignado, ignorando las liebres. Si uno de los cazadores no coopera en el objetivo de cazar el ciervo, no podrá por sí mismo cazarlo. Los dos cazadores prefieren el ciervo a las liebres y las liebres a nada. La matriz de pagos es:

Cazador II Cooperar Buscar Liebre

Cazador I Cooperar V, V 0, 2W

Buscar Liebre 2W, 0 W, W

Siendo V >2W, W>0. Hay dos equilibrios de Nash en estrategias puras, (𝑉, 𝑉) y (𝑊,𝑊) [ Discuta ]

Page 18: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: El Juego de la Gallina Dos jóvenes de los años de 1950 arrancan sus carros, acelerando cada uno en dirección del otro. Las

alternativas que cada conductor tiene son “Continuar” (𝐶) o “Quitarse” (𝑄). Si los dos continúan, reciben un pago negativo dado el choque que se suscita en este caso. Si uno de ellos elige quitarse del camino mientras el otro continúa, es un “gallina” y recibe un pago de cero en tanto que el otro recibe un pago

positivo. Si los dos se retiran, los dos son considerados gallinas. 𝑁 = {1,2}, 𝑆𝑖 = {𝐶, 𝑄} ∀𝑖

II C Q

I C -1, -1 1, 0

Q 0, 1 0, 0

Hay dos equilibrios de Nash en estrategias puras, (𝐶, 𝑄) y (𝑄, 𝐶).

Page 19: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: Una Matriz no Cuadrada de Pagos Considere la siguiente matriz de pagos:

No hay estrategias estrictamente dominadas para ningún jugador y hay dos (2) equilibrios de Nash: (𝑆,𝐻)

y (𝐷, 𝐹).

H F

S 5,2 1,1

D 1,1 5,2

W 2,3 2,3

Page 20: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Correspondencia de Respuesta Óptima (Correspondencias de Reacción) [ Ver Pérez, Jimeno & Cerdá, (JCP) (2004: 95~) ]

Es siempre útil definir en forma sistemática el conjunto de acciones disponibles para un jugador que le garantizan el mejor pago posible, dada la acción conjunta de los demás individuos en el juego (Monsalve, Arévalo, 2006: 72), i.e., calcular las estrategias óptimas que el jugador podría elegir como respuesta a cualquier combinación de estrategias por parte de los otros jugadores. En el caso del i-ésimo jugador se busca un conjunto de estrategias que supongan la mejor respuesta del jugador i a las estrategias de los –i restantes individuos. A esta relación se le denomina Correspondencia de

Respuesta Óptima (Correspondencia de Reacción) y se nota 𝑅𝑖(𝑠𝑖)

Page 21: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Correspondencia de Respuesta Óptima Definición [Correspondencia de Respuesta Óptima ]: Considere el juego finito en forma normal

Γ = [𝑁, (𝑠𝑖)𝑖=1𝑁 , (𝑢𝑖)𝑖=1

𝑁 ]

Entonces, para cada uno de los 𝑖 = 1,2, … , 𝑁 jugadores, se llama Correspondencia de Respuesta Óptima o Correspondencia de Mejor Respuesta o Correspondencia de Reacción a la regla que a cada combinación de estrategias

𝑠−𝑖 = (𝑠1, 𝑠2, … , 𝑠𝑖−1, 𝑠𝑖+1, … , 𝑠𝑁)

asigna el conjunto 𝑅𝑖(𝑠−𝑖), siempre que y si y sólo si resulta que:

𝑢𝑖(𝑠1, 𝑠2, … , 𝑠𝑖−1, 𝑠𝑖′, 𝑠𝑖+1, … , 𝑠𝑁) ≥ 𝑢𝑖(𝑠1, 𝑠2, … , 𝑠𝑖−1, 𝑠𝑖 , 𝑠𝑖+1, … , 𝑠𝑁)

∀𝑠𝑖 ∈ 𝑆𝑖

Page 22: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Correspondencia de Respuesta Óptima Teorema [Correspondencia de Respuesta Óptima y Equilibrio de Nash]: Considere el juego finito en forma

estratégica:

Γ = [𝑁, (𝑠𝑖)𝑖=1𝑁 , (𝑢𝑖)𝑖=1

𝑁 ] Entonces el perfil de estrategias:

𝑠∗ = (𝑠1∗, 𝑠2

∗, … , 𝑠𝑖−1∗ , 𝑠𝑖

∗, 𝑠𝑖+1∗ , … , 𝑠𝑖

∗) Es un equilibrio de Nash si y sólo si:

𝑠𝑖∗ ∈ 𝑅𝑖(𝑠−𝑖

∗ )

Prueba: Ver Fundenberg and Tirole, 1992.—

Page 23: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: Juego de la Mayor Diferencia

Sea 𝑁 ≔ 2. El juego consiste en que los dos jugadores escriben al mismo tiempo un número 𝑥𝑖 ∈ [0,1] y los pagos están constituidos por la diferencia entre cada uno de los números escritos de acuerdo con la siguiente regla:

𝑢1(𝑠1, 𝑠2) = 𝑢2(𝑠1, 𝑠2) = (𝑠1 − 𝑠2)2

Si 𝑠2 =3

4 entonces la respuesta óptima de 𝑠1 = 0

Si 𝑠1 =1

4 entonces la respuesta óptima de 𝑠2 = 1, etc.

Las correspondencias de respuesta óptimas de cada jugador, 𝑅𝑖(𝑠−𝑖) en este caso son:

Jugador 1 Jugador 2

𝑅1(𝑠2) =

{

0 ⟷ 𝑠2 >

1

2

1 ⟷ 𝑠2 <1

2

0 ó 1 ⟷ 𝑠2 =1

2

𝑅2(𝑠1) =

{

0 ⟷ 𝑠1 >

1

2

1 ⟷ 𝑠1 <1

2

0 ó 1 ⟷ 𝑠1 =1

2

Page 24: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Page 25: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: Juego del Reparto (Nash Calls) El juego consiste en repartirse un valor. El reparto se hace con las siguientes reglas. Cada jugador escribe un número entre 0 y 1 que representa la fracción del activo que desean que se les entregue. Si la suma de los dos números es menor o igual que 1, a cada jugador se le entrega lo que pidió. Si la suma de los dos números es mayor que 1, ninguno de los jugadores recibe nada. En forma normal, el juego adquiere la siguiente forma.

𝑖 = {1,2}, 𝑠𝑖 = [0, 1] ∀𝑖 = 1,2 Pagos (Juego Infinito)

Jugador 1 Jugador 2

𝑢1(𝑠1, 𝑠2) {𝑠1 ⟷ (𝑠1 + 𝑠2) ≤ 10 ⟷ 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

𝑢2(𝑠1, 𝑠2) {𝑠2 ⟷ (𝑠1 + 𝑠2) ≤ 10 ⟷ 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Si, por ejemplo, el Jugador 2 juega 𝑠2 =1

2 la respuesta óptima de 1 es 𝑠1

∗ = 1

2= 1 − 𝑠2

Si, por ejemplo, el Jugador 1 juega 𝑠1 =4

5 la respuesta óptima de 2 es 𝑠1

∗ = 1

5= 1 − 𝑠1

Page 26: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Por lo tanto, las correspondencias de respuesta óptima para cada uno de los jugadores son:

Jugador 1 Jugador 2

𝑅1(𝑠2) = {1 − 𝑠2 ⟷ 𝑠2 < 1

[0, 1] ⟷ 𝑠2 = 1 𝑅2(𝑠1) = {

1 − 𝑠1 ⟷ 𝑠1 < 1

[0, 1] ⟷ 𝑠1 = 1

Page 27: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: Juego Simple de Cournot [Pérez, Jimeno & Cerdá, (2004:98) ]

Dos jugadores escriben al mismo tiempo un número 𝑞𝑖 ∈ [0,1]. Los pagos correspondientes a cada uno de los jugadores son los siguientes:

𝜋𝑖 = {𝜋1 = 𝑞1(1 − 𝑞1 − 𝑞2)

𝜋2 = 𝑞2(1 − 𝑞1 − 𝑞2)

Para el Jugador 1, la correspondencia de respuesta óptima se obtiene resolviendo para todo 𝑞2 ∈ [0,1]:

max𝑞1𝜋1 = 𝑞1(1 − 𝑞1 − 𝑞2) 𝑠. 𝑎. ∶ 0 ≤ 𝑞1 ≤ 1

Las CPO son:

𝜕𝜋1𝑞1= (1 − 𝑞1 − 𝑞2) − 𝑞1 = 1 − 2𝑞1 − 𝑞2 = 0

∴ 𝑞10 = 𝑅1(𝑞2) =

1 − 𝑞22

∈ [0,1]

Page 28: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Para el Jugador 1, la correspondencia de respuesta óptima se obtiene resolviendo:

max𝑞2𝜋1 = 𝑞2(1 − 𝑞1 − 𝑞2) 𝑠. 𝑎. ∶ 0 ≤ 𝑞2 ≤ 1

Las CPO son:

𝜕𝜋2𝑞2= 1 − 𝑞1 − 2𝑞2 = 0

∴ 𝑞20 = 𝑅2(𝑞1) =

1 − 𝑞12

∈ [0,1]

El(los) equilibrio(s) de Nash se encuentra en el lugar en el cual cada estrategia es una respuesta óptima a la(s) otra(s). Esto es, el(los) equilibrio(s) de Nash se encuentran en el punto en el cual

𝑞10 = 𝑅1(𝑞2) =

1 − 𝑞22

=1 − 𝑞12

= 𝑅2(𝑞1) = 𝑞20

Page 29: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Es decir, debe resolverse el sistema:

𝑠𝑦𝑠𝑒𝑞(𝑞1, 𝑞2) == {𝑞1 =

1 − 𝑞22

[1]

𝑞2 =1 − 𝑞12

[2]

De la ecuación [1]:

2𝑞1 = 1 − 𝑞2 → 𝑞2 = 1 − 2𝑞1 Reemplazando en [2]:

1 − 2𝑞1 =1 − 𝑞12

2 − 4𝑞1 = 1 − 𝑞1

∴ 𝑞1∗ =

1

3

Page 30: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Reemplazando de nuevo en [2]

2𝑞2 =2

3=2

6=1

3= 𝑞2

Es decir, el conjunto de los Equilibrios de Nash es el perfil de estrategias: (𝑞1∗, 𝑞2

∗) = (13, 13)

Page 31: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Equilibrios de Nash (Estrategias Puras):

El concepto de Equilibrio de Nash es ampliamente atractivo por la versatilidad relativa que ofrece al en la búsqueda de equilibrio para una amplísima variedad de juegos.

Es conveniente notar que, en general los conjuntos de equilibrios estudiados bajo los distintos

conceptos-solución al momento son tales que: ED ⊆ EID ⊆ EN

En general, los equilibrios de Nash dan lugar a pagos que son al menos tan preferibles como los pagos mínimos garantizados (MinMax) aun cuando en general las estrategias de seguridad no son Equilibrios de Nash.

La conducta de seguridad y el comportamiento no cooperativo solo coinciden en juegos estrictamente competitivos [ Montet & Serra, 2008:66 ]. No obstante, debe esperarse que no siempre existan equilibrios de Nash en estrategias puras.

Para probar que un juego tiene al menos un Equilibrio de Nash buscaremos mostrar que el perfil

de estrategias 𝑠∗ = (𝑠1∗, 𝑠2

∗, … , 𝑠𝑖−1∗ , 𝑠𝑖

∗, 𝑠𝑖+1∗ , … , 𝑠𝑖

∗) es un equilibrio de Nash si y sólo si 𝑠𝑖∗ ∈

𝑅𝑖(𝑠−𝑖∗ ), es decir, probar que existe al menos un equilibrio de Nash equivale a probar que existe un

𝑠𝑖∗tal que 𝑠𝑖

∗ ∈ 𝑅𝑖(𝑠−𝑖∗ ).

Page 32: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Existencia de Equilibrios de Nash (Estrategias Puras)

Considere la correspondencia 𝑅: 𝑆 ⇉ 𝑆 definida por el producto cartesiano de los espacios de estrategias

de los 𝑁 jugadores (Cfr. Fundenberg & Tirole, (1992: 6)]

𝑅(𝑠) =∏ 𝑅𝑖(𝑠−𝑖∗ )

𝑁

𝑖=1

Siendo 𝑆 = ∏ 𝑆𝑖𝑁𝑖=1 . En términos vectoriales, esto equivale a poner:

𝑠∗ ∈ 𝑅(𝑠∗)

Es decir, un juego tendrá un Equilibrio de Nash siempre que 𝑅 tenga un punto fijo. Dado que la relación supra plantea un mapeo punto-conjunto (set to point mapping), el Teorema de Punto Fijo de Kakutani, que es el instrumento analítico utilizado por JohnNash para mostrar la existencia de este tipo de equilibrios, es justamente el instrumento a utilizar a los efectos descritos. Una definición detallada de estos contenidos aparece en [6.], [8.], [11.] y [12]. El teorema de existencia de EN se presenta a continuación.

Page 33: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Teorema [Existencia de un Equilibrio de Nash ]: Considere el juego en forma estratégica,

Γ = [𝑁, (𝑠𝑖)𝑖=1𝑁 , (𝑢𝑖)𝑖=1

𝑁 ]

Se dice que el juego Γ tiene al menos un Equilibrio de Nash si, para todos y cada uno de los 𝑖 = 1,⋯ ,𝑁 jugadores en el juego:

El conjunto 𝑆𝑖 de estrategias es un subconjunto compacto y convexo de un Espacio Euclidiano;

La función de retorno 𝑢𝑖 es continua y estrictamente cuasi-concava en 𝑠𝑖

Demostración: Para todo 𝑖 ∈ 𝑁

El conjunto 𝑅𝑖(𝑠−𝑖∗ ) es no vacío puesto que 𝑢𝑖 es continua y 𝑆𝑖 es compacto;

Al mismo tiempo, se puede garantizar que 𝑅𝑖(𝑠−𝑖∗ ) es convexo puesto que 𝑢𝑖 es cuasi cóncava en

𝑆𝑖 ;

𝑅 = ∏ 𝑅𝑖𝑖 es hemi-continua superior puesto que 𝑢𝑖 es continua, ∀𝑖 = 1,… , 𝑁

Entonces, por el teorema de Punto Fijo de Kakutani, 𝑅 tiene un punto fijo∎

Page 34: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: El Duopolio de Cournot

El mercado de una mercancía homogénea está habitado por 𝑛 = 2 firmas que compiten en cantidades.

Sea 𝑞𝑗 la cantidad de mercancía que produce la j-ésima firma. Considere los siguientes supuestos:

La función inversa de demanda3 correspondiente a la j-ésima firma es decreciente y lineal para todo

𝑞𝑗 ∈ [0, 𝑎 𝑏⁄ ]

El coste marginal de la firma 𝑗 es constante y tal que 𝐶𝑀𝑔𝑗 < 𝑎 ∀𝑗 = 1,… , 𝑛

No hay costos fijos;

El mercado absorbe cualquier oferta de las firmas.

En general, el precio de mercado, es tal que

𝑃(𝑄) = {𝑎 − 𝑏𝑄 ⟷ 𝑎 > 𝑏𝑄0 ⟷ 𝑎 ≤ 𝑏𝑄

Donde 𝑏 > 0 y ∑ 𝑞𝑗 = 𝑞1 + 𝑞2 = 𝑄𝑗

3 La función inversa de demanda no es el recíproco de la función de demanda; el termino “inversa” alude al concepto analítico de función inversa. Por consiguiente, dada 𝑞 =𝑓(𝑝), la función inversa de demanda, que relaciona la cantidad de mercancía 𝑘-ésima con el precio de mercado, 𝑝𝑘 se expresa como 𝑝 = 𝑓−1(𝑞)∎

Page 35: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Las funciones de costes relevantes son:

𝐶𝑗(𝑞𝑗) = 𝑐𝑞𝑗 , 𝑐 < 𝑎

Mientras que la función de beneficio correspondiente a la firma j viene dada por:

𝜋𝑗(𝑞𝑗 , 𝑞−𝑗) = 𝑞𝑗(𝑎 − 𝑏𝑄) − 𝑐𝑞𝑗 Esto es:

{𝜋1(𝑞1, 𝑞2) = 𝑞1(𝑎 − 𝑏𝑞1 − 𝑏𝑞2) − 𝑐𝑞1 = 𝑞1(𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐)

𝜋2(𝑞1, 𝑞2) = 𝑞2(𝑎 − 𝑏𝑞1 − 𝑏𝑞2) − 𝑐𝑞2 = 𝑞2(𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐)

En forma normal, el juego de Cournot cuenta con 𝑁 = 2 jugadores con espacios de estrategias 𝑆1 =𝑆2 = [0, 𝑎 𝑏⁄ ] y con funciones de pago:

𝑢𝑗(𝑞𝑗 , 𝑞−𝑗) = 𝑞𝑗[𝑎 − (𝑏 ∑ 𝑞𝑗𝑁𝑗=1 ) − 𝑐] todo 𝑗 = 1,2

Page 36: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Para computar el(los) equilibrio(s) de Nash, téngase en cuenta que la respuesta óptima de cada actor a

una acción del otro actor, 𝑅𝑗(𝑠−𝑗), se obtiene de la solución del problema:

max𝑞𝑗𝑢𝑗(𝑞𝑗 , 𝑞−𝑗) = 𝑞𝑗[𝑎 − (𝑏 ∑ 𝑞𝑗

𝑁𝑗=1 ) − 𝑐] sujeta a: 0 ≤ 𝑞𝑗 ≤ 𝑎 𝑏⁄

En el caso de la firma 1:

max𝑞1𝑢1(𝑞1, 𝑞2) = 𝑞1[𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐] sujeta a: 0 ≤ 𝑞1 ≤ 𝑎 𝑏⁄

CPO:

𝜕𝑢1(𝑞1, 𝑞2)

𝜕𝑞1= [𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐] + 𝑞1(−𝑏) = 0

Esto es,

𝑞1∗ =

𝑎 − 𝑐 − 𝑏𝑞22𝑏

Note que para este problema las C2O: 𝜕2𝑢1(∙) 𝜕𝑞12 = −2𝑏 < 0⁄ por lo que 𝑞1

∗ corresponde a un máximo, y por tanto, para la firma 1,

𝑞1∗ ≡ 𝑅1(𝑞2) =

𝑎 − 𝑐 − 𝑏𝑞22𝑏

Page 37: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

En lo que respecta a la firma 2, el problema es:

max𝑞2𝑢2(𝑞1, 𝑞2) = 𝑞2[𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐] sujeta a: 0 ≤ 𝑞2 ≤ 𝑎 𝑏⁄

CPO:

𝜕𝑢2(𝑞1, 𝑞2)

𝜕𝑞2= [𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐] + 𝑞2(−𝑏) = 0

Esto es,

𝑞2∗ ≡ 𝑅2(𝑞1) =

𝑎 − 𝑐 − 𝑏𝑞12𝑏

Suponga que el par (𝑞1∗, 𝑞2

∗) es un Equilibrio de Nash. Entonces, por el teorema de existencia presentado

supra, 𝑞1∗ ≡ 𝑅1(𝑞2) y 𝑞2

∗ ≡ 𝑅2(𝑞1). Es decir, es la solución del sistema de ecuaciones:

{𝑞1∗ =

𝑎 − 𝑐 − 𝑏𝑞22𝑏

𝑞2∗ =

𝑎 − 𝑐 − 𝑏𝑞12𝑏

Page 38: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Reemplazando la expresión para 𝑞2∗ en 𝑞1

∗:

𝑞1∗ =

𝑎 − 𝑐 − 𝑏 (𝑎 − 𝑐 − 𝑏𝑞1

2𝑏)

2𝑏

De donde,

𝑞1∗ =

𝑎 − 𝑐

3𝑏

Bajo el mismo razonamiento,

𝑞2∗ =

𝑎 − 𝑐

3𝑏

Y, el conjunto de puntos de equilibrio (de Nash) vendrá dado por:

𝑆𝐸𝑁 ≡ [𝑞1∗ =

𝑎 − 𝑐

3𝑏, 𝑞2∗ =

𝑎 − 𝑐

3𝑏]

Page 39: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Dado que la cantidad total de equilibrio ∑ 𝑞𝑗 = 𝑞1 + 𝑞2 = 𝑄𝑗

𝑄∗ = 𝑞1∗ + 𝑞2

∗ = 2 ∙𝑎 − 𝑐

3𝑏

En tanto que el precio de equilibrio viene dado por:

𝑃(𝑄∗) = 𝑎 − 𝑏𝑄∗ = 𝑎 − 𝑏 (2 ∙𝑎 − 𝑐

3𝑏) =

𝑎 + 2𝑐

3

Recuerde que la función de beneficio de la firma j está dada por 𝜋𝑗 = 𝑞𝑗[𝑎 − (𝑏 ∑ 𝑞𝑗𝑁𝑗=1 ) − 𝑐]. Luego en el óptimo,

fijando j=1 (el mismo procedimiento aplica a la otra empresa),

𝜋1∗ = 𝑢1

∗(𝑞1∗, 𝑞2

∗) = 𝑞1∗ [𝑎 − 𝑏 (

𝑎 − 𝑐

3𝑏) − 𝑏 (

𝑎 − 𝑐

3𝑏) − 𝑐] = 𝑞1

∗ [𝑎 −𝑎 − 𝑐

3−𝑎 − 𝑐

3− 𝑐]

∴ 𝜋1∗ =

(𝑎 − 𝑐)2

9𝑏= 𝜋2

Y el beneficio total en la industria,

Π∗ = 𝜋1∗ + 𝜋2

∗ =(𝑎 − 𝑐)2

9𝑏+(𝑎 − 𝑐)2

9𝑏= 2 [

(𝑎 − 𝑐)2

9𝑏]

En resumen, el equilibrio en esta industria viene dado por una tupla:

[𝑃∗(𝑄∗); 𝑄∗(𝑞𝑗∗); Π∗(𝜋𝑗

∗)]𝑗=1

𝑁=2= [(

𝑎 + 2𝑐

3) ; (2(𝑎 − 𝑐)

3𝑏) ; (

2(𝑎 − 𝑐)2

9𝑏) ]

Page 40: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Page 41: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: El Oligopolio de Cournot

Extendamos el resultado de Cournot a un número 𝑗 = 1,… , 𝑛 de firmas cada una con un nivel de

producción, 𝑞𝑗 . La función inversa de demanda es, como en el caso anterior,

𝑃(𝑄) = {𝑎 − 𝑏𝑄 ⟷ 𝑎 > 𝑏𝑄0 ⟷ 𝑎 ≤ 𝑏𝑄

Con 𝑏 > 0 y ∑ 𝑞𝑗 = 𝑞1 + 𝑞2+,… ,+𝑞𝑛−1 + 𝑞𝑛 = 𝑄𝑗

La función de costos de la firma j viene dada por:

𝐶𝑗(𝑞𝑗) = 𝑐𝑞𝑗 𝑐 < 𝑎 ∀𝑗 El beneficio de la firma j es:

𝜋𝑗 = 𝑞𝑗𝑃(𝑄) − 𝐶𝑗(𝑞𝑗) = 𝑞𝑗𝑃(𝑞𝑗 + 𝑄−𝑗) − 𝐶𝑗(𝑞𝑗) = 𝑞𝑗[𝑎 − 𝑏(𝑞𝑗 + 𝑄−𝑗)] − 𝑐𝑞𝑗

𝜋𝑗 = 𝑞𝑗[𝑎 − 𝑏(𝑞𝑗 + 𝑄−𝑗) − 𝑐]

Page 42: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

La respuesta óptima de la firma j a una combinación de acciones 𝑞−𝑗 = (𝑞1, … , 𝑞𝑗−1, 𝑞𝑗+1, … , 𝑞𝑛) es la

solución de

max𝑞𝑗𝜋𝑗 = 𝑞𝑗[𝑎 − 𝑏(𝑞𝑗 + 𝑄−𝑗) − 𝑐] sujeta a: 𝑞𝑗 ∈ [0,

𝑎

𝑏]

Las condiciones relevantes para óptimo son:

𝜕𝜋𝑗(𝑞𝑗 , 𝑞−𝑗)

𝜕𝑞𝑗= [𝑎 − 𝑏(𝑞𝑗 + 𝑄−𝑗) − 𝑐] − 𝑏𝑞𝑗 = 0

∴ 𝑎 − 2𝑏𝑞𝑗 − 𝑏𝑄−𝑗 − 𝑐 = 0

La C2O permite verificar la cuasi concavidad (estricta) de 𝜋𝑗 por lo que CPO supone un máximo.

El vector 𝑞∗ = (𝑞1∗, 𝑞2

∗, … , 𝑞𝑗−1∗ , 𝑞𝑗

∗, 𝑞𝑗+1∗ , … , 𝑞𝑛

∗) caracteriza a un Equilibrio de Nash si se verifican:

𝑎 − 2𝑏𝑞𝑗∗ − 𝑏𝑄−𝑗

∗ − 𝑐 = 0 todo 𝑗 = 1,… , 𝑛

Page 43: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Es claro (simetría) que 𝑞𝑗∗ = 𝑞𝑖

∗, 𝑖 ≠ 𝑗. Además se notará que 𝑏𝑄−𝑗∗ = 𝑏(𝑛 − 1)𝑞𝑗

∗. Ergo,

𝑎 − 2𝑏𝑞𝑗∗ − 𝑏𝑄−𝑗

∗ − 𝑐 =

𝑎 − 2𝑏𝑞𝑗∗ − 𝑏(𝑛 − 1)𝑞𝑗

∗ − 𝑐 = 0

2𝑏𝑞𝑗∗ + 𝑏(𝑛 − 1)𝑞𝑗

∗ = 𝑎 − 𝑐

𝑞𝑗∗(2𝑏 + 𝑏(𝑛 − 1)) = 𝑎 − 𝑐

∴ 𝑞𝑗∗ =

𝑎 − 𝑐

𝑏(𝑛 + 1) ∀𝑗

El equilibrio de Nash es el n-vector:

[𝑞1∗ =

𝑎 − 𝑐

𝑏(𝑛 + 1), … , 𝑞𝑗

∗ =𝑎 − 𝑐

𝑏(𝑛 + 1), … , 𝑞𝑛

∗ =𝑎 − 𝑐

𝑏(𝑛 + 1)]

Page 44: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

La cantidad total de mercancía en el equilibrio, es:

𝑄∗ =∑ (𝑎 − 𝑐

𝑏(𝑛 + 1))

𝑛

𝑗=1= 𝑛 (

𝑎 − 𝑐

𝑏(𝑛 + 1))

Los precios de equilibrio,

𝑃(𝑄∗) = 𝑎 − 𝑏 [𝑛 (𝑎 − 𝑐

𝑏(𝑛 + 1))] =

𝑎 + 𝑛𝑐

𝑛 + 1

El beneficio individual de equilibrio:

𝜋𝑗∗ ≡ 𝑢𝑗

∗ = 𝑞𝑗∗(𝑎 − 𝑏(𝑞𝑗

∗ + 𝑄−𝑗∗ ) − 𝑐)

= 𝑞𝑗∗ (𝑎 − 𝑏 (𝑛 (

𝑎 − 𝑐

𝑏(𝑛 + 1))) − 𝑐) = 𝑞𝑗

∗ (𝑎 − 𝑛𝑎 − 𝑐

𝑛 + 1− 𝑐)

∴ 𝜋𝑗∗ =

(𝑎 − 𝑐)2

𝑏(𝑛 + 1)2 ∀= 1,… , 𝑛

Y el beneficio de equilibrio agregado,

Π∗ =∑ 𝜋𝑗∗

𝑛

𝑗=1=∑

(𝑎 − 𝑐)2

𝑏(𝑛 + 1)2= 𝑛 [

(𝑎 − 𝑐)2

𝑏(𝑛 + 1)2]

𝑛

𝑗=1∎

Page 45: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: El Modelo de Bertrand - Productos Homogéneos4 Contrario a la opinión de Agustín Cournot, el matemático francés Joseph Louis François Bertrand (1822-1900) creía que las firmas utilizaban precios (en lugar de cantidades) para ajustar a la demanda de mercado. En el modelo de Bertrand las firmas compiten en precios y venden toda la producción que puedan poner en el mercado y que los demandantes quieran comprar a ese precio. Considere una economía con j = {1, 2} firmas que producen un cierto bien y cuya estrategia de competencia es la modificación de los precios a los que participan en el mercado relevante.

Sea 𝑞(𝑝) la función de demanda de mercado del producto. Entonces:

El consumidor compra al precio más bajo siendo indiferente entre quienes venden el producto si las firmas tienen el mismo precio;

𝑞(𝑝) es monótona decreciente en 𝑝 ∈ [0, 𝑝𝑐) 𝑞(𝑝) = 0 si 𝑝 ≥ 𝑝𝑐 El proceso fabril de las dos firmas se caracteriza por funciones de costes idénticas (sin coste fijo) y

con costes marginales constantes 𝑐 Sea 𝑝𝑀 el precio de monopolio de la mercancía. Entonces vale 0 < 𝑐 < 𝑝𝑀 < 𝑝𝑐

4 Cfr. Pérez, Jimeno & Cerdá (2004): 119-122.

Page 46: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

La demanda que enfrenta la j-ésima firma está segmentada en función de la relación que mantiene el precio ofrecido por ella con el precio de la firma rival.

𝑞𝑗(𝑝𝑗 , 𝑝𝑖) =

{

0 ⟷ 𝑝𝑗 > 𝑝𝑖

𝑞(𝑝𝑗) ⟷ 𝑝𝑗 < 𝑝𝑖

𝑞(𝑝𝑗) 2⁄ ⟷ 𝑝𝑗 = 𝑝𝑖

Las funciones de costes son:

𝐶𝑗(𝑞𝑗) = 𝑐𝑞𝑗 ∀𝑗

Y los beneficios:

𝜋𝑗(𝑝𝑗 , 𝑝𝑖) =

{

0 ⟷ 𝑝𝑗 > 𝑝𝑖

(𝑝𝑗 − 𝑐) ∙ 𝑞(𝑝𝑗) ⟷ 𝑝𝑗 > 𝑝𝑖

(𝑝𝑗 − 𝑐) ∙ 𝑞(𝑝𝑗) 2⁄ ⟷ 𝑝𝑗 = 𝑝𝑖

Page 47: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

En el modelo de Bertrand, un Equilibrio de Nash es un vector de precios 𝑝∗ = (𝑝𝑗∗, 𝑝𝑖

∗) al cual el precio

fijado por la j-ésima firma es la reporta el mayor beneficio, dado el precio de la firma rival, i.e.,

𝑢𝑗(𝑝𝑗∗, 𝑝𝑖

∗) ≥ 𝑢𝑗(𝑝𝑗 , 𝑝𝑖∗) ∀𝑗 = 1,2; ∀𝑝𝑗 ∈ 𝑆𝑗

La discontinuidad de la demanda de mercado es heredada por la función de beneficio de cada una de las

firmas razón por la cual, las funciones de respuesta óptima 𝑅𝑗(𝑠−𝑗) no pueden ser derivadas usando el

cálculo.

A la sazón una caracterización del equilibrio para este juego consiste en estudiar diferentes puntos candidatos a equilibrio y estudiar su estabilidad relativa, i.e., “considerar todas las situaciones (de equilibrio) posibles y descartar aquellas que no cumplan con nuestra definición(es decir descartar aquellas situaciones en las que alguna empresa pudiera conseguir un beneficio mayor alterando la situación mediante el cambio de su precio)” (Pérez, Jimeno & Cerdá, 2008: 120). Las situaciones a las que las firmas involucradas se enfrentan, son las siguientes:

i. 𝑝𝑗∗ > 𝑝𝑖

∗ = 𝑐. El precio de las firmas es diferente; el precio de la firma rival se fija al coste marginal;

ii. 𝑝𝑗∗ > 𝑝𝑖

∗ > 𝑐. El precio de las firma es distinto y mayor que el coste marginal;

iii. 𝑝𝑗∗ = 𝑝𝑖

∗ > 𝑐. Los precios de las dos firmas son iguales y mayores que el coste marginal;

iv. 𝑝𝑗∗ = 𝑝𝑖

∗ = 𝑐. Los precios de las dos firmas son iguales e iguales al coste marginal;

Page 48: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Page 49: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

De acuerdo con estas posibilidades, valórense los beneficios de las firmas, según el caso:

Caso i: 𝑝𝑗∗ > 𝑝𝑖

∗ = 𝑐. En este caso, los beneficios son:

𝑢𝑖(𝑝𝑖∗, 𝑝𝑗

∗) = {𝑢𝑖(𝑝𝑖

∗, 𝑝𝑗∗) = 𝑞(𝑝𝑖

∗)(𝑝𝑖∗ − 𝑐) = 𝑞(𝑐)(𝑐 − 𝑐) = 0

𝑢𝑖(𝑝𝑖∗, 𝑝𝑗

∗) = 0

Suponga, sin embargo, que la firma i elige un precio distinto y superior al costo marginal 𝑐 pero aún

inferior al precio de la otra firma, e.g. 𝑝𝑖′ = 𝑝𝑗

∗ − 𝜖 > 𝑐. En este caso, los beneficios de la firma i son:

𝑢𝑖(𝑝𝑖′, 𝑝𝑗

∗) = 𝑞(𝑝𝑖′)(𝑝𝑖

′ − 𝑐) > 0

i.e.., La firma tiene incentivos para desviarse de la situación inicial propuesta y, consecuentemente este caso no constituye un Equilibrio de Nash.

Page 50: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Caso ii: 𝑝𝑗∗ > 𝑝𝑖

∗ > 𝑐. El precio de las firmas es distinto y mayor que el coste marginal. En este escenario

los beneficios de las firmas son

𝑢𝑖(𝑝𝑖∗, 𝑝𝑗

∗) = {𝑢𝑖(𝑝𝑖

∗, 𝑝𝑗∗) = 𝑞(𝑝𝑖

∗)(𝑝𝑖∗ − 𝑐) = 𝑞(𝑝𝑖

∗)(𝑝𝑖∗ − 𝑐) > 0

𝑢𝑖(𝑝𝑖∗, 𝑝𝑗

∗) = 0

Puesto que 𝑝𝑗∗ > 𝑝𝑖

∗, el beneficio para la firma j es cero. No obstante suponga que esta firma reduce su

precio en una cantidad 𝜖 de modo que el nuevo precio sea igual al precio de la otra firma, menos una

cantidad determinada 𝑝𝑗′ = (𝑝𝑖

∗ − 𝜖) > 𝑐, entonces, el beneficio para esta firma es:

𝑢𝑗(𝑝𝑖∗, 𝑝𝑗

∗) = 𝑞(𝑝𝑗′)(𝑝𝑗

′ − 𝑐) = 𝑞(𝑝𝑗′) (𝑝𝑖

∗ − 𝜖⏟ >𝑐

− 𝑐) > 0

Al adoptar esta estrategia la firma j obtendría beneficio positivo, situación que involucra un incentivo para desviarse de esta situación y, por tanto, no constituye un Equilibrio de Nash.

Page 51: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Caso iii: Los precios de las dos firmas son iguales y mayores que el coste marginal, i.e. 𝑝𝑗∗ = 𝑝𝑖

∗ > 𝑐. Los

beneficios de las firmas, en esta situación, son:

𝑢𝑖(𝑝𝑖∗, 𝑝𝑗

∗) = {𝑢𝑖(𝑝𝑖

∗, 𝑝𝑗∗) = 𝑞(𝑝𝑖

∗)(𝑝𝑖∗ − 𝑐) 2⁄ > 0

𝑢𝑗(𝑝𝑖∗, 𝑝𝑗

∗) = 𝑞(𝑝𝑗∗)(𝑝𝑗

∗ − 𝑐) 2⁄ > 0

En este caso, las firmas obtienen un beneficio estrictamente positivo si bien se reparten el mercado entre los dos. Note además que si cualquier firma reduce su precio por debajo del de la otra firma, se queda con todo el mercado duplicando prácticamente su beneficio. En efecto, suponga que:

𝑝𝑖′ = 𝑝𝑖

∗ − 𝜖 < 𝑝𝑗∗ con 𝑝𝑖

′ > 𝑐

En este caso,

𝑢𝑖(𝑝𝑖′, 𝑝𝑗

∗) = 𝑞(𝑝𝑖∗ − 𝜖)(𝑝𝑖

∗ − 𝜖 − 𝑐) ≈ 2𝑢𝑖(𝑝𝑖∗, 𝑝𝑗

∗) > 𝑢𝑖(𝑝𝑖∗, 𝑝𝑗

∗)

Por consiguiente, cualquiera de las dos firmas tiene incentivos para fijar un precio inferior al de su rival, siendo este un equilibrio inestable, i.e., una situación de no Equilibrio de Nash.

Page 52: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Caso iv: 𝑝𝑗∗ = 𝑝𝑖

∗ = 𝑐. Los precios de las dos firmas son iguales entre si e iguales al coste marginal. En

este caso, los beneficios de las firmas son:

𝑢𝑖(𝑝𝑖∗, 𝑝𝑗

∗) = {𝑢𝑖(𝑝𝑖

∗, 𝑝𝑗∗) = 𝑞(𝑝𝑖

∗)(𝑝𝑖∗ − 𝑐) = 𝑞(𝑐)(𝑐 − 𝑐) = 0

𝑢𝑗(𝑝𝑖∗, 𝑝𝑗

∗) = 𝑞(𝑝𝑗∗)(𝑝𝑗

∗ − 𝑐) = 𝑞(𝑐)(𝑐 − 𝑐) = 0

Esto es, ninguna de las firmas observa rentas no competitivas y ninguna de ellas tiene incentivo para desviarse de esta situación (compruebe que es así) que se constituye en el Equilibrio de Nash.

Page 53: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

En términos de funciones de reacción (correspondencias de respuesta óptima):

Si el precio fijado por la firma i, 𝑝𝑖 es menor que el costo marginal, 𝑐 cualquier respuesta 𝑝𝑗 > 𝑝𝑖

es óptima pues implica beneficios nulos, en contraste con respuestas 𝑝𝑗 ≤ 𝑝𝑖 , que implican

beneficio negativo (pérdida).

Si el precio fijado por la firma i, 𝑝𝑖 es igual al costo marginal, 𝑐 cualquier respuesta 𝑝𝑗 ≥ 𝑝𝑖 es

óptima pues implica beneficios nulos, en contraste con respuestas 𝑝𝑗 < 𝑐, que implican beneficio

negativo (pérdida).

Si el precio fijado por la firma i, 𝑝𝑖 es igual al costo marginal, 𝑐 pero menor o igual al precio de

monopolio 𝑝𝑀 no existe una respuesta 𝑝𝑗 óptima a la estrategia 𝑝𝑖 :

o Mientras 𝑝𝑗 se aproxima desde abajo a 𝑝𝑖 , el beneficio de la firma j se aproxima a la que supone

el precio de monopolio 𝑝𝑀.

o Sin embargo, cuando 𝑝𝑗=𝑝𝑖 , el beneficio salta a la mitad (los dos individuos se reparten el

mercado),

o Si, 𝑝𝑗 sigue aumentando por encima de 𝑝𝑖 , el beneficio salta a cero.

Claramente, dado el precio de la otra firma, siempre es mejor fijar un precio ligeramente inferior, pero nunca óptimo.

Si el precio fijado por la firma i, 𝑝𝑖 es mayor que el precio de monopolio, 𝑝𝑀, la respuesta 𝑝𝑗 = 𝑝𝑀

es la única respuesta óptima, pues proporciona el máximo beneficio.

Page 54: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Adaptado de PJC (2004: 123)

Page 55: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Final Remark (Bertrand) La solución para el juego de Bertrand es un equilibrio de Nash que coincide con un equilibrio en estrategias débilmente dominadas.

Para la firma j-ésima la estrategia 𝑝𝑗∗ = 𝑐 está débilmente dominada por cualquier otra estrategia 𝑝𝑗

∗ > 𝑐

tal que 𝑞(𝑝𝑗∗) > 0 pues:

Daría lugar a beneficios estrictamente positivos si 𝑝𝑖∗ ≥ 𝑝𝑗

∗, pero

Daría lugar a beneficios nulos si 𝑝𝑖∗ < 𝑝𝑗

Page 56: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Equilibrios de Nash (Estrategias Mixtas): No todo juego finito tiene un Equilibrio de Nash por Solución. Considere, por ejemplo, el Juego del Lanzamiento de las Monedas:

Jugador 2 Cara Sello

Jugador 1 Cara 1, -1 -1, 1

Sello -1, 1 1, -1

Considerando correspondencias de respuesta óptima, al Jugador 1 le resulta conveniente responder a cualquier estrategia del Jugador 2 con la misma estrategia en tanto que al Jugador 2, le resulta más rentable, dada cualquier estrategia del Jugador 1, elegir la estrategia opuesta. Las correspondencias de respuesta óptima son,

Jugador 1: 𝑅1(𝑠2) = 𝑠2, i.e., 𝑅1(𝐶𝑎𝑟𝑎) = 𝐶𝑎𝑟𝑎 ; 𝑅2(𝑆𝑒𝑙𝑙𝑜) = 𝑆𝑒𝑙𝑙𝑜

Jugador 2: 𝑅2(𝑠1) = −𝑠1, i.e., 𝑅2(𝐶𝑎𝑟𝑎) = 𝑆𝑒𝑙𝑙𝑜 ; 𝑅2(𝑆𝑒𝑙𝑙𝑜) = 𝐶𝑎𝑟𝑎 Es decir, no hay perfiles de estrategias puras en las que cada una de ella sea respuesta óptima de la otra.

Page 57: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Equilibrios de Nash (Estrategias Mixtas): El juego de las monedas, se sabe que tiene una solución MaxiMin (Von Neumann-Morgenstern) en estrategias mixtas, dada una aleatorización de la conducta del jugador que ahora se representa como un individuo que no elige únicamente estrategias puras, sino loterías sobre los conjuntos de estrategias (puras) que pueden generar para él un perfil dado de estrategias: En el juego de las monedas el Jugador 1 puede Jugar Cara con probabilidad 0.25 y Jugar Sello con probabilidad 0.75.

Definición. Estrategias Mixtas (PJCerdá [2006]: 146) Volvamos sobre la definición de Estrategias Mixtas presentada en la p.4 supra:

Sea 𝑆𝑖 = {𝑠𝑖

1, 𝑠𝑖2, ⋯ , 𝑠𝑖

𝑘 } el conjunto de estrategias puras del i-ésimo jugador. Entonces, una estrategia

mixta para este jugador es una lotería —es decir una distribución de probabilidades—, 𝜎𝑖 =

(𝜎𝑖1, 𝜎𝑖

2, ⋯ , 𝜎𝑖𝑘) sobre los elementos de 𝑆𝑖 esto es, a cada distribución de probabilidades sobre 𝑆𝑖 =

{𝑠𝑖1, 𝑠𝑖

2, ⋯ , 𝑠𝑖𝑘 }, donde los elementos de 𝜎𝑖 son todos no negativos y suman 1

Page 58: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Al conjunto de las estrategias mixtas del i-ésimo jugador se notará con Δ(𝑆𝑖) que se define como:

Δ(𝑆𝑖) = {𝜎𝑖 = (𝜎𝑖1, 𝜎𝑖

2, ⋯ , 𝜎𝑖𝑘): 𝜎𝑖

𝑗≥ 0, ∀𝑗 = 1,2,3, … , 𝑘 𝑦 ∑ 𝜎𝑖

𝑗= 1

𝑘

𝑗=1}

Toda estrategia pura es una estrategia mixta: Bajo este tipo de definición una estrategia mixta da

probabilidad 1 a una única estrategia y cero a las demás. La estrategia pura 𝑠𝑖𝑗

es entonces

susceptible de ser identificada con la estrategia mixta 𝜎𝑖 = (0, 0,⋯ ,1,⋯ ,0,0) siendo 1 la j-ésima estrategia pura.

Para cada estrategia mixta es posible identificar y distinguir al conjunto de estrategias puras que reciben probabilidad estrictamente positiva. Este subconjunto recibe el nombre de Soporte de dicha estrategia (mixta).

Page 59: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Definición.— Soporte de una Estrategia Mixta Sea 𝑆𝑖 = {𝑠𝑖

1, 𝑠𝑖2, ⋯ , 𝑠𝑖

𝑘 } el conjunto de estrategias puras del i-ésimo jugador. Entonces, el soporte de

una estrategia mixta 𝜎𝑖 es el subconjunto de estrategias puras, al cual 𝜎𝑖 asigna probabilidades positivas, i.e.

𝑠𝑢𝑝𝑝(𝜎𝑖 ) = {𝑠𝑖𝑘 ∈ 𝑆𝑖 ∶ 𝜎𝑖(𝑠𝑖

𝑘) > 0 }

El soporte de una estrategia mixta 𝜎𝑖, 𝑠𝑢𝑝𝑝(𝜎𝑖 ) ⊆ 𝑆𝑖 tal que 𝑠𝑖𝑗∈ 𝑠𝑢𝑝𝑝(𝜎𝑖 ) ⟷ 𝜎𝑖

𝑗> 0.

Se dirá que la estrategia mixta 𝜎𝑖 es una estrategia mixta completa si dicha estrategia coincide con

el conjunto de estrategias puras del jugador, es decir, 𝑠𝑢𝑝𝑝(𝜎𝑖 ) = 𝑆𝑖 .

Una estrategia mixta es completa si asigna una probabilidad estrictamente positiva a cada estrategia

pura de 𝑆𝑖

Toda estrategia pura es una estrategia mixta de soporte unitario, i.e., un soporte de un único elemento.

Toda estrategia mixta no pura (de soporte no unitario) se denomina estrategia mixta propia.

Page 60: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo ( PJC: 147 ) Sea el siguiente juego:

Jugador 2 Izquierda Derecha

Jugador 1 Arriba 3, 2 1, 4

Centro 1, 3 2, 1

Abajo 2, 2 2, 0

Los conjuntos de estrategias puras son: {𝑆1 = [𝐴, 𝐶, 𝐵]

𝑆2 = [𝐼, 𝐷]

Una estrategia mixta para el Jugador 1 puede ser una distribución 𝜎1 = {𝑝, 𝑞, 1 − 𝑝 − 𝑞} donde 𝑝

es la probabilidad de elegir Arriba, 𝑞 es la probabilidad de elegir C, y Abajo se elige con probabilidad

1 − 𝑝 − 𝑞.

Una estrategia mixta para el Jugador 2 puede ser una distribución 𝜎2 = {𝑟, 1 − 𝑟} con 𝑟 siendo la

probabilidad de jugar Izquierda mientras que la estrategia Derecha se juega con probabilidad (1 − 𝑟).

Page 61: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Para el Jugador 1, toda estrategia mixta en la que 𝑝 > 0, 𝑞 > 0, 1 − 𝑝 − 𝑞 > 0 tendrá un conjunto

soporte 𝑠𝑢𝑝𝑝(𝜎1 ) igual al número de estrategias puras siendo así una estrategia mixta completa.

Una estrategia mixta completa para este jugador es (12, 14,1

4), en donde jugar 𝐴 tiene probabilidad 1

2,

jugar 𝐶 tiene probabilidad 14, y jugar 𝐵 tiene probabilidad 1

4 tiene un conjunto soporte que coincide

con el conjunto de estrategias puras, 𝑆1: 𝑠𝑢𝑝𝑝(1

2, 14,1

4).

En contraste, si una estrategia mixta para el jugador 1 es una lotería (0, 13,2

3) esta no puede entenderse

como una estrategia mixta completa porque asigna probabilidad 0 a la estrategia pura 𝐴 , y su

soporte es un subconjunto propio de 𝑆1: 𝑠𝑢𝑝𝑝(0,1

3,2

3) = {𝐵, 𝐶};

Las estrategias puras {𝐴, 𝐵, 𝐶} pueden entenderse como las estrategias mixtas:

(1,0,0), (0,1,0), (0,0,1).

Bajo estrategias mixtas las funciones de pago dejan de ser determinísticas para tornarse en aleatorias;

Bajo estrategias mixtas, las funciones de pago dejan de ser ordinales.

Page 62: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: Matching Pennies.— Suponga de nuevo el juego de las monedas. En este caso 𝑆1 = 𝑆2 =(𝐶𝑎𝑟𝑎 𝑆𝑒𝑙𝑙𝑜) con pagos:

Jugador 2 Cara Sello

Jugador 1 Cara 1, -1 -1, 1

Sello -1, 1 1, -1

Sean 𝜎1 = (𝑝, 1 − 𝑝) y 𝜎2 = (𝑞, 1 − 𝑞). Entonces, los pagos esperados para cada jugador son:

𝑈1((𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) = 𝑝𝑢1(𝐶𝑎𝑟𝑎, 𝐶𝑎𝑟𝑎) + (1 − 𝑝)𝑢1(𝑆𝑒𝑙𝑙𝑜, 𝐶𝑎𝑟𝑎) = 𝑝(1) + (1 −

𝑝)(−1) = 𝑝 − 1 + 𝑝 = 2𝑝 − 1

𝑈2((𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) = 𝑝𝑢2(𝐶𝑎𝑟𝑎, 𝐶𝑎𝑟𝑎) + (1 − 𝑝)𝑢2(𝑆𝑒𝑙𝑙𝑜, 𝐶𝑎𝑟𝑎) = 𝑝(−1) + (1 −

𝑝)(1) = −𝑝 + 1 − 𝑝 = 1 − 2𝑝 En tanto que:

𝑈1((𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) = 𝑝𝑢1(𝐶𝑎𝑟𝑎, 𝑆𝑒𝑙𝑙𝑜) + (1 − 𝑝)𝑢1(𝑆𝑒𝑙𝑙𝑜, 𝑆𝑒𝑙𝑙𝑜) = 𝑝(−1) + (1 −

𝑝)(1) = −𝑝 + 1 − 𝑝 = 1 − 2𝑝

𝑈2((𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) = 𝑝𝑢2(𝐶𝑎𝑟𝑎, 𝑆𝑒𝑙𝑙𝑜) + (1 − 𝑝)𝑢2(𝑆𝑒𝑙𝑙𝑜, 𝑆𝑒𝑙𝑙𝑜) = 𝑝(1) + (1 −

𝑝)(−1) = 𝑝 + 1 + 𝑝 = 2𝑝 − 1

Page 63: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Los pagos esperados al combinar las dos estrategias mixtas son:

𝑈1[𝜎1, 𝜎2] = 𝑈1[(𝑝, 1 − 𝑝) , (𝑞, 1 − 𝑞)] = 𝑞𝑈1((𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) + (1 − 𝑞)𝑈1((𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜)

= 𝑞(2𝑝 − 1) + (1 − 𝑞)(1 − 2𝑝) = 1 − 2𝑝 − 2𝑞 + 4𝑝𝑞

𝑈2[𝜎1, 𝜎2] = 𝑈2[(𝑝, 1 − 𝑝) , (𝑞, 1 − 𝑞)]= 𝑝 ∙ 𝑞(−1) + (1 − 𝑝) ∙ 𝑞 ∙ (1) + 𝑝 ∙ (1 − 𝑞)(1) + (1 − 𝑝) ∙ (1 − 𝑞)(−1)= −1 + 2𝑝 + 2𝑞 − 4𝑝𝑞

Suponga ex post que se tienen los siguientes pares de estrategias: ((1 3⁄ , 2 3⁄ ), 𝐶𝑎𝑟𝑎) y

((1 3⁄ , 2 3⁄ ), (4 5⁄ , 1 5⁄ )) Ejercicio: Cuáles son las ganancias esperadas de los jugadores 1¸y 2 en cada caso?

Page 64: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Utilidad Esperada en Juegos Bi-persona

Sea Γ un juego con dos jugadores cuyos conjuntos de estrategias puras son:

𝑆1 = {𝑠11, 𝑠1

2, … , 𝑠1𝑚} y 𝑆2 = {𝑠2

1, 𝑠22, … , 𝑠2

𝑛}

Sea además la estrategia mixta: 𝜎2 = {𝜎21, 𝜎2

2, … , 𝜎2𝑛}

Si el jugador 1 juega 𝑠1𝑖 y el jugador 2 juega 𝜎2 las ganancias esperadas para cada jugador serán:

𝑈1(𝑠1𝑖 , 𝜎2) = 𝜎2

1𝑢1(𝑠1𝑖 , 𝑠2

1) + 𝜎22𝑢1(𝑠1

𝑖 , 𝑠22) + ⋯+ 𝜎2

𝑛𝑢1(𝑠1𝑖 , 𝑠2

𝑛) =∑ 𝜎2𝑗𝑢1(𝑠1

𝑖 , 𝑠2𝑗)

𝑛

𝑗=1

𝑈2(𝑠1𝑖 , 𝜎2) = 𝜎2

1𝑢2(𝑠1𝑖 , 𝑠2

1) + 𝜎22𝑢2(𝑠1

𝑖 , 𝑠22) + ⋯+ 𝜎2

𝑛𝑢2(𝑠1𝑖 , 𝑠2

𝑛) =∑ 𝜎2𝑗𝑢2(𝑠1

𝑖 , 𝑠2𝑗)

𝑛

𝑗=1

Page 65: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Suponga que el jugador 1 ahora juega 𝜎1 = {𝜎11, 𝜎1

2, … , 𝜎1𝑚} y el jugador 2 juega 𝜎2 = {𝜎2

1, 𝜎22, … , 𝜎2

𝑛}, las ganancias esperadas serán:

𝑈1(𝜎1, 𝜎2) = 𝜎11𝑈1(𝑠1

1, 𝜎2) + 𝜎12𝑈1(𝑠1

2, 𝜎2) + ⋯+ 𝜎1𝑚𝑈1(𝑠1

𝑚, 𝜎2) =

= 𝜎11∑ 𝜎2

𝑗𝑢1(𝑠1

1, 𝑠2𝑗)

𝑛

𝑗=1+ 𝜎1

2∑ 𝜎2𝑗𝑢1(𝑠1

2, 𝑠2𝑗)

𝑛

𝑗=1+⋯+ 𝜎1

𝑚∑ 𝜎2𝑗𝑢1(𝑠1

𝑚, 𝑠2𝑗)

𝑛

𝑗=1

=∑ 𝜎1𝑖 (∑ 𝜎2

𝑗𝑢1(𝑠1

𝑖 , 𝑠2𝑗)

𝑛

𝑗=1)

𝑚

𝑖=1=∑ ∑ 𝜎1

𝑖𝜎2𝑗𝑢1(𝑠1

𝑖 , 𝑠2𝑗)

𝑛

𝑗=1

𝑚

𝑖=1

En tanto que para el Jugador 2:

𝑈2(𝜎1, 𝜎2) = 𝜎11𝑈2(𝑠1

1, 𝜎2) + 𝜎12𝑈2(𝑠1

2, 𝜎2) + ⋯+ 𝜎1𝑚𝑈2(𝑠1

𝑚, 𝜎2) =

= 𝜎11∑ 𝜎2

𝑗𝑢1(𝑠1

1, 𝑠2𝑗)

𝑛

𝑗=1+ 𝜎1

2∑ 𝜎2𝑗𝑢2(𝑠1

2, 𝑠2𝑗)

𝑛

𝑗=1+⋯+ 𝜎1

𝑚∑ 𝜎2𝑗𝑢2(𝑠1

𝑚, 𝑠2𝑗)

𝑛

𝑗=1

=∑ 𝜎1𝑖 (∑ 𝜎2

𝑗𝑢2(𝑠1

𝑖 , 𝑠2𝑗)

𝑛

𝑗=1)

𝑚

𝑖=1=∑ ∑ 𝜎1

𝑖𝜎2𝑗𝑢2(𝑠1

𝑖 , 𝑠2𝑗)

𝑛

𝑗=1

𝑚

𝑖=1

Page 66: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Las Ganancias Esperadas en Forma Matricial:

Considere un juego Γ con estrategias puras 𝑆1 = {𝑠11, 𝑠1

2, … , 𝑠1𝑚} y 𝑆2 = {𝑠2

1, 𝑠22, … , 𝑠2

𝑛} , y con

estrategias mixtas 𝜎1 = {𝜎11, 𝜎1

2, … , 𝜎1𝑚} y 𝜎2 = {𝜎2

1, 𝜎22, … , 𝜎2

𝑛}. En tonces, la representación en forma estratégicas es: Jugador 2

𝑠21 𝑠2

1 … 𝑠2𝑛

Jugador 1 𝑠11 𝑢1(𝑠1

1, 𝑠21), 𝑢2(𝑠1

1, 𝑠21) 𝑢1(𝑠1

1, 𝑠22), 𝑢2(𝑠1

1, 𝑠22) … 𝑢1(𝑠1

1, 𝑠2𝑛), 𝑢2(𝑠1

1, 𝑠2𝑛)

𝑠12 𝑢1(𝑠1

2, 𝑠21), 𝑢2(𝑠1

2, 𝑠21) 𝑢1(𝑠1

´2, 𝑠22), 𝑢2(𝑠1

2, 𝑠22) … 𝑢1(𝑠1

2, 𝑠2𝑛), 𝑢2(𝑠1

2, 𝑠2𝑛)

… … … … …

𝑠1𝑚 𝑢1(𝑠1

𝑚, 𝑠21), 𝑢2(𝑠1

𝑚, 𝑠21) 𝑢1(𝑠1

𝑚, 𝑠22), 𝑢2(𝑠1

𝑚, 𝑠22) … 𝑢1(𝑠1

𝑚, 𝑠2𝑛), 𝑢2(𝑠1

𝑚, 𝑠2𝑛)

Sean: 𝐴1 = (𝑢1(𝑠1𝑖 , 𝑠2

𝑗 )) y 𝐴2 = (𝑢2(𝑠1𝑖 , 𝑠2

𝑗 )), que corresponden respectivamente a las submatrices de

ganancias del Jugador 1 y del Jugador 2. Entonces, la ganancia esperada de cada jugador, dadas las

estrategias mixtas 𝜎1 y 𝜎2, son:

𝑈1 = 𝜎1𝐴1𝜎2 y 𝑈2=𝜎1𝐴2𝜎2 Donde las matrices involucradas son todas conformables para multiplicación.

Page 67: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo (PJC, 2004: 150~): Considere de nuevo el juego,

Jugador 2 Izquierda Derecha

Jugador 1 Arriba 3, 2 1, 4

Centro 1, 3 2, 1

Abajo 2, 2 2, 0

i. Sean 𝜎1 = {2 3⁄ , 1 6⁄ , 1 6⁄ } y 𝜎2 = {1 3⁄ , 2 3⁄ }. Entonces, dadas:

𝐴1 = (3 11 22 2

) y 𝐴2 = (2 43 12 0

)

Las ganancias esperadas de jugar las estrategias mixtas propuestas para cada jugador son:

𝑈1 = 𝜎1𝐴1𝜎2𝑇 = (2 3⁄ , 1 6⁄ , 1 6⁄ ) (

3 11 22 2

) (1 3⁄

1 3⁄) = 31 18⁄

Page 68: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

𝑈2 = 𝜎1𝐴2𝜎2𝑇 = (2 3⁄ , 1 6⁄ , 1 6⁄ ) (

2 43 12 0

) (1 3⁄

1 3⁄) = 47 18⁄

ii. Considere ahora el siguiente par de estrategias: 𝜎1 = (2 3⁄ , 1 6⁄ , 1 6⁄ ) y 𝑠2 = 𝐼𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎. ¿Cuáles son las utilidades esperadas de los Jugadores?

𝑈1(𝜎1, 𝜎2) = 𝜎1𝐴1𝜎2𝑇 = (2 3⁄ , 1 6⁄ , 1 6⁄ ) (

3 11 22 2

) (10) = (5 2⁄ 4 3⁄ ) (

10) = 5 2⁄

𝑈2(𝜎1, 𝜎2) = 𝜎1𝐴2𝜎2𝑇 = (2 3⁄ , 1 6⁄ , 1 6⁄ ) (

2 43 12 0

) (10) = (13 6⁄ 17 6⁄ ) (

10) = 31 6⁄

Page 69: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Definición: Equilibrio de Nash en Estrategias Mixtas:

Sea el Juego Γ = [𝑁; 𝑆1, … , 𝑆𝑁; 𝑢1, … , 𝑢𝑁] . Entonces, se dice que el perfil de estrategias mixtas 𝜎∗ =(𝜎1∗, … , 𝜎𝑖

∗, … , 𝜎𝑁∗ ) es un Equilibrio de Nash (en estrategias mixtas), si para todo 𝑖 = 1,2,… , 𝑁

𝑈𝑖(𝜎1∗, … , 𝜎𝑖−1

∗ , 𝜎𝑖∗, 𝜎𝑖+1

∗ , … , 𝜎𝑁∗ ) ≥ 𝑈𝑖(𝜎1

∗, … , 𝜎𝑖−1∗ , 𝜎𝑖 , 𝜎𝑖+1

∗ , … , 𝜎𝑁∗ )

Para todo 𝜎𝑖 ∈ Δ(𝑆𝑖) = {𝜎𝑖 = (𝜎𝑖1, 𝜎𝑖

2, ⋯ , 𝜎𝑖𝑘): 𝜎𝑖

𝑗≥ 0, ∀𝑗 = 1,2,3, … , 𝑘 𝑦 ∑ 𝜎𝑖

𝑗= 1𝑘

𝑗=1 }

Esto es, si para todo 𝑖 = 1,2, … , 𝑁 resulta que:

𝜎𝑖∗ = argmax

𝜎𝑖

{𝑈𝑖(𝜎1∗, … , 𝜎𝑖−1

∗ , 𝜎𝑖 , 𝜎𝑖+1∗ , … , 𝜎𝑁

∗ )}

O sea, cuando para cada uno de los 𝑖 = 1,2, … ,𝑁 jugadores 𝜎𝑖∗ es respuesta óptima a 𝜎−𝑖

Observación: El pago esperado de una estrategia mixta de un jugador, dadas las estrategias de los demás jugadores, es una combinación convexa de los pagos de las estrategias puras soporte de esa estrategia mixta: luego la ganancia esperada de una estrategia mixta debe estar entre las ganancias máxima y mínima de las estrategias puras soporte del jugador.

Page 70: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Teorema: Equilibrio de Nash (Ampliado)

Sea el Juego Γ = [𝑁; 𝑆1, … , 𝑆𝑁; 𝑢1, … , 𝑢𝑁] . Se dice que el perfil de estrategias mixtas 𝜎∗ =(𝜎1∗, … , 𝜎𝑖

∗, … , 𝜎𝑁∗ ) es un Equilibrio de Nash si y solo si para todo 𝑖 = 1,2, … ,𝑁 con estrategia mixta

𝜎𝑖∗ = (𝜎𝑖

1∗, 𝜎𝑖2∗, … , 𝜎𝑖

𝑗∗, … ) el hecho de que 𝜎𝑖

𝑗∗> 0 implica que 𝑠𝑖

𝑗 es una respuesta óptima a 𝜎−𝑖

∗ =(𝜎𝑖∗, … , 𝜎𝑖−1

∗ , 𝜎𝑖+1∗ … , 𝜎𝑛

∗ ). Demostración: Ver Fundenberg and Tirole (1992)

Page 71: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo (PJC, 2004: 155~): Considere de nuevo el juego,

Jugador 2 Izquierda Derecha

Jugador 1 Arriba (A) 3, 2 1, 4

Centro (C) 1, 3 2, 1

Abajo (B) 2, 2 2, 0

El juego tiene un único Equilibrio de Nash en estrategias mixtas bajo el perfil [(1 2⁄ , 0, 1 2⁄ ), (1 2⁄ , 1 2⁄ )]: Cualquier estrategia del Jugador 1 con soporte contenido en el conjunto {𝐴, 𝐵} incluidas las estrategias puras 𝐴 y 𝐵 es

respuesta óptima a la estrategia mixta del jugador 2, 𝜎2∗ = (1 2⁄ , 1 2⁄ ). Al mismo tiempo, cualquier estrategia, pura

o mixta del jugador 2 es respuesta óptima a la estrategia , 𝜎1∗ = (1 2⁄ , 0, 1 2⁄ ) del Jugador 1.

Page 72: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

i. Dada la estrategia 𝜎2∗ = (1 2⁄ , 1 2⁄ ) del jugador 2, el jugador 1 obtiene las mismas ganancias al

utilizar distintas estrategias con soporte {𝐴, 𝐵}. En efecto,

𝑈1(𝜎1, 𝜎2) = 𝜎1𝐴1𝜎2𝑇 = (1 2⁄ , 0, 1 2⁄ ) (

3 11 22 2

) (1 2⁄

1 2⁄) = (5 2⁄ , 3 2⁄ ) (

1 2⁄

1 2⁄) = 2

𝑈1(𝐴, 𝜎2) = (1, 0,0) (3 11 22 2

) (1 2⁄

1 2⁄) = (3,1) (

1 2⁄

1 2⁄) = 2

𝑈1(𝐵, 𝜎2) = (0, 0,1) (3 11 22 2

) (1 2⁄

1 2⁄) = (2,2) (

1 2⁄

1 2⁄) = 2

𝑈1((1 3⁄ , 0, 2 3⁄ ), 𝜎2) = (1 3⁄ , 0, 2 3⁄ ) (3 11 22 2

) (1 2⁄

1 2⁄) = (7 3⁄ , 5 3⁄ ) (

1 2⁄

1 2⁄) = 2

En general, dada 𝜎2∗ cualquier estrategia 𝜎1 = (𝑝1

𝑘 , 0, 1 − 𝑝1𝑘) de soporte {𝐴, 𝐵} genera ganancia

2 para el jugador 1. Compruebe que:

𝑈1 ((𝑝1𝑘 , 0, 1 − 𝑝1

𝑘), 𝜎2) = ((𝑝1𝑘 , 0, 1 − 𝑝1

𝑘)) (3 11 22 2

) (1 2⁄

1 2⁄) = (2 + 𝑝1

𝑘 , 2 − 𝑝1𝑘) (1 2⁄

1 2⁄) = 2

Page 73: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

ii. Dada la estrategia 𝜎1∗ = (1 2⁄ , 0, 1 2⁄ ) las ganancias para el jugador 2 serán:

𝑈2(𝜎1∗, 𝜎2) = 𝜎1𝐴2𝜎2

𝑇 = (1 2⁄ , 0, 1 2⁄ ) (2 43 12 0

) (1 2⁄

1 2⁄) = (2, 2) (

1 2⁄

1 2⁄) = 2

𝑈2(𝜎1∗, 𝐼) = 𝜎1𝐴2𝜎2

𝑇 = (1 2⁄ , 0, 1 2⁄ ) (2 43 12 0

) (10) = (2, 2) (

10) = 2

𝑈2(𝜎1∗, 𝐷) = 𝜎1𝐴2𝜎2

𝑇 = (1 2⁄ , 0, 1 2⁄ ) (2 43 12 0

) (01) = (2, 2) (

01) = 2

𝑈2(𝜎1∗, (4 5⁄ , 1 5⁄ )) = 𝜎1𝐴2𝜎2

𝑇 = (1 2⁄ , 0, 1 2⁄ ) (2 43 12 0

) (4 5⁄

1 5⁄) = (2, 2) (

4 5⁄

1 5⁄) = 2

𝑈2(𝜎1∗, (𝑝2

1, 1 − 𝑝21)) = 𝜎1𝐴2𝜎2

𝑇 = (1 2⁄ , 0, 1 2⁄ ) (2 43 12 0

)(𝑝21

1 − 𝑝21) = (2, 2) (

𝑝21

1 − 𝑝21) = 2

Page 74: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Equilibrios de Nash en Estrategias Mixtas en Juegos 2 × 2

Para calcular los Equilibrios de Nash en juegos 2 × 2 se usa la siguiente propiedad de las estrategias mixtas:

Una estrategia mixta es respuesta óptima a otra estrategia pura o mixta determinada, si y solo si sus estrategias puras soporte son respuesta óptima. Como consecuencia tales estrategias puras producen ganancias iguales y máximas, dada la estrategia del otro jugador (PJC, 2004: 158).

El procedimiento para obtener gráficamente los Equilibrios de Nash se resume a continuación (PJC, id.):

i. Fíjense estrategias mixtas genéricas (𝑝, 1 − 𝑝) y (𝑞, 1 − 𝑞); ii. Calcúlese la utilidad esperada que obtiene el jugador 1 de cada estrategia pura cuando la estrategia

del jugador 2 es (𝑞, 1 − 𝑞); iii. Seguidamente, calcúlese la correspondencia de respuesta óptima del Jugador 1, 𝑅1(𝑞); iv. Procédase con el Jugador 2, calculando la utilidad esperada de cada una de las estrategias puras

cuando la estrategia del jugador 1 es (𝑝, 1 − 𝑝). v. Calcule a continuación la correspondencia de respuesta óptima del jugador 2, 𝑅2(𝑝);

Page 75: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

vi. Represente gráficamente las correspondencias 𝑅𝑖(∙) en el plano 𝑝, 𝑞. Los Equilibrios de Nash se

encuentran en los puntos en los que 𝑅1(𝑞) y 𝑅2(𝑝) se intersecan. Ejemplo (PJC, 2004: 158~): Matching Pennies. Considere de nuevo el siguiente juego:

Jugador 2 Cara Sello

Jugador 1 Cara 1, -1 -1, 1

Sello -1, 1 1, 1

i. Sean 𝜎1 = (𝑝, 1 − 𝑝) y 𝜎2 = (𝑞, 1 − 𝑞)

ii. Fije (𝑞, 1 − 𝑞). En el caso del Jugador 1 se tiene:

𝑈1(𝐶𝑎𝑟𝑎, (𝑞, 1 − 𝑞)) = 𝑞(1) + (1 − 𝑞)(−1) = 2𝑞 − 1

𝑈1(𝑆𝑒𝑙𝑙𝑜, (𝑞, 1 − 𝑞)) = 𝑞(−1) + (1 − 𝑞)(1) = 1 − 2𝑞

iii. Se tienen las siguientes situaciones:

𝑈1(𝐶𝑎𝑟𝑎, (𝑞, 1 − 𝑞)) > 𝑈1(𝑆𝑒𝑙𝑙𝑜, (𝑞, 1 − 𝑞)) ⟷ 2𝑞 − 1 > 1 − 2𝑞 ⟷ 𝑞 > 1 2⁄

𝑈1(𝐶𝑎𝑟𝑎, (𝑞, 1 − 𝑞)) < 𝑈1(𝑆𝑒𝑙𝑙𝑜, (𝑞, 1 − 𝑞)) ⟷ 2𝑞 − 1 < 1 − 2𝑞 ⟷ 𝑞 < 1 2⁄

Page 76: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

𝑈1(𝐶𝑎𝑟𝑎, (𝑞, 1 − 𝑞)) = 𝑈1(𝑆𝑒𝑙𝑙𝑜, (𝑞, 1 − 𝑞)) ⟷ 2𝑞 − 1 = 1 − 2𝑞 ⟷ 𝑞 = 1 2⁄

En consecuencia,

La respuesta óptima del jugador 1 a cualquier (𝑞, 1 − 𝑞) será Cara si 𝑞 > 1 2⁄ ;

La respuesta óptima del jugador 1 a cualquier (𝑞, 1 − 𝑞) será Sello si 𝑞 < 1 2⁄ ;

La respuesta óptima del jugador 1 a cualquier (𝑞, 1 − 𝑞) será Cara o Sello si 𝑞 = 1 2⁄ ;

𝑅1(𝑞) = {

𝑝 = 0(𝐽𝑢𝑔𝑎𝑟 𝑆𝑒𝑙𝑙𝑜) ↔ 𝑞 < 1 2⁄

𝑝 = 1(𝐽𝑢𝑔𝑎𝑟 𝐶𝑎𝑟𝑎) ↔ 𝑞 > 1 2⁄

𝑝 ∈ [0,1] ↔ 𝑞 = 1 2⁄

Page 77: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

iv. Fije ahora (𝑝, 1 − 𝑝) para el Jugador 1. Calcule los pagos esperados para el Jugador 2. En este caso,

𝑈2((𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) = 𝑝(−1) + (1 − 𝑝)(1) = 1 − 2𝑝

𝑈2((𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) = 𝑝(1) + (1 − 𝑝)(−1) = 2𝑝 − 1

Se tienen las siguientes situaciones:

𝑈2((𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) > 𝑈2((𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) ⟷ 1 − 2𝑝 > 2𝑝 − 1 ⟷ 𝑝 < 1 2⁄

𝑈2((𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) < 𝑈2((𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) ⟷ 1 − 2𝑝 < 2𝑝 − 1 ⟷ 𝑝 > 1 2⁄

𝑈2((𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) = 𝑈2((𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) ⟷ 1 − 2𝑝 = 2𝑝 − 1 ⟷ 𝑝 = 1 2⁄

En este caso, la correspondencia de respuesta óptima del Jugador 2 es:

𝑅2(𝑝) = {

𝑞 = 0(𝐽𝑢𝑔𝑎𝑟 𝑆𝑒𝑙𝑙𝑜) ↔ 𝑝 > 1 2⁄

𝑞 = 1(𝐽𝑢𝑔𝑎𝑟 𝐶𝑎𝑟𝑎) ↔ 𝑝 < 1 2⁄

𝑞 ∈ [0,1] ↔ 𝑝 = 1 2⁄

Page 78: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

En términos gráficos, la Correspondencia de Respuesta Óptima del Jugador 2:

Page 79: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Combinando los gráficos de 𝑅1(𝑞) y 𝑅2(𝑝) en el espacio 𝑝, 𝑞:

Page 80: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: La Batalla de los Sexos (otra vez!)

Los pagos en este juego son los que aparecen en seguida:

Jugador 2 Cine Fútbol

Jugador 1 Cine 1, 2 0, 0

Fútbol 0, 0 2, 1

El juego tiene dos equilibrios de Nash en estrategias puras. Considere para el jugador 2 la estrategia mixta

𝜎2 = (𝑞, 1 − 𝑞). El jugador 1 obtiene los siguientes niveles de utilidad para cada una de sus estrategias puras así:

𝑈1(𝐶𝑖𝑛𝑒, 𝜎2) = (1)𝑞 + 0(1 − 𝑞) = 𝑞

𝑈1(𝐹𝑢𝑡𝑏𝑜𝑙, 𝜎2) = (0)𝑞 + 2(1 − 𝑞) = 2 − 2𝑞

𝑈1(𝐶𝑖𝑛𝑒, 𝜎2) = 𝑈1(𝐹𝑢𝑡𝑏𝑜𝑙, 𝜎2) ↔ 𝑞 = 2 − 2𝑞 → 𝑞 = 2/3

Cuando 𝑞 = 2/3, J1 es indiferente respecto de sus dos estrategias puras y por lo tanto respecto de cualquiera de sus estrategias mixtas

Page 81: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

La correspondencia de respuesta óptima para J1 es:

𝑅1(𝜎2) = {

𝑝 = 1 ↔ 𝑞 > 2/3𝑝 = 0 ↔ 𝑞 < 2/3

𝑝 ∈ [0,1] ↔ 𝑞 = 2/3

Ahora considere 𝜎1 = (𝑝, 1 − 𝑝). Para J2 las ganancias esperadas serán:

𝑈2((𝑝, 1 − 𝑝), 𝐶𝑖𝑛𝑒) = 2𝑝 + 0(1 − 𝑝) = 2𝑝

𝑈2((𝑝, 1 − 𝑝), 𝐹𝑢𝑡𝑏𝑜𝑙) = 0𝑝 + 1(1 − 𝑝) = 1 − 1𝑝

𝑈2((𝑝, 1 − 𝑝), 𝐶𝑖𝑛𝑒) = 𝑈2((𝑝, 1 − 𝑝), 𝐹𝑢𝑡𝑏𝑜𝑙) ↔ 2𝑝 = 1 − 1𝑝 → 𝑝 =1

3

𝑅2(𝜎1) = {

𝑞 = 1 ↔ 𝑝 > 1/3𝑞 = 0 ↔ 𝑝 < 1/3

𝑞 ∈ [0,1] ↔ 𝑝 = 1/3

Page 82: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Gráficamente:

Page 83: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Ejemplo: Halcón-Paloma (otra vez!)

Dos individuos pueden comportarse de manera agresiva (Halcón) o pacífica (Paloma) por la posesión de un objeto de valor, V. Si los dos se comportan en modo agresivo, del conflicto resultante surgirán unos costos C. Si ambos se comportan de manera conciliadora, se repartirán el objeto. Si uno se comporta en forma pacífica y el otro no, el pacífico no obtienen nada y el agresivo se quedará con todo. Los pagos en este juego son los que aparecen en seguida:

Jugador 2 Paloma Halcón

Jugador 1 Paloma 𝑉 2⁄ , 𝑉 2⁄ 0, 𝑉

Halcón 𝑉, 0 𝑉 2⁄ − 𝐶, 𝑉 2 − 𝐶⁄

Sean 𝑉 = 2 y 𝐶 = 4. Los pagos para este juego son:

Jugador 2 Halcón Paloma

Jugador 1 Halcón 1, 1 0, 2

Paloma 2, 0 -3, -3

El Juego presenta dos EN en estrategias puras: (Paloma, Halcón), (Halcón, Paloma).

Page 84: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Suponga que para J1 𝜎1 = (𝑝, 1 − 𝑝) y que para J2 𝜎1 = (𝑞, 1 − 𝑞). Las utilidades esperadas serán:

𝑈1 = (𝑝, 1 − 𝑝) (1 0

2 −3) (

𝑞

1 − 1) = 3𝑝 + 5𝑞 − 4𝑝𝑞 − 3

𝑈2 = (𝑝, 1 − 𝑝) (1 2

0 −3) (

𝑞

1 − 1) = 5𝑝 + 3𝑞 − 4𝑝𝑞 − 3

El Jugador 1 maximiza su ganancia esperada, i.e., resuelve:

max𝑝𝑈1 = 3𝑝 + 5𝑞 − 4𝑝𝑞 − 3

Las condiciones relevantes para óptimo son:

𝜕𝑈1𝜕𝑝= 3 − 4𝑞 = 0 → (𝑞, 1 − 𝑞) = (3 4⁄ , 1 4⁄ )

Note que 3 − 4𝑞 < 0 → −4𝑞 < −3. Multiplicando ambos lados por (-1) se tiene que si 𝑞 > 3/4

el beneficio máximo de J1 se torna negativo. Por lo tanto, si 𝑞 > 3/4, esto es, si J2 juega Paloma, J1

debería hacer 𝑝 = 0, esto es, deberá jugar Halcón.

Si 3 − 4𝑞 > 0 → 𝑞 < 3/4 y J1 deberá jugar 𝑝 = 1, i.e., deberá jugar paloma.

Cuando 3 − 4𝑞 = 0, 𝑞 = 3/4 y J1 será indiferente entre jugar Halcón o Paloma así como respecto de cualquier otra estrategia mixta a su disposición.

Page 85: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Por su parte, el Jugador 2 deberá resolver:

max𝑞𝑈2 = 5𝑝 + 3𝑞 − 4𝑝𝑞 − 3

CPO:

𝜕𝑈2𝜕𝑞

= 3 − 4𝑝 = 0

El Jugador 2 deberá jugar Halcón (jugará 𝑞 = 0), siempre que J1 juegue 𝑝 > 3/4 (siempre que J1, juegue Paloma);

El Jugador 2 deberá jugar Paloma (jugará 𝑞 = 1) siempre que J1 juegue 𝑝 < 3/4 (i.e., siempre que J1, juegue Halcón);

El Jugador 2 será indiferente respecto de sus estrategias puras y de cualquier combinación lineal de

ellas, siempre que 𝑝 = 3/4

Page 86: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Gráficamente, el juego Halcón-Paloma adquiere la siguiente manifestación:

Page 87: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Teorema: Equilibrio de Nash (Existencia)

Sea el Juego Γ = [𝑁; 𝑆1, … , 𝑆𝑁; 𝑢1, … , 𝑢𝑁]. Suponga que se cumplen:

i. 𝑆𝑖 es subconjunto no vacío y compacto de ℝ𝑘

ii. 𝑢𝑖 es continua en 𝑆 = ∏ 𝑆𝑖 = 𝑆1 × 𝑆2 ×⋯× 𝑆𝑁𝑁𝑖=1 y es estrictamente cuasicóncava en 𝑠𝑖

Entonces, existe al menos un Equilibrio de Nash en Estrategias Puras para Γ Demostración: Ver Fundenberg and Tirole 1992.

Corolario (Nash, 1950): En todo juego finito Γ = [𝑁; 𝑆1, … , 𝑆𝑁; 𝑢1, … , 𝑢𝑁], existe al menos un Equilibrio de Nash en estrategias Mixtas bajo i. y ii. Demostración: Ver PJC 2004: 173

Page 88: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Apéndice: Teorema Punto Fijo [ Kakutani ]:

Sea 𝑋 un subconjunto compacto y convexo de ℝℓ y sea 𝑇: 𝑋 ⇉ 𝑋 una correspondencia tal que:

Para todo 𝑥 ∈ 𝑋 el conjunto 𝑇(𝑥) es no vacío y convexo

𝑇(𝑥) es hemicontinuo superior

Entonces, ∃𝑥∗ ∈ 𝑋 tal que 𝑥∗ ∈ 𝑇(𝑥)

Page 89: Segura   2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash // @JackFlash

Referencias Bauman, Y. (2009): Quantum Micro, Class Notes. Whitman College.

Barron, E.N. (2008): Game Theory. An Introduction. Hoboken (N.J.): John Wiley.

Fundenberg, D. and J. Tirole (1992): Game Theory. Cambridge: MIT press.

Gibbons, R. (1992): Un Primer Curso de Teoría de Juegos. Barcelona: Antoni Bosch.

Jehle, G. and P.J. Reny (2001): Advanced Microeconomic Theory. N.Y.: Addison-Wesley.

Lancaster, K. (2011): Mathematical Economics. N.Y.(N.Y.): Dover.

Manrique, O., E. Villa, G. Junca y S. Monsalve (1999): Competencia Imperfecta I: Equilibrio de Nash en Juegos Estaticos. Capítulo IV En: Monsalve, S. [ed.] (1999): Introducción a los Conceptos de Equilibrio en Economía. Bogotá: Universidad Nacional de Colombia.

Mas-Colell, A., M.D. Whinton and J.R.Green (1985): Microeconomic Theory. Oxford: Oxford University Press.

Monsalve, S. [ed.] (1999): Introducción a los Conceptos de Equilibrio en Economía. Bogotá: Universidad Nacional de Colombia.

Monsalve, S. y J. Arévalo [eds.] (2005): Un Curso de Teoría de Juegos Clásica. Bogotá: Universidad Externado de Colombia.

Montet, C. and D. Serra (2003): Game Theory & Economics. N.Y. (N.Y.): Palgrave.

Nash, John (1950): Equilibrium points in n-person games. Proceedings of the National Academy of Sciences 36(1):48-49.

Nash, John (1951): Non-Cooperative Games. The Annals of Mathematics 54(2):286-295.

Takayama, A. (1985): Mathematical Economics. Cambridge: Cambridge University Press.

Varian, H. (1993): Microeconomic Analysis. N.Y.: Norton & Co.