Este documento presenta la teoría de juegos y su aplicación a un ejemplo de campaña política. La teoría de juegos analiza situaciones de conflicto entre tomadores de decisiones racionales. En este caso, dos políticos deben elegir cómo distribuir su tiempo de campaña entre dos ciudades para maximizar sus votos. El problema se formula como un juego de dos personas y suma cero, con estrategias y una matriz de pagos. La solución se obtiene eliminando estrategias dominadas hasta alcanzar un equilibrio.
Teoría de Juegos: Análisis Estratégico de Decisiones
1. INVESTIGACIÓN DE
OPERACIONES
ECONÓMICAS II
Econ. Romel A. Rojas Melgarejo
TEMA :
Teoría de juegos
UNIVERSIDAD NACIONAL
“SANTIAGO ANTUNEZ DE
MAYOLO”
Departamento Académico de Economía y Contabilidad
2. Investigación de Operaciones II 2
La teoría de juegos fue creada por el matemático húngaro John Von
Neumann (1903-1957) y por Oskar Morgenstern (1902-1976) en
1944 gracias a la publicación de su libro “The Theory of Games
Behavior”.
Anteriormente, Cournot y Edgeworth habían anticipado ya ciertas
ideas, a las que se sumaron otras posteriores de los matemáticos
Borel y Zermelo que en uno de sus trabajos (1913) muestra que
juegos como el ajedrez son resolubles.
Sin embargo, no fue hasta la aparición del libro de Von Neumann y
Morgenstern que se comprendió la importancia de la teoría de
juegos para estudiar las relaciones humanas.
Teoría de Juegos
INTRODUCCIÓN
3. Investigación de Operaciones II 3
Von Neumann y Morgenstern investigaron dos planteamientos
distintos de la Teoría de Juegos:
El primero de ellos el planteamiento estratégico o no
cooperativo. Este planteamiento requiere especificar
detalladamente lo que los jugadores pueden y no pueden hacer
durante el juego, y después buscar cada jugador una estrategia
óptima.
En la segunda parte, desarrollaron el planteamiento coalicional
o cooperativo, en el que buscaron describir la conducta optima
en juegos con muchos jugadores. Puesto que este es un
problema mucho más difícil, sus resultados fueran mucho menos
precisos que los alcanzados para el caso de suma cero y dos
jugadores.
Teoría de Juegos
INTRODUCCIÓN
4. Investigación de Operaciones II 4
INTRODUCCIÓN
En los temas anteriores, vimos situaciones en las cuales un
tomador de decisiones –o un grupo de decisores- elige una
decisión óptima sin considerar el efecto que la decisión tiene en
otros tomadores de decisiones y viceversa.
Sin embargo, en muchas situaciones financieras, dos o más
personas que toman decisiones escogen en forma simultánea
una acción, y dicha acción que eligió cada persona, o jugador,
afecta las recompensas que obtienen los otros jugadores.
La teoría de juegos es útil para tomar decisiones en casos donde
dos o más tomadores de decisiones se enfrentan a un conflicto
de intereses. Sin embargo, nos enfocaremos al caso mas sencillo
conocido como juegos de dos personas y suma cero.
Teoría de Juegos
5. Investigación de Operaciones II 5
DEFINICIONES
Teoría de Juegos
1. JUEGO: situación interactiva especificada por el conjunto de
participantes, los posibles cursos de acción que puede seguir
cada participante, y el conjunto de utilidades.
2. ESTRATÉGIA: Si un jugador tiene en cuenta las reacciones de
otros jugadores para realizar su elección, se dice que el jugador
tiene una estrategia. Una estrategia es un plan de acción
completo que se lleva a cabo cuando se juega el juego. Se
explicita antes de que comience el juego, y prescribe cada
decisión que los agentes deben tomar durante el transcurso del
juego, dada la información disponible para el agente. La
estrategia puede incluir movimientos aleatorios.
6. Investigación de Operaciones II 6
DEFINICIONES
Teoría de Juegos
3. VALOR DEL JUEGO: El valor de un juego es una cierta asignación
de utilidades finales:
Se denomina valor de equilibrio si ningún jugador puede
mejorar su utilidad unilateralmente dado que los otros
jugadores se mantienen en sus estrategias.
Un equilibrio estratégico es aquel que se obtiene cuando,
dado que cada jugador se mantiene en su estrategia, ningún
jugador puede mejorar su utilidad cambiando de estrategia.
Alternativamente, un perfil de estrategias conforma un
equilibrio si las estrategias conforman la mejor respuesta a las
otras.
7. Investigación de Operaciones II 7
DEFINICIONES
Teoría de Juegos
4. MATRIZ DE PAGO: muestra los resultados para todas las
combinaciones de alternativas de decisión y estados de la
naturaleza. Las entradas pueden expresar utilidad, costo, tiempo
u otra medida de resultado apropiada según la situación.
Donde: 𝑱 𝟏 representa el jugador fila y 𝑱 𝟐 el jugador columna.
Además tenemos que:
𝒂𝒊𝒋: Pago que recibe 𝑱 𝟏, si elige la i-ésima estrategia y 𝑱 𝟐 elige la
j-ésima estrategia.
𝒃𝒊𝒋: Pago que recibe 𝑱 𝟐, si elige la j-ésima estrategia y 𝑱 𝟏 elige la i-
ésima estrategia.
𝑱 𝟐
𝑱 𝟏
𝒂 𝟏𝟏, 𝒃 𝟏𝟏
𝒂𝒊𝒋, 𝒃𝒊𝒋
𝒂 𝒎𝒏, 𝒃 𝒎𝒏
8. Investigación de Operaciones II 8
FORMULACIÓN DE JUEGOS DE DOS PERSONAS Y
SUMA CERO
Para ilustrar las características básicas de modelo de juegos de dos
personas de suma cero, considere el juego llamado pares y nones.
Consiste en que los dos jugadores muestran al mismo tiempo uno o
dos dedos. Si el numero total de dedos mostrados por ambos
jugadores es par, el jugador que apuesta a pares (por ejemplo 𝑱 𝟏)
gana la apuesta (digamos $ 1.00) al jugador que elige nones. Si el
numero de dedos es impar, 𝑱 𝟏 paga $ 1.00 al 𝑱 𝟐.
Entonces, cada jugador tiene dos estrategias: mostrar uno o dos
dedos. El pago (en US$) que resulta para 𝑱 𝟏 se muestra en una
matriz de pagos (siguiente diapositiva).
Teoría de Juegos
9. Investigación de Operaciones II 9
FORMULACIÓN DE JUEGOS DE DOS PERSONAS Y SUMA CERO
Teoría de Juegos
Tabla 01: matriz de pagos del juego de pares y nones
Estrategia Jugador 2
1 2
Jugador 1
1 1 -1
2 -1 1
En general, un juego de dos personas se caracteriza por:
1. Las estrategias del jugador 1.
2. Las estrategias del jugador 2.
3. La matriz de pagos.
Previo al juego, 𝑱 𝟏 y 𝑱 𝟐 conocen sus estrategias, las de su oponente
y la matriz de pagos. Una jugada real consiste en que 𝑱 𝟏 y 𝑱 𝟐 elijan
simultáneamente una estrategia sin saber la elección del otro.
10. Investigación de Operaciones II 10
FORMULACIÓN DE JUEGOS DE DOS PERSONAS Y SUMA CERO
Teoría de Juegos
Observaciones:
Una estrategia puede ser una acción sencilla (mostrar un numero
par o non de dedos). Sin embargo, en juegos mas complejos que
implican en si una serie de movimientos, una estrategia es una
regla predeterminada que especifica por completo como se
intenta responder a cada circunstancia posible en cada etapa del
juego (el ajedrez: número de estrategias puede ser muy elevada).
Por lo general, la matriz de pagos muestra la ganancia (positiva o
negativa) del jugador 1 que resultaría con cada combinación de
estrategias de los dos jugadores (se presenta solo la matriz del
𝑱 𝟏 ya que del 𝑱 𝟐 es el negativo de 𝑱 𝟏).
11. Investigación de Operaciones II 11
Teoría de Juegos
FORMULACIÓN DE JUEGOS DE DOS PERSONAS Y SUMA CERO
Aclaremos que el resultado con valor «2» en la matriz de pagos
debe valer «el doble» para el jugador 1 que el resultado
correspondiente a un valor de «1». Así, si se da a elegir entre 1)
recibir, con 50% de probabilidad, $ 2 millones o nada, 2) recibir $ 1
millón con seguridad; dada la elección, debe serle indiferente 50%
de posibilidades de recibir el primer resultado (en lugar de nada) y
recibir en definitiva el ultimo resultado.
Un objetivo primordial de la teoría de juegos es desarrollar criterios
racionales para seleccionar una estrategia, los cuales implican dos
supuestos importantes:
1. Ambos jugadores son racionales.
2. Ambos jugadores eligen sus estrategias solo para promover su
propio bienestar (sin compasión para el oponente).
12. Investigación de Operaciones II 12
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Dos políticos compiten entre si por un escaño en el congreso. Así,
elaboran sus planes para los últimos días de campaña que son
cruciales en su deseo de ser electos. Desean hacer campaña en dos
ciudades Huaraz y Chimbote. Para evitar pérdidas de tiempo, están
planeando viajar en la noche y pasar un día completo en cada
ciudad o dos días en sólo una de ellas. Como deben hacer los
arreglos por adelantado, ninguno de los dos sabrá lo que su
oponente tiene planeado hasta después de concretar sus propios
planes. Cada candidato tiene un jefe de campaña en cada ciudad
para asesorarlo en cuanto al impacto que tendrán (en términos de
votos ganados o perdidos) las distintas combinaciones posibles de
los días dedicados a cada ciudad por ellos o por sus oponentes. Con
esta información deben escoger su mejor estrategia para los dos
días.
13. Investigación de Operaciones II 13
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Formulación como un juego de dos personas y suma cero:
Para ello, se deben identificar los dos jugadores (los dos políticos),
las estrategias de cada jugador y la matriz de pagos.
Según los datos del problema, cada jugador tiene tres estrategias:
Estrategia 1: pasar un día en cada ciudad.
Estrategia 2: Pasar ambos días en Huaraz.
Estrategia 3.: pasar ambos días en Chimbote.
Cada elemento de la matriz de pagos para el jugador 1 representa la
utilidad para ese jugador (o la utilidad negativa para el jugador 2) de
los resultados obtenidos cuando los dos jugadores utilizan las
estrategias correspondientes..
14. Investigación de Operaciones II 14
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Formulación como un juego de dos personas y suma cero:
Desde el punto de vista de los políticos, el objetivo es ganar votos y
cada voto adicional (antes de conocer el resultado de las elecciones)
tiene el mismo valor para él.
Entonces, los elementos apropiados en la matriz de pagos se darán
en términos del total neto de votos ganados a su oponente (esto es,
la suma de la cantidad neta de cambios de votos en las dos
ciudades) que resulten de estos dos días de campaña. En la Tabla 02
se resume esta formulación.
La teoría de juegos supone que ambos jugadores usan la misma
información (incluso los mismos pagos para el jugador 1) para elegir
sus estrategias.
15. Investigación de Operaciones II 15
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Formulación como un juego de dos personas y suma cero:
Cuando se utiliza la forma dada en la tabla 02 se pueden obtener
tres conjuntos de datos alternativos para la matriz de pagos, a fin de
ilustrar como se resuelven tres tipos distintos de juegos.
Tabla 02: Formulación de la matriz de pagos del problema de la
campaña política
Estrategia
Cantidad neta en unidades de votos ganados por el
político 1 (cada unidad equivale a 1000 votos)
Político 2
1 2 3
Político 1
1
2
3
16. Investigación de Operaciones II 16
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 1: Método de la estrategia dominada
Con esta matriz de pagos, ¿qué estrategia debe seguir cada uno de
los jugadores?. La respuesta se puede obtener con sólo aplicar el
concepto de estrategia dominada, que nos dice que se puede
eliminar una estrategia cuando está dominada por otra; es decir, si
existe otra estrategia que siempre es al menos tan buena como
ésta, sin importar lo que hace el oponente.
Tabla 02: Matriz de pagos de la variación 1 del problema de la campaña
política
Estrategia Político 2
1 2 3
Político 1
1 1 2 4
2 1 0 5
3 0 1 -1
17. Investigación de Operaciones II 17
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 1: Método de la estrategia dominada
Inicialmente, la matriz de pagos no presenta estrategias dominadas
para el jugador 2. Para el jugador 1 la estrategia 3 está dominada
por la estrategia 1 ya que tiene pagos más altos (1>0; 2>1; 4>-1)
independientemente de lo que hace el jugador 2. Al eliminar la
estrategia 3 del jugador 1, la matriz de pagos quedaría reducida de
la siguiente manera:
Estrategia Político 2
1 2 3
Político 1
1 1 2 4
2 1 0 5
18. Investigación de Operaciones II 18
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 1: Método de la estrategia dominada
Como se supone que ambos jugadores son racionales, también el
jugador 2 puede deducir que el jugador 1 sólo dispone de estas dos
estrategias. Entonces, ahora el jugador 2 tiene una estrategia
dominada: la estrategia 3, que está dominada tanto por la estrategia
1 como por la 2, puesto que siempre tiene menores pérdidas (pagos
al jugador 1) en esta matriz de pagos reducida. Al eliminar al
estrategia 2, para el jugador 2, la matriz quedará reducida así:
Estrategia Político 2
1 2
Político 1
1 1 2
2 1 0
19. Investigación de Operaciones II 19
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 1: Método de la estrategia dominada
Ahora, la estrategia 2 del jugador 1 se convierte en dominada por la
estrategia 1, ya que esta última es mejor en la columna 2 (2>0) y es
igual en la columna 1 (1=1). Si se elimina la estrategia dominada, se
llega a:
Ahora, la estrategia 2 del jugador 2 está dominada por la estrategia
1, con lo que la matriz de pagos, por último, queda de la siguiente
manera:
Estrategia Político 2
1 2
Político 1 1 1 2
Estrategia Político 2
1
Político 1 1 1
20. Investigación de Operaciones II 20
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 1: Método de la estrategia dominada
En consecuencia, ambos jugadores deberán elegir su estrategia 1.
Con esta solución el jugador 1 recibirá un pago de 1 por parte del
jugador 2; esto es, el político 1 ganará 1000 votos al político 2.
En general, el pago al jugador 1, cuando ambos jugadores juegan de
manera óptima, recibe el nombre de valor de juego. Se dice que se
trata de un juego justo cuando el juego tiene un valor 0. Como este
juego, en particular, tiene un valor de 1, se trata de un juego no
justo.
El concepto de estrategia dominada es muy útil para reducir el
tamaño de la matriz de pagos y en algunos casos raros como éste,
puede identificar el valor de juego. Sin embargo, casi todos los
juegos requieren otro enfoque para terminar de resolverlos.
21. Investigación de Operaciones II 21
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 2: Criterio minimax
Ahora suponga que los datos de la matriz de pagos son los que se
muestran en la tabla 03. Este juego no tiene estrategias dominadas
por lo que no es obvio lo que deben hacer los jugadores. En este
caso, ¿cuál es la línea de razonamiento que recomienda la teoría de
juegos?.
Tabla 03: Matriz de pagos del jugador 1 en la
variación 2 del problema de la campaña política
Estrategia Jugador 2
1 2 3 Mínimo
Jugador
1
1 -3 -2 6 -3
2 2 0 2 0
3 5 -2 -4 -4
Máximo 5 0 6
Valor
maximin
Valor
minimax
22. Investigación de Operaciones II 22
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 2: Criterio minimax
Jugador 1: si elige la estrategia 1 puede ganar 6 o perder 3. Como el
jugador 2 es racional y buscará una estrategia que lo proteja de
pagos grandes al jugador 1, parece probable que si el jugador 1
juega la estrategia 1, perderá. De manera análoga, al seleccionar la
estrategia 3, el jugador 1 puede ganar 5, pero es probable que su
oponente racional evite esta pérdida y logre que él pierda 4. Por
otro lado, si el jugado 1 elige la estrategia 2, tiene garantizado que
no perderá y quizá gane 2. Entonces, por proporcionar la mejor
garantía (un pago de cero) la estrategia 2 parece ser la elección
racional del jugador 1 contra su oponente racional. Esta línea de
razonamiento supone que ambos jugadores tienen aversión a
arriesgar pérdidas más grandes que las necesarias, al contrario de
aquellos individuos que disfrutan la apuesta por una gran paga con
pocas posibilidades.
23. Investigación de Operaciones II 23
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 2: Criterio minimax
Ahora el jugador 2: Puede perder tanto como 5 o 6 al usar las
estrategias 1 o 3, respectivamente. Pero está garantizado que al
menos empata con la estrategia 2. Entonces, si usa el mismo
razonamiento para buscar su mejor garantía contra su oponente
racional, parece que la mejor elección es la estrategia 2. Si ambos
jugadores eligen la estrategia 2 el resultado es un empate. Así,
ningún jugador mejora con su mejor garantía, pero ambos están
forzando a su oponente a la misma posición. Aunque cada jugador
deduzca la estrategia del otro, no puede explotar esta información
para mejorar su situación.
El producto final de esta línea de razonamiento, es que cada jugador
debe jugar de manera tal que minimice su pérdida máxima siempre
que el resultado de su elección no pueda ser aprovechado por su
oponente para mejorar su posición.
24. Investigación de Operaciones II 24
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 2: Criterio minimax
De hecho, este criterio dice que se seleccione la mejor estrategia
aún cuando la elección fuera anunciada al oponente antes de que el
oponente eligiera su estrategia. En términos de matriz de pagos
implica que el jugador 1 debe elegir aquella estrategia cuyo pago
mínimo sea el mayor; mientras que el jugador 2 debe elegir aquella
estrategia cuyo pago máximo al jugador 1 sea el menor. Este criterio
se muestra en la Tabla Nº 8 en donde se identifica a la estrategia 2
como la estrategia maximin para el jugador 1, y la estrategia 2 es la
estrategia minimax para el jugador 2. El pago de cero (0) que resulta
es el valor de juego (juego justo).
25. Investigación de Operaciones II 25
SOLUCIÓN DE JUEGOS SENCILLOS: EJEMPLO PROTOTIPO
Teoría de Juegos
Variación 2: Criterio minimax
En esta matriz de pagos el mismo elemento proporciona tanto el
valor mínimo como el valor máximo. Esto se debe al hecho de que
por un lado es el mínimo del reglón y, por otro, el máximo de la
columna. Esta posición del elemento se denomina punto silla. Ello
proporciona una solución estable o solución de equilibrio. Así,
ningún jugador puede aprovechar la estrategia de su oponente para
mejorar su posición. Si el jugador cambia su plan de usar la
estrategia 2 sólo aumentará sus pérdidas. De igual manera, si el
jugador 1 cambia su plan original de utilizar su estrategia 2, sólo
empeoraría su posición. Así ningún jugador tiene motivos para
considerar un cambio de estrategias ni para quedar con ventaja
respecto a su oponente, ni para evitar que su oponente quede con
ventaja.
26. Investigación de Operaciones II 26
Teoría de Juegos
Variación 3: juegos con estrategias mixtas
Algunos juegos sin punto silla requiere de un análisis mas complejo.
La información reciente sobre la campaña da como resultado la
matriz de pagos final de los dos políticos que se muestra a
continuación. ¿Como debe jugarse este juego?.
Tabla 04: Matriz de pagos del jugador 1 de la
variación 3 del problema de la campaña política
Estrategia Jugador 2
1 2 3 Mínimo
Jugador
1
1 0 -2 2 -2
2 5 4 -3 -3
3 2 3 -4 -4
Máximo 5 4 2
Valor
maximin
Valor
minimax
JUEGOS CON ESTRATEGIAS MIXTAS
27. Investigación de Operaciones II 27
Teoría de Juegos
Suponga que ambos jugadores quieren aplicar el criterio minimax. El 𝑱 𝟏 no
perderá más de dos si juega con su estrategia 1. De la misma manera, el
𝑱 𝟐 no perderá más de 2 si elige la estrategia 3. Sin embargo, en este caso,
el valor máximo (-2) y el valor mínimo (2) no resultado es que no hay
punto silla.
¿Qué pasaría si ambos jugadores emplean las estrategias mencionadas?. El
𝑱 𝟏 ganaría 2 al 𝑱 𝟐; como éste es racional, puede prever el resultado y
jugaría su estrategia 2 para tratar de ganar 2 en vez de perder 2. Como el
𝑱 𝟏 también es racional, vería este cambio y concluiría que él también
puede mejorar mucho si cambia a la estrategia 2 con lo cual ganaría 4 en
vez de perder 2. Al darse cuenta de esto, el 𝑱 𝟐 regresaría a su estrategia 3
para convertir la pérdida de 4 en una ganancia de 3. Este cambio obligaría
al 𝑱 𝟏 regresar a su estrategia 1, después de lo cual volvería a comenzar
todo el ciclo.
JUEGOS CON ESTRATEGIAS MIXTAS
28. Investigación de Operaciones II 28
Teoría de Juegos
Por tanto, aunque este juego se juega una sola vez, cualquier
elección tentativa de una estrategia deja al jugador en posición de
considerar un cambio de estrategia, ya sea para tener ventaja sobre
su oponente o para evitar que el oponente tenga ventaja sobre él.
Es decir, la solución sugerida al principio (estrategia 1 para el 𝑱 𝟏 y
estrategia 3 para el 𝑱 𝟐) es una solución inestable; con esto se ve la
necesidad de desarrollar una solución más satisfactoria.
El fracaso de las estrategias minimax - maximin (puras) en general,
para dar una solución óptima al juego, ha llevado a la idea de usar
estrategias mixtas. Cada jugador, en lugar de seleccionar una
estrategia pura solamente, puede jugar todas sus estrategias de
acuerdo a un conjunto predeterminado de probabilidades.
JUEGOS CON ESTRATEGIAS MIXTAS
29. Investigación de Operaciones II 29
JUEGOS CON ESTRATEGIAS MIXTAS
Teoría de Juegos
Es decir, cada jugador debe asignar una distribución de probabilidad sobre
su conjunto de estrategias. Sea:
𝒙𝒊 = Probabilidad de que el 𝑱 𝟏 utilice la estrategia «i» (i = 1, 2, 3, …m).
𝒚𝒋 = Probabilidad de que el 𝑱 𝟐 utilice la estrategia «j» (j = 1, 2, 3, …n)
Donde: «m» y «n» son los números respectivos de estrategias disponibles.
Entonces, el 𝑱 𝟏 especificará su plan de juego asignando valores a
𝒙 𝟏, 𝒙 𝟐, … 𝒙 𝒎. De igual forma, el plan del 𝑱 𝟐 se describe como los valores
asignados a 𝒚 𝟏, 𝒚 𝟐, … 𝒚 𝒎. Para ambos casos, como estos valores son
probabilidades tendrán que ser no negativos y sumar 1.
Por lo general, estos planes se describen (𝒙 𝟏, 𝒙 𝟐, … 𝒙 𝒎) y (𝒚 𝟏, 𝒚 𝟐, … 𝒚 𝒎) y
se denominan estrategias mixtas y las estrategias originales se denominan
estrategias puras.
30. Investigación de Operaciones II 30
Teoría de Juegos
En el momento de jugar es necesario que cada participante use una
de sus estrategia puras; pero ésta se seleccionará mediante algún
dispositivo aleatorio para obtener una observación aleatoria que
siga la distribución de probabilidad especificada por la estrategia
mixta; esta observación indicará la estrategia pura que se debe
utilizar.
Por ejemplo, suponga que 𝑱 𝟏 y 𝑱 𝟐 en la variación 3 (tabla 04) eligen
las estrategias mixtas (𝒙 𝟏, 𝒙 𝟐, 𝒙 𝟑) =(½, ½, 0) y (𝒚 𝟏, 𝒚 𝟐, 𝒚 𝟑) =(0, ½,
½), respectivamente. Esto indica que el 𝑱 𝟏 da igual oportunidad
(probabilidad = ½) a la elección de las estrategias (puras) 1 o 2 y está
descartando la estrategia 3. De igual manera, el 𝑱 𝟐 está eligiendo al
azar entre sus dos últimas estrategias puras.
JUEGOS CON ESTRATEGIAS MIXTAS
31. Investigación de Operaciones II 31
Teoría de Juegos
Pese a no contar con una medida de desempeño satisfactoria por
completo para evaluar las estrategias mixtas, el pago esperado es
una herramienta útil, que para el jugador 1, puede definirse de la
siguiente manera:
𝑷𝑬 𝟏 =
𝒊=𝟏
𝒎
𝒋=𝟏
𝒏
𝒑𝒊𝒋 𝒙𝒊 𝒚𝒋
Donde: 𝒑𝒊𝒋 es el pago si el 𝑱 𝟏 usa la estrategia pura «i» y el 𝑱 𝟏 usa la
estrategia pura «j». En el ejemplo, existen cuatro pagos posibles: (-
2; 2; 4; -3), donde cada uno ocurre con una probabilidad de ¼; por
tanto, el pago esperado es:
𝟏
𝟒
−𝟐 + 𝟐 + 𝟒 − 𝟑 =
𝟏
𝟒
; Esta medida
de desempeño no revela nada sobre los riesgos del juego, pero
indica a qué cantidad tiende el pago promedio si el juego se
efectuara muchas veces.
JUEGOS CON ESTRATEGIAS MIXTAS
32. Investigación de Operaciones II 32
Teoría de Juegos
Con esta medida, la teoría de juegos puede extender el concepto
del criterio minimax a juegos sin punto silla y que requieren de
estrategias mixtas. Este criterio, sostiene que un jugador debe elegir
la estrategia mixta que minimice la máxima pérdida que espera
para si mismo. Del mismo modo, si se analizan los pagos (𝑱 𝟏) en
lugar de las pérdidas (𝑱 𝟐 ), este criterio es maximin; es decir,
maximizar el pago esperado mínimo para el jugador.
Se entiende por pago esperado mínimo aquel pago esperado más
pequeño posible que puede resultar de cualquier estrategia mixta
con la que el oponente puede contar.
JUEGOS CON ESTRATEGIAS MIXTAS
33. Investigación de Operaciones II 33
Teoría de Juegos
JUEGOS CON ESTRATEGIAS MIXTAS
Así la estrategia mixta del 𝑱 𝟏 que es óptima, según este criterio, es
la que proporciona la garantía (el mínimo pago esperado) de que es
la mejor (máxima). El valor de esta mejor garantía es el valor
maximin y se denota por «𝒗». De manera similar, la estrategia
optima del 𝑱 𝟐 es la que proporciona la mejor garantía, donde mejor
implica mínima y garantía se refiere a la máxima perdida que
espera poder lograr con cualquiera de las estrategias mixtas del
oponente. La mejor garantía es el valor minimax y se denota por
« 𝒗».
Recuerde que cuando solo se emplean estrategias puras y no tiene
punto silla, los juegos resultan inestables (sin solución estable). La
razón esencial es que «𝒗 < 𝒗», por lo que los jugadores quieren
cambiar sus estrategias para mejorar su posición.
34. Investigación de Operaciones II 34
Teoría de Juegos
JUEGOS CON ESTRATEGIAS MIXTAS
De manera parecida, en los juegos con estrategias mixtas, es
necesario que «𝒗 = 𝒗», para que la solución óptima sea
estable.
Esta condición se refleja y se cumple en el Teorema minimax
de la teoría de juegos.
Teorema minimax: Si se permiten estrategias mixtas, el par de
estrategias que es óptimo de acuerdo con el criterio minimax,
proporciona una solución estable con «𝒗 = 𝒗 = 𝒗», (el valor
del juego), de manera que ninguno de los dos jugadores
puede mejorar cambiando unilateralmente su estrategia.
35. Investigación de Operaciones II 35
Teoría de Juegos
Ahora mostraremos cómo se encuentra la estrategia mixta
óptima para cada jugador. Existen varios métodos, uno de
ellos es el método gráfico que se utiliza siempre que uno de
los dos jugadores tenga sólo dos estrategias puras (no
dominadas). Cuando se trata de juegos más grandes el
método más empleado es en transformar el problema en uno
de programación lineal que puede resolverse mediante el
método simplex.
JUEGOS CON ESTRATEGIAS MIXTAS
36. Investigación de Operaciones II 36
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Considere cualquier juego con estrategias mixtas, tal que después
de eliminar las estrategias dominadas, uno de los jugadores tiene
solo dos estrategias puras (sea 𝑱 𝟏). Como sus estrategias mixtas son
(𝒙 𝟏, 𝒙 𝟐) y 𝒙 𝟐 = 𝟏 − 𝒙 𝟏, nada mas debe obtener el valor óptimo de
𝒙 𝟏. Sin embargo, resulta directo y sencillo hacer la grafica del pago
esperado como una función de 𝒙 𝟏 para cada una de las estrategias
su oponente.
Esta gráfica se utiliza para identificar el punto que maximiza el
mínimo pago esperado y, además, la estrategia mixta minimax del
oponente.
37. Investigación de Operaciones II 37
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Consideremos la variación 3 del problema de la campaña política.
La 3ª estrategia pura del jugador 1 esta dominada por la 2ª. Por lo
que la matriz de pagos se puede reducir a:
Tabla 05: Matriz de pagos del jugador 1 de la variación 3 del
problema de la campaña política
Estrategia Jugador 2
1 2 3
Jugador 1
1 0 -2 2
2 5 4 -3
3 2 3 -4
Jugador 2
Probabilidad 𝒚 𝟏 𝒚 𝟐 𝒚 𝟑
Probabilidad Estrategia pura 1 2 3
Jugador 1
𝒙 𝟏 1 0 -2 2
𝟏 − 𝒙 𝟏 2 5 4 -3
38. Investigación de Operaciones II 38
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Entonces para cada estrategia pura de que dispone el jugador 2, el
pago esperado para el jugador 1 será:
Luego graficamos estas rectas del pago esperado. Para cualquier
valor dado de 𝒙 𝟏 y de (𝒚 𝟏, 𝒚 𝟐, 𝒚 𝟑), el pago esperado será el
promedio ponderado apropiado de los puntos correspondientes a
estas tres rectas. En particular:
Pago esperado para el 𝑱 𝟏= 𝒚 𝟏 𝟓 − 𝟓𝒙 𝟏 + 𝒚 𝟐 𝟒 − 𝟔𝒙 𝟏 +
𝒚 𝟑 −𝟑 + 𝟓𝒙 𝟏
(𝒚 𝟏, 𝒚 𝟐, 𝒚 𝟑) Pago esperado
(1, 0, 0)
(0, 1, 0)
(0, 0, 1)
𝟎𝒙 𝟏 + 𝟓 𝟏 − 𝒙 𝟏 = 𝟓 − 𝟓𝒙 𝟏
−𝟐𝒙 𝟏 + 𝟒 𝟏 − 𝒙 𝟏 = 𝟒 − 𝟔𝒙 𝟏
𝟐𝒙 𝟏 + 𝟑 𝟏 − 𝒙 𝟏 = −𝟑 + 𝟓𝒙 𝟏
39. Investigación de Operaciones II 39
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
0
3
2
-1
6
1
-2
-3
-4
5
4
11/4 3/41/2
Punto maximin
𝒙 𝟏
Pagoesperado
40. Investigación de Operaciones II 40
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Recuerde que el jugador 2 quiere minimizar este pago esperado
para el jugador 1. Dado x1, el jugador 2 puede minimizar este pago
esperado eligiendo la estrategia pura que corresponde a la recta
“inferior” de esa 𝒙 𝟏 en el gráfico. Podría ser −𝟑 + 𝟓𝒙 𝟏 o
𝟒 − 𝟔𝒙 𝟏 pero no 𝟓 − 𝟓𝒙 𝟏 . Según el criterio minimax (o
maximin), el jugador 1 quiere maximizar este pago esperado
mínimo. En consecuencia, debe elegir el valor de 𝒙 𝟏 para el que la
recta inferior tenga su mayor valor; es decir, el valor en que las
rectas −𝟑 + 𝟓𝒙 𝟏 y 𝟒 − 𝟔𝒙 𝟏 se intersectan. Esto proporciona un
pago esperado de:
𝒗 = 𝒗 = max
𝟎≤𝒙 𝟏≤𝟏
𝒎í𝒏 −𝟑 + 𝟓𝒙 𝟏, 𝟒 − 𝟔𝒙 𝟏
41. Investigación de Operaciones II 41
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Por tanto, el valor óptimo de x1 es el que se encuentra en la
intersección de las dos rectas −𝟑 + 𝟓𝐱 𝟏 y 𝟒 − 𝟔𝐱 𝟏 . Resolviendo
algebraicamente, se obtiene:
−𝟑 + 𝟓𝐱 𝟏 = 𝟒 − 𝟔𝐱 𝟏
De donde se obtiene que 𝐱 𝟏 = 𝟕
𝟏𝟏 y 𝐱 𝟐 = 𝟒
𝟏𝟏
Por tanto: (𝐱 𝟏, 𝐱 𝟐) = ( 𝟕
𝟏𝟏 , 𝟒
𝟏𝟏) es la estrategia mixta óptima del
jugador 1. Además:
𝒗 = 𝒗 = −𝟑 + 𝟓𝐱 𝟏 = −𝟑 + 𝟓 𝟕
𝟏𝟏
𝒗 = 𝒗 = 𝟐
𝟏𝟏
Es el valor del juego.
42. Investigación de Operaciones II 42
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Para encontrar la estrategia mixta óptima para el jugador 2, el
razonamiento es el siguiente: de acuerdo con la definición del valor
minimax « 𝒗» y el teorema minimax, el pago esperado que se
obtiene con esta estrategia (𝐲 𝟏, 𝐲 𝟐, 𝐲 𝟑) = 𝐲 𝟏
∗
, 𝐲 𝟐
∗
, 𝐲 𝟑
∗
tendrá que
satisfacer la condición:
𝐲 𝟏
∗
𝟓 − 𝟓𝐱 𝟏 + 𝐲 𝟐
∗
𝟒 − 𝟔𝐱 𝟏 + 𝐲 𝟑
∗
−𝟑 + 𝟓𝐱 𝟏 ≤ 𝒗 = 𝒗 = 𝟐
𝟏𝟏
Para todos los valores de 𝐱 𝟏(𝟎 ≤ 𝒙 𝟏 ≤ 𝟏). Mas aun, cuando el
jugador 1 juega de manera optima – esto es 𝐱 𝟏 = 𝟕
𝟏𝟏 - esta
desigualdad será una igualdad – por el teorema minimax -, de
manera que:
𝟐𝟎
𝟏𝟏
𝐲 𝟏
∗
+
𝟐
𝟏𝟏
𝐲 𝟐
∗
+
𝟐
𝟏𝟏
𝐲 𝟑
∗
= 𝒗 = 𝟐
𝟏𝟏
43. Investigación de Operaciones II 43
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Como 𝐲 𝟏
∗
, 𝐲 𝟐
∗
, 𝐲 𝟑
∗
es una distribución de probabilidad,
también se sabe que:
𝐲 𝟏
∗
+ 𝐲 𝟐
∗
+ 𝐲 𝟑
∗
= 𝟏
Por lo tanto, 𝐲 𝟏
∗
= 𝟎, puesto que 𝒚 𝟏 > 𝟎 violaría la penúltima
ecuación; es decir, en la grafica, el pago esperado en el punto
𝐱 𝟐 = 𝟕
𝟏𝟏 estaría por encima por encima del punto maximin.
En general, a cualquier recta que no pasa por el punto
maximin se le debe asignar un peso de cero para evitar que el
pago esperado tenga un valor mas alto que este punto.
44. Investigación de Operaciones II 44
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Entonces:
𝐲 𝟐
∗
𝟒 − 𝟔𝒙 𝟏 + 𝐲 𝟑
∗
−𝟑 + 𝟓𝒙 𝟏
≤
𝟐
𝟏𝟏
𝒑𝒂𝒓𝒂 𝟎 ≤ 𝒙 𝟏 ≤ 𝟏,
=
𝟐
𝟏𝟏
𝒑𝒂𝒓𝒂 𝒙 𝟏 =
𝟕
𝟏𝟏
Pero 𝐲 𝟐
∗
y 𝐲 𝟑
∗
son números y, entonces, el lado derecho es la
ecuación de una recta, lo cual es un peso ponderado fijo de las dos
rectas “inferiores” de la gráfica. Como la ordenada de esta recta
debe ser igual a 𝟐
𝟏𝟏, en el punto 𝒙 𝟏 = 𝟕
𝟏𝟏 y como nunca debe
exceder 𝟐
𝟏𝟏 , la recta necesariamente es horizontal. (Esta
conclusión siempre es válida a menos que el valor óptimo de𝒙 𝟏 sea
0 o 1, en cuyo caso el jugador 2 también debe usar una sola
estrategia pura).
45. Investigación de Operaciones II 45
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Por tanto:
𝐲 𝟐
∗
𝟒 − 𝟔𝒙 𝟏 + 𝐲 𝟑
∗
−𝟑 + 𝟓𝒙 𝟏 =
𝟐
𝟏𝟏
; para 𝟎 ≤ 𝒙 𝟏 ≤ 𝟏
Entonces, para obtener 𝐲 𝟐
∗
y 𝐲 𝟑
∗
se seleccionan dos valores de 𝒙 𝟏
(como 0 y 1) y se resuelven las dos ecuaciones simultaneas
obtenidas. Así:
𝟒𝐲 𝟐
∗
−3𝐲 𝟑
∗
=
𝟐
𝟏𝟏
−𝟐𝐲 𝟐
∗
+2𝐲 𝟑
∗
=
𝟐
𝟏𝟏
De donde: 𝐲 𝟐
∗
= 𝟓
𝟏𝟏 y 𝐲 𝟑
∗
= 𝟔
𝟏𝟏. Por tanto, la estrategia mixta
optima del jugador 2 es (𝐲 𝟏, 𝐲 𝟐, 𝐲 𝟑) = 𝟎, 𝟓
𝟏𝟏 , 𝟔
𝟏𝟏
46. Investigación de Operaciones II 46
PROCEDIMIENTO DE SOLUCIÓN GRAFICA
Teoría de Juegos
Si en algún otro problema ocurre que mas de dos rectas pasan por
el punto maximin, de manera que mas de dos valores 𝐲𝐣
∗
pueden ser
mayores que cero, entonces habría muchos empates en el caso de
la estrategia mixta optima del jugador 2. una de estas estrategias se
puede identificar si se igualan en forma arbitraria todas menos dos
de estos valores 𝐲𝐣
∗
a cero y se obtienen las dos restantes como se
acaba de describir. En el caso de esas dos 𝐲𝐣
∗
, las rectas asociadas
deben tener una pendiente positiva en un caso y una pendiente
negativa en el otro.
El mismo razonamiento empleado en el procedimiento grafico se
puede usar para resolver cualquier juego con estrategias mixtas que
tenga solo dos estrategias puras no dominadas de uno de los
jugadores.
47. Investigación de Operaciones II 47
SOLUCIÓN MEDIANTE PROGRAMACIÓN LINEAL
Teoría de Juegos
Cualquier juego de estrategias mixtas se puede resolver en forma
muy sencilla si se lo transforma en un problema de programación
lineal (PL). Como se vera, esta transformación requiere apenas un
poco mas que la aplicación del teorema minimax y el uso de la
definición de valor maximin 𝒗 y valor minimax 𝒗.
Primero consideremos como se encuentra la estrategia mixta del
jugador 1:
𝑷𝑬 𝟏 =
𝒊=𝟏
𝒎
𝒋=𝟏
𝒏
𝒑𝒊𝒋 𝒙𝒊 𝒚𝒋
Y la estrategia 𝑥1, 𝑥2, . . . , 𝑥 𝑚 es optima si:
48. Investigación de Operaciones II 48
SOLUCIÓN MEDIANTE PROGRAMACIÓN LINEAL
Teoría de Juegos
Y la estrategia 𝒙 𝟏, 𝒙 𝟐, . . . , 𝒙 𝒎 es optima si:
𝒊=𝟏
𝒎
𝒋=𝟏
𝒏
𝒑𝒊𝒋 𝒙𝒊 𝒚𝒋 ≥ 𝒗 = 𝒗
Para todas las estrategias del oponente 𝒚 𝟏, 𝒚 𝟐, . . . , 𝒚 𝒏 . Entonces,
esta desigualdad se debe cumplir, por ejemplo, para cada una de las
estrategias puras del jugador 2, es decir, para cada una de las
estrategias 𝒚 𝟏, 𝒚 𝟐, . . . , 𝒚 𝒏 donde 𝒚 𝟏 = 𝟏 y el resto es igual a 0. Al
sustituir estos valores en la desigualdad se obtiene:
𝒋=𝟏
𝒏
𝒚𝒋
𝒊=𝟏
𝒎
𝒑𝒊𝒋 𝒙𝒊 ≥
𝒋=𝟏
𝒏
𝒚𝒋 𝒗 = 𝒗
49. Investigación de Operaciones II 49
SOLUCIÓN MEDIANTE PROGRAMACIÓN LINEAL
Teoría de Juegos
Por que:
𝒋=𝟏
𝒏
𝒚𝒋 = 𝟏
Como la implicación va en ambas direcciones, se concluye que
imponer este conjunto de «n» desigualdades lineales es
equivalente a requerir que la desigualdad original se cumpla para
todas las estrategias 𝒚 𝟏, 𝒚 𝟐, . . . , 𝒚 𝒏 . Pero estas «n» desigualdades
son restricciones validas en programación lineal, como lo son las
restricciones adicionales.
𝒙 𝟏 + 𝒙 𝟐+. . . +𝒙 𝒎 = 𝟎
𝒙𝒊 ≥ 𝟎, para i=1, 2, . . . , m
50. Investigación de Operaciones II 50
SOLUCIÓN MEDIANTE PROGRAMACIÓN LINEAL
Teoría de Juegos
Que se necesitan para asegurar que las 𝒙𝒊 sean probabilidades. Por
esta razón, cualquier solución 𝒙 𝟏, 𝒙 𝟐, . . . , 𝒙 𝒎 que satisfaga este
conjunto completo de restricciones de PL es la estrategia mixta
optima deseada.
En consecuencia, el problema de encontrar una estrategia mixta
optima se ha reducido a encontrar una solución factible para un
problema de PL. Las dos dificultades que quedan por resolver son
que: 1) se desconoce «𝒗», y 2) el problema de PL no tiene función
objetivo. Sin embargo, ambos obstáculos se puede superar al
mismo tiempo si se sustituye la constante desconocida «𝒗», por la
variable 𝒙 𝒎+𝟏 y después se maximiza 𝒙 𝒎+𝟏, de manera que en
forma automática 𝒙 𝒎+𝟏 será igual a «𝒗» (por definición) en la
solución optima del problema de PL.
51. Investigación de Operaciones II 51
FORMULACIÓN DE LA PROGRAMACIÓN LINEAL
Teoría de Juegos
Para resumir, el jugador 1 encontrara su estrategia mixta optima al
emplear el método simplex para resolver el problema de PL.
Maximizar 𝒙 𝒎+𝟏,
Sujeta a:
𝒑 𝟏𝟏 𝒙 𝟏 + 𝒑 𝟐𝟏 𝒙 𝟐+. . . +𝒑 𝒎𝟏 𝒙 𝒎 − 𝒙 𝒎+𝟏 ≥ 𝟎
𝒑 𝟏𝟐 𝒙 𝟏 + 𝒑 𝟐𝟐 𝒙 𝟐+. . . +𝒑 𝒎𝟐 𝒙 𝒎 − 𝒙 𝒎+𝟏 ≥ 𝟎
….………………………………………………………………….
𝒑 𝟏𝒏 𝒙 𝟏 + 𝒑 𝟐𝒏 𝒙 𝟐+. . . +𝒑 𝒎𝒏 𝒙 𝒎 − 𝒙 𝒎+𝟏 ≥ 𝟎
𝒙 𝟏 + 𝒙 𝟐+. . . +𝒙 𝒎 = 𝟏
Y
𝒙𝒊 ≥ 𝟎, para i=1, 2, . . . , m.
52. Investigación de Operaciones II 52
FORMULACIÓN DE LA PROGRAMACIÓN LINEAL
Teoría de Juegos
Observe que 𝒙 𝒎+𝟏 no esta restringida a ser no negativa, mientras
que el método simplex solo se puede aplicar una vez que todas las
variables tienen la restricción de no negatividad. Lo anterior puede
resolverse fácilmente, como veremos.
Ahora considere al jugador 2, que puede hallar su jugada optima
mixta si reescribe la matriz de pagos como los pagos a si mismo en
lugar del jugador 1 y procediendo del mismo modo que describimos
anteriormente. Sin embargo, resulta ilustrativo resumir la
formulación en términos de la matriz de pagos original. Si seguimos
un procedimiento análogo a lo descrito, el jugador 2 concluiría que
su estrategia mixta optima esta dada por la solución óptima del
problema de PL.