Equilibrio de Nash
El equilibrio de Nash o equilibrio de Cournot o equilibrio de Cournot y Nash o equilibrio del miedo es, en la teoría de los juegos, un “concepto de solución” para juegos con dos o más jugadores, el cual asume que:
- Cada jugador conoce y ha adoptado su mejor estrategia, y
- Todos conocen las estrategias de los otros.
Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros mantengan las suyas. Así, cada jugador está ejecutando el mejor "movimiento" que puede dados los movimientos de los demás jugadores.
En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en práctica, y saben que lo han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de los otros. Consecuentemente, ningún jugador tiene ningún incentivo para modificar individualmente su estrategia.
Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para los participantes, sino sólo el mejor resultado para cada uno de ellos considerados individualmente. Es perfectamente posible que el resultado fuera mejor para todos si, de alguna manera, los jugadores coordinaran su acción.
En términos económicos, es un tipo de equilibrio de competencia imperfecta que describe la situación de varias empresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia.
Quizás el mejor ejemplo de un equilibrio de Nash es la variación del conocido “dilema del prisionero” modificado a fin de resaltar los efectos descritos. En esta versión hay varios jugadores (más de tres). El resultado sería mejor para todos si todos cooperaran entre ellos y no declararan, pero, dado que cada cual persigue su propio interés, y ninguno puede confiar en que nadie declarará, todos deben adoptar la estrategia de declarar, lo que termina en una situación (equilibrio) en la cual cada uno minimiza su posible pérdida.
Modificaciones adicionales permiten repetir el juego de forma indefinida (por ejemplo, con los jugadores repartiendo un “botín”, etc.). En todas esas situaciones resulta que la estrategia de no cooperar es la que minimiza el riesgo de pérdidas y otorga una ganancia media pero segura para cada jugador individual, pero la cooperación maximizaría la ganancia tanto a nivel individual como de grupo.
Juego competitivo
Consideramos el siguiente juego de dos jugadores:
"Los jugadores escogen simultáneamente un número entero entre cero (0) y diez (10). Los dos jugadores ganan el valor menor en dólares, pero además, si los números son distintos, el que ha escogido el mayor le debe pagar $2 al otro."
Este juego tiene un único equilibrio de Nash: ambos jugadores deben escoger cero (0). Cualquier otra estrategia puede desfavorecer a un jugador si otro escoge un número menor.
Si se modifica el juego de modo que los dos jugadores ganen el número escogido si ambos son iguales, y de otro modo no ganen nada, hay 11 equilibrios de Nash distintos.
Juego de coordinación
Este juego es un juego de coordinación al conducir. Las opciones son: o conducir por la derecha o conducir por la izquierda: 100 significa que no se produce un choque y 0 significa que sí. El primer número en cada celda indica la ganancia del primer jugador (cuyas opciones se muestran a la izquierda) y el segundo la ganancia del segundo jugador (cuyas opciones se muestran encima).
| Conducir por la izquierda: | Conducir por la derecha: | |
| Conducir por la izquierda: | 100,100 | 0,0 |
| Conducir por la derecha: | 0,0 | 100,100 |
En este caso hay dos equilibrios de Nash con estrategias puras, cuando ambos conducen por la derecha o ambos conducen por la izquierda. Esto ayuda a explicar por qué en casi todo el mundo se conduce por el mismo lado (a la derecha) y como en Inglaterra, al ser una isla y no empeorar su pago por no coordinarse con los demás países, se mantuvo la estrategia de conducir por la izquierda.
Dilema del prisionero[editar]
El dilema del prisionero tiene un equilibrio de Nash en estrategias puras: se produce cuando ambos jugadores confiesan. A pesar de ello, "ambos confiesan" es peor que "ambos cooperan", en el sentido de que el tiempo total de cárcel que deben cumplir es mayor. Sin embargo, la estrategia "ambos cooperan" es inestable, ya que un jugador puede mejorar su resultado desertando si su oponente mantiene la estrategia de cooperación. Así, "ambos cooperan" no es un equilibrio de Nash pero sí unóptimo paretiano. Una manera de llegar a ese resultado es logrando una colusión y mediante la promesa de cada jugador de "castigar" al otro si rompe el acuerdo. También podría llegarse a una solución fuera del equilibrio de Nash si el juego se repitiese infinitas veces, cuando se logra la estrategia "ojo por ojo".
La tragedia de los comunes[editar]
La tragedia de los comunes es una generalización del dilema del prisionero ideada por James Garrett Hardin y publicada por primera vez en su artículo "the tragedy of the commons" (1968). En este juego existen n jugadores que hacen uso de un bien común (como por ejemplo, un terreno comunal). Aunque cada jugador puede participar en el cuidado de este bien (lo que conlleva un costo para el que lo hace), todos los jugadores tienen derecho a usarlo, lo cuiden o no. De este modo tenemos un juego n-personal donde cada jugador tiene dos estrategias: egoísta o solidario, y donde la estrategia egoísta es dominante estricta, es decir, para cualquier perfil de estrategias puras el jugador j puede mejorar su pago si elige la estrategia egoísta en lugar de la solidaria. De este modo, el juego sólo tiene un equilibrio de Nash en estrategias puras y es (egoísta, egoísta,..., egoísta) a pesar de que, como en el dilema del prisionero, el beneficio para cada jugador termina siendo mucho menor que si todos hubieran elegido ser solidarios.
Este juego ha encontrado diversas aplicaciones en la vida diaria. Consideremos por ejemplo una ciudad, con caminos libres de tránsito y contaminación baja como un bien común que todos debemos cuidar. Siempre existe la tentación de ser egoísta (usar automóvil particular para mejorar nuestro propio transporte por la ciudad, ignorar semáforos en rojo, etc) a pesar de que si todos siguen la misma estrategia los viales sufren congestionamientos extremos y surge el serio problema de la contaminación ambiental. Debido a que la ruina común es el único equilibrio de Nash, los gobiernos recurren a medidas externas para intentar cambiar los pagos por ser egoísta y llevar a nuevos equilibrios. Así el poner multas a los que no obedecen los reglamentos y encarecer el uso del transporte privado a la vez que se mejora el transporte público es una forma de conseguir que la estrategia egoísta deje de ser dominante estricta y que todas las personas puedan seguir una estrategia solidaria, es decir, como un contrato en un juego cooperativo.
Piedra, papel o tijera[editar]
Consideremos el juego piedra, papel o tijera con la matriz de pagos dada por:
| Piedra | Papel | Tijera | |
| Piedra | 0 | -1 | +1 |
| Papel | +1 | 0 | -1 |
| Tijera | -1 | +1 | 0 |
Supongamos que el jugador 1 juega siempre en estrategias puras, por ejemplo piedra. Entonces el jugador 2 podría sacar ventaja de ello jugando siempre papel. Una mejor respuesta del jugador 1 sería entonces jugar con estrategias mixtas, es decir, asignarle cierta probabilidad a cada estrategia y en cada jugada elegir aleatoriamente de acuerdo a la distribución elegida.
Puede demostrarse que siempre que haya sesgo en estas probabilidades (es decir, cuando se le asigne más probabilidad a una estrategia que a otra), el otro jugador puede sacar ventaja de ello y mejorar su pago esperado. De éste modo, el juego sólo tiene un equilibrio de Nash y es (1/3,1/3,1/3), es decir, jugar con igual probabilidad cada estrategia (siempre y cuando se mantengan los pagos dados por la matriz).
Comentarios
Publicar un comentario