EL EQUILIBRIO DE NASH
A cada conjunto de estrategias denominado con frecuencia combinación de estrategias, que es una por jugador, se le asocia una salida del juego, caracterizada por las ganancias expresadas en forma de números que le toca a cada uno. Entre estas salidas puede haber unas más “interesantes” que otras, por ejemplo las que “reportan más”. Sin embargo, cono regla general, la mayoría de las salidas, si no la totalidad, no son comparables entre ellas en el sentido que el paso de una a otra se traduce en un aumento de ganancias para unos y una baja para otros. No se puede pues aplicar el criterio de Pareto y, con mayor razón, no se puede decir que una de ellas es “superior” a todas las otras, según este criterio, salvo un caso muy particular.
Frente a la ausencia de una clasificación de las salidas que logre la unanimidad de los participantes, los teóricos de juegos adoptan un punto de vista mas limitado, que se puede calificar de “local” en el sentido de estudiar separadamente cada una de las salidas y las combinaciones de estrategias de las cuales ellas son el resultado; se le acuerda un estatuto privilegiado a las que son de “equilibrio”, esto es a las que los individuos, tomados uno a uno no tienen interés en desechar -es típico de una situación en la cual “nada se mueve”-. Porque el matemático John Nash estableció un importante resultado en 1950 sobre la existencia de situaciones de este tipo, se habla entonces de la existencia de equilibrios de Nash.
Así, por definición, se dice de una combinación de estrategias (una por jugador) que está en equilibrio de Nash si ningún jugador puede aumentar sus ganancias por un cambio unilateral de estrategia. Con frecuencia se identifica, por abuso del lenguaje y sin que ello tenga consecuencias, un equilibrio de Nash con la salida que le corresponde.
En la definición del equilibrio de Nash el adjetivo “unilateral” ocupa un lugar esencial, en tanto ello traduce el carácter no cooperativo de las elecciones individuales (el “cada cual para sí mismo”). Así es bastante posible que en un equilibrio de Nash la situación se puede mejorar para todos por medio de un cambio simultáneo de estrategia por parte de varios jugadores. Volveremos sobre este importante punto cuando nos referimos a la eficiencia del equilibrio de Nash.
a) Importancia y límites del equilibrio de Nash.
El equilibrio de Nash ocupa un lugar central en la teoría de juegos; constituye de alguna manera una condición mínima de racionalidad individual ya que, si una combinación de estrategias no es un equilibrio de Nash, existe al menos un jugador que puede aumentar sus ganancias cambiando de estrategia, y en consecuencia, ésta se puede considerar difícilmente como una “solución” del modelo en la medida en que el jugador interesado en cambiar descarta su elección, después de conocer la de los otros.
Ahora, el recíproco de esta proposición no es generalmente verdad: si un juego admite un equilibrio de Nash no existe una razón a priori para que éste aparezca como la “solución” evidente, que se impone a los ojos de todos los jugadores. Ello al menos por una razón: con frecuencia los juegos admiten varios equilibrios de Nash, como se constata en el ejemplo de dos que han diseñado normas diferentes de emisión para la televisión. En efecto, la pareja de estrategias:
(A adopta la norma A, B adopta la norma A) es un equilibrio de Nash del modelo en tanto A evidentemente no tiene interés de cambiar de estrategia habida cuenta la elección de B; este tampoco ya que la coexistencia de dos normas diferentes es el caso más desfavorable para las dos empresas.
Ahora, la pareja de estrategias:
(A adopta la norma B, B adopta la norma B) es de igual manera un equilibrio de Nash, como se puede verificar de manera inmediata. Ninguno de estos dos equilibrios aparece como una solución evidente porque A prefiere la primera ya que impone su norma y B la segunda, por iguala motivo. Se deduce la posibilidad de que cada uno escoja producir según su propia norma, pensando que el otro lo seguirá, con el resultado de una salida que no es de equilibrio, pues es mala para todos. Se encuentra la cuestión central para el microeconomista, la coordinación, propuesta en el marco de juegos, pero igualmente no resuelta por éste mismo marco.
b) Equilibrios de Nash ante condiciones mas restrictivas.
El problema de la multiplicidad de equilibrios de Nash, en un juego dado, es indudablemente la principal fuente de preocupación para los teóricos de los juegos, que han buscado su solución considerando, por ejemplo, que ciertas elecciones no son completamente “razonables” o “creíbles”. De tal manera, si retomamos nuestro ejemplo, pero con un orden preestablecido en los golpes (digamos, A “juega” primero y B después), entonces nos encontramos en presencia de los dos mismos equilibrios, pero ahora uno de ellos es poco “creíble”, el que A y B adopten la norma de B. En efecto, no se ve por que A tomaría tal decisión ya que tomó la delantera; es cierto que B puede esgrimir una amenaza: “pase lo que pase, produciré con mi propia norma” y que, si tal es el caso A tendría interés en producir según la norma B por ello hay un equilibrio. Pero, será que A tomará en serio la amenaza de B?
Se puede dudar porque, si A decide producir según su propia norma sería suicida por parte de B poner en ejecución su amenaza, lo que provocaría la ruina de A, pero también la suya. Sabiendo eso, A actuará de distinta manera. En consecuencia, existen un de los equilibrios de Nash que se impone como solución:
(A produce según la norma A, B según la norma A).
Se dice de tal solución, en donde el orden de los golpes estipulado con antelación juega un papel importante, que es un equilibrio perfecto; esta solución comporta elementos de los equilibrios de Nash, haciendo intervenir elementos suplementarios.
Notemos, además, que la hipótesis de información completa juega un papel esencial; A debe estar “seguro” que B actuará como se previó ya que, si existe el más mínimo riesgo de que no fuera así y que B cumple con su amenaza, entonces la decisión no es tan evidente. Por ello el interés de B de forjarse una reputación del tipo que “no cede jamás”; no obstante, hay que entrever por ello opciones sucesivas y, en consecuencia,juegos repetidos, como lo veremos mas adelante.
En el caso donde se presenten varios equilibrios con decisiones simultáneas, donde ninguna de ellas sea superior a la otra según el criterio de Pareto, ciertos teóricos de los juegos han propuesto la siguiente solución: los participantes se ponen de acuerdo para la selección a la suerte de uno de los equilibrios, lo cual se evita la indeterminación y se elude también la realización de salidas “peores”, como aquella de cada uno producir según su propia norma.
Esta solución, que es todavía un equilibrio de Nash, se denomina un equilibrio correlacionado. Notemos que esta solución supone una cierta forma de colaboración, que es el acuerdo previo sobre el principio de tirar a la suerte los equilibrios y sobre el procedimiento de azar empleado hay que darle la misma probabilidad a todos los equilibrios o hay que atribuirles probabilidades diferentes?.
A pesar de existir un cierto acuerdo sobre el procedimiento a emplear, de todas maneras se está en presencia de una solución no cooperativa, en el sentido en que nadie tiene interés en apartarse unilateralmente, porque la salida retenida es un equilibrio de Nash.
c) Equilibrio de Nash y optimalidad.
Otro de los límites esenciales del equilibrio de Nash en tanto “solución” de un juego, reside en el hecho que tal equilibrio es con frecuencia subóptimo, en el sentido de Pareto. Ya hemos constatado con el equilibrio de Cournot -denominado de Cournot-Nashpor los microeconomistas-, donde la filosofía del “cada uno para sí mismo” conduce a una salida en la cual los beneficios son menores que si hubiera acuerdo entre los duopolistas. Sin embargo, tal acuerdo no es de equilibrio en la medida en que cada cual tiene interés de no respetarlo si el otro lo respeta. Este tipo de situación es muy corriente: pensemos en el agricultor que enfrenta cuotas de producción que le son impuestas a él y a todos los agricultores con el fin de evitar el desplome de precios y que, además, busca sobrepasarlas para beneficiarse de los precios favorables originados en la existencia misma de estas cuotas; pensemos también en los bienes colectivos infraestructuras, ambiente y condiciones de vida que todo el mundo desea aprovechar, pero escapando a su financiación, en el caso de existir una cotización voluntaria. Es el mismo caso de las barreras proteccionistas con las cuales cada país desea rodearse, pero buscando exportar el máximo. Existen tantos ejemplos de este tipo, que se podría decir que ocultarían la mayoría de las relaciones sociales si estas se redujeran a la filosofía de “cada uno para sí mismo”.
Se ha tomado la costumbre por parte de los teóricos de juegos, lo mismo que por parte de sociólogos, economistas etc. de ilustrar este tipo de situación empleando una “pequeña historia” propuesta por A.W. Tucker y que llamó el dilema del prisionero que se puede resumir de la siguiente manera.
Dos individuos sospechosos de haber cometido un robo son detenidos por al policía que los lleva ante el juez, el cual los interroga separadamente. Cada uno puede callar o denunciar a su cómplice; los dos se encuentran ante las Siguientes posibilidades:
- ·Callar y salir libre si el otro hace lo mismo;
- ·Callar y ser condenado si el otro escoge denunciarlo;
- ·Denunciar al otro y salir libre, ganándose una recompensa si el otro se calla;
- ·Denunciar al otro y quedarse en prisión por un tiempo si el otro decide de la misma manera la delación.
Se constata fácilmente que el único equilibrio de Nash consiste en una denuncia mutua, lo que evidentemente es subóptimo ya que los dos sufren una condena, en tanto que si se hubieran callado habrían sido liberados. No obstante este equilibrio es “robusto” en el sentido en que la estrategia de acusar al otro es dominante cualquiera que sea la elección del otro, la denuncia le procura una ganancia superior.
Notemos que acá hay un dilema porque cada cual toma su decisión sólo considerando sus propios intereses y sabiendo que el otro actúa de la misma manera. Incluso, aceptando que los dos individuos se puedan comunicar previamente, no cambia nada la cosa, ya que al momento de escoger la estrategia dominante, “denunciar al otro” se impone. El problema no está pues en la posibilidad de comunicarse o no antes de tomar una decisión, sino más bien en la existencia de acuerdos obligatorios cuyo incumplimiento implica sanciones y de instituciones que velen por su aplicación, las cuales son difíciles de introducir en el ejemplo que nos ocupa.
El dilema del prisionero, o más exactamente las situaciones que representa, crean un problema fundamental al microeconomista, porque queda claro el hecho de las decisiones racionales por parte de individuos puede conducir a una “solución” -equilibrio- poco satisfactoria, es decir, subóptima por tanto “colectivamente irracional”. De ahí las numerosas tentativas de los teóricos de los juegos para salir de este “dilema”, pero siempre preservando el principio según el cual cada cual sólo busca su propio beneficio, es decir, maximizar sus ganancias. Entre estas tentativas, el recurso a los juegos repetidos, ocupa un lugar importante.