El dilema del prisionero y otros juegos

Escribo un artículo que creo que quedará un poco largo sobre diferentes problemas de lo que se conoce como Teoría de Juegos. La Teoría de Juegos es un campo de las matemáticas que aparece muy a menudo en el campo de la economía. Son situaciones en las que se investigan estrategias óptimas ante la toma de decisiones. Interviene también la psicología, la filosofía y otras ciencias, pero analizándolo fríamente, todo parece un problema de maximizar beneficios.

Si bien ya se hablaba de este tipo de situaciones en el siglo XVIII, no es hasta entrado el siglo XX, y especialmente durante la Guerra Fría, cuando varios matemáticos, destacando entre ellos John Von Neumann (del que destacó también su colaboración con el Proyecto Manhattan y la bomba atómica, pero también sus grandes contribuciones a la computación) y John Forbes Nash (Premio Nobel de Economía en 1994 y mundialmente conocido tras la película «Una mente maravillosa»), desarrollaron las bases de esta rama de las matemáticas.

Para desarrollar en qué consiste la Teoría de Juegos, vamos a empezar con este «Dilema del Prisionero», desarrollado por varios matemáticos de RAND (Reserarch ANd Development), un laboratorio de ideas de las fuerzas armadas estadounidenses.

Usted y otra persona colaboran para cometer un crimen. Después, son detenidos por la policía y los dos sospechosos son ubicados en celdas separadas y sin ningún tipo de posibilidad de comunicarse. La policía le ofrece a usted y a su cómplice un trato idéntico.

  • Si ambos sospechosos niegan el crimen, serán condenados a 1 año de prisión.
  • Si usted confiesa el crimen y su cómplice lo niega, usted saldrá absuelto, y su cómplice será condenado a 10 años de prisión.
  • Si usted niega el crimen y su cómplice lo confiesa, él saldrá absuelto y usted será condenado a 10 años de prisión.
  • Si ambos confiesan el crimen, los dos serán condenados a 5 años de prisión.
  •  

En resumen, la situación es esta:

 El cómplice lo niegaEl cómplice confiesa
Usted lo niegaLos dos 1 añoUsted 10 años / Él libre
Usted lo confiesaUsted libre / Él 10 añosLos dos 5 años

Fijémonos en que tenemos dos opciones: o negamos el crimen cooperando con nuestro cómplice, o lo traicionamos y confesamos. Obviamente, la situación puede ser distinta (y ahí interviene la psicología) si conocemos a la otra persona. Si es un amigo o familiar nuestro, probablemente confiaríamos en él y negaríamos el crimen (colaboraríamos), porque seguramente él haría lo mismo. Pero en una situación más general, no sabemos qué hará nuestro cómplice.

Pensándolo ahora desde un punto de vista egoísta, si sabemos que nuestro cómplice lo negará, nuestra opción óptima es confesar, ya que así nosotros saldríamos libres. Si el cómplice confiesa, nuestra mejor opción vuelve a ser confesar, ya que es preferible pasar 5 años en prisión a pasar 10. En cambio, si se piensa en el bien común, lo mejor para ambos es callarse y pasar un año en prisión.

El Giro de Italia y otros dilemas reales

Podemos pensar en esta situación como una muy extraña, pero pensemos en otra parecida. Dos ciclistas van escapados en una etapa del Giro de Italia respecto al pelotón.

14526143463001

El ciclista que va en cabeza tiene el viento de cara tiene más dificultades para avanzar, mientras que el que va detrás va más cómodo. Los ciclistas pueden optar por cooperar, es decir, ir relevándose para llegar con éxito al final de la etapa y tener posibilidades de victoria. También podría darse el caso que sólo colaborara uno de ellos poniéndose en cabeza. Este llegaría más cansado al final de la etapa y con bastante seguridad el otro sería el vencedor. También podría pasar que no colaborasen, y en este caso, serían atrapados por el pelotón.

De forma simple, sería algo así:

 El otro colaboraEl otro no colabora
Usted colaboraUno de los dos ganaÉl gana
Usted no colaboraUsted ganaEl pelotón alcanza

Hay que tener en cuenta que, en esta situación existe una diferencia respecto el dilema inicial: en este dilema la situación puede repetirse en el futuro, y si usted «traiciona» al compañero, en una etapa más adelante la decisión del otro (o de alguien de su equipo) puede ser distinta. Así pues, suele acabar siendo más aconsejable colaborar de cara a futuros eventos. De hecho, nuestra sociedad, aunque individualista, está hecha para cooperar y así sobrevivir.

Más adelante veremos cómo estas hipotéticas situaciones también aparecieron y fueron muy importantes en la Guerra Fría, o incluso hoy en día son importantes en algunas decisiones estratégicas a nivel global.

El dilema del prisionero iterativo

Estas situaciones se acaban resumiendo en matrices numéricas, donde a cada casilla se le pondría una cifra que cuantificaría las ganancias o pérdidas.

Supongamos ahora la situación del dilema del prisionero, con las dos opciones (colaborar o desertar), pero ahora con un beneficio determinado en cada decisión (lo que se conoce como «matriz de pagos»). Quedaría algo así:

 El otro colaboraEl otro deserta
Usted colabora20 € / 20 €0 € / 30 €
Usted deserta30 € / 0 €10 € / 10 €

Supongamos que esta situación se produce un número de veces (pongamos, por ejemplo, que se hace 100 veces). ¿Cuál sería la mejor estrategia?

Supongamos que decidimos desertar siempre. Eso nos asegura ganar, como mínimo, 1000 € en total (suponiendo que la otra persona deserta también siempre, serían 10 € cada partida). Pero si hubiéramos hablado habríamos visto que colaborando ambos podríamos haber conseguido 2000  (20€ por partida). Sin embargo, ¿estamos seguros que el otro siempre colaborará? Si no es así, colaborando siempre sólo estaríamos «haciendo el primo» y permitiendo que el otro se lleve los beneficios.

Otra opción sería escoger, de forma aleatoria, una estrategia u otra, aunque hacerlo así tampoco asegura muy buenos resultados.

Robert Axelrod llevó a cabo, en 1984 un experimento por ordenador, que desarrolló en su libro The evolution of cooperation, enfrentando entre ellas diversas estrategias para ver cuál de ellas funcionaba mejor. La clave era intentar «comunicarse» con el otro, para hacerle ver que lo mejor era colaborar, y si no lo hacía, «vengarse». En este sentido, la que resultó más efectiva es la conocida como «Tit for tat» (Toma y daca). Consiste en lo siguiente:

En la primera partida, se coopera. En las siguientes, se hace justo lo que ha hecho el oponente en la partida anterior. Si el oponente coopera en la partida número 10, usted lo hace en la 11. Si el oponente deserta en la 23, usted deserta en la 24. De esta forma, se tiende la mano para cooperar en la primera partida, y si el otro coopera esto seguirá así como en la primera estrategia, pero si el otro no coopera, entonces llega la «venganza» (donde las dan, las toman). Esta estrategia, amable pero defensiva, se mostró la más eficaz en ese experimento, obteniendo mayores ganancias que el resto de estrategias.

Así pues, parece que lo mejor es ayudarse, pero estar alerta por si los demás deciden no hacer lo mismo, y actuar en consecuencia.

He sacado algunas ideas del interesantísimo libro de William Poundstone titulado, precisamente, El dilema del prisionero, y tengo futuras historias y variantes para ir comentando, ya que el tema da mucho de sí. ¡Espero vuestros comentarios!


Deja un comentario