dissabte, d’octubre 18, 2008

La cooperació en joc

Poc després de que dos dels vaixells destinats a evacuar l'amenaçada població de Gotham City salpin, el Joker comunica al passatge que ha col·locat explosius a les bodegues i que cadascun d'ells disposa d'un detonador amb el que poden fer explotar l'altre vaixell. Ambdós vaixells no poden comunicar-se entre si, així que l'única opció de supervivència és cooperar esperant que l'altre també ho faci, o bé ser el primer en prémer el botó del detonador.

Aquesta és la darrera recreació que he vist del cèlebre dilema del presoner (DdP), i forma part de The Dark Knight, la (fluixa) darrera seqüela de Batman. La formulació del joc —que té aplicacions en els àmbits de l'economia, les ciències polítiques, la sociologia, la psicologia i la biologia— podria ser aquesta (copio de la Wikipedia):


La policia arresta dos sospitosos. No hi ha proves suficients per condemnar-los i, després d'haver-los separat, els interroga i els ofereix el mateix tracte. Si un confessa i el seu còmplice no, el còmplice serà condemnat a la pena total, deu anys, i el primer serà alliberat. Si un calla i el còmplice confessa, el primer rebrà aquesta pena i serà el còmplice que surti lliure. Si ambdós romanen callats, tot el que podran fer serà tancar-los durant sis mesos per un càrrec menor. Si ambdós confessen, ambdós seran condemnats a sis anys.

Els valors numèrics concrets no importen sempre que es mantingui l'ordenació. El problema pot expressar-se en forma matricial de la següent manera:



On s'ha de complir que T>R>P>S i R>(T+S)/2. Si només es juga una vegada (DdP simple), la solució només pot ser una: si un dels presoners pensa que l'altre cooperarà, li surt més rentable trair-lo (T>R). Si pel contrari, pensa que serà traït, també li compensa la traïció (P>S). Per tant, faci el que faci el seu còmplice, la traïció és la sortida òptima. És per això que Christopher Nolan ha d'apel·lar als sentiments morals en el film, ja que la situació no deixaria una altra sortida que detonar l'altre vaixell si s'apliqués purament la lògica. I és per aquesta raó també que John von Neumann, un dels científics més eminents del segle XX, creador de la Teoria de Jocs i partícep al Projecte Manhattan que va desenvolupar la primera bomba atòmica, defensava un atac nuclear preventiu contra la Unió Soviètica. Són famoses les seves paraules a la revista Life: «En el caso de los rusos, no hay que decidir si se les ataca, sino cuándo. [...] Si me propone usted bombardearles mañana, yo le contesto, ¿por qué no hoy? Si dice usted que hoy a las cinco de la tarde, yo le digo, ¿por qué no a la una?». Aquesta bel·licosa actitud s'explica per la interpretació que feia de la Guerra Freda en termes d'un DdP.

Molt més interessant és la situació en el que els jugadors repeteixen el joc successivament, guardant memòria dels jocs anteriors. Això és el que es coneix com a DdP iterat. Robert Axelrod, professor de Ciències Polítiques a la Universitat de Michigan, va convocar el 1980 experts en Teoria de Jocs de diferents àrees per a que proposessin estratègies per a un torneig de DdP iterat per ordinador. El sistema enfrontava totes les estratègies reportades (incloent-ne una purament aleatòria) contra totes, i imposava algunes restriccions més: la més important, la de considerar que, si bé el moviment present sempre té menys pes que l'anterior (el que es pot representar amb un paràmetre de descompte w aplicat als guanys, on 1>w>0), aquest factor és prou alt com per fer que cap estratègia òptima sigui independent de l'estratègia utilitzada pel contrincant.

Doncs bé, sorprenentment, l'estratègia guanyadora en ambdues conteses fou la més simple de totes les presentades (5 línies de codi FORTRAN), la proposada pel professor Anatol Rapoport de la Universitat de Toronto i denominada TIT FOR TAT. Aquesta estratègia és molt fàcil d'explicar: coopera en el primer moviment i a partir d'aquí fa en cada jugada el que el seu contrincant ha fet en la jugada anterior. És a dir, és l'estratègia de l'«ull per ull» o de «tornar la moneda». És fàcil veure que per la seva estructura, aquesta estratègia no pot guanyar cap enfrontament: com a molt farà tants punts com el seu adversari o menys. On rau, aleshores, el secret del seu èxit? Doncs en que obté bones puntuacions contra qualsevol tipus d'adversari. Altres estratègies aconseguien explotar les febleses d'alguns contrincants, però eren a la vegada clarament derrotades per altres; mentre que TIT FOR TAT és inexpugnable. Axelrod va detectar les característiques de les estratègies triomfadores: són amables (no traeixen sense causa), provocables (prenen represàlies quan són traïdes), perdonen (tornen a cooperar si l'oponent deixa de trair) i els manca enveja (no juguen pensant en obtenir millor puntuació que l'adversari). TIT FOR TAT reunia aquestes virtuts millor que qualsevol altra. Aquest anàlisi va ser publicar per Axelrod en quatre importants articles científics (un d'ells a la revista Science) i el 1984 en forma de llibre: The Evolution of Cooperation.

El que resulta realment interessant d'aquest experiment són les seves aplicacions biològiques. Molts científics havien observat relacions de cooperació a la natura que no acabaven de poder explicar amb la teoria de la selecció natural. La pregunta que calia respondre era: sota quines condicions pot emergir la cooperació en un món d'egoistes sense autoritat central?

L'aplicació de la Teoria de Jocs a l'àmbit de la teoria evolutiva va sistematitzar-se també aquells anys. La primera obra que presentava una visió de conjunt de la teoria fou Evolution and the Theory of Games (1982), de John Maynard Smith. Maynard Smith va introduir un concepte clau, el d'Estratègia Evolutiva Estable (ESS, de les sigles en anglès). Una ESS és aquella que, si tots els membres d'una població l'adopten, aleshores cap estratègia mutant pot envair-la si només hi intervé la selecció natural. En aquest assaig es partia del model més bàsic, el joc del Falcó-Colom [Hawk-Dove game] i a partir d'ell s'hi anava afegint complexitat, tant conceptual com matemàtica: interacció d'un individu amb un grup, guerra de desgast [war of attrition], jocs amb models genètics, sistemes d'aprenentatge, estratègies mixtes, jocs asimètrics, influència de variables com la propietat del recurs en joc, la transferència d'informació, el compromís, la territorialitat...

D'acord amb la definició de Maynard Smith i els resultats d'Axelrod, TIT FOR TAT és una ESS. Axelrod demostrà no només que TIT FOR TAT no podia ser envaïda per cap altra estratègia, sinó que ella mateixa podia envair qualsevol altra estratègia col·lectivament estable (com la de «sempre trair») sempre que fós una petita comunitat d'individus mutants la que s'infiltrés, i no només un de sol. Un experiment molt revelador que va dur a terme fou la d'emular l'ecologia del torneig: les poblacions representatives de cada estratègia en la següent ronda eren proporcionals a l'èxit que obtenien en la present. Aquest model, que simula l'evolució de les poblacions per selecció natural, tornava a tenir TIT FOR TAT com a clara guanyadora, el que refermava la seva estabilitat al llarg del temps.

El treball d'Axelrod es va convertir immediatament en objecte d'estudi i ha generat una àmplia bibliografia. Com acostuma a passar, les solucions simples i espectaculars atreuen a molta gent, i els seus resultats van ser aplicats a situacions molt diverses, de vegades simplificant excessivament les condicions per aplicar el model (el mateix Axelrod la utilitza per explicar la situació de viu-i-deixa-viure a la guerra de trinxeres durant la Primera Guerra Mundial). Així, TIT FOR TAT es va convertir en el model capaç d'explicar l'aparició de la cooperació en les complexes interaccions socials entre humans i fins i tot l'evolució de la cooperació social en tota la naturalesa, el que evidentment és fer-ne un gra massa. Una conseqüència interessant fou la de servir de base a un grup d'intel·lectuals que, com Peter Singer, reclamaven a les posicions polítiques d'esquerra una reconciliació amb el darwinisme, reticent des de que Marx postulà que «l'essència de l'home [...] consisteix en el conjunt de les relacions socials» i des de que un interessat darwinisme social servís de justificació de les desigualtats socials. Els liberals també poden portar l'aigua al seu molí afirmant que es pot reduir el paper de l'Estat perquè la cooperació sorgirà de manera natural entre els individus, tot i que Axelrod fa algunes observacions en termes de que l'autoritat pot intervenir en el joc alterant els valors dels guanys en la matriu (per exemple, augmentant la pena per traïció) i transformar el joc en quelcom que ja no és més un DdP. Com observa Roger Arnold, del Mises Institute, Axelrod sembla justificar la intervenció estatal tot i que entra en conflicte amb la troballa que ell mateix acaba de fer: que la cooperació pot sorgir per selecció natural en un ambient no-coercitiu. Això, és clar, sempre que es donin les condicions que s'imposen al joc, una de les quals també té una lectura política: per a que la cooperació emergeixi de forma natural, el pes de les interaccions futures ha de ser prou important, és a dir, els dos adversaris han de saber que s'enfrontaran repetidament en el futur i que les decisions que prenguin ara tindran conseqüències. Això afavoreix evidentment un model de societats obertes i interrelacionades.

Axelrod manté una web on pot descarregar-se el programari del seu torneig. Al seu llibre li seguí una seqüela, The Complexity of Cooperation (1997), on aprofundeix en les seves tesis. Com a curiositat, John Maynard Smith va participar al segon torneig presentant una variació de TIT FOR TAT menys estable, que només assolí la vint-i-quatrena posició.