Teoria dos Jogos e da Cooperação para Filósofos: Seção II

TEORIA DOS JOGOS E DA COOPERAÇÃO (MAY, E. 'Ben Franklin leva Xeque-Mate de Lady Howe', sec.XIX)

TEORIA DOS JOGOS E DA COOPERAÇÃO PARA FILÓSOFOS

SEÇÃO II

» 1ª Unidade: DPI

Condições para Cooperação.

Por Antônio Rogério da Silva

Os diversos experimentos realizados em torno do Dilema dos Prisioneiros Iterado, todas simulações e torneios de computador, bem como as estratégias construídas para enfrentar as peculiaridades de cada situação subsidiaram a discussão sobre as condições e os pressupostos que promovem o comportamento cooperativo entre os jogadores. Compreender quais são os fatores que contribuem para formação e manutenção da cooperação é uma das metas principais da filosofia política, da ética, e da psicologia comportamental. Uma sociedade bem ordenada só pode se manter como tal se houver a cooperação entre seus membros. Cooperar com o outro é um aspecto do altruísmo que pode ser explicado, mesmo entre agentes egoístas, sem perda de consistência, por conta dos efeitos da reciprocidade exigida pelas partes e que fundamenta princípios éticos fortes como a conhecida Regra de Ouro - faça ao outro aquilo que gostaria que fizesse a si mesmo.

O livro The Evolution of Cooperation, de Robert Axelrod, é o responsável pelo lançamento dessa Teoria da Cooperação que procura responder à simples questão de como agentes egoístas podem seguir cooperando uns com os outros, sem a necessidade de nenhum instrumento externo - como o Estado, instituições jurídicas ou contratos que obriguem a levar em consideração os interesses dos outros. De um ponto de vista radical, nem mesmo uma racionalidade forte seria requerida para que a cooperação emergisse e, por conseguinte, até mesmo organismos muito simples - bactérias, vírus etc. - poderiam ser considerados aptos a tomar parte da interação igualmente fácil de se perceber como o Dilema dos Prisioneiros.

Por conta de sua montagem simplificada, biólogos, políticos, economistas e matemáticos puderam propor uma ampla gama de cenários onde os agentes poderiam atuar. A concepção de agente utilizada partilha da noção de agência creditada do filósofo estadunidense Daniel Cl. Dennett. Um agente dennettiano tem capacidade suficiente para praticar ações, ao invés de apenas sofrê-las. Este agente atua em função de razões ou conjunto de instruções sobre as quais não tem consciência (1).

Fora da filosofia, um agente dennettiano corresponde a sistemas complexos dinâmicos, às macromoléculas orgânicas e aos autônomos celulares. Organismo que reagem entre si segundo regras, leis da física ou químicas e programas instalados. Assim sendo, a reprodução do comportamento de unidades reativas tão básicas pôde ser perpetrada convenientemente em torneios virtuais de computadores. As simulações que se sucederam às primeiras competições promovidas por Axelrod trataram de explorar as consequências e conclusões anunciadas em 1984.

Em The Evolution of Cooperation, Axelrod apresentou as condições que considerava responsáveis pela vitória da estratégia OLHO POR OLHO entre as cooperadoras. A ação de OPO era clara, gentil, retaliadora e clemente. Essas quatro primeiras condições eram tidas, então, como sendo a chave explicativa para a robustez exibida nas disputas iniciais (2).

Com base nessas propriedades, alguns conselhos foram proferidos como sendo adequados para jogadores desenvolverem sua finalidade em uma longa interação do tipo do Dilema dos Prisioneiros: não ser o primeiro a desertar, não ser invejoso, nem ardiloso e responder com reciprocidade à cooperação e a deserção (3). A ambição de um ganho maior sobre o outro jogador eventualmente conduz a uma tentativa de reparar o desequilíbrio dos resultados. Isto leva, então, a uma deserção que visa retificar as perdas sofridas. Dessa forma, jogadores invejosos provocariam a ruína mútua através de uma série de punições repetidas. Por ser uma estratégia que nunca busca vantagem sobre os ganhos dos outros, OPO consegue no máximo igualar os ganhos aos do outro jogador ou um pouco abaixo do outro. Mesmo assim, no ambiente dos dois primeiros torneios, foi a estratégia que obteve a melhor pontuação média em comparação ao desempenho das demais.

Os ganhos equilibrados de um jogador OPO, ocorreu por que este nunca é o primeiro a desertar. A gentileza inicial evitava a deflagração de conflitos desnecessários. Estratégias gentis, não por acaso estiveram entre as melhores colocadas, não obstante o fato da deserção ser uma estratégia dominante na versão básica do Dilema dos Prisioneiros, em uma só rodada. A falta de gentileza pode trazer vantagens imediatas, mas a longo prazo degrada a convivência necessária para sua proliferação ao futuro, como ocorreu a todas estratégias desse tipo na disputa ecológica feita depois do segundo torneio (4).

Muita sofisticação e sutilezas dos programas não foram características próprias aos algoritmos que tiveram êxito no DPI. Comportamentos ardilosos e muito complexos podem, dada a dificuldade de compreensão pela outra parte, ser considerados aleatórios, imponderáveis, ou irresponsáveis. Desta forma, estratégias difíceis de entender são perigosas devido à falta de clareza sobre suas ações que geram desconfianças em quem deve participar da cooperação. A clareza de OPO foi uma das razões para seu desempenho vitorioso. Ao contrário do jogo de soma zero, onde ocultar informações sobre sua linha de ação dificulta as tomadas de decisões do adversário a ser derrotado, em jogos de soma variável, como o DPI, em que se busca a cooperação do outro, é importante parecer transparente, sinalizando e fornecendo garantias de que o objetivo de ambos maximizarem seus resultados passa pela cooperação mútua. Tal transparência das ações é reforçada à medida que a cooperação for sendo retribuída com cooperação e deserção punida com deserção. De todos os conselhos extraídos dessa forma de interação, a prática da reciprocidade é o mais eficaz, de um modo geral.

Objeções e Respostas

Como sempre ocorre em debates filosóficos, esses conselhos e as propriedades relacionadas às estratégias vitoriosas nas simulações e intuitivamente aceitáveis foram criticados por outros pesquisadores que não estavam satisfeitos com as conclusões tiradas. Kenneth Binmore atacou duramente as propriedades atribuídas a OPO, advertindo que, em contextos específicos, estratégias que não fossem claras, gentis, retaliadoras e clementes poderiam também ser bem sucedidas (5). Além deste, vários outros pesquisadores consideraram irrealista as primeiras simulações e introduziram novos ingredientes, a fim de aproximar aquelas descrições ao ambiente natural cotidiano. Alternância de movimentos, possibilidade de erro ou má compreensão, memória de mais de uma rodada, ao lado de diversos outros aspectos ligados à topologia do território foram criados para tornar ainda mais precisas as observações feitas sobre a interação entre os organismos.

De um modo geral, todas as dificuldades postas acabaram por confirmar os resultados iniciais que apontavam para a possibilidade da cooperação evoluir na maioria das circunstâncias examinadas. Contudo, de acordo com a avaliação de Robert Hoffmann - feita duas décadas depois de constantes debates aos torneios iniciais - outras estratégias, que não a OPO determinista, poderiam promover a cooperação sob certas condições. Toda uma família de estratégias variantes de OPO foi gerada. Outros algoritmos híbridos permitiram a ligação entre famílias concorrentes, diluindo as fronteiras entre estratégias cooperadoras.

Os resultados dessa literatura, portanto, confirma um número de descobertas chaves dos trabalhos teóricos. Primeiro, a cooperação é possível em equilíbrio quando jogadores não levam em consideração o término do jogo. Segundo, na estrutura evolucionária, qualquer estratégia que propague rigidez pode ser em última instância deslocada por formas alternativas de comportamento (HOFFMANN, R. "Twenty Years On", § 4.2, p. 10).

De todos os atributos estratégicos e condições necessárias para a cooperação, a reciprocidade surge como elemento principal. Contudo, outros fatores relevantes ajudam a entender porque a cooperação nem sempre ocorre entre espécies diferentes e como ela pode ser mantida em meio à adversidade. Relacionamentos mais complexos em cenários que envolvam eventos aleatórios, mudanças territoriais, erros, alternância etc. mostraram a necessidade de manutenção de um contrato estável ou de uma larga "sombra do futuro", no intuito de permitir a previsão comportamento do outro a partir de uma adaptação a longo prazo, com obtenção de resultados favoráveis o bastante para que a deserção não viesse a ser compensada.

[A] utilização e extensão do paradigma original do Dilema dos Prisioneiros Iterado entre duas pessoas proviu de ricas possibilidades os efeitos de uma ampla faixa de fatores tais como o tempo dos movimentos tomada de garantias, redes sociais, adaptação, inveja, ruído e mobilidade. À luz de extensa literatura existente, sobre os modelos relatados relacionam resultados dos modelos detalhadamente relatados sobre cada fator, bem como para a contínua adoção de novos temas (AXELROD, R. "On Six Advances in Cooperation Theory", pp. 31/32).

A simplicidade dos modelos empregados nas simulações realizadas delinearam como a cooperação entre organismos complexos pode emergir no ambiente biológico natural, a partir do permanente incentivo a repetida interação entre indivíduos. O reconhecimento e as lembranças das ações passadas de cada um estimulavam os seres inteligentes a manter a cooperação entre os cooperadores e a deserção para os que têm má reputação de desertores. Nos casos de agentes mais simples, próximos aos autômatos celulares, a cooperação resiste em face da reação de agentes semelhantes na vizinhança.

Direta ou indiretamente, a reciprocidade é, portanto, uma condição necessária para sustentação a cooperação. Mas essa não é a única maneira disso acontecer. Sem a memória ou qualquer recordação das ações passadas, a reciprocidade deixa de ser um fator efetivo. Nesses casos, apenas a similaridade, ou o recurso ao reconhecimento de uma marca ou etiqueta que identifique um parceiro semelhante ao seu algoritmo, seria capaz de fazer prevalecer a tolerância ou a cooperação entre os agentes. No entanto, a proliferação das etiquetas ou mesmo a falsificação delas podem gerar equívocos custosos aqueles que só cooperam pela observação de sinais externos. Entretanto, essas características fisionômicas ou comportamentais poderiam explicar a aplicação de mecanismos etnocêntricos, como forma de garantir a cooperação entre os membros de um grupo identificado pelos mesmos rótulos (6).

Na prática, a similaridade pode explicar o flocescimento da cooperação entre espécies ou etnias. Porém, embora à primeira vista possa parecer uma forma simples e econômica de encontrar parceiros bons cooperadores, as etiquetas implicam em um custo crescente no refinamento do aparato de identificação, a fim de evitar falsificações e o oportunismo dos organismos que mimetizam as maneiras do outro se apresentar ou comportar. Recorrer a garantias, por vezes acaba em regressão ao infinito de um inferno burocrático em torno do aval das garantias, fiadores, garantias dos fiadores etc.

Se as sinalizações por meio de etiquetas podem enfrentar problemas de identificação ao longo do tempo, a reciprocidade obriga que os jogadores estejam atentos para as ações executadas pelos outros. Mais do que as palavras, importa aos agentes recíprocos os resultados obtidos da interação. Em todo caso, as recomendações não são tão simples quanto possam parecer as regras adotadas. Intuitivamente, permanecem válidos os conselhos de Marco Polo a Kublai Khan em Cidades Invisíveis, de Ítalo Calvino.

O inferno dos vivos não é algo que será; se existe, é aquele que já está aqui, o inferno ao qual vivemos todos os dias, que formamos estando juntos. Existem duas maneiras de não sofrer. A primeira é fácil para a maioria das pessoas: aceitar o inferno e tornar-se parte deste até o ponto de deixar de percebê-lo. A segunda é arriscada e exige atenção e aprendizagem contínuas: tentar saber reconhecer quem e o que, no meio do inferno, não é inferno, e preservá-lo e abrir espaço (CALVINO, I. As Cidades Invisíveis, 9, p. 150).

O DPI apresenta alguns aspectos básicos relacionados com a emersão da cooperação entre agentes egoístas em interação direta, uns com os outros. Evolutivamente, espécies de primatas, além do Homo sapiens, comportam-se como altruístas recíprocos que consolidaram estratégias em situações semelhantes ao dilema dos prisioneiros. Sem embargo, convém notar que o DPI é adequado para análise do comportamento entre duas partes. Para mais de dois jogadores, outros modelos esclarecem pontos que não são precisamente detectados em simulações baseadas em jogos bimatriciais (2 X 2). Os Bens Públicos vêm esclarecer outros aspectos da cooperação em dilemas sociais.

Notas
1. Veja DENNETT, D. Cl. Tipos de Mentes, cap. 2, p. 26.
2. Veja AXELROD, R. The Evolution of Cooperation, cap. 2, p. 54.
3. Veja AXELROD, R. Op. cit., cap. 6, p. 110.
4. Veja AXELROD, R. Idem, cap. 6, p. 117.
5. Um sumário dessas críticas encontra-se em BINMORE, K. "Review: The Complexity of Cooperation", resenha de 1998.
6. Veja RIOLO, R. L., COHEN. M. D. & AXELROD, R. "Evolution of Cooperation without Reciprocity" e AXELROD, R. & HAMMOND, R. A. "The Evolution of Ethnocentric Behavior" para o assunto das etiquetas.

« Antes: A Famíla de Estratégias TIT FOR TAT

A seguir: O Jogo dos Bens Públicos.»

Referências Bibliográficas

AXELROD, R. The Evolution of Cooperation. - Nova York: Basic Books, 1984.

__________. "On Six Advances in Cooperation Theory". Analyse & Kritik, pp. 1-39, janeiro de 2000. Disponível na Internet via http://www-personal.umich.edu/~axe/research/SixAdvances.pdf

AXELROD, R. & HAMMOND, R. A. "The Evolution of Ethnocentric Behavior". Midwest Political Science Convention. - Chicago, abril de 2003. Disponível na Internet via http://www.personal.umich.edu/~axe/research/Ax.Hamm.Ethno.pdf

BINMORE, K. "Review: The complexity of cooperation", in Journal of Artificial Societies and Social Simulation. Disponível na Internet via http://jasss.soc.surrey.ac.uk/1/1/review1.html. Arquivo consultado em 2003.

CALVINO, I. As Cidades Invisíveis; trad. Diogo Mainardi. - São Paulo: Companhia das Letras, 1998.

DENNETT, D. Cl. Tipos de Mentes; trad. Alexandre Tort. - São Paulo: Rocco, 1997.

HOFFMANN, R. "Twenty Years On", in Journal of Artificial Societies and Social Simulation, vol 3, nº 2. Disponível na Internet via http://www.soc.surrey.ac.uk/JASSS/3/2/forum/1.html

RIOLO, R. L., COHEN. M. D. & AXELROD, R. "Evolution of Cooperation without Reciprocity", in Nature, vol. 414, novembro 2001.