Teoria dos Jogos e da Cooperação para Filósofos: Seção I

TEORIA DOS JOGOS E DA COOPERAÇÃO (MAY, E. 'Ben Franklin leva Xeque-Mate de Lady Howe', sec.XIX)

TEORIA DOS JOGOS E DA COOPERAÇÃO PARA FILÓSOFOS

SEÇÃO I

» 4ª Unidade: Modelos de Jogos

A Centopéia, Indução Reversa, o Papel do Tempo.

Por Antônio Rogério da Silva

Um dos problemas mais graves de jogos repetidos como Dilema dos Prisioneiros Iterado é o efeito da jogada final sobre o comportamento dos jogadores. A forte tendência para deserção acontece quando se estabelece de antemão um prazo fixo para o término da partida. No primeiro torneio de computadores de Axelrod, essa dificuldade não foi determinante, graças ao fato de nenhum dos programas que participaram do evento terem explorado tal propriedade dos superjogos finitos. Quando há um momento que todos sabem ser o fim do jogo, a tendência é deste ser interpretado como o jogo básico, onde as escolhas são feitas em função do ponto de equilíbrio original.

No Dilema dos Prisioneiros, cuja matriz tem seu equilíbrio de Nash na deserção mútua, sua repetição finita levaria os jogadores a fazerem suas escolhas próximos à rodada final de modo a obterem, contra suas vontades, como pagamento a indesejável punição. Pelo menos é isso o que prevê a teoria dos jogos para agentes egoístas racionais. Tudo porque em um jogo finito repetido várias vezes, o único equilíbrio de Nash existente na matriz do jogo base tende a repetir-se nos subjogos subsequentes. Por exemplo, a partir da matriz do Dilema dos Prisioneiros, o jogo imediato a seguir à deserção mútua inicial somará os resultados decorrentes dessa primeira rodada aos da nova etapa produzindo a seguinte figura:

Figura 1a Estratégias
Coluna

Cooperar Desertar

Linha
Cooperar 3, 3 1, 4 c

Desertar l 4, 1 l 2, 2 c

DPI após Punição da 1ª rodada

Quando a deserção de linha e a cooperação da coluna são somadas à matriz básica, produz-se, em seguida, essa nova figura:

Figura 1b Estratégias
Coluna

Cooperar Desertar

Linha
Cooperar 6, 3 4, 4 c

Desertar l 7, 1 l 5, 2 c

DPI que acumula P e Tentação de Linha

A possível retaliação da coluna e contrição da linha levaria então à figura abaixo:

Figura 1c Estratégias
Coluna

Cooperar Desertar

Linha
Cooperar 6, 6 4, 7 c

Desertar l 7, 4 l 5, 5 c

P, T de Linha e Coluna acumulados ao DPI

Para finalmente, somarmos a cooperação mútua, gerando essa quarta figura:

Figura 1d Estratégias
Coluna

Cooperar Desertar

Linha
Cooperar 8, 8 6, 9 c

Desertar l 9, 6 l 7, 7 c

DPI com P, T e Recompensa somados

Portanto, a cada nova etapa da repetição do jogo, apenas a deserção mútua se mantém como o equilíbrio perfeito nesse subjogo em todas as suas sucessivas etapas. Se a deserção perpétua (SEMPRE D), em jogos factuais e virtuais nunca é a estratégia vitoriosa, a despeito do que prediz a teoria dos jogos a explicação aparece em evidência ao se examinar o jogo criado por Robert W. Rosenthal, em 1980, e que foi chamado de Centopéia. O modelo da Centopéia é uma ferramenta adequada para exame desse tipo de comportamento. Isso porque diferente do Dilema dos Prisioneiros, trata-se de um jogo de informação perfeita e completa e sua solução surge pela aplicação da indução reversa.

Em jogos de informação perfeita, a indução reversa funciona como método prático para detecção de um equilíbrio perfeito nos subjogos de um jogo estendido. A partir do caminho principal, que as estratégias adotaram conforme as escolhas de cada um, retorna-se à raiz passando por cada ponto de decisão (nó em uma árvore). Desde as folhas dos últimos ramos, segue-se em direção a sua raiz. Em cada nó é-se levado pelas melhores escolhas de um jogador até o nó anterior do outro sucessivamente. Quando se chegar ao nó unitário que deu origem ao caminho seguido as demais alternativas podem ser eliminadas, restando apenas o conjunto dos movimentos feitos por uma determinada estratégia conjunta. Assim é possível ver qual será o resultado final do jogo "retrospectivamente", antes mesmo de começar, já que todas as informações estão postas desde o início. A indução reversa requer que haja o conhecimento comum sobre a racionalidade dos agentes. Se forem racionais, a indução reversa mostrará que o primeiro jogador, na figura 2, deverá escolher logo o caminho da esquerda em sua escolha inicial.

Todavia, se há a mínima probabilidade de um dos dois jogadores supor que o sucessor fará uma confusão, acionando "o botão errado", o antecedente poderia fazer uma escolha diferente da prevista pelo paradoxo da indução reversa e racionalmente ir para a direita. A "mão trêmula" (trembling hands) do adversário poderia levar uma outra solução aceitável para a Centopéia poder andar. Sendo ou não verdade que as pessoas apelam intuitivamente para a "mão trêmula" - termo fixado para este tipo de solução -, experimentos posteriores com a centopéia raramente revelam uma jogada à esquerda do primeiro jogador (1).

David M. Kreps promoveu várias experiências com variantes de centopéia que se chocaram com a previsão fornecida pela indução reversa. Em geral, as respostas dos líderes indicavam o risco assumido por eles, uma vez que a perda do ponto inicial não significaria uma perda tão grande, quanto à possibilidade de um ganho maior caso o segundo jogador também tivesse ambição de chegar ao 101. Haveria como que uma aposta no "espírito" cooperador do outro participante. Mas essa crença não é suficiente para manter um equilíbrio diferente daqueles do começo. Pequenas mudanças nos valores pagos que aproximassem o jogo de uma situação real podem destruir tais crenças sobre a personalidade do outro. A incerteza sobre as características do adversário levaria a situação dos fazendeiros de David Hume que se abstêm da ajuda do outro em nome da segurança e da inconfidência (2).

Variações da Centopéia

Em Trust within Reason (1998), o filósofo inglês Martin Hollis (1938-1998) imaginou o jogo sequencial como a centopéia para analisar a validade da forma de raciocínio que poderia estar por trás da indução reversa. No Jogo das Moedas, que ele preparou, um montante de seis moedas estaria à disposição de dois jogadores que teriam a possibilidade de pegar na sua vez uma ou duas moedas. Caso pegasse uma moeda, o líder a reteria para si passando a jogada para o próximo jogador. Se pegasse duas moedas, o jogo encerrar-se-ia e as quatro moedas restantes reverteriam à banca. Na sua forma completa, o jogo tem a árvore que aparece na figura 3.

Pela indução reversa, o melhor seria "A" pegar logo as duas moedas, ao invés de esperar por quatro da última rodada, ou três, se quisesse parecer justo ao outro jogador. Sendo ambos agentes racionais é válido pensar que o jogo terminará em seu lance inicial. Contudo, ponderou Hollis, se "A" pega apenas uma moeda pode levar "B" a pensar que há uma algum equívoco na sua atitude ou que não procura maximizar sua utilidade, pondo também em dúvida sua capacidade racional. Porém, uma iniciativa cooperadora como esta poderia levantar a suspeita de se tratar apenas de um ardil para chegar às quatro moedas no final, posto que nenhum agente racional preferiria três ao invés de um ganho maior. Essa segunda linha de raciocínio religaria o paradoxo da indução reversa, fazendo com que "B" termine o jogo em seu primeiro movimento (3).

A conclusão que Hollis chegou é que a indução reversa não é uma forma inválida de argumentar contra a cooperação entre agentes egoístas racionais, mas uma maneira sutil de mostrar que não se pode determinar o comportamento de um agente com base apenas no conhecimento comum sobre sua racionalidade. Pessoas de "carne e osso" tem levado a cooperação até o final nesse tipo de jogo, repartindo meio a meio o total oferecido na maioria das vezes. Especulações sobre tal conduta indicam que haveria algo mais a ser considerado fora do aparato da racionalidade pressuposta pela teoria dos jogos. No contexto cultural de uma sociedade, o hábito ou o costume de se levar uma interação até o final poderia estar na raiz da tendência desse comportamento regular produzido pela vida cotidiana (4).

De outro modo, jogos mais curtos revelam que a formação de uma reputação poderia explicar que está em questão a maneira como os agentes querem ser compreendidos no futuro. Assim, um jogo alternado, como o proposto pelo sociólogo norueguês Jon Elster (5), ajuda a entender o papel do passado e do futuro nas tomadas de decisão (figura 4).

O líder tem a oportunidade de encerrar o jogo escolhendo "B", entretanto, por acreditar que II seja racional, deve arriscar-se a ganhar o máximo possível, deixando que este decida ficar com um ou nada ganhar. A despeito de sua racionalidade - e talvez por ser um INVEJOSO MODERADO -, o segundo jogador emprega a indução reversa e verifica que se I tivesse escolhido "B", ambos obteriam a repartição justa de (2, 2). Nessa hora, sentimentos de indignação e ressentimento podem vir à tona, fazendo que II tenha a chance de se vingar do líder, escolhendo (0, 0). Teóricos dos jogos poderiam considerar irracional deixar-se levar por sentimentos morais como a indignação ou vergonha e buscar a vingança, abrindo mão de um ganho maior do que zero, nesses casos. Todavia, a tendência experimental para uma divisão justa sinalizaria, sob o ponto de vista evolutivo, que, embora o jogo seja implementado em uma só rodada, sem repetição, a consideração da reputação de uma pessoa justa, que não aceita uma distribuição flagrantemente desigual, ou vingativa acompanha a decisão nesses modelos de jogos, apoiado em uma projeção no tempo, passado e futuro, da expectativa de comportamento por parte do outro, que não quer passar a imagem de quem aceita qualquer coisa em nome de sua racionalidade instrumental.

Em casos extremos, quando há a possibilidade de comunicação prévia entre agentes, o ultimato pode vir acompanhado por uma chantagem do líder ao segundo jogador ou deste para o primeiro, a fim de que o outro procure favorecer os ganhos do próprio chantagista. Tal como Hollis, o filósofo inglês, Simon Blackburn, afirma que nas situações empíricas concretas, os teóricos dos jogos não podem recomendar esta ou aquela maneira de jogar (6).

Em casos concretos, apesar das dificuldades de descrição das situações com maior grau de complexidade, críticas como as de Blackburn não desautorizam as recomendações da teoria dos jogos para circunstâncias específicas que atendam as condições iniciais dos modelos teóricos. Para evitar as ameaças, cortar as comunicações parece ser um bom conselho geral. Para fazer crível uma promessa é bom ter construído antes uma reputação de quem cumpre a palavra e assim por diante. Por muito paradoxais que sejam as descrições e sugestões feitas pela Teoria dos Jogos, cada vez mais, biólogos evolutivos têm encontrado razões para considerá-la um instrumento de análise adequado, no sentido de explicar o processo de evolução do comportamento cooperativo entre seres vivos, de um modo geral, e a emergência de algumas propriedades relevantes a isso, em particular.

Na filosofia, a aplicação dos modelos de jogos como Centopéia e o Dilema dos Prisioneiros - em suas diversas versões, pelo que foi visto até aqui, permite examinar aspectos importantes da evolução da cooperação e da equidade, bem como de sentimentos morais e da comunicação em sujeitos racionais egoístas, sem apelar para conceitos transcendentais ou metafísicos de qualquer ordem. Além dessas características, outros problemas e instrumentos têm sido acrescentado, ampliando a área de atuação da filosofia prática e sua acuidade. Resta observar mais atentamente para onde a teoria dos jogos aponta ao invés de simplesmente recusar seus métodos com argumentos precipitados sobre sua inadequação em relação às maneiras da tradição filosófica.

Notas
1. KREPS, D. "Game Theory and Economic Modelling", cap. 4, pp. 77-82.
2. Veja HUME, D. A Treatise of Human Nature, liv. III, part. II, seç. V, pp.286 e ss.
3. Veja HOLLIS, M. Trust within Reason, cap. 3, pp. 55-57.
4. Veja HOLLIS, M Op. cit., cap. 3, p. 57.
5. Veja ELSTER, J. "Some Unresolved Problems in the Theory of Rational Behavior", p. 186.
6. Veja BLACKBURN, S. Ruling Passions, cap. 6, p. 172.

« Antes: Ruído, Alternância e Evolução

A seguir: Computadores X Estudos Acadêmicos.»

Referências Bibliográficas

BLACKBURN, S. Ruling Passions. - Oxford: Claredon, 1998.

ELSTER, J. "Some Unresolved Problems in the Theory of Rational Behavior", in Acta Sociologica, 36, pp. 179-190, 1993.

FIANI, R. Teoria dos Jogos. - Rio de Janeiro: Elsevier, 2004.

HUME, D. A Treatise of Human Nature. Versão eletrônica disponível na INTERNET via http://www.grupohume.hpg.ig.com.br/Grupo%20Hume.htm. Arquivo consultado em 2002.

HOLLIS, M. Trust Within Reason. – Cambridge: CUP, 1998.

KREPS, D. M. Game Theory and Economic Modelling. – Oxford: OUP, 1996.