Teoria dos Jogos e da Cooperação para Filósofos: Seção II

TEORIA DOS JOGOS E DA COOPERAÇÃO (MAY, E. 'Ben Franklin leva Xeque-Mate de Lady Howe', sec.XIX)

TEORIA DOS JOGOS E DA COOPERAÇÃO PARA FILÓSOFOS

SEÇÃO II

» 4ª Unidade: Novos Campos Interdisciplinares

A Construção de Jogos e sua Utilização Prática.

Por Antônio Rogério da Silva

Logo que tiveram notícia da descoberta do conceito de ponto de equilíbrio, por John Nash, Merrill Flood e Melvin Dresher elaboraram o experimento que ficou mundialmente famoso - depois da história montada por Albert W. Tucker - como Dilema dos Prisioneiros. O objetivo era saber se pessoas que desconheciam a ideia de equilíbrio de Nash, ao se depararem com uma situação semelhante à matriz do jogo, reagiriam conforme a previsão teórica, desertando mutuamente. A experiência foi realizada nos laboratórios da corporação RAND, com John Williams, chefe do departamento de matemática da empresa, e o economista Armen Alchian, da universidade de Los Angeles (UCLA). O jogo foi repetido em 100 rodadas e, ao contrário de estimular o uso da estratégia dominante - a deserção -, acabou por gerar a cooperação entre os jogadores, longe do ponto de equilíbrio (1).

Efetivamente, os participantes tinham percebido que deveriam cooperar, caso quisessem maximizar seus ganhos, usando a dominante somente quando o outro não tivesse cooperado, como punição instantânea, e retomando a cooperação na rodada posterior - segundo o que se chamou depois de estratégia OLHO POR OLHO. John Nash havia demonstrado a existência de, ao menos, um ponto de equilíbrio em qualquer jogo não-cooperativo finito com mais de um jogador e soma diferente de zero. Essa teoria foi apresentada em sua premiada tese de 1950 "Non-Cooperative Games", que propunha uma solução mais abrangente do que os resultados do teorema minimax de Von Neumann que se restringia a jogos cooperativos e de soma zero. De fato, Nash logrou demonstrar a existência de ponto de equilíbrio para qualquer tipo de situação finita: cooperativa ou não cooperativa; soma zero ou variante; dois ou mais agentes. Todo seu esforço estava voltado para tornar mais úteis e práticas as ideias lançadas em Theory of Games and Economic Behavior (1947), por Von Neumann e Morgenstern. Ainda que as estratégias puras não mostrassem um ponto de equilíbrio, sempre se poderia encontrá-lo por meio de mistura das linhas de ação (2).

Os modelos de jogos, como o Dilema dos Prisioneiros, surgiram, portanto, como uma maneira de testar as hipóteses propostas para solucionar o conflito parcial de interesses entre agentes racionais egoístas. Mais tarde o campo de aplicação de suas simulações se estendeu a todo tipo de agente - racional ou não - que tivesse de tomar uma decisão sobre que fazer diante de um ser semelhante que disputa os bens disponíveis, mas que depende do outro para alcançá-lo. Dessa forma, a construção de jogos como método de pesquisa permite por em prática os tradicionais experimentos mentais que sempre foram produto da especulação filosófica mais apurada. Só que agora, os jogos possibilitavam encontrar uma resposta sobre os efeitos da proposta examinada.

No caso do Dilema dos Prisioneiros, sua matriz jogada em uma só rodada punha em cheque o influente mecanismo da mão invisível, anunciado por Adam Smith (1723-1790), em Teoria dos Sentimentos Morais (1759) e depois reapresentado em A Riqueza das Nações (1776). À medida que, sendo repetido várias vezes, o jogo permitia à cooperação ser implementada, contra a orientação racional que era recomendada, no que diz respeito à mão invisível, a noção apresentada por Smith não seria capaz de fornecer a distribuição justa que se pensava poder realizar afinal. Ao promover suas ações no sentido de obter "o máximo valor possível", cada indivíduo não conseguiria elevar ao máximo a renda da sociedade de modo que a distribuição desses bens, conduzida pela mão invisível, fosse a mais igualitária e eficiente do que se fosse planejada. Os agentes racionais, na situação do dilema, se seguirem as estratégias que maximizam seus ganhos individuais, acabam por gerarem o pior resultado conjunto: a puniçao mútua (3).

Uma distribuição justa só surge quando, aos jogadores, é dada a oportunidade de retaliar e tolerar os erros cometidos pelos outros. O comportamento recíproco torna-se viável com a repetição frequente das rodadas. Não obstante o fato da fuga da estratégia dominante, no Dilema dos Prisioneiros Iterado, contradizer a previsão de que seres racionais a seguem e se encontram em um ponto de equilíbrio de Nash.

O uso de experimentos por modelos de jogos para formalizar as situações de conflito visa detectar os aspectos mais importantes de cada circunstância e que influenciam as deliberações, bem como o comportamento dos agentes. Desde o Dilema dos Prisioneiros, sua aplicação vem sendo cada vez mais incrementada. Por conta disso, os elementos que permitem prever as ações dos indivíduos, ou ao menos interpretar suas decisões, podem ser descritos de forma mais precisa. Antes dos torneios de Axelrod, diversos testes realizados em torno do Dilema dos Prisioneiros revelaram uma atitude competitiva dos participantes, tal como aquelas adotadas pelos programadores que tentaram bater a estratégia OPO, vitoriosa desde o início. Contudo, além da capacidade de retaliar, Axelrod havia chamado atenção para a condição de clemência (forgiving), que fazia OPO recuperar a cooperação, como característica decisiva de seu êxito nos dois torneios que ele promoveu (4).

A complexa ação dos elementos observados nos experimentos transformou a meta inicial de se construir uma teoria que buscasse em primeiro lugar a predição de resultados. Agora, ao invés de apontar soluções para todos os jogos, a investigação procura avaliar o grau de participação de cada fator deliberativo e dos princípios do comportamento estratégico. O conhecimento empírico adquirido pela prática dos jogos permitiu avançar respostas para as questões problemáticas do comportamento estratégico, que as suposições teóricas, por si só, não conseguiam solucionar.

(...) As previsões da teoria dos jogos, particularmente a teoria dos jogos não cooperativos, que suportam muitas aplicações, são notavelmente sensíveis aos detalhes da estrutura do jogo, e muito de sua sensibilidade é refletida no comportamento observado. Tais detalhes raramente podem ser precisamente observados ou adequadamente controlados no campo. O laboratório partilha alguns desses problemas, mas o controle e observação que técnicas experimentais modernas permitem amiúde fornecer aos experimentos uma decisiva vantagem na identificação da relação entre o ambiente e o comportamento estratégico (...) (CRAWFORD, V. P. "Introduction to Experimental Game Theory", I, p. 2).

Se antes a personalidade do jogador era uma variável importante que estava longe do alcance do experimentador, hoje, modelos como o Ultimato e o DPI procuram enfocar os diversos aspectos da cognição humana - crenças, desejos e sentimentos - que interferem nas escolhas de cada um. Nesse sentido, as simplificações praticadas pelas simulações funcionam de modo similar aos experimentos avançados da física, que isolam as partículas em ambiente artificial, a fim de estudar o comportamento entre elas e as forças que atuam em situações específicas. Cada modelo de jogo proporciona a observação mais detalhada das características do comportamento que influenciam as tomadas de decisão. O DPI aponta o papel fundamental da reciprocidade para o estabelecimento da cooperação de um modo geral. Os Bens Públicos mostram o papel de mecanismos como a punição na manutenção de um emprendimento comum. Enquanto o Ultimato revela que as emoções e o ambiente cultural também exercem pressão considerável na emersão de resultados equitativos.

Sentimentos morais, como indignação, vergonha e vingança, foram incorporados ao repertório comportamental da espécie humana à medida que suas manifestações provocavam restrições às escolhas estratégicas que a longo prazo traziam resultados prejudiciais à sobrevivência e reprodução dos indivíduos. Esses sentimentos proporcionariam as respostas adaptativas a diversas situações sociais e ambientais que envolvessem outros sujeitos e ameaçassem o bem estar do agente racional. Corresponderiam então àquilo que António R. Damásio denominou de marcadores-somáticos (5).

A base neural para o sistema interno de preferências consiste, sobretudo, em disposições reguladoras inatas com o fim de garantir a sobrevivência do organismo. Conseguir sobreviver coincide com conseguir reduzir os estados desagradáveis do corpo e atingir estados homeostáticos, isto é, estados biológicos funcionalmente equilibrados. O sistema interno de preferências encontra-se inerentemente predisposto a evitar a dor e procurar o prazer e é provável que esteja pré-sintonizado para alcançar esses objetivos em situações sociais (DAMÁSIO, A. R. O Erro de Descartes, part. 2, cap. 8, p. 211).

A utilização de jogos como o Ultimato permite avaliar até onde os sentimentos morais, adquiridos durante a evolução, se manifestam de acordo com uma lista de preferências internas e a compreensão dos contextos externos nos quais o agente deve decidir a maneira de se comportar conforme normas sociais e éticas. Martin Nowak e Karl Sigmund pressumem que essas respostas emocionais foram montadas graças à convivência humana praticada por milhões de anos em pequenos grupos, nos quais cada um de seus membros são conhecidos dos outros. Ao passo que, a superpopulação e o crescimento desordenado das grandes cidades colocarariam o problema do anonimato como fator perturbador das interações continuadas. O conhecimento do tipo de agente com o qual se interage favorece a manifestação das emoções, enquanto a recusa sistemática de ofertas baixas restringem sua repetição no futuro, obrigando o outro a aumentar os ganhos propostos e maximizar a utilidade de todos participantes (6).

Todavia, quando a impossibilidade de novos encontros entre agentes se torna constante, o anonimato acaba por perturbar a cooperação e proporcionar o florescimento de desertores e a insegurança das propostas e respostas. A reputação só é eficaz se novos encontros puderem ocorrer no futuro. Coisa que se torna difícil entre estranhos de uma megalópole. Pode-se saber com alguma precisão como se comportam parentes, vizinhos, amigos e colegas. Mas o controle fica difícil quanto maior for o número de conhecidos com os quais se interage. O efeito do anonimato é mais uma consequência perturbadora das grandes cidades e da superpopulação sobre o comportamento dos seus habitantes, diminuindo a confiança entre eles. Por conta dessa desconfiança, a exigência de garantias, mecanismos de identificação - cadastro de bons e maus pagadores - e aparelhos de repressão tornam-se cada vez mais necessários.

A construção do modelo adequado de jogo permite, então, avaliar com maior precisão os componentes relevantes de interação. A partir disso, as decisões a serem adotadas no intuito de fomentar ou restringir a cooperação podem ser sugeridas com maior probabilidade de correção. Desse modo, o emprego de simulações e jogos entre agentes humanos ajuda a compreender melhor os aspectos sutis que subjazem à interação. Com isso, as hipóteses tecidas por teóricos que estudam o comportamento humano podem ser testadas no sentido de fazer valer ou derrubar as conclusões tiradas sobre a cooperação que acontece no mundo concreto.

A pesquisa realizada por esse método deve atender alguns requisitos básicos acerca da maneira como a experiência será modelada, da análise dos resultados e sua divulgação. Os modelos de jogos funcionam como os experimentos mentais, bastante difundidos em textos filosóficos, mas que podem ser reproduzido por meio eletrônico ou questionários tradicionais, em papel. De um modo geral, parte-se de hipóteses simples que uma vez implementadas geram consequências complexas ou paradoxais. Os efeitos decorrentes da complexidade de interação entre agentes simples fazem emergir propriedades que não eram observadas antes no comportamento individual. Tais propriedades emergentes são temas comuns às pesquisas feitas na física contemporânea sobre os sistemas complexos abordados sob a perspectiva da Teoria do Caos.

Nesse sentido, hipóteses fortes sobre a racionalidade das escolhas podem ser enfraquecidas, no intuito de abranger toda forma de atuação de indivíduos cujo processo de deliberação leva a inferência de algum princípio dedutivo. Seres muito simples poderiam ser incluídos nessa pesquisa, concebendo suas escolhas como geradas por meio de um processamento de informações obtidas no meio ambiente que provocam uma resposta do agente. Essas respostas dar-se-iam através de um conjunto de regras incorporadas que produziriam uma maneira de extrair ações em função da entrada de informações.

Quanto mais simples forem os testes baseados no modelo de agente, maiores são as possibilidades de se perceber o processo fundamental ascendente que se inicia com os elementos básicos da interação e se eleva às conclusões gerais sobre o comportamento social. A validade interna do procedimento que conduz esse tipo de pesquisa a resultados consistentes depende do grau de precisão entre elementos que compõem o experimento e a situação real analisada. Resultados contra-intuitivos causam forte discussão sobre a possibilidade de algum erro ter sido cometido na formulação ou execução dos modelos propostos. Nesses casos, deve-se proceder ao reexame de todo método empregado, utilizando propostas alternativas, variantes e contra-exemplos, a fim de se detectar possíveis falhas na aplicação dos testes que devem também ser flexíveis o suficiente para permitir novas versões aprimoradas e extensões a diversas circunstâncias (7).

Os modelos mais avançados de estudo do comportamento de agentes incluem abordagens de redes neurais, algoritmos que podem evoluir e técnicas de aprendizagem que se aplicam à maneira como os indivíduos se adaptam nas interações cotidianas. O sistema de agentes é modelado com base em informações sobre como os agentes tomam suas decisões de modo autônomo. Assim, procura-se saber como são organizados os mercados, o fluxo da população e a difusão das estratégias simuladas de um ponto de vista "atômico" (partículas mínimas e indivisíveis) da sociedade como alternativa à visão "macroscópica", que é descendente. A rigor, a simplicidade dos modelos não deve diminuir a importância e a profundidade dos conceitos trabalhados.

Nas ciências sociais, as simulações dos contextos da sociedade têm estimulado a mudança de metas tradicionais que antes buscavam uma ferramenta que produzisse resultados previsíveis, mas que agora se restringem aos limites da tarefa de compreensão do modo como os agentes atuam. Nas palavras de Eric Bonabeau - então, pesquisador da Icosystem Corporation -, "prever o sucesso pode ser simples, mas coisa difícil de fazê-lo; entender como o sucesso acontece é um uso melhor do modelo" (8). Tais modelos são úteis para mostrar o modo complexo de como o agente aprende e se adapta a uma situação. Além disso, podem ser aplicados para avaliar a mobilidade territorial e a resistência a invasões, sobretudo, quando o comportamento dos indivíduos de uma população é heterogêneo e varia de região para região - nas relações de convívio familiar, vizinhança, instituições públicas, trabalho etc.

Em geral, os temas de maior interesse para essa área do conhecimento são as questões sociais, políticas e econômicas, que devem aplicar modelos específicos para cada proposta de investigação e não forçar o uso de um modelo de solução universal para todos os problemas da humanidade. Como já se tentou destacar os DPI, os Bens Públicos e o Ultimato, por exemplo, servem para tratar questões de reciprocidade direta, indireta e de equidade, respectivamente, com maior precisão. Isso não implica em soluções ad hoc, pois a formalização empregada segue os mesmos procedimentos gerais da teoria dos jogos, variando apenas os elementos que têm de ser mudados de modo realista. Para as ciências sociais, o modelo de jogos talvez seja a única maneira viável, salvo melhor juízo, de abordar a inconsistência do comportamento humano e seu complexo processo cognitivo de escolha.

Os jogos experimentados vêm expandindo-se além dos domínios econômicos e se tornando um ambiente próprio para troca de informações interdisciplinares. Mesmo quando são tratados por economistas, suas conclusões dizem respeito a outras matérias pertinentes, como no caso da avaliação da equidade nos modelos de jogos que interessam desde áreas administrativas até as neurociências em suas mais recentes descobertas.

Notas
1. Veja relato desse fato em NASAR, S. Uma Mente Brilhante, part. I, cap. 12, pp. 147-149.
2. Veja NASH, J. "Non-Cooperative Games", pp. 85 e ss.
3. A descrição da "mão invisível" está em SMITH, A. Teoria dos Sentimentos Morais, IV part., cap. 1, p. 226 e SMITH, A. A Riqueza das Nações, liv. VI, cap. II, pp. 379-380.
4. Veja AXELROD, R. The Evolution of Cooperation, II, cap. 2, p. 40.
5. Veja DAMÁSIO, A.R. O Erro de Descartes, part. 2, cap. 8, pp. 209 e ss.
6. Veja SIGMUND, K., FEHR, E. & NOWAK, M. "The Economics of Fair Play", p. 85.
7. Pormenores dessa metodologia podem ser buscados em AXELROD, R. "Advancing the Art of Simulation in the Social Sciences", § 3.1, p. 7.
8. BONABEAU, E. "Agent-Based Modelling", p. 7286.

« Antes: A Emersão da Equidade

A seguir: As Diversas Disciplinas que Empregam os Modelos de Jogos.»

Referências Bibliográficas

AXELROD, R. The Evolution of Cooperation. - Nova York: Basic Books, 1984.

_______. "Advancing the Art of Simulation in the Social Science", in RENNARD, J-Ph (Ed.) Handbook of Reasearch on Nature Inspired Computing for Economy and Management.. - Hersey: Idea Group. Disponível na Internet via http://www-personal.umich.edu/~axe/research/AdvancingArtSim2005.pdf.

BONABEAU, E. "Agent-Based Modelling", in PNAS, vol. 99, sup. 3, pp. 7280-7287. Disponível na Internet via www.pnas.org.

DAMÁSIO, A.R. O Erro de Descartes, trad. Dora Vicente e Georgina Segurado. - São Paulo: Companhia das Letras, 1996.

NASAR, S. Uma Mente Brilhante; trad. Sérgio M. Rego. –Rio de Janeiro: Record, 2002.

NASH, J. "Non-Cooperative Games", in KUHN, H. & NASAR, S. The Essential John Nash. - Princeton: PUP, 2002.

SIGMUND, K. , FEHR, E., NOWAK, M.A. "The Economics of Fair Play", in Scientific American, jan. 2002.

SMITH, A. Teoria dos Sentimentos Morais, trad. Lya Luft. - São Paulo: Martins Fontes, 1999.

_____. A Riqueza das Nações, trad. Luiz J. Baraúna. - São Paulo: Nova Cultural, 1985.