O dilema do companheiro preso
O dilema do prisioneiro é a situação em que dois comparsas, A e B, são pegos cometendo um crime. Levados à delegacia e colocados em celas separadas, o promotor lhes diz que a polícia possui evidência suficiente para mantê-los presos por um ano, mas não o bastante para uma condenação mais pesada. Porém, se um confessar e concordar em depor contra seu cúmplice, ficará livre por ter colaborado, e o outro irá para a cadeia por 4 anos. Já se ambos confessarem o crime, cada um sofrerá uma pena de dois anos.
As decisões são simultâneas e um não sabe nada sobre a decisão do outro. O dilema do prisioneiro mostra que, em cada decisão, o prisioneiro pode satisfazer o seu próprio interesse – trair – ou atender ao interesse do grupo – cooperar. Aqui estão as possibilidades organizadas em ordem...
B coopera
|
B trai
| |
A coopera
|
1 ano para A
1 ano para B
|
4 anos para A
B fica livre
|
A trai
|
A fica livre
4 anos para B
|
2 anos para A
2 anos para B
|
Para qualquer um dos prisioneiros, o melhor resultado possível é trair e seu parceiro ficar calado. E até mesmo se seu parceiro trair, o prisioneiro ainda lucra por não cooperar também, já que ficando em silêncio pegará três anos de cadeia, enquanto que, confessando, só pegará dois. Em outras palavras, seja qual for a opção do parceiro, o prisioneiro se sai melhor traindo.
O único problema é que ambos chegarão a essa conclusão, a escolha racional é trair. Essa lógica vai, desta forma, proporcionar a ambos dois anos de cadeia. Se os dois cooperassem, haveria um ganho maior para todos, mas a otimização dos resultados não é o que acontece. (Fonte: PUC RIO. Dilema do prisioneiro.)
Economia e Direito: Nash e a Teoria do Equilíbrio
O emprego de estratégias mistas é recomendável sempre que as estratégias puras não indicarem uma estratégia dominante, uma solução em ponto de sela, ou em um ponto de equilíbrio. A noção de ponto de equilíbrio, em termos da Teoria dos Jogos, foi formalizada por John Nash como uma generalização da solução maximin para jogos não-cooperativos de várias pessoas e soma variável, não se restringindo somente aos cooperativos de duas pessoas e soma zero. O ponto de equilíbrio, nas palavras de Nash, é o conjunto de resultados opostos que maximiza os ganhos de cada jogador em face da melhor estratégia do outro. Nash mostrou que embora pudesse haver jogos em que as estratégias puras não apontassem para ponto de equilíbrio, o recurso à mistura de estratégia sempre produziria um novo ponto de equilíbrio em jogos finitos.
Um equilíbrio de Nash, ou ponto de equilíbrio, portanto, é uma combinação de estratégias da qual nenhum jogador pode aumentar seu ganhos unilateralmente, ao mudar de estratégia. Para localizar um ponto de equilíbrio em uma matriz, existem alguns métodos práticos e simples. O jogador deve descobrir a célula na qual o ganho seja, simultaneamente, o máximo da Linha nas devidas colunas e o da Coluna nas suas linhas. Visualmente, isto pode ser feito com o recurso de setas ou de letras que marquem os máximos da Linha (l) e da Coluna (c), sendo equilíbrios de Nash as células que contenham as marcas de ambos os jogadores, ou seja, a convergência das setas. Na matriz da Batalha dos Sexos, descrita há pouco, os equilíbrios surgem da seguinte forma...
Figura 4b
|
Estratégias
|
Ü
Coluna
| ||
Esquerda
|
Direita
| |||
Ý Linha
|
Alto
|
l 2, 1 c
|
0, 0
|
ß
|
Baixo
|
0, 0
|
l 1, 2 c
| ||
Batalha dos Sexos
|
Þ
|
O encontro das estratégias – alto, esquerda – e – baixo, direita – indicam a existência de dois pontos de equilíbrio que impedem a escolha de uma única solução usando só as estratégias puras, motivo pelo qual a mistura de estratégias se faz necessária. Quando um jogo apresenta apenas um ponto de equilíbrio pela combinação de estratégias puras é sinal que houve o cruzamento de duas estratégias dominantes. Ou seja, estratégias que dominam as outras estratégias de cada jogador, fornecendo o melhor ganho, independentemente do que o outro faça.
Assim, no modelo desenhado na figura 6, também conhecido como Dilema dos Prisioneiros, as estratégias baixo e direita superam as respectivas estratégias alto e esquerda, da Linha e da Coluna. Contudo, a dominância e a perfeição deste ponto de equilíbrio espanta a todos que se defrontam com este quadro pela primeira vez.
Figura 6
|
Estratégias
|
Coluna
Þ
| ||
Esquerda
|
Direita
| |||
ß Linha
|
Alto
|
2, 2
|
0, 3 c
|
ß
|
Baixo
|
l 3, 0
|
l 1, 1 c
| ||
Dilema dos Prisioneiros
|
Þ
|
A solução que dois agentes instrumentalmente racionais acabam por encontrar nunca é a melhor para ambos, no contexto do Dilema dos Prisioneiros, pois o ponto de equilíbrio (1, 1) é subótimo em relação a (2, 2), que poderiam obter se adotassem a estratégia dominada. Porém, um agente racional, quando possui uma estratégia dominante, nunca escolhe outra que não esta. Note que a combinação de estratégias dominantes conduz sempre a resultados que são equilíbrio de Nash, mas nem todo ponto de equilíbrio é formado por pares dominantes, como mostrou a Batalha dos Sexos, onde há dois equilíbrios de Nash em estratégias puras que não são dominantes.
Todas essas técnicas de solucionar um jogo, cooperativo ou não, estão apoiadas numa concepção de racionalidade que, apesar da aparente precisão, geram resultados paradoxais do ponto de vista filosófico, como no caso do Dilema dos Prisioneiros e nestes dois outros apresentados por Mário Henrique Simonsen (1935-1997) em sua inacabada introdução à Teoria dos Jogos. Para atacar a fragilidade da suposição de racionalidade entre os participantes, Simonsen montou uma matriz semelhante a da figura 7.
Figura 7
|
Estratégias
|
Û
Coluna
| ||
Esquerda
|
Direita
| |||
Ý Linha
|
Alto
|
l 3, 3 c
|
-3, 3 c
|
ß
|
Baixo
|
2, 2 c
|
l 1, 1
| ||
Ü
|
Alto-esquerda constitui o único equilíbrio de Nash desta matriz, sendo esquerda a estratégia dominante de Coluna. Tendo em mente, o pressuposto de racionalidade da teoria, Linha não tem porque se preocupar em escolher a estratégia Alto, uma vez que a dominante de Coluna lhe garante três de ganho. Entretanto, Esquerda domina fracamente a direita, pois se Linha escolher Alto, Coluna nada perderia mudando de dominância para a direita, amargando seu adversário -3 de perda. Sem saber as reais intenções de Coluna, Linha pode refletir que o melhor seria reduzir ao mínimo suas perdas seguindo a sua maximin localizada em Baixo. Assim, Linha obteria um, pelo menos, e Coluna o seu pior resultado, caso viesse a jogar Direita.
Simonsen, então, advertiu que poderia ser extremamente imprudente escolher estratégias conducentes a um tal equilíbrio – de Nash – sem a garantia de que todos os demais jogadores façam o mesmo.
Além do mais, os equilíbrios de Nash podem estar em combinações totalmente opostas como neste segundo exemplo fornecido por Simonsen e que foi adaptado à figura 8.
Figura 8
|
Estratégias
|
Coluna
Þ
| ||
Esquerda
|
Direita
| |||
ß Linha
|
Alto
|
-3, -3
|
l 2, -2 c
|
Ý
|
Baixo
|
l -2, 2 c
|
1, 1
| ||
Ü
|
De novo, um problema de coordenação surge entre os participantes, mas agora ambos preferem ganhar 2, fazendo com que o outro assumisse o prejuízo de -2. Contudo, se jogarem suas estratégias favoritas acabariam pior do que no Dilema dos Prisioneiros, obtendo o resultado mais baixo possível (-3, -3). Para fugir deste destino, a única solução seria adotar mais uma vez suas respectivas estratégias maximin, que evita o pior e neste caso garante (1, 1) para as partes.
O apoio na racionalidade forte exige a aceitação de respostas que transformam o agente estratégico em um homo economicus caricatural, visto que pessoas que não fossem tão racional poderiam alcançar um patamar mais vantajoso do que as que agem de modo estritamente racional e egoísta, como o defendido pela teoria. Isso revela uma certa ambigüidade na concepção de racionalidade defendida pelo equilíbrio de Nash, que nem sempre corresponde aos melhores resultados possíveis. De fato, testes em laboratórios provaram que a maioria das pessoas, formadas ou não em economia ou matemática, procuram soluções que sustentem ganhos próximo a uma distribuição justa para todos os envolvidos.
Na complexidade do contexto social, no qual vários agentes racionais atuam no sentido de maximizar suas utilidades, satisfazendo seus desejos, não se pode esperar tranquilamente que uma mão invisível acomode todos os interesses através do encontro das melhores escolhas em equilíbrio. O Dilema dos Prisioneiros, entre outros, representa as situações nas quais a disputa entre agentes econômicos redunda em tragédia como a dos comuns, esboçada por Garrett Hardin.
Soluções, como as propostas por Nash, são construídas com base em conhecimento a posteriori e não podem servir idealmente a priori para determinar, em todas as circunstâncias, as decisões racionais, seja lá o que isto signifique. Para evitar o pior, faz-se necessário olhar com maior atenção a maneira pela qual as pessoas deliberam em meio a influências emocionais ou culturais. Uma observação que valeu o Nobel a Daniel Kahneman e será o foco do próximo ponto.
[...]
Fonte
SILVA, Antônio Rogério da. Equilíbrio de Nash. [S.l.: s.n.].
Comentários