Teoria gierTekst

0
Recenzje
Przeczytaj fragment
Oznacz jako przeczytane
Jak czytać książkę po zakupie
Czcionka:Mniejsze АаWiększe Aa



Tytuł oryginału: Game Theory: A Very Short Introduction

Rada Naukowa serii Krótkie Wprowadzenie

Jerzy Gajdka, Ewa Gajewska, Krystyna Kujawińska Courtney Aneta Pawłowska, Piotr Stalmaszczyk

Redaktorzy inicjujący serii Krótkie Wprowadzenie

Urszula Dzieciątkowska, Agnieszka Kałowska

Tłumaczenie

Iwona Konarzewska

Redakcja

Aurelia Hołubowska

Skład i łamanie

Munda – Maciej Torz

Projekt typograficzny serii

Tomasz Przybył

Game Theory: A Very Short Introduction was originally published in English in 2007. This translation is published by arrangement with Oxford University Press. Wydawnictwo Uniwersytetu Łódzkiego is solely responsible for this translation from the original work and Oxford University Press shall have no liability for any errors, omissions or inaccuracies or ambiguities in such translation or for any losses caused by reliance thereon

© Copyright by Ken Binmore 2007

© Copyright for this edition by Uniwersytet Łódzki, Łódź 2017

© Copyright for Polish translation by Iwona Konarzewska, Łódź 2017

Publikacja sfinansowana ze środków Wydawnictwa Uniwersytetu Łódzkiego

Wydane przez Wydawnictwo Uniwersytetu Łódzkiego

Wydanie I. W.07585.16.0.M

Ark. wyd. 8,0; ark. druk. 13,0

Paperback ISBN Oxford University Press: 978-0-19-921846-2

ISBN 978-83-8088-594-3

e-ISBN 978-83-8088-595-0

Wydawnictwo Uniwersytetu Łódzkiego

90-131 Łódź, ul. Lindleya 8

www.wydawnictwo.uni.lodz.pl

e-mail: ksiegarnia@uni.lodz.pl

tel. (42) 665 58 63

Dla Petera i Niny

Spis ilustracji

1 Orzeł-czy-reszka

2 Tablice wypłat

3 Wypłaty liczbowe

4 Gry z mieszanymi motywacjami

5 James Dean© 2004 TopFoto

6 John Nash© Robert P. Matthews / Princeton University / Getty Images

7 Dwie wersje dylematu więźnia

8 Toczące się kości© iStockphoto

9 Nauka gry w równowagę

10 Dwie gry planszowe

11 Porwanie

12 Miłe porwanie

13 Minigra ultimatum

14 Ewolucyjne dostosowanie w minigrze ultimatum

15 Uproszczony paradoks sieci handlowej

16 David Hume© Hulton Archive / Getty Images

17 Gra Schellinga solitaire

18 Gra polowanie na jelenia (ang. stag hunt)

19 Wzajemne iskanie się przez szympansy© Peter Arnold Inc. / Alamy

20 Twierdzenie ludowe (ang. folk theorem)

21 Zbiory informacyjne w grze orzeł-czy-reszka

22 Full© iStockphoto

23 Strategie maksiminowe w modelu pokera von Neumanna

24 Model von Neumanna

25 Tablica wypłat dla modelu pokera von Neumanna

26 Niekompletna informacja w grze w tchórza

27 Sąd Salomona

28 Po raz pierwszy, po raz drugi, sprzedano!© Hiu Yin Leung / Fotolia

29 Dynamika replikatorów w grze jastrząb-gołąb (ang. hawk-dove)

30 Dylemat więźnia w przypadku graczy spokrewnionych

31 Nietoperz wampir

32 Gra jastrząb-gołąb-mściciel

33 Rozwiązanie arbitrażowe Nasha

34 Mit jawnej skłonności

35 Dwie próby spełnienia postulatów Newcomba

36 Trzy damy ze Środkowego Zachodu© Library of Congress, Prints and Photographs Division, FSA-OW1 Collection (reproduction no. LC-USF33-012381-M5 DLC)

37 Paradoks Monty’ego Halla

Wydawca i autor przepraszają za ewentualne błędy lub pominięcia w powyższym spisie. W przypadku ich zgłoszenia, wprowadzą zmiany przy najbliższej okazji.

Rozdział 1

Nazwa gry

Czym zajmuje się teoria gier?

W czasie gdy moja żona była poza domem na sympatycznej jednodniowej konferencji w Toskanii, trzy młode kobiety zaprosiły mnie, abym dzielił z nimi stół w czasie lunchu. Gdy usiadłem, jedna z nich odezwała się zmysłowym głosem: „Naucz nas, jak grać w miłość”. Okazało się jednak, że wszystko, czego oczekiwały, to porada, jak postępować z włoskimi chłopakami. Wciąż myślę, że popełniły błąd, odrzucając moje sugestie dotyczące strategii, jednak miały rację, przyjmując za rzecz oczywistą, że zaloty są jedną z wielu różnych rodzajów gier, w które gramy w realnym życiu.

Kierowcy manewrujący w czasie dużego ruchu grają w grę kierowców. Licytujący na eBayu, polując na okazje cenowe, grają w grę aukcyjną. Firma i związek zawodowy negocjujący wysokość płac na następny rok grają w grę przetargową. Oponenci decydujący o kształcie programu politycznego podczas wyborów grają w grę polityczną. Właściciel sklepu spożywczego podejmujący decyzję o cenie płatków kukurydzianych w danym dniu gra w gę ekonomiczną. Mówiąc krótko: gra pojawia się zawsze, gdy tylko ludzie wchodzą w interakcję.

Antoniusz i Kleopatra rozgrywali grę miłosną na wielką skalę. Bill Gates zdobył ogromny majątek, grając w grę software’u komputerowego. Adolf Hitler i Józef Stalin grali w grę, która spowodowała śmierć znaczącej części populacji świata. Chruszczow i Kennedy w czasie kryzysu kubańskiego rozgrywali grę, która w efekcie mogła zmieść z powierzchni Ziemi nas wszystkich.

Mając tak wiele zastosowań, teoria gier mogłaby być panaceum, jeżeli tylko można byłoby zawsze przewidzieć, w jaki sposób ludzie grają w grach, które składają się na życie społeczne. Jednakże teoria gier nie może rozwiązać wszystkich problemów świata, ponieważ jej zasady działają tylko wówczas, gdy ludzie grają w sposób racjonalny. Nie może więc przewidzieć zachowania chorych z miłości nastolatków, jak Romeo i Julia, lub szaleńców, jak Hitler i Stalin. Ludzie jednak nie zawsze zachowują się irracjonalnie i nie traci się czasu, badając, co się dzieje, gdy postępują w sposób przemyślany. Większość z nas przynajmniej stara się wydawać pieniądze w sposób rozsądny i zwykle nie postępuje na tyle niemądrze, aby teoria ekonomii przestała mieć rację bytu.

Nawet gdy ludzie nie przemyśleli wszystkiego z wyprzedzeniem, nie oznacza to, że na pewno postąpią nieracjonalnie. Teoria gier odniosła kilka znaczących sukcesów w wyjaśnianiu zachowania pająków i ryb, których nawet nie podejrzewa się o myślenie. Takie nierozumne zwierzęta zachowują się, jak gdyby były istotami racjonalnymi, ponieważ konkurenci, zaprogramowani genetycznie, aby zachowywać się nieracjonalnie, wyginęli. Podobnie firmy nie zawsze są zarządzane przez osoby o wielkim intelekcie. Rynek jest jednak zwykle równie bezwzględny jak natura i eliminuje niedostosowanych.

Czy teoria gier działa?

Pomimo teoretycznych sukcesów w praktyce ludzie biznesu zwykle odrzucali teorię gier jako jeden z bardziej nieprzydatnych działów nauk społecznych. Zmienili zdanie niemal z dnia na dzień, kiedy rząd amerykański podjął decyzję o zorganizowaniu aukcji częstotliwości radiowych w telefonii komórkowej.

Ze względu na brak uznanych ekspertów-praktyków porady teoretyków z zakresu teorii gier okazały się kluczowe dla stworzenia projektu reguł gier aukcyjnych, które zostały zastosowane w tym przypadku. W wyniku tego podatnik amerykański zyskał 20 miliardów dolarów – ponad dwukrotnie więcej niż oczekiwano. Jeszcze więcej udało się zyskać w późniejszej licytacji w Wielkiej Brytanii, za którą byłem odpowiedzialny. Na jednej tylko aukcji zarobiliśmy w sumie 35 miliardów dolarów. W konsekwencji magazyn „Newsweek” napisał o mnie, że jestem bezwzględnym ekonomistą-pokerzystą, który zniszczył przemysł telekomunikacyjny!

Jak się okazało, przemysł telekomunikacyjny przetrwał. Poza tym czerpanie zysków z licencji, za które przemysł telekomunikacyjny płaci tyle, ile są warte, wcale nie jest bezlitosne. Zwłaszcza gdy pieniądze przeznaczane są na szpitale dla tych, którzy nie mogą sobie pozwolić na prywatną opiekę medyczną. A jeśli chodzi o pokera, to minęło co najmniej 20 lat od czasu, gdy grałem o więcej niż pięcio- i dziesięciocentówki. Jedyną rzeczą, co do której „Newsweek” miał rację, jest to, że teoria gier naprawdę działa, gdy jest stosowana przez ludzi, którzy są świadomi tego, co robią. Działa nie tylko w ekonomii, ale również w biologii ewolucyjnej i w naukach politycznych. W mojej książce Natural Justice, gdy mówię o etyce, stosując teorię gier, obrażam nawet ortodoksyjnych filozofów moralności.

Proste gry

Każda nowa wielomiliardowa aukcja telekomunikacyjna musi być „przykrojona” na miarę okoliczności, w których ma być przeprowadzona. Nie można po prostu użyć gotowego projektu, jak zdążył się zorientować rząd amerykański, zatrudniając dom aukcyjny Sotheby’s w celu przeprowadzenia aukcji zestawu transponderów satelitarnych. Nikt nie może jednak ująć wszystkich skomplikowanych szczegółów nowego rynku telekomunikacyjnego w modelu matematycznym. Projektowanie aukcji telekomunikacyjnej jest w związku z tym zarówno sztuką, jak i nauką. Dokonuje się ekstrapolacji na podstawie prostego modelu wybranego dla przybliżenia najistotniejszych właściwości problemu.

Chciałbym zrobić to samo w niniejszej książce, która nie zawiera formuł algebraicznych i w której ograniczyłem żargon techniczny do minimum. Zajmuję się w niej tylko grami, odsuwając na bok wszystkie dodatkowe elementy, które je komplikują w realnym życiu.


1. Orzeł-czy-reszka. Problem decyzyjny Alice i Boba

 

Konflikt i kooperacja

Większość gier w niniejszej książce jest rozgrywana przez zaledwie dwójkę graczy, których nazwiemy Alice i Bob. Pierwsza gra, jaką rozegrają, to orzeł-czy-reszka.

Sherlock Holmes i zły profesor Moriarty, zmierzając do ostatecznej konfrontacji nad wodospadem Reichenbach, grali w orła-czy-reszkę. Holmes musiał zadecydować, na której stacji wysiąść z pociągu. Moriarty musiał podjąć decyzję, na której stacji czekać. Odpowiednikiem tej gry w prawdziwym życiu jest gra pomiędzy nieuczciwymi księgowymi a audytorami. Jeden decyduje, kiedy oszukać, drugi podejmuje decyzję, kiedy sprawdzić księgi rachunkowe.

W naszej, szkolnej wersji gry Alice i Bob pokazują monety. Alice wygrywa, jeżeli obie z nich są odwrócone tą samą stroną do góry. Bob wygrywa, gdy każda z monet jest odwrócona inną stroną do góry. Zarówno Alice, jak i Bob mają dwie strategie: orzeł i reszka. Na ilustracji 1 przedstawiono, kto wygrywa lub ponosi porażkę w przypadku wszystkich możliwych kombinacji strategii. Te wyniki to tak zwane wypłaty w grze. Ikony: kciuk w górę i kciuk w dół zostały użyte dla podkreślenia, że wypłaty nie muszą być mierzone w jednostkach pieniężnych.

Ilustracja 2 przedstawia, w jaki sposób całość informacji zawartej na ilustracji 1 można przenieść do tablicy wypłat, w której wypłata dla Alice znajduje się w lewym dolnym (południowo-zachodnim) rogu każdej komórki, a dla Boba w prawym górnym (północno-wschodnim) rogu. Pokazuje ona także dwuosobową wersję gry samochodowej, w którą gramy każdego ranka, wsiadając do naszych samochodów, aby dotrzeć do pracy. Alice i Bob mają ponownie dwie strategie, w prawo i w lewo, ale tym razem wypłaty graczy są jednakowe, inaczej niż w poprzedniej grze, w której były diametralnie różne. Gdy dziennikarze mówią o sytuacji, w której wygrywają wszystkie strony, mają na myśli coś w rodzaju gry samochodowej.


2. Tablice wypłat. Alice wybiera wiersz, a Bob wybiera kolumnę

Von Neumann

Pierwszą zdobyczą teorii gier było twierdzenie minimaksowe Johna von Neumanna mające zastosowanie tylko do gier typu orzeł-czy-reszka, w których gracze są nieprzejednanymi wrogami. Można jeszcze przeczytać lekceważące komentarze na temat teorii gier, w których von Neumann jest przedstawiany karykaturalnie jako archetypowy zimny wojownik – taki jak doktor Strangelove ze znanego filmu1. Mówi się w nich, że tylko szalony strateg wojskowy mógłby pomyśleć o zastosowaniu teorii gier w prawdziwym życiu, ponieważ jedynie szaleniec lub cyborg mógłby popełnić błąd przy założeniu, że życie jest grą czysto konfliktową.

Von Neumann był wszechstronnym geniuszem. Tworzenie teorii gier było dla niego jedynie dodatkowym zajęciem. Prawdą jest, że w czasie zimnej wojny był jastrzębiem (nie gołębiem), ale daleko było mu do szalonego cyborga – stanowił uosobienie geniusza, który lubił przyjęcia i zabawę. Tak jak ty i ja wolał kooperację od konfliktu, ale rozumiał, że droga do osiągnięcia porozumienia nie polega na udawaniu, że ludzie nie mogą czasem zyskać poprzez stwarzanie kłopotów.

Kooperacja i konflikt są dwiema stronami tego samego medalu i żadne z nich nie może być właściwie zrozumiane bez uwzględnienia drugiego. Rozważanie gry czysto konfliktowej, jak orzeł-czy-reszka, nie polega na utrzymywaniu, że wszystkie ludzkie interakcje są konkurencyjne. Z drugiej strony nikt nie twierdzi, przyglądając się czysto koordynacyjnej grze samochodowej, że wszystkie ludzkie interakcje są kooperacyjne. Wyodrębnia się po prostu dwa przeciwstawne aspekty zachowań ludzkich, aby móc badać je osobno.

Ujawnione preferencje

Stawiając jednocześnie czoła kooperacji i konfliktowi, musimy lepiej opisać motywacje graczy, niż mówiąc po prostu, że lubią wygrywać albo nie lubią przegrywać. W tym celu ekonomiści stworzyli ideę użyteczności. Pozwala ona każdemu graczowi przydzielić wartość liczbową dla każdego możliwego wyniku gry.

W biznesie końcowym wynikiem jest zwykle zysk, ale ekonomiści wiedzą, że ludzie mają często bardziej złożone cele od prostego zarabiania tylu pieniędzy, ile potrafią. Nie możemy zatem identyfikować użyteczności z pieniędzmi. Naiwnym substytutem jest zadowolenie z pieniędzy. Ale co to jest zadowolenie? Jak je mierzyć?

Tak się niefortunnie składa, że słowo „użyteczność” (ang. utility) historycznie wiąże się z wiktoriańskimi utylitarystami, jak Jeremy Bentham i John Stuart Mill. Współcześni ekonomiści nie naśladują ich w identyfikacji użyteczności jako odczuwania wielkości przyjemności czy też bólu. Nowoczesna teoria porzuca próby wyjaśnienia zachowań ludzi za pomocą opisu tego, co dzieje się w ich głowach. Przeciwnie, poczytuje sobie za cnotę nieczynienie żadnych założeń o charakterze psychologicznym2.

Nie zamierzamy tłumaczyć, dlaczego Alice lub Bob zachowują się tak, a nie inaczej. Zamiast teorii objaśniającej, musi nam wystarczyć teoria opisowa, która nie może powiedzieć więcej niż to, że Alice lub Bob będą działać niekonsekwentnie, jeżeli to-czy-tamto zrobili w przeszłości, ale planują postąpić tak-lub-inaczej w przyszłości. W teorii gier obserwuje się decyzje, które Alice i Bob podejmują (lub zamierzają podjąć), jeżeli nie komunikują się ze sobą lub z kimkolwiek innym, ale także rozważa się, jak zachowaliby się, gdyby mogli się porozumieć w trakcie rozgrywania gry.

Nie chcemy dowodzić, że pewne preferencje są bardziej racjonalne od innych. Przyjmujemy pogląd wielkiego filozofa Davida Hume’a, który uznał rozum za „niewolnika nałogów”. Jak ekstrawagancko zauważył, nie ma nic irracjonalnego w chęci zniszczenia całego świata, aby się podrapać w palec. Jednakże idziemy dalej tą drogą, uznając rozum za narzędzie pozwalające uniknąć nielogicznego zachowania. Każde logiczne zachowanie będzie traktowane jako racjonalne.

Przy pewnych założeniach działanie konsekwentne może być uznane za tożsame z działaniem mającym na celu maksymalizację jakiejś wartości. Czymkolwiek jest ta abstrakcyjna wartość w konkretnym przypadku, ekonomiści zwą ją użytecznością. Nie musi być związana z pieniędzmi, ale – choć przykro to mówić – zwykle jest.

Podejmowanie ryzyka

Działając konsekwentnie, Alice może nie być świadoma, że postępuje, jakby maksymalizowała coś, co zdecydowaliśmy się nazwać jej użytecznością. Jeżeli jednak chcemy przewidzieć jej zachowanie, musimy mieć możliwość pomiaru jej użyteczności na skali użyteczności, w podobny sposób jak pomiaru temperatury dokonuje się za pomocą termometru. Tak jak jednostki na termometrze nazywa się stopniami, możemy powiedzieć, że util jest jednostką na skali użyteczności Alice.

Ortodoksyjna ekonomia przyjmuje, że skale użyteczności kardynalnej są z natury rzeczy bezsensowne. Na szczęście von Neumann nie wiedział o tym, gdy Oskar Morgenstern zjawił się u niego w domu, narzekając, że w książce na temat teorii gier, którą pisali wspólnie, brak im właściwej podstawy dla obliczania wypłat liczbowych. Wobec tego von Neumann natychmiast sformułował koncepcję pomiaru tego, jak bardzo Alice czegoś pragnie, za pomocą rozmiaru ryzyka, jakie jest gotowa podjąć, aby to uzyskać. Następnie możemy wyliczyć, jakiego wyboru dokonałaby Alice w ryzykownych sytuacjach, biorąc pod uwagę opcję, która zapewni jej przeciętnie najwyższą użyteczność.

Teoria von Neumanna przyda się, jeżeli chcemy przypisać wielkość użyteczności wszystkiemu, co Alice chciałaby wycenić. Na przykład, ile utili Alice powinna przydzielić randce z Bobem?

Po pierwsze, musimy zdecydować, jaką skalę użyteczności zastosować. W tym celu należy wybrać dwa wyniki, które są odpowiednio lepsze lub gorsze od każdego innego wyniku, na jaki Alice może się natknąć. Te wyniki odpowiadają poziomom temperatur wrzenia i zamarzania wody, które zostały wybrane do skalibrowania termometru Celsjusza, z tym, że w skali użyteczności 0 utili zostaje przydzielone wynikowi najgorszemu, a 100 utili – najlepszemu. Następnie rozważa się pakiet biletów na loterię, w której jedynymi wypłatami są: wynik najlepszy albo najgorszy.

Kiedy oferujemy Alice bilety na loterię jako alternatywę dla randki z Bobem, ciągle zwiększając prawdopodobieństwo uzyskania najlepszego wyniku, sprawimy, że Alice w pewnym momencie zmieni zdanie z nie na tak. Jeżeli prawdopodobieństwo najlepszego wyniku w loterii, przy którym nastąpiła zmiana zdania, jest równe 75%, teoria von Neumanna mówi, że randka z Bobem jest dla Alice warta 75 utili. Każdy kolejny punkt procentowy dodany do prawdopodobieństwa indyferencji (prawdopodobieństwa równych preferencji dla obu oferowanych wariantów) odpowiada jednemu dodatkowemu utilowi.

Gdy niektórzy ludzie wykorzystują tę metodę, szacując sumę pieniędzy, zawsze przydzielają taką samą liczbę utili każdemu dodatkowemu dolarowi. Mówimy, że ludzie ci są neutralni względem ryzyka (ang. risk neutral). O tych, którzy przydzielają mniej utili każdemu kolejnemu dolarowi, mówimy, że mają awersję wobec ryzyka (ang. risk averse).

Ubezpieczenie

Alice rozważa zaakceptowanie oferty Boba w sprawie ubezpieczenia od ognia jej rezydencji w Beverly Hills. Jeżeli odmówi, to tak jakby zagrała w loterii, w wyniku której może posiadać dom i składkę ubezpieczeniową w przypadku, gdy dom nie uleg­nie spaleniu, oraz tylko ubezpieczenie w przypadku pożaru. Należy to porównać z wynikiem końcowym, pewnym, jeżeli zaakceptuje ofertę Boba – wartość domu minus składka.

Jeżeli złożenie przez Boba oferty oraz akceptacja jej przez Alice są racjonalne, oznacza to, że on musi myśleć, że loteria jest lepsza niż zerwanie, nawet pewne, a ona musi mieć przeciwne preferencje. Istnienie branży ubezpieczeniowej potwierdza nie tylko fakt, że gra może być racjonalna – zakładając, że ryzyko, które podejmujemy, jest obliczone – ale także, że racjonalni ludzie mogą mieć różny stosunek do ryzyka. W branży ubezpieczeniowej ubezpieczyciele są bliscy neutralności wobec ryzyka, a ubezpieczający się mają awersję wobec ryzyka różnej wielkości.

Zauważmy, że ekonomiści uważają stopień awersji wobec ryzyka, jaki prezentuje dana osoba, za kwestię indywidualnych preferencji. Alice może tak samo przedkładać (lub nie) lody czekoladowe nad waniliowe, jak i chcieć (lub nie) przeznaczyć 1000 dolarów na ubezpieczenie swojego domu. Niektórzy filozofowie – w tym sławny John Rawls – utrzymują, że posiadanie awersji wobec ryzyka jest postawą racjonalną, niezależnie od maksymalizacji przeciętnej użyteczności, jaką preferują. Jednakże takie twierdzenie pomija fakt, że nastawienie graczy do podejmowania ryzyka zostało już uwzględnione przy użyciu metody von Neumanna do przydzielania wielkości użyteczności każdemu wynikowi.

Ekonomiści popełniają inny błąd, przypisując awersję wobec ryzyka niechęci do podejmowania aktu gry. Teoria von Neumanna ma sens jedynie wówczas, gdy gracze są całkowicie neutralni wobec aktualnego aktu gry. Podobnie jak prezbiteriański pastor ubezpieczający swój dom, nie grają, ponieważ lubią hazard – grają tylko wówczas, gdy sądzą, że los będzie im sprzyjał.


3. Wypłaty liczbowe

Życie nie jest grą o sumie wypłat zero

Tak jak przy pomiarze temperatury, punkt zero oraz jednostkę na skali użyteczności Alice możemy wybrać w dowolny sposób. Możemy, na przykład, przydzielić 32 utile najgorszemu wynikowi, a 212 utili – najlepszemu. Liczbę utili odpowiadającą randce z Bobem można znaleźć w tej nowej skali podobnie jak podczas przeliczania stopni Celsjusza na stopnie Fahrenheita. Tak więc randka z Bobem warta 75 utili według starej skali odpowiada 167 utilom w nowej skali.

W grach szkolnych, które do tej pory rozważaliśmy, jedynymi wynikami Alice i Boba, które można wycenić, są WYGRANA i PRZEGRANA. Możemy przydzielać tym dwóm wynikom dowolną liczbę utili tak długo, jak długo wygranej przydzielimy więcej niż przegranej. Jeżeli przydzielimy +1 utila wygranej, a -1 utila przegranej, otrzymamy wyniki takie jak w tabelach na ilustracji 3.

Wypłaty w każdej komórce tabeli gry orzeł-czy-reszka na ilustracji 3 zawsze sumują się do zera. Zawsze możemy uzyskać taki wynik w grach czysto konfliktowych. Są one nazywane grami o sumie zerowej (o sumie wypłat równej zero). Kiedy różni guru mówią nam, że życie nie jest grą o sumie zerowej, nie mówią niczego o całkowitej sumie szczęścia na świecie. Przypominają tylko, że gry, które rozgrywamy w prawdziwym życiu, rzadko są grami czysto konfliktowymi.


4. Gry z mieszanymi motywacjami

 

Równowaga Nasha

Stary film Buntownik bez powodu (Rebel without a Cause) wciąż bywa wyświetlany ze względu na gwiazdorską rolę niezapomnianego Jamesa Deana grającego seksownego nastoletniego buntownika. Gra w tchórza (ang. game of chicken) powstała, by upamiętnić scenę, w której Dean oraz drugi chłopak jadą samochodami w stronę przepaści na końcu klifu, aby sprawdzić, który z nich stchórzy jako pierwszy. Bertrand Russell wykorzystał ten epizod jako znaną metaforę zimnej wojny.


5. James Dean

Wolę ilustrować grę w tchórza za pomocą bardziej banalnej opowieści, w której Alice i Bob są dwójką kierowców w średnim wieku spotykających się na ulicy zbyt wąskiej, by oboje mogli bezpiecznie przejechać, jeżeli jedno z nich nie zwolni. Strategie przedstawione na ilustracji 4 to zatem wolno i szybko.

Nowa opowieść marginalizuje element współzawodnictwa z oryginalnej historii. W takiej odsłonie gra w tchórza różni się od gier o sumie zerowej, takich jak orzeł-czy-reszka, ponieważ gracze mają wspólny interes: obaj chcą uniknąć nieszczęścia.

Stereotypy utrwalone w grze wojna płci pochodzą z okresu poprzedzającego narodziny ruchów emancypacyjnych kobiet. Alice i Bob są świeżo poślubioną parą spędzającą miesiąc miodowy w Nowym Jorku. Przy śniadaniu dyskutują, czy wybrać się wieczorem na mecz bokserski, czy też na balet. Nie mogą podjąć decyzji. Później rozdziela ich tłum i muszą zdecydować indywidualnie, dokąd wybiorą się wieczorem.

Opowieść towarzysząca grze wojna płci podkreśla kooperacyjne cechy problemu, ale także element konfliktu, który był nieobecny w grze samochodowej. Każdy gracz preferuje współpracę, ale z innym wynikiem. Alice woli balet, a Bob – mecz bokserski.

John Nash

Każdy usłyszał o Johnie Nashu, gdy jego życie zostało przedstawione w filmie Piękny umysł (A Beautiful Mind). Tak jak pokazuje to film, sukcesy i niepowodzenia Nasha są poza możliwościami doświadczenia większości ludzi. Był jeszcze studentem, gdy stworzył nowoczesną teorię racjonalnych negocjacji. W jego pracy dyplomowej sformułowana została koncepcja równowagi Nasha, która jest dziś uważana za kamień węgielny teorii gier. W kolejnych latach rozwiązywał poważne problemy czystej matematyki, stosując tak oryginalne metody, że zyskał reputację geniusza matematycznego najwyższej klasy. Padł jednak ofiarą schizofrenii, która zniszczyła jego karierę i sprawiła, że opuszczony spędził ponad 40 lat w kampusie Princeton, stając się obiektem kpin. Jego powrót do zdrowia w czasie, gdy przyznano mu Nagrodę Nobla w 1994 r., z perspektywy czasu wydaje się cudem. Jak komentuje Nash, bez swojego „szaleństwa” byłby prawdopodobnie jednym w wielu anonimowych ludzi, którzy żyli i umarli na tej planecie, nie pozostawiając żadnego śladu swojego istnienia.


6. John Nash

Jednak nie trzeba być nieobliczalnym geniuszem, aby zrozumieć ideę równowagi Nasha. Widzieliśmy, że wybieranie wypłat w grze jest tożsame z próbą maksymalizacji przeciętnych wartości wypłat przez racjonalnych graczy. Będzie to łatwe, jeżeli gracze będą wiedzieć, jakie strategie mają zamiar wybrać ich oponenci. Na przykład, gdyby Alice wiedziała, że Bob ma zamiar wybrać balet w wojnie płci, zmaksymalizowałaby swój zysk, również wybierając balet. Można powiedzieć, że balet jest najlepszą odpowiedzią Alice na wybór baletu przez Boba. Na ilustracji 4 fakt ten zaznaczono wzięciem w kółko wypłaty dla Alice w komórce tabeli odpowiadającej wyborowi przez obu graczy opcji balet.

Równowaga Nasha to właśnie taka para strategii, których jednoczesne zastosowanie daje wynik z tej komórki tabeli, w której oba wyniki są wzięte w kółko. Inaczej mówiąc, równowaga Nasha występuje, gdy wszyscy gracze równocześnie wybierają najlepszą odpowiedź na strategie wybierane przez innych.

Zatem zarówno para strategii (boks, boks), jak i (balet, balet) tworzy równowagę Nasha w grze wojna płci. Podobnie strategie (wolno, szybko) oraz (szybko, wolno) są równowagami Nasha w grze w tchórza.

Dlaczego warto dbać o równowagę Nasha? Są po temu dwa główne powody. Po pierwsze, zakłada się, że idealnie racjonalni gracze będą mieć szansę rozwiązania problemu. Po drugie, zakłada się, że ludzie znajdują rozwiązania w jakimś ewolucyjnym procesie prób i błędów. Niemała część mocy predykcyjnej teorii gier rodzi się z możliwości korzystania z obu tych alternatywnych interpretacji. Rzadko znamy szczegóły procesów ewolucyjnych, ale możemy czasami przewidzieć, dokąd mogą prowadzić, zadając pytania, co zrobiliby racjonalni gracze w danej sytuacji.

Racjonalna interpretacja

Załóżmy, że ktoś, nawet mądrzejszy od Nasha lub von Neumanna, napisał książkę, w której podaje listę wszystkich możliwych gier, autorytatywnie instruując, jak każda z nich powinna być rozgrywana przez racjonalnych graczy. Tak świetna książka o teorii gier będzie oczywiście wskazywała równowagę Nasha jako rozwiązanie każdej gry. W innym przypadku racjonalne byłoby, aby przynajmniej jeden z graczy odstąpił od instrukcji, która w wyniku tego przestanie być autorytatywna.

Załóżmy, na przykład, że książka rekomenduje nastoletnim chłopakom grającym w tchórza wybranie strategii wolno, jak życzyłyby sobie ich matki. Jeżeli książka byłaby autorytatywna, każdy z graczy wiedziałby, że drugi ma zamiar grać strategią wolno. Ale racjonalny gracz w tchórza, który wie, że jego oponent ma zamiar wybrać wolno, wybierze oczywiście szybko, obalając tym samym roszczenia książki do bycia autorytatywną.

Zauważmy, że uzasadnianie w obronie równowagi Nasha ma charakter cyrkulacyjny. Dlaczego Alice gra w ten sposób? Ponieważ Bob gra w tamten sposób. Dlaczego Bob gra w tamten sposób? Ponieważ Alice gra w ten sposób.

Ci, których nie zadowalają takie cyrkulacyjne argumenty, mogą skorzystać z różnych łacińskich sentencji. Kiedy po raz pierwszy zarzucono mi błąd circulus in probando3, gdy mówiłem o równowadze, musiałem to rozważyć. Okazało się, że szczęśliwie nie zostałem oskarżony o bardziej dyskredytujące petitio principii4. Ale wszystkie argumenty muszą w sposób oczywisty być cyrkulacyjne lub zredukować się do nieskończonej regresji, jeżeli ktoś nigdy nie ustaje w zadawaniu pytania dlaczego. Definicje słownikowe są najbardziej znanym tego przykładem.

W grach możemy bez końca kontemplować nieskończoną regresję, która rozpoczyna się następująco:

Alice myśli, że Bob myśli, że Alice myśli, że Bob myśli…

albo ratować się cyrkularnością wbudowaną w ideę równowagi Nasha. Każdy inny profil strategiczny może zostać potencjalnie zdestabilizowany, gdy gracze zaczną myśleć, o czym myślą inni gracze. Inaczej mówiąc, jeżeli oczekiwania graczy co do planów innych graczy są zgodne, oznacza to, że gracze są w równowadze.

Interpretacja ewolucyjna

Racjonalna interpretacja równowagi Nasha miała tak silny wpływ na pierwszych zwolenników teorii gier, że interpretacja ewolucyjna była prawie całkowicie lekceważona. Wydawcy czasopisma, w którym Nash opublikował swój artykuł o równowadze, prawie odrzucili jego uwagi w tej kwestii jako nieinteresujące! Ale teoria gier nigdy nie mogłaby przewidywać zachowania zwykłych ludzi, gdyby interpretacja ewolucyjna nie była istotna. Na przykład znany matematyk Émile Borel myślał o teorii gier jeszcze przed von Neumannem, ale doszedł do wniosku, że twierdzenie minimaksowe jest prawdopodobnie błędne. Zatem jakie szanse może mieć reszta z nas, kiedy nawet ktoś tak mądry jak Borel nie mógł uzasadnić swojego rozwiązania dla najprostszej klasy gier!

Istnieje wiele możliwych ewolucyjnych interpretacji równowagi Nasha różniących się procesem dostosowawczym, za pomocą którego gracze mogą znaleźć swoją drogę do równowagi. W prostszych procesach dostosowawczych wypłaty w grze identyfikuje się z tym, jak bardzo odpowiadają one graczom. Procesy, które faworyzują lepiej dopasowane strategie kosztem ich mniej dopasowanych krewnych, mogą przestać działać, gdy zbliżamy się do osiągnięcia równowagi Nasha, ponieważ tylko wtedy wszystkie niewyeliminowane strategie będą tak dopasowane, jak to tylko możliwe w danych okolicznościach. Zatem gracze nie muszą być świetnymi matematykami, aby odnaleźć równowagę Nasha. Zwykle całkiem dobrze przewiduje ona zachowania zwierząt. Ewolucyjna istotność równowag Nasha nie ogranicza się do biologii. Odgrywa rolę predykcyjną zawsze wtedy, kiedy proces dostosowawczy eliminuje strategie, które generują niskie wypłaty.

Na przykład maklerzy, którzy są mniej sprawni od swoich konkurentów, ponoszą porażkę. Praktyczne reguły, które stosują, podlegają tego samego typu ewolucyjnej presji jak geny ryb czy owadów. Zatem sensowne jest, aby przyglądać się równowadze Nasha w grach rozgrywanych przez maklerów, nawet jeżeli wszyscy wiemy, że niektórzy z nich nie będą w stanie odnaleźć się w pobliżu akwarium ze złotą rybką, nie mówiąc już o książce na temat teorii gier.