Nekooperativne igre za dva igrača s nenul-sumom
Ključne riječi: teorija igara, matrične igre, nekooperativne igre s nenul-sumom, Nashova ravnoteža, Pareto optimalnost.
Pod pojmom igra obično mislimo na društvene, kartaške ili računalne igre. Tijekom 20. stoljeća, potaknuta različitim praktičnim problemima, razvila se teorija igara, grana matematičke znanosti koja detaljnije proučava igre uz primjenu teorije vjerojatnosti, linearnog programiranja, kombinatorike i drugih grana matematike. U teoriji igara, igra predstavlja natjecateljsku situaciju u kojoj sudjeluju barem dva igrača, pri čemu svaki ima određenu kontrolu nad ishodom igre. Svaki igrač ima određeni broj mogućih poteza koje može odabrati, a svakom mogućem ishodu igre pridružene su isplate za svakog igrača. Pretpostavljamo da igrači djeluju razumno i žele profitirati.
Proučavat ćemo igre u kojima sudjeluju dva igrača. Nazivamo ih matričnim igrama i prikazujemo matricom isplata P. Redci matrice P označavaju m poteza koje na raspolaganju ima igrač A, a stupci označavaju n mogućih poteza igrača B. Ako igrač A odigra svoj i-ti potez, a igrač B svoj j-ti potez, tada u matrici isplata
promatramo element (isplatu) p_{ij}. Kod igara s nula-sumom, igrači imaju strogo konfliktne interese, odnosno dobitak jednoga jednak je gubitku drugoga pa promatramo isplate samo za jednog igrača. Ako je u matrici P vrijednost p_{ij}\gt 0, igrač A dobiva iznos p_{ij} od igrača B, odnosno igrač B gubi iznos p_{ij}. Ako je p_{ij}=0, niti jedan igrač ne dobiva niti gubi. Ako je p_{ij}\lt 0, igrač B dobiva iznos p_{ij} od igrača A, odnosno igrač A gubi iznos p_{ij}. Napomenimo da je situacija kod igara s nenul-sumom nešto složenija, jer igrači nemaju strogo konfliktne interese te stoga na poziciji p_{ij} navodimo isplate za oba igrača.
Domagoj | ||
\begin{matrix} par & nepar \end{matrix} | ||
Marija | \begin{matrix} par \\ nepar \end{matrix} | \begin{bmatrix} 1 & 0 \\ 0 &-1 \end{bmatrix}. |
Pravila igre unaprijed su poznata svakom igraču, određuju koje poteze on ima na raspolaganju te koje su posljedice pojedinog poteza. Dobitak na kraju igre ovisi i o potezima suparničkog igrača pa u teoriji igara govorimo o konfliktu ili suradnji. Zbog svega toga, svaki igrač mora imati i primjenjivati određenu strategiju tijekom igre. Sljedeće dvije definicije izričemo iz perspektive prvog igrača u igri (igrača A), a analogno se mogu izreći i iz perspektive drugog igrača.
Postoji beskonačno mnogo mješovitih strategija za svakog igrača, a glavni cilj teorije igara je svakom igraču pronaći optimalnu strategiju. Kod igara s nula-sumom, optimalne strategije su najopreznije strategije, u kojima igrač A želi osigurati najveći mogući minimalni dobitak, dok će istovremeno za igrača B maksimalan gubitak biti najmanji mogući, bez obzira na to koji potez suparnički igrač odabrao. Ako jedan od igrača ima na raspolaganju samo dva poteza, optimalnu strategiju moguće je odrediti grafički. Kod matrica isplata većih dimenzija u tome pomaže linearno programiranje, a ovakvi se problemi rješavaju korištenjem računala. Traženjem optimalnih strategija ovdje se nećemo baviti (pogledati, na primjer, u
Za daljnju analizu matričnih igara potrebno je uključiti i teoriju vjerojatnosti.
Analogno možemo izračunati i prosječni dobitak igrača B, samo što u tom slučaju moramo uzeti u obzir dobitke igrača B.
Kod igara s nenul-sumom dobitak jednog igrača ne predstavlja direktni gubitak drugog igrača u svakom od mogućih ishoda igre, odnosno zbroj dobitaka oba igrača nije nužno jednak nuli. Kombiniraju se natjecateljski aspekti s mogućnošću suradnje pa analiza ovakvih igara ovisi o tome jesmo li pretpostavili da igrači komuniciraju tijekom igre ili ne. Razlikujemo kooperativne i nekooperativne igre s nenul-sumom. Mi ćemo pretpostaviti da igrači ne komuniciraju, dakle razmatramo nekooperativne igre. Također, uzet ćemo da istovremeno odabiru svoje strategije i da njihov izbor nije poznat drugom igraču, kao što je to kod igara s nula-sumom. Kod igara s nenul-sumom, elementi matrice isplata su uređeni parovi, pri čemu su prve koordinate vrijednosti isplata za prvog igrača, a druge za drugog.
Igrač B | ||
\begin{matrix} s_{1}\hspace{0,7cm} & s_{2} \end{matrix} | ||
Igrač A | \begin{matrix} r_{1} \\ r_{2} \end{matrix} | \begin{bmatrix} (0,0) & (10,-8) \\ (-5,8) & (8,8) \end{bmatrix}. |
U igri iz Primjera
Kako i u igrama sa sumom nula nije pristuna suradnja, logično je pogledati koji se termini vezani uz igre s nula-sumom mogu proširiti na igre s nenul-sumom. Krenimo s pojmom dominacije.
Očekuje se da će razuman igrač uvijek igrati dominantnu strategiju. Kod igara sa sumom nula takva je strategija uvijek optimalna i nazivamo je ravnotežna strategija. U Primjeru
Igrač B | ||
\begin{matrix} s_{1}\hspace{0,4cm} & s_{2} \end{matrix} | ||
Igrač A | \begin{matrix} r_{1} \\ r_{2} \end{matrix} | \begin{bmatrix} (4,8) & (2,0) \\ (6,2) & (0,8) \end{bmatrix}. |
Postavlja se pitanje možemo li odrediti mješovite strategije za oba igrača, takve da odabirom nekih drugih strategija niti jedan od njih neće profitirati. John Forbes Nash Jr. (1928.-2015.) je 1950. godine dokazao da svaka igra za dva igrača ima barem jedan par ravnotežnih strategija, bilo čistih, bilo mješovith (detaljnije opisano u
Dakle, ako neki igrač odluči tijekom igre promijeniti svoju strategiju, to mu neće omogućiti veći dobitak, u odnosu na odabir strategije kojom je uspostavljena Nashova ravnoteža, sve dok i drugi igrač ne promijeni svoju strategiju.
Promotrimo li u Primjeru
Igrač B | ||
\begin{matrix} s_{1}\hspace{1cm} & s_{2} \end{matrix} | ||
Igrač A | \begin{matrix} r_{1} \\ r_{2} \end{matrix} | \begin{bmatrix} (6,6) & (-2,10) \\ (10,-2) & (0,0) \end{bmatrix}. |
Nashova ravnoteža je uspostavljena ravnotežnim strategijama X_{0}=Y_{0}=(0,1). Dobivamo isplatu p_{22}=(0,0), no isplata p_{11}=(6,6) povoljnija je za igrače. Dakle, opet postoji bolja isplata od one u Nashovoj ravnoteži.
Igrač B | ||
\begin{matrix} s_{1}\hspace{0,5cm} & s_{2} \end{matrix} | ||
Igrač A | \begin{matrix} r_{1} \\ r_{2} \end{matrix} | \begin{bmatrix} (5,1) & (0,0) \\ (0,0) & (1,5) \end{bmatrix}. |
Ako igrač A odabere potez r_{1}, za igrača B je bolje odabrati potez s_{1} te igrač A prolazi bolje, s isplatom p_{11}=(5,1). Imamo ravnotežne strategije X_{0}=Y_{0}=(1,0). Ako igrač A odabere potez r_{2}, igrač B odabire potez s_{2} i s isplatom p_{22}=(1,5) on prolazi bolje. Drugi par ravnotežnih strategija je X'_{0}=Y'_{0}=(0,1). Kada bismo igračima dozvolili komunikaciju, mogli bi se dogovoriti da kod višestrukog ponavljanja igre naizmjenično odaberu parove ravnotežnih strategija te tako oba budu na dobitku. No, u nekooperativnim igrama to ne možemo.
Djelomično rješenje problema u kojima postoje povoljnije isplate od onih dobivenih Nashovom ravnotežom, nudi Vilfredo Federico Pareto (1848.-1923.), talijanski sociolog, ekonomist i filozof.
Paretov se princip temelji na grupnoj racionalnosti, a princip dominacije na individualnoj. Igre mogu imati više Pareto optimalnih isplata, a riječ optimalna znači da nije lošija od neke druge isplate. Paretov princip glasi: Da bi isplata bila prihvatljiva kao rješenje igre, ona mora biti Pareto optimalna.
Radi lakšeg razmatranja, problem prikazujemo u koordinatnoj ravnini, s vrijednostima dobitaka za igrača A na osi apscisa te vrijednostima dobitaka za igrača B na osi ordinata. Točke u koordinatnoj ravnini predstavljaju isplate u matrici isplata, a povezane dužinama tvore mnogokut koji se naziva mnogokut isplata. Križić predstavlja isplatu dobivenu uspostavom Nashove ravnoteže, a isprekidane linije povezuju Pareto optimalne isplate.
U Primjeru
U Primjeru
Ishodi igara dobiveni uspostavom Nashove ravnoteže su poželjni, jer su stabilni i postoje u svakoj igri, ali često dobivene isplate nisu Pareto optimalne. Zato se javlja potreba za drugim idejama. U igrama sa sumom nula optimalne su strategije najopreznije strategije.
Odabirom vrijednosti maximin igrač A nastoji sebi osigurati najveći minimalni dobitak, a igrač B želi sebi osigurati najmanji maksimalni gubitak odabirom ishoda minimax. Ako postoji sedlo, u igri s nula-sumom za oba je igrača najbolje igrati sedlo.
Pogledajmo ponašanje ovakvih strategija u kontekstu igara s nenul-sumom. Za igru iz Primjera
Dakle, odabirom razborite strategije, igrač A osigurava najmanje onaj dobitak koliko iznosi njegov sigurnosni nivo. U Primjeru
U igri igrača B ne postoji sedlo. Razborita stategija Y=(\frac{4}{7},\frac{3}{7}) za igrača B dobiva se rješavanjem matrične igre s nula-sumom. Njegov sigurnosni nivo iznosi \frac{32}{7}. Ako igrači odigraju svoje razborite strategije, ishod igre (
Strategija igrača A | Strategija igrača B | Isplata igrača A | Isplata igrača B |
razborita | razborita | 3.14 | 4.57 |
razborita | kontra-razborita | 4 | 8 |
kontra-razborita | razborita | 3.42 | 4.57 |
kontra-razborita | kontra-razborita | 6 | 2 |
Iz Tablice 1 vidimo da je, u igri iz Primjera
Razmotrimo detaljnije rješivost igre.
1) postoji barem jedna Nashova ravnoteža koja je Pareto optimalna i
2) ako postoji više Pareto optimalnih Nashovih ravnoteža, one su sve ekvivalnentne2 i međusobno razmjenjive3.
Sve do sada prikazane igre s nenul-sumom nisu rješive u strogom smislu.
Karolina | ||
\begin{matrix} s_{1}\hspace{0,5cm} & s_{2} \end{matrix} | ||
Ruža | \begin{matrix} r_{1} \\ r_{2} \end{matrix} | \begin{bmatrix} (2,3) & (3,2) \\ (1,0) & (0,1) \end{bmatrix}. |
Za Ružu je strategija X=(1,0) dominantna. Znajući to, Karolina radije igra potez s_{1} nego s_{2}. Ishodom p_{11}=(2,3) postignuta je Nashova ravnoteža u ovoj igri jer niti jedna od igračica nema potrebu promijeniti strategiju. Taj je ishod i Pareto optimalan jer ne postoji drugi koji je za obje bolji ili barem jednako dobar.
Nekooperativne igre s nenul-sumom imaju široku primjenu u brojnim situacijama iz svakodnevnog života, na primjer: igra kamen-škare-papir, igra bacanja novčića i šah. Ipak, najpoznatiji primjer nekooperativne igre s nenul-sumom je Dilema zatvorenika. 1950. godine američki matematičari Melvin Dresher i Merrill Flood razvili su igru s nenul-sumom koja ima jedinstvenu Nashovu ravnotežu koja nije Pareto optimalna. Kasnije je kanadski matematičar Albert W. Tucker osmislio priču koja odgovara situaciji u igri te tako doprinio popularizaciji te igre.
1.) "Ako jedan od vas prizna sudjelovanje u zločinu, a drugi ne, onda će onaj koji prizna biti nagrađen slobodom, a onaj koji ne prizna dobit će kaznu veću za 3 godine od predviđene."
2.) "Ako obojica priznate sudjelovanje u zločinu, svaki od vas bit će kažnjen propisanom kaznom od 2 godine zatvora."
Postoji i mogućnost da oba osumnjičenika budu oslobođena zbog nedostatka dokaza, ako se obojica odluče za šutnju. Matrica isplata ovog problema je:
Osumničenik B | ||
\begin{matrix} priznaje\hspace{0,5cm} & ne\ priznaje \end{matrix} | ||
Osumnjičenik A | \begin{matrix} priznaje \\ ne\ priznaje \end{matrix} | \begin{bmatrix} (-2,-2) & (0,-5) \\ (-5,0) & (0,0) \end{bmatrix}. |
Ako oba igrača odaberu svoje dominantne strategije X=Y=(1,0), uspostavom Nashove ravnoteže dobivamo isplatu p_{11}=(-2,-2). Ona nije Pareto optimalna, jer je za obojicu bolja isplata p_{22}=(0,0), jedina Pareto optimalna isplata ove igre.
Ovo je tipičan primjer sukoba individualne racionalnosti dominantnih strategija i kolektivne racionalnosti Paretova principa. Oba osumnjičenika slijede vlastite interese, što rezultira lošijim izborom za obojicu. Ovaj bi problem najlakše riješili ako im dopustimo suradnju. Moguće je da oba igrača budu oslobođena i ako postoji mogućnost predviđanja što bi drugi osumnjičenik mogao učiniti. No, teško je predvidjeti što će netko učiniti. Kod Dileme zatvorenika nema pouzdane strategije koja bi uvijek rezultirala najboljim ishodom igre za oba igrača.
Slične igre sa zanimljivim aspektima socijalne interakcije bile su primjenjivane u eksperimentalnom radu iz područja socijalne psihologije. Mnogi su takvi problemi vezani uz ekonomiju, na primjer situacija u kojoj dva trgovačka lanca u svom natjecanju za kupce razmišljaju kako ih zadržati i kako steći nove, a da pritom i dalje budu na dobitku. Ako oba lanca snize cijene kako bi bili konkurentniji, rezultat je podjednak broj kupaca uz niži prihod.
Promotrili smo različite strategije za rješavanje nekooperativnih igara s nenul-sumom, od jednostavnijih, poput dominacije, do Nashove ravnoteže i Pareto optimalnosti. Riješiti takvu igru nije uvijek moguće, za razliku od igara s nula-sumom. Igre za dva igrača s nenul-sumom često odgovaraju stvarnim situacijama pa je u tome njihova ljepota i intrigantnost, unatoč čestom izostanku rješenja.
Napomena: Članak je nastao iz diplomskog rada studenta Mije Radoša, pod mentorstvom doc. dr. sc. Ane Jurasić, na Diplomskom sveučilišnom studiju Matematika i informatika - smjer nastavnički, Fakulteta za matematiku Sveučilišta u Rijeci.