ekonomika

Nashova rovnováha. Teória hier pre ekonómov (John Nash)

Obsah:

Nashova rovnováha. Teória hier pre ekonómov (John Nash)
Nashova rovnováha. Teória hier pre ekonómov (John Nash)
Anonim

V 30. rokoch 20. storočia sa John von Neumann a Oscar Morgenstern stali zakladateľmi novej zaujímavej oblasti matematiky, ktorá sa nazýva „teória hier“. V 50. rokoch 20. storočia sa o túto oblasť začal zaujímať mladý matematik John Nash. Teória rovnováhy sa stala predmetom jeho dizertačnej práce, ktorú napísal, keď mal 21 rokov. Vznikla tak nová stratégia pre hry s názvom Nash Equilibrium, ktorá získala Nobelovu cenu o mnoho rokov neskôr, v roku 1994.

Image

Dlhá priepasť medzi písaním dizertačnej práce a univerzálnym prijatím bola skúškou pre matematika. Génius bez rozpoznania vyústil do vážnych duševných porušení, ale John Nash bol schopný vyriešiť tento problém vďaka svojej vynikajúcej logickej mysli. Jeho teória „Nashovej rovnováhy“ získala Nobelovu cenu a filmovú adaptáciu vo filme „Krásna myseľ“ („Mind Games“).

Teória hier v skratke

Pretože teória Nashovej rovnováhy vysvetľuje správanie ľudí z hľadiska interakcie, stojí za to zvážiť základné pojmy teórie hier.

Teória hry študuje správanie účastníkov (agentov) v podmienkach vzájomnej interakcie podľa typu hry, keď výsledok závisí od rozhodnutia a správania viacerých ľudí. Účastník prijíma rozhodnutia na základe svojich predpovedí týkajúcich sa správania ostatných, ktoré sa nazýva herná stratégia.

Existuje aj dominantná stratégia, v ktorej účastník získa optimálny výsledok pre akékoľvek správanie ostatných účastníkov. Toto je najlepšia stratégia pre všetkých, ktorá bude prínosom pre všetkých.

Dilema väzňov a vedecký prielom

Dilema väzňa je prípad hry, keď sú účastníci nútení robiť racionálne rozhodnutia a dosahovať spoločný cieľ v kontexte konfliktu alternatív. Otázka znie, ktorá z týchto možností si vyberie, pričom uznáva jeho osobný a spoločný záujem, ako aj neschopnosť získať oboje. Zdá sa, že hráči sú obklopení tvrdými hernými podmienkami, čo ich niekedy núti myslieť veľmi produktívne.

Image

Túto dilemu preskúmal americký matematik John Nash. Rovnováha, ktorú vyniesol, sa stala revolucionárom svojho druhu. Obzvlášť živé toto nové myslenie ovplyvnilo názor ekonómov na to, ako si účastníci trhu vyberajú, berúc do úvahy záujmy ostatných, s úzkou interakciou a priesečníkom záujmov.

Najlepšie je študovať teóriu hier s konkrétnymi príkladmi, pretože táto matematická disciplína sama osebe nie je suchá teoretická disciplína.

Príklad väzenskej dilemy

Napríklad dvaja ľudia okradli, padli do rúk polície a sú vypočúvaní v samostatných celách. Policajti zároveň ponúkajú každému účastníkovi priaznivé podmienky, za ktorých bude prepustený, ak vypovedajú proti jeho partnerovi. Každý zo zločincov má k dispozícii nasledujúcu stratégiu:

  1. Súčasne svedčia a dostávajú 2, 5 roka vo väzení.

  2. Obe strany mlčia súčasne a dostávajú každý 1 rok, pretože v tomto prípade bude dôkazná základňa ich viny malá.

  3. Jeden dáva svedectvo a získava slobodu, zatiaľ čo druhý mlčí a dostane 5 rokov väzenia.

Výsledok prípadu samozrejme závisí od rozhodnutia oboch účastníkov, nemôžu sa však dohodnúť, pretože zasadajú v rôznych celách. Konflikt ich osobných záujmov v boji za spoločný záujem je tiež jasne viditeľný. Každý väzeň má dve možnosti na konanie a 4 možnosti na dosiahnutie výsledkov.

Inferenčná reťaz

Zločin A teda zvažuje tieto možnosti:

  1. Mlčím a môj partner mlčí - obaja dostaneme 1 rok väzenia.

  2. Dávam svojho partnera a on mi dáva - obaja máme 2, 5 roka väzenia.

  3. Mlčím a môj partner ma odovzdáva - dostanem 5 rokov väzenia a bude voľný.

  4. Prenajímam si svojho partnera, ktorý mlčí - mám slobodu a je vo väzení 5 rokov.

Pre prehľadnosť uvádzame maticu možných riešení a výsledkov.

Tabuľka pravdepodobných výsledkov dilemy väzňa.

Image

Otázka znie, čo si každý účastník vyberie?

„Ticho, nemôžete hovoriť“ alebo „Ticho, nemôžete hovoriť“

Aby ste pochopili výber účastníka, musíte prejsť reťazou jeho myšlienok. Podľa odôvodnenia zločince A: ak mlčem a nemlčím svojho partnera, dostaneme minimálny termín (1 rok), ale neviem zistiť, ako sa bude správať. Ak svedčí proti mne, potom je lepšie svedčiť, inak sa môžem posadiť na 5 rokov. Radšej by som sedel 2, 5 roka ako 5 rokov. Ak nič nehovorí, tým viac musím svedčiť, pretože takto získam slobodu. Rovnakým spôsobom argumentuje aj člen B.

Image

Je ľahké pochopiť, že dominantnou stratégiou každého zločinca je svedčiť. Optimálny bod tejto hry nastane, keď obaja zločinci poskytnú dôkazy a dostanú svoju „cenu“ - 2, 5 roka vo väzení. Nashova teória hry ju nazýva rovnováhou.

Nash Optimal Optimal Solution

Revolúciou Nashevovho názoru je, že takáto rovnováha nie je optimálna, ak vezmeme do úvahy individuálneho účastníka a jeho osobný záujem. Koniec koncov, najlepšou možnosťou je mlčať a ísť zadarmo.

Nashova rovnováha je kontaktným miestom, kde si každý účastník vyberie optimálnu možnosť, iba ak si ostatní účastníci zvolia konkrétnu stratégiu.

Ak vezmeme do úvahy možnosť, keď obaja zločinci mlčia a dostanú každý jeden rok, môžeme to nazvať Pareto-optimálna možnosť. Je však možné, iba ak by sa zločinci mohli vopred dohodnúť. Ale ani to by nezaručilo tento výsledok, pretože pokušenie ustúpiť od presvedčovania a vyhnúť sa trestu je veľké. Nedostatok úplnej dôvery v seba navzájom a nebezpečenstvo, že budú mať 5 rokov, si jeden z nich vyberie s uznaním. Je jednoducho iracionálne uvažovať o tom, že účastníci budú mlčky konať v zhode. K takémuto záveru možno dospieť, ak študujeme Nashovu rovnováhu. Príklady to len dokazujú.

Sebecký alebo racionálny

Teória Nashovej rovnováhy priniesla ohromujúce závery, ktoré vyvracajú zásady, ktoré existovali predtým. Napríklad Adam Smith považoval správanie každého z účastníkov za absolútne sebecké, čo prinieslo systém do rovnováhy. Táto teória sa volala „neviditeľná ruka trhu“.

Image

John Nash videl, že ak všetci účastníci konajú v záujme svojich záujmov, nikdy to nebude viesť k optimálnemu výsledku skupiny. Vzhľadom na to, že racionálne myslenie je spojené s každým účastníkom, je pravdepodobnejšia voľba, ktorú ponúka Nashova rovnovážna stratégia.

Čisto mužský experiment

Živým príkladom je hra „blond paradox“, ktorá, hoci sa zdá nevhodná, je živou ilustráciou, ktorá ukazuje, ako funguje teória hry Nash.

V tejto hre si musíte predstaviť, že spoločnosť slobodných ľudí prišla do baru. Ďalej je to spoločnosť dievčat, z ktorých jedna je vhodnejšia ako ostatné, povedzme blond. Ako sa chlapci správajú, aby pre seba získali najlepšiu priateľku?

Image

Dôvody chlapcov: ak sa všetci začnú zoznámiť s blondínkou, s najväčšou pravdepodobnosťou sa nikomu nedostanú, potom sa jej priatelia nebudú chcieť stretnúť. Nikto nechce byť druhým záložníkom. Ale ak sa chlapci rozhodnú vyhnúť blondínke, potom je pravdepodobnosť, že každý z nich nájde medzi dievčatami dobrú priateľku, vysoká.

Situácia Nashovej rovnováhy nie je optimálna pre mužov, pretože pri sledovaní iba svojich sebeckých záujmov by si každý vybral blondínku. Je zrejmé, že sledovanie iba sebeckých záujmov sa bude rovnať kolapsu záujmov skupiny. Nashova rovnováha bude znamenať, že každý človek koná vo svojich osobných záujmoch, ktoré sú v kontakte so záujmami celej skupiny. Toto nie je optimálna možnosť pre každého osobne, ale optimálna pre každého na základe celkovej stratégie úspechu.

Celý náš život je hra

Rozhodovanie v reálnych podmienkach je veľmi podobné hre, keď od ostatných účastníkov očakávate určité racionálne správanie. V podnikaní, v práci, v tíme, v spoločnosti a dokonca aj vo vzťahoch s opačným pohlavím. Od veľkých transakcií po bežné životné situácie sa všetko riadi jedným alebo druhým zákonom.

Image

Uvažované herné situácie so zločincami a barom sú samozrejme iba vynikajúcimi ilustráciami preukazujúcimi Nashovu rovnováhu. Príklady takýchto dilem sa veľmi často objavujú na reálnom trhu, a to najmä v prípade dvoch monopolov, ktorí trh kontrolujú.

Zmiešané stratégie

Často nie sme zapojení do jednej hry, ale do viacerých hier naraz. Výber jednej z možností pre jednu hru, ktorá sa riadi racionálnou stratégiou, ale dostanete sa do inej hry. Po niekoľkých racionálnych rozhodnutiach môžete zistiť, že váš výsledok vám nevyhovuje. Čo robiť?

Zvážte dva typy stratégií:

  • Čistá stratégia je správanie účastníkov, ktoré vychádza z premýšľania o možnom správaní ostatných účastníkov.

  • Zmiešaná stratégia alebo náhodná stratégia je náhodná alternatíva čistých stratégií alebo voľba čistej stratégie s určitou pravdepodobnosťou. Táto stratégia sa nazýva aj náhodná.

Image

Vzhľadom na toto správanie získame nový pohľad na Nashovu rovnováhu. Ak skôr bolo povedané, že hráč si raz vyberie stratégiu, môže si predstaviť ďalšie správanie. Môžeme pripustiť možnosť, že hráči vyberú stratégiu náhodne s určitou pravdepodobnosťou. Hry, v ktorých Nashove rovnováhy nemožno nájsť v čistých stratégiách, ich vždy obsahujú v zmiešaných.

Nashova rovnováha v zmiešaných stratégiách sa nazýva zmiešaná rovnováha. Je to taká rovnováha, keď si každý účastník vyberie optimálnu frekvenciu pre výber svojich stratégií za predpokladu, že ostatní účastníci si vyberú svoje stratégie s danou frekvenciou.