Nash-likevekt. Spillteori for økonomer (John Nash)

På 1930-tallet ble John von Neumann og Oscar Morgenstern grunnleggerne av et nytt interessant matematikkområde, som ble kalt "spillteori." På 1950-tallet ble den unge matematikeren John Nash interessert i dette området. Likevektsteorien ble temaet for avhandlingen hans, som han skrev da han var 21 år gammel. Dermed ble det født en ny strategi for spill kalt Nash Equilibrium, som tjente Nobelprisen mange år senere, i 1994.

Det lange gapet mellom å skrive en avhandling og universell aksept var en test for matematikeren. Geni uten anerkjennelse resulterte i alvorlige mentale krenkelser, men John Nash klarte å løse dette problemet takket være hans utmerkede logiske sinn. Hans teori om "Nash-likevekt" ble tildelt Nobelprisen, og hans filmatisering i filmen "Beautiful mind" ("Mind Games").

Game Theory Kort

Siden teorien om Nash-likevekt forklarer menneskers oppførsel når det gjelder samhandling, er det derfor verdt å vurdere de grunnleggende begrepene i spillteori.

Spillteori studerer oppførselen til deltakere (agenter) under betingelser for interaksjon med hverandre i henhold til type spill, når utfallet avhenger av avgjørelsen og atferden til flere mennesker. Deltakeren tar avgjørelser, styrt av sine prognoser angående andres oppførsel, som kalles spillstrategi.

Det er også en dominerende strategi der deltakeren får det optimale resultatet for enhver atferd fra andre deltakere. Dette er spillerens beste vinn-vinn-strategi.

Prisoners dilemma og vitenskapelig gjennombrudd

Fangens dilemma er et tilfelle med et spill når deltakerne blir tvunget til å ta rasjonelle avgjørelser og når et felles mål i sammenheng med en konflikt med alternativer. Spørsmålet er hvilke av disse alternativene han vil velge, anerkjenner hans personlige og felles interesse, så vel som manglende evne til å få begge deler. Spillerne ser ut til å være innelukket i tøffe spillforhold, noe som noen ganger får dem til å tenke veldig produktivt.

Dette dilemmaet ble utforsket av den amerikanske matematikeren John Nash. Likevekten som han brakte ut ble revolusjonerende i sitt slag. Spesielt levende påvirket denne nye tanken økonomers mening om hvordan markedsaktører tar valg, tatt hensyn til andres interesser, med nært samspill og skjæringspunkt mellom interesser.

Det er best å studere spillteori med spesifikke eksempler, siden denne matematiske disiplinen i seg selv ikke er en tørr teoretisk.

Eksempel på fange

Eksempel to personer som ble ranet, falt i hendene på politiet og blir avhørt i separate celler. Samtidig tilbyr politifolk hver deltaker gunstige forhold under hvilke han vil bli løslatt dersom han vitner mot sin partner. Hver av de kriminelle har følgende sett med strategier som han vil vurdere:

Begge vitner samtidig og får 2, 5 års fengsel.
Begge er tause på samme tid og får ett år hver, siden bevisbasen for deres skyld i dette tilfellet vil være liten.
Den ene gir bevis og får frihet, mens den andre er taus og får 5 års fengsel.

Det er klart, utfallet av saken avhenger av avgjørelsen fra begge deltakerne, men de kan ikke komme til enighet fordi de sitter i forskjellige celler. Konflikten mellom deres personlige interesser i kampen for en felles interesse er også tydelig synlig. Hver fange har to alternativer for handling og 4 alternativer for utfall.

Inferenskjede

Så vurderer kriminell A følgende alternativer:

Jeg er taus og partneren min er taus - vi begge får 1 års fengsel.
Jeg gir partneren min, og han gir meg - vi får begge 2, 5 års fengsel.
Jeg er taus, og partneren min overlater meg - jeg vil motta 5 års fengsel, og han vil være fri.
Jeg leier partneren min, og han er taus - jeg får frihet, og han sitter i 5 års fengsel.

Vi gir en matrise av mulige løsninger og utfall for klarhet.

Tabellen over sannsynlige utfall av fangens dilemma.

Spørsmålet er hva vil hver deltaker velge?

"Stillhet, du kan ikke snakke" eller "Stillhet kan du ikke snakke"

For å forstå deltakerens valg, må du gå gjennom tankene våre. Etter begrunnelsen til den kriminelle A: hvis jeg tier og tier min partner, vil vi få en minstetid (1 år), men jeg kan ikke finne ut hvordan han vil oppføre seg. Hvis han vitner mot meg, er det også bedre for meg å vitne, ellers kan jeg sette meg ned i 5 år. Jeg vil heller sitte 2, 5 år enn 5 år. Hvis han ikke sier noe, så desto mer trenger jeg å vitne, for på denne måten vil jeg få frihet. Medlem B argumenterer også på samme måte.

Det er lett å forstå at den dominerende strategien for hver av de kriminelle er å vitne. Det optimale poenget med dette spillet oppstår når begge kriminelle gir bevis og mottar sin "premie" - 2, 5 års fengsel. Nashs spillteori kaller det likevekt.

Nash Optimal Optimal Solution

Revolutionen av Nashev-synet er at en slik balanse ikke er optimal hvis vi vurderer den enkelte deltaker og hans personlige interesse. Tross alt er det beste alternativet å tie og gå fri.

Nash-likevekt er et kontaktpunkt, der hver deltaker velger et alternativ som er optimalt for ham bare hvis de andre deltakerne velger en spesifikk strategi.

Tatt i betraktning alternativet når begge kriminelle er stille og får bare 1 år hver, kan vi kalle det Pareto-optimalt alternativ. Det er imidlertid bare mulig hvis kriminelle kunne ha avtalt på forhånd. Men selv dette ville ikke garantere dette resultatet, siden fristelsen til å spore tilbake fra overtalelse og unngå straff er stor. Mangelen på full tillit til hverandre og faren for å være 5 år tvinger en til å velge alternativet med anerkjennelse. Å reflektere over det faktum at deltakerne vil holde seg til alternativet med stillhet, opptre på konsert, er ganske enkelt irrasjonelt. En slik konklusjon kan gjøres hvis vi studerer Nash-likevekten. Eksempler beviser det bare.

Egoistisk eller rasjonell

Teorien om Nash-likevekt har gitt fantastiske konklusjoner og tilbakevist prinsippene som eksisterte før. Adam Smith vurderte for eksempel oppførselen til hver av deltakerne som absolutt egoistisk, noe som førte systemet i likevekt. Denne teorien ble kalt "markedets usynlige hånd."

John Nash så at hvis alle deltakerne opptrer etter deres egne interesser, vil dette aldri føre til et optimalt grupperesultat. Tatt i betraktning at rasjonell tenking er iboende hos hver deltaker, er valget som Nash-likevektsstrategien tilbyr mer sannsynlig.

Rent mannlig eksperiment

Et levende eksempel er spillet "blonde paradox", som, selv om det virker upassende, er en levende illustrasjon som viser hvordan Nash-spillteorien fungerer.

I dette spillet må du forestille deg at selskapet med gratis karer kom til baren. Neste er et selskap med jenter, hvorav den ene er å foretrekke fremfor de andre, sier en blond. Hvordan oppfører gutta seg for å få den beste kjæresten for seg selv?

Så, guttenes begrunnelse: Hvis alle begynner å bli kjent med blondinen, så vil hun sannsynligvis ikke komme til noen, da vil vennene ikke møte. Ingen ønsker å bli den andre fallbacken. Men hvis gutta velger å unngå blondinen, er sannsynligheten for hver av gutta å finne en god kjæreste blant jentene stor.

Situasjonen for Nash-likevekt er ikke optimal for gutta, fordi, bare de forfølger deres egoistiske interesser, ville alle velge en blond. Det er tydelig at forfølgelsen av bare egoistiske interesser vil være likeverdig som sammenbruddet av gruppeinteresser. Nash-likevekt vil bety at hver fyr handler i sine egne personlige interesser, som er i kontakt med interessene til hele gruppen. Dette er ikke et optimalt alternativ for alle personlig, men optimalt for alle, basert på den generelle suksessstrategien.

Hele livet vårt er et spill

Å ta avgjørelser under reelle forhold ligner veldig på et spill når du forventer en viss rasjonell oppførsel fra andre deltakere. I virksomhet, i arbeid, i et team, i et selskap, og til og med i forhold til det motsatte kjønn. Fra store transaksjoner til vanlige livssituasjoner, adlyder alt en eller annen lov.

De vurderte spillsituasjonene med kriminelle og baren er selvfølgelig bare glimrende illustrasjoner som viser Nashs balanse. Eksempler på slike dilemmaer oppstår ofte i det virkelige markedet, og dette fungerer spesielt i tilfeller med to monopolister som kontrollerer markedet.

Blandede strategier

Ofte er vi ikke involvert i ett, men flere spill på en gang. Å velge et av alternativene for ett spill, styrt av en rasjonell strategi, men du kommer inn i et annet spill. Etter flere rasjonelle beslutninger, kan det hende du opplever at resultatet ditt ikke passer deg. Hva skal jeg gjøre?

Vurder to typer strategi:

En ren strategi er en deltakers oppførsel som kommer fra å tenke på andre deltagers mulige oppførsel.
En blandet strategi eller en tilfeldig strategi er vekslingen av rene strategier tilfeldig eller valget av en ren strategi med en viss sannsynlighet. Denne strategien kalles også randomisert.

Med tanke på denne oppførselen får vi et nytt blikk på Nash-likevekten. Hvis det tidligere ble sagt at spilleren velger en strategi en gang, kan man forestille seg en annen oppførsel. Vi kan innrømme alternativet at spillere velger en strategi tilfeldig med en viss sannsynlighet. Spill der Nash-likevekt ikke kan finnes i rene strategier, har dem alltid i blandede.

Nash-likevekt i blandede strategier kalles blandet likevekt. Dette er en slik balanse, der hver deltaker velger den optimale frekvensen for å velge sine strategier, forutsatt at andre deltakere velger sine strategier med en gitt frekvens.