(20) Optimierung & strategische Interaktion Flashcards

1
Q

Spieltheorie - game theory : Entstehung

A
  • mathematische Form der Spieltheorie seit 1940ern
  • populär in Politikwissenschaft seit 1990ern
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Einfachste Form eines Spiels

A
  • Matrix für zwei Spieler
    • Zeilenspieler
    • Kolonnenspieler
  • beide agieren simultan (gleichzeitig)
  • common knowledge (beide kennen mögliche pay-offs für alle in allen Situationen)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Einfache Spiele: N =

A

Spieler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Einfache Spiele: Si

A

für jede i Element N gibt es eine Menge Si (mögliche Strategien)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Einfache Spiele: Ri

A

jeder Spieler hat rationale Präferenz (Ri) über Ergebnisse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Einfache Spiele: s= {s1, s2,…,si,…,sn}

A

jeder Spieler hat Strategie, kann als Profil dargestellt werden s= {s1, s2,…,si,…,sn}

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Einfache Spiele: Vorgehen

A

man geht Optionen für beide Spieler durch und erstellt für jeden einzelnen ein Profil

diese Profil wird dann zu einem Gesamtprofil zusammengefügt

Bsp
N = Zeilenspieler, Kolonnenspieler

Sz = {O, U}

Sk = {L,R}

Annahmen: a > e, c > g, b > d, f > h

Rz = O > U

Rk = L > R

Profil: s = {O, L}

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Gleichgewicht =

A

> Ergebnis, bei dem keine endogene Änderung zu erwarten ist → Stabilität(keine Garantie, dass Gleichgewicht existiert, höchstens Wahrscheinlichkeit → mixed strategies)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dominierte Strategien

A

> Strategie, die nicht den höchsten Nutzen bringt, unabhängig von Strategien der anderen Spieler

  • si* = dominierte Strategie
    • u (si*, s_i) ≤ u (si, s_i)
  • strikt dominierte Strategie
    • u (si*, s_i) < u (si, s_i)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

si* =

A

dominierte Strategie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

strikt dominierte Strategie =

A

u (si*, s_i) < u (si, s_i)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Nash Gleichgewicht =

A

> Nash Gleichgewicht (s*) ist Profil (s), bei dem man sein Ergebnis nicht dadurch verbessern könnte, wenn man seine Strategie ändert (allenfalls müsste anderer es tun)

≠ pareto-optimaler Zustand

Nash: Zustand für alle könnte besser sein, es hilft mir aber nichts, wenn ich etwas tue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Beste-Antwort-Funktion

A

best-response-function

  1. eine Strategie fixieren
    • schauen, was anderer Spieler unter dieser Bedingung optimalerweise machen sollte
    • Antwort markieren
  2. so durch alle Spieler mit allen Strategien gehen (alle Permutationen)
  3. Ergebnis suchen, bei dem sich beste Antworten der Spieler überschneiden → Nash
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

best response function: Bsp. Gefangenendilemma

A

bz (k gesteht) = {gestehe}

bz (k schweigt) = {gestehe}

bk (z gesteht) = {gestehe}

bk (z schweigt) = {gestehe}

Nash:
bz (k gesteht) = {gestehe}
bk (z gesteht) = {gestehe}

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nash GG: Vorhersagekraft

A
  • Nash Ggw muss nicht existieren
  • Nash Ggw ist steady state
  • mehrere Nash Ggw zugleich möglich
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Nash GG: Effizienz

A
  • Nash Ggw muss nicht kollektiv effizient sein
    • Gefangenendilemma wäre kollektiv effizienter
    • ist aber nicht so, weil nur eigener Nutzen in Vordergrund
17
Q

Iteratives Ausschließen von dominierten Strategien (IAvDS)

A
  1. paarweiser Vergleich aller Spalten miteinander
    - wenn eine Spalte für alle Spieler schlechter ist als die andere, ist dies dominierte Strategie, kann herausgestrichen werden
  2. paarweiser Vergleich aller Zeilen miteinander
    - wieder dominierte Strategie streichen, falls vorhanden

man arbeitet sich durch 1 & 2, bis man dies nicht mehr kann -> Gleichgewicht (kann auch mehrere oder gar keins geben)

18
Q

Achtung bei IAvDS

A
  • auch Spiel mit mehreren Gleichgewichten (oder keinem) möglich
  • IAvDS muss nicht immer funktionieren
19
Q

Cournot: Ausgangssituation

A

(weiteres Beispiel für best-response-function)

Ausgangssituation:

  • ein Produkt, zwei Firmen
  • Firmen entscheiden lediglich Produktionsmenge
  • Firmen wollen Gewinn maximieren
  • Produktionsmenge → kontinuierliche Handlungsoption, nicht vorgefertigte Kategorien
  • Modell illustriert Marktimperfektion (Oligopol)
  • beide Firmen haben identische Nutzungsfunktionen
20
Q

Cournot: c =

A

Fixkosten pro produzierte Einheit

21
Q

Cournot: p =

A
  • Preis, fällt mit Menge (q)

p (q1, q2) = {Alpha - qi - qj, if Alpha > q1 + q2, else 0}

22
Q

Cournot: Alpha =

A

irgendeine große Zahl

23
Q

Cournot: πi =

A

Profit

  • πi = qi * p - qi * c → Einsatz p in Gleichung
  • πi = qi * (Alpha - qi - qj) - qi * c
24
Q

Cournot: best response function (Annahmen)

A

beide Firmen haben identische Nutzungsfunktionen

  • Firma i produziert Menge qi, sodass Profit maximal ist gegeben qj
    • beste response function: optimales Produktionsvolumen ist abhängig von anderer Firma
25
Q

Cournot: Vorgehensweise

A

1) Berechnung des Maximums von Profitformel πi (ist für beide Firmen gleich)
2) Schnittpunkt beider Funktionen (von beiden Unternehmen) berechnen

26
Q

Cournot: 1) Berechnung des Maximums

A

πi = qi * (Alpha - qi - qj) - qi * c |Klammer auflösen

πi = Alpha * qi - qi^2 - qi * qj - qi * c |Erste Ableitung bilden

πi’ = Alpha - 2qi - qj - c = 0

zweite Ableitung ist -2, also Maximum

qi = Alpha - qj - c / 2

→ nun ist für jeden Wert von qj, Alpha und c optimale Menge qi bekannt

27
Q

Cournot: 2) Schnittpunkt beider Funktionen berechnen

A

qi = Alpha - qj - c / 2
qj = Alpha - qi - c / 2

→ zwei Gleichungen mit zwei Unbekannten lösen

Ergebnis: qi = Alpha - c / 3

Im Cournot-Modell produzieren beide Firmen je Alpha - c / 3.
Der Gewinn ist für beide Firmen je (Alpha - c / 3)^2.

28
Q

Sequentielle Spiele: Charakteristika

A

> ermöglichen es, Zeit zu modellieren und Reihenfolge der Spieler zu berücksichtigen

diesmal: nur Vollinformationsspiele (Jeder Spieler kennt alle pay-offs für alle)

29
Q

Vollinformationsspiele =

A

Jeder Spieler kennt alle pay-offs für alle

30
Q

sequentielle Spiele: Bestandteile

A
  • Spielbaum
  • Reihe von Gabelungen
  • Äste (Handlungen)
  • Geschichte (das, was vor meinem Zug gewesen ist)
  • Strategie (zeigt an, welche Handlung ein Spieler an jeder Stelle macht)
    • ≠ einzelne Aktion
    • s1 = {L,R}
    • s2 Element {(l,l), (l,r,), (r,l), (r,r)}
  • Strategieprofil
    • s = {L, (l,l)}
  • O (s) = Ergebnis, wenn jeder Spieler seine Strategie spielt si
  • Strategieprofil s* ist Nash Gleichgewicht, falls gewählte Strategie ≥ ist gegenüber nicht-Strategie
31
Q

sequentielle Spiele: Strategie =

A
  • (zeigt an, welche Handlung ein Spieler an jeder Stelle macht)
    • ≠ einzelne Aktion
    • s1 = {L,R}
    • s2 Element {(l,l), (l,r,), (r,l), (r,r)}
32
Q

O (s*) =

A

Ergebnis, wenn jeder Spieler seine Strategie spielt si*

33
Q

Strategieprofil s* ist Nash Gleichgewicht, falls

A

gewählte Strategie ≥ ist gegenüber nicht-Strategie

34
Q

SPNE =

A

Subgame perfect Nash Equlibrium

(Gleichgewichtsverfeinerung für sequentielle Spiele mit Vollinformation)

→ in sequentiellem Spiel ist Strategieprofil (s) ein SPNE, wenn in jedem Sub-Spiel auch ein Nash Equilibrium ist

35
Q

SPNE: Nash Equilibrium finden:

A
  1. sub-Spiele identifizieren
  2. für alle sub-Spiele Nash-Gleichgewichte identifizieren→ backwards induction (ganz unten bzw. hinten anfangen)
  3. sich immer weiter nach oben bzw. an den Anfang arbeiten

→ wenn überall Ggw. in Sub-Spielen, dann SPNE