(20) Optimierung & strategische Interaktion Flashcards

1
Q

Spieltheorie - game theory : Entstehung

A
  • mathematische Form der Spieltheorie seit 1940ern
  • populär in Politikwissenschaft seit 1990ern
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Einfachste Form eines Spiels

A
  • Matrix für zwei Spieler
    • Zeilenspieler
    • Kolonnenspieler
  • beide agieren simultan (gleichzeitig)
  • common knowledge (beide kennen mögliche pay-offs für alle in allen Situationen)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Einfache Spiele: N =

A

Spieler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Einfache Spiele: Si

A

für jede i Element N gibt es eine Menge Si (mögliche Strategien)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Einfache Spiele: Ri

A

jeder Spieler hat rationale Präferenz (Ri) über Ergebnisse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Einfache Spiele: s= {s1, s2,…,si,…,sn}

A

jeder Spieler hat Strategie, kann als Profil dargestellt werden s= {s1, s2,…,si,…,sn}

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Einfache Spiele: Vorgehen

A

man geht Optionen für beide Spieler durch und erstellt für jeden einzelnen ein Profil

diese Profil wird dann zu einem Gesamtprofil zusammengefügt

Bsp
N = Zeilenspieler, Kolonnenspieler

Sz = {O, U}

Sk = {L,R}

Annahmen: a > e, c > g, b > d, f > h

Rz = O > U

Rk = L > R

Profil: s = {O, L}

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Gleichgewicht =

A

> Ergebnis, bei dem keine endogene Änderung zu erwarten ist → Stabilität(keine Garantie, dass Gleichgewicht existiert, höchstens Wahrscheinlichkeit → mixed strategies)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dominierte Strategien

A

> Strategie, die nicht den höchsten Nutzen bringt, unabhängig von Strategien der anderen Spieler

  • si* = dominierte Strategie
    • u (si*, s_i) ≤ u (si, s_i)
  • strikt dominierte Strategie
    • u (si*, s_i) < u (si, s_i)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

si* =

A

dominierte Strategie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

strikt dominierte Strategie =

A

u (si*, s_i) < u (si, s_i)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Nash Gleichgewicht =

A

> Nash Gleichgewicht (s*) ist Profil (s), bei dem man sein Ergebnis nicht dadurch verbessern könnte, wenn man seine Strategie ändert (allenfalls müsste anderer es tun)

≠ pareto-optimaler Zustand

Nash: Zustand für alle könnte besser sein, es hilft mir aber nichts, wenn ich etwas tue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Beste-Antwort-Funktion

A

best-response-function

  1. eine Strategie fixieren
    • schauen, was anderer Spieler unter dieser Bedingung optimalerweise machen sollte
    • Antwort markieren
  2. so durch alle Spieler mit allen Strategien gehen (alle Permutationen)
  3. Ergebnis suchen, bei dem sich beste Antworten der Spieler überschneiden → Nash
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

best response function: Bsp. Gefangenendilemma

A

bz (k gesteht) = {gestehe}

bz (k schweigt) = {gestehe}

bk (z gesteht) = {gestehe}

bk (z schweigt) = {gestehe}

Nash:
bz (k gesteht) = {gestehe}
bk (z gesteht) = {gestehe}

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nash GG: Vorhersagekraft

A
  • Nash Ggw muss nicht existieren
  • Nash Ggw ist steady state
  • mehrere Nash Ggw zugleich möglich
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Nash GG: Effizienz

A
  • Nash Ggw muss nicht kollektiv effizient sein
    • Gefangenendilemma wäre kollektiv effizienter
    • ist aber nicht so, weil nur eigener Nutzen in Vordergrund
17
Q

Iteratives Ausschließen von dominierten Strategien (IAvDS)

A
  1. paarweiser Vergleich aller Spalten miteinander
    - wenn eine Spalte für alle Spieler schlechter ist als die andere, ist dies dominierte Strategie, kann herausgestrichen werden
  2. paarweiser Vergleich aller Zeilen miteinander
    - wieder dominierte Strategie streichen, falls vorhanden

man arbeitet sich durch 1 & 2, bis man dies nicht mehr kann -> Gleichgewicht (kann auch mehrere oder gar keins geben)

18
Q

Achtung bei IAvDS

A
  • auch Spiel mit mehreren Gleichgewichten (oder keinem) möglich
  • IAvDS muss nicht immer funktionieren
19
Q

Cournot: Ausgangssituation

A

(weiteres Beispiel für best-response-function)

Ausgangssituation:

  • ein Produkt, zwei Firmen
  • Firmen entscheiden lediglich Produktionsmenge
  • Firmen wollen Gewinn maximieren
  • Produktionsmenge → kontinuierliche Handlungsoption, nicht vorgefertigte Kategorien
  • Modell illustriert Marktimperfektion (Oligopol)
  • beide Firmen haben identische Nutzungsfunktionen
20
Q

Cournot: c =

A

Fixkosten pro produzierte Einheit

21
Q

Cournot: p =

A
  • Preis, fällt mit Menge (q)

p (q1, q2) = {Alpha - qi - qj, if Alpha > q1 + q2, else 0}

22
Q

Cournot: Alpha =

A

irgendeine große Zahl

23
Q

Cournot: πi =

A

Profit

  • πi = qi * p - qi * c → Einsatz p in Gleichung
  • πi = qi * (Alpha - qi - qj) - qi * c
24
Q

Cournot: best response function (Annahmen)

A

beide Firmen haben identische Nutzungsfunktionen

  • Firma i produziert Menge qi, sodass Profit maximal ist gegeben qj
    • beste response function: optimales Produktionsvolumen ist abhängig von anderer Firma
25
Cournot: Vorgehensweise
1) Berechnung des Maximums von Profitformel πi (ist für beide Firmen gleich) 2) Schnittpunkt beider Funktionen (von beiden Unternehmen) berechnen
26
Cournot: 1) Berechnung des Maximums
πi = qi * (Alpha - qi - qj) - qi * c |Klammer auflösen πi = Alpha * qi - qi^2 - qi * qj - qi * c |Erste Ableitung bilden πi’ = Alpha - 2qi - qj - c = 0 zweite Ableitung ist -2, also Maximum qi = Alpha - qj - c / 2 → nun ist für jeden Wert von qj, Alpha und c optimale Menge qi bekannt
27
Cournot: 2) Schnittpunkt beider Funktionen berechnen
qi = Alpha - qj - c / 2 qj = Alpha - qi - c / 2 → zwei Gleichungen mit zwei Unbekannten lösen Ergebnis: qi = Alpha - c / 3 Im Cournot-Modell produzieren beide Firmen je Alpha - c / 3. Der Gewinn ist für beide Firmen je (Alpha - c / 3)^2.
28
Sequentielle Spiele: Charakteristika
> ermöglichen es, Zeit zu modellieren und Reihenfolge der Spieler zu berücksichtigen > diesmal: nur Vollinformationsspiele (Jeder Spieler kennt alle pay-offs für alle)
29
Vollinformationsspiele =
Jeder Spieler kennt alle pay-offs für alle
30
sequentielle Spiele: Bestandteile
- Spielbaum - Reihe von Gabelungen - Äste (Handlungen) - Geschichte (das, was vor meinem Zug gewesen ist) - Strategie (zeigt an, welche Handlung ein Spieler an jeder Stelle macht) - ≠ einzelne Aktion - s1 = {L,R} - s2 Element {(l,l), (l,r,), (r,l), (r,r)} - Strategieprofil - s = {L, (l,l)} - O (s*) = Ergebnis, wenn jeder Spieler seine Strategie spielt si* - Strategieprofil s* ist Nash Gleichgewicht, falls gewählte Strategie ≥ ist gegenüber nicht-Strategie
31
sequentielle Spiele: Strategie =
- (zeigt an, welche Handlung ein Spieler an jeder Stelle macht) - ≠ einzelne Aktion - s1 = {L,R} - s2 Element {(l,l), (l,r,), (r,l), (r,r)}
32
O (s*) =
Ergebnis, wenn jeder Spieler seine Strategie spielt si*
33
Strategieprofil s* ist Nash Gleichgewicht, falls
gewählte Strategie ≥ ist gegenüber nicht-Strategie
34
SPNE =
Subgame perfect Nash Equlibrium (Gleichgewichtsverfeinerung für sequentielle Spiele mit Vollinformation) → in sequentiellem Spiel ist Strategieprofil (s) ein SPNE, wenn in jedem Sub-Spiel auch ein Nash Equilibrium ist
35
SPNE: Nash Equilibrium finden:
1. sub-Spiele identifizieren 2. für alle sub-Spiele Nash-Gleichgewichte identifizieren → backwards induction (ganz unten bzw. hinten anfangen) 3. sich immer weiter nach oben bzw. an den Anfang arbeiten → wenn überall Ggw. in Sub-Spielen, dann SPNE