- Stackelberg-Modell
-
Das Stackelbergmodell ist ein strategisches Spiel in den Wirtschaftswissenschaften, das dadurch gekennzeichnet ist, dass das marktführende Unternehmen zuerst zieht und danach die marktfolgenden Unternehmen sich entscheiden. Handelt es sich nur um zwei Unternehmen spricht man von einem Stackelberg-Duopol. Es ist nach dem deutschen Ökonomen Heinrich Freiherr von Stackelberg benannt, der sein Werk Marktform und Gleichgewicht 1934 veröffentlichte, in dem das Modell beschrieben wurde, und stellt eine Weiterentwicklung von Cournots Duopol-Modell dar.
Wir bezeichnen die beiden Spieler als Stackelbergführer bzw. Leader und Stackelbergfolger bzw. Follower und sie konkurrieren in Mengeneinheiten. Der Stackelbergführer wird dabei auch manchmal als Marktführer bezeichnet.
Für die Existenz eines Gleichgewichts im Stackelberg-Duopol gibt es einige weitere Bedingungen: Der Leader muss wissen, dass der Follower seine Aktion beobachtet. Der Follower darf keine Möglichkeit haben, sich vor dem Leader auf eine zukünftige Aktion festzulegen (also auch nicht auf eine Aktion außerhalb des Gleichgewichts im Stackelberg-Modell) und dem Leader muss dies bekannt sein. Wenn dies möglich wäre, würde der Follower sich auf die Menge festlegen, die der Leader im Stackelberg-Modell wählt und die beste Antwort des Leaders darauf wäre die Menge zu wählen, die der Follower im Stackelberg-Modell wählt. (Das Ganze würde sich also umdrehen!)
Unternehmen können sich im Stackelberg-Wettbewerb befinden, wenn eine von ihnen einen irgendwie gearteten Vorteil hat, der sie in die Lage versetzt, zuerst zu entscheiden. Üblicherweise sollte der Leader in der Lage dazu sein, sich festzulegen. Seine Aktion offen zuerst zu wählen ist die offensichtlichste Form dabei; sobald der Leader seine Aktion gewählt hat, kann er sie nicht rückgängig machen, er ist an sie gebunden. Die Möglichkeit des ersten Zuges kann zum Beispiel in einer Situation gegeben sein, in dem der Leader ein Monopol innehat und der Follower neu auf dem Markt ist.
Inhaltsverzeichnis
Nash-Gleichgewicht
Das Stackelberg-Modell kann gelöst werden, um ein (oder mehrere) Nash-Gleichgewicht(e) aufzufinden, also die Strategiekonfiguration(en), bei der jeder der Spieler die optimale Menge gewählt hat bei gegebener Wahl der Mengen der anderen Spieler.
Ganz allgemein sei die inverse Nachfragefunktion für den Markt im Duopol gegeben durch P(q1 + q2) , wobei der Index 1 den Leader und der Index 2 den Follower bezeichnet. Der Preis ergibt sich somit als eine Funktion des Gesamtoutputs. Da Unternehmen i habe die Kostenfunktionfirm Ci(qi). Das Modell wird durch Rückwärtsinduktion gelöst. Unternehmen 1 ermittelt die Beste Antwort von Unternehmen 2, d.h. wie dieses reagieren wird, wenn es die Wahl der Menge q1 beobachtet. Unternehmen 1 (der Leader) wählt dann eine Menge so, dass es unter Antizipation der Antwort von Unternehmen 2 (dem Follower) seine Auszahlung maximiert. Unternehmen 2 beobachtet dies und wählt im Gleichgewicht tatsächlich die erwartete Menge als Antwort.
Um das Nash-Gleichgewicht zu berechnen, muss die Beste-Antwort-Funktion des Followers zuerst berechnet werden (->Rückwärtsinduktion).
Der Gewinn von Unternehmen 2 (Follower) ist dessen Erlös minus dessen Kosten; der Erlös ist das Produkt aus Preis und der produzierten Menge von Unternehmen 2 und die Kosten sind durch die Kostenstruktur des Unternehmens gegeben, der Gewinn ist also: . Die beste Antwort ist der Wert von q2, der Π2 maximiert, gegeben q1, den Output des Leaders(Unternehmen 1). Dieser Wert gibt den Output an, der den Gewinn von Unternehmen 2 maximiert. Also muss das Maximum von Π2 unter q2 gefunden werden. Leite dazu zunächst Π2 nach q2 ab:
Nach der hinreichenden Bedingung für ein Extremum muss dies 0 ergeben(Anschließend ist noch zu prüfen, ob die zweite Ableitung negativ ist oder es einen Vorzeichenwechsel von + nach – gibt):
Die Werte von q2, die diese Gleichung erfüllen, liegen in der Menge der besten Antworten. Nun wird die Gewinnfunktion von Unternehmen 1 betrachtet. Sie wird berechnet, in dem bei der Berechnung des Preises die Beste-Antwort-Funktion von Unternehmen 2 eingesetzt wird.
Der Gewinn von Unternehmen 1 (dem Leader) ergibt sich zu , wobei q2(q1) den Output von Unternehmen 2 als Funktion (nämlich die Beste Antwort-Funktion von oben) von Unternehmen 1 angibt. Es wird nun der Wert von q1 gesucht, der Π1 maximiert, gegeben q2(q1). Das heißt gegeben die Reaktionsfunktion des Followers(Unternehmen 2), muss der Output gefunden werden, der den Gewinn von Unternehmen 1 maximiert. Also muss das Maximum von Π1 unter q1 gefunden werden. Leite dazu zunächst Π1 nach q1 ab:
Nach der hinreichenden Bedingung für eine Extremstelle muss dies 0 ergeben(s.o.):
Beispiel
Das folgende Beispiel ist charakteristisch. Es setzt eine lineare Nachfragekurve voraus und stellt einige Bedingungen an die Kostenstrukturen der Einfachheit halber, sodass das Problem gelöst werden kann.
- and
um die Berechnung zu vereinfachen. Die Kostenstruktur eines Unternehmens ist also unabhängig vom Output des anderen Unternehmen.
Der Gewinn von Unternehmen 2(Follower) ist:
Das Maximierungsproblem wird wie folgt allgemein gelöst(notwendige Bedingung):
Betrachten wir das Problem von Unternehmen 1(Leader):
Einsetzen der Reaktionsfunktion q2(q1) , die wir aus dem Maximierungsproblem von Unternehmen 2 erhalten haben:
Das Maximierungsproblem wird wie folgt allgemein gelöst(notwendige Bedingung):
Durch Auflösen nach q1 ergibt , die optimale Wahl des Leaders:
Dies ist die beste Wahl des Leaders unter Antizipation der Antwort des Followers im Gleichgewicht. Die Aktion des Followers kann nun gefunden werden, indem man den Output von Unternehmen 1 in die oben erhaltene Reaktionsfunktion einsetzt:
Die Nash-Gleichgewichte sind alle . Offensichtlich(wenn man die Kosten außen vor lässt) hat der Leader einen großen Vorteil. Wenn das nicht der Fall wäre, könnte er auch einfach die Menge aus dem Cournot-Gleichgewicht wählen. Da er dies nicht tut, obwohl er die Möglichkeit dazu hat, erhält er einen Vorteil durch seine Marktführer-Stellung.
Ökonomische Analyse
Eine Darstellung in Extensiv-Form wird oft benutzt um das Stackelberg-Duopol zu analysieren. Das auch als Entscheidungsbaum bekannte Modell zeigt die Outputkombinationen und Auszahlungen beider Unternehmen im Stackelberg-Spiel.
Das Bild auf der linken Seite zeigt ein Stackelberg-Spiel in Extensivform. Die Auszahlungen stehen dabei rechts. Das Beispiel ist recht einfach. Die Kostenstruktur beinhaltet nur Grenzkosten (es gibt keine Fixen Kosten). Die Nachfragefunktion ist linear und der Betrag ihrer Preiselastizität ist 1. Dennoch zeigt es den Vorteil des Leaders.
Der Follower wählt eine Menge q2, die seine Auszahlung q2(5000 − q1 − q2 − c2) maximiert. Indem man dies ableitet und Null setzt(zur Bestimmunge des Maximums) erhält man als den Wert von q2, der genau dies erfüllt.
Der Leader möchte eine Menge q1 wählen, die seine Auszahlung q1(5000 − q1 − q2 − c1) maximiert. Er weiß dabei, dass im der Follower im Gleichgewicht das q2 von oben wählen wird. Also wird der Leader tatsächlich seine Auszahlung (q2 als Reaktionsfunktion des Follower wurde eingesetzt) maximieren. Durch Ableiten ergibt sich, dass die maximale Auszahlung sich für einstellt. Einsetzen in die Reaktionsfunktion des Follower ergibt . Angenommen die Grenzkosten der beiden Kurven sind identisch (so dass der Leader keinen anderen Vorteil hat außer dem, zuerst am Zug zu sein) und im speziellen c1 = c2 = 1000. Der Leader würde 2000 Einheiten produzieren und der Follower 1000. Dies würde dem Leader einen Gewinn von 2 Millionen und dem Follower einen Gewinn von einer Million generieren. Nur dadurch, zuerst am Zug zu sein, hat der Leader einen doppelt so hohen Gewinn wie der Follower erreicht. Im Cournot-Wettbewerb wären die Gewinne bei etwa 1.78 Millionen jeweils, das heißt im Vergleich dazu hat der Leader verhältnismäßig wenig gewonnen, der Follower dafür relativ viel verloren. Dies ist jedoch nicht allgemein der Fall. Es kann auch Fälle geben, in denen der Leader verhältnismäßig viel im Vergleich zum Cournot-Wettbewerb dazu gewinnt, die an Monopol-Gewinne heranreichen(zum Beispiel, wenn der Leader zusätzlich noch einen großen Vorteil in der Kostenstruktur hat, zum Beispiel durch eine bessere Produktionsfunktion). Ebenso kann es der Fall sein, dass der Follower sogar einen höheren Gewinn als der Leader erzielt, aber nur wenn er sehr viel niedrigere Kosten hat.
Unglaubwürdige Drohungen des Followers
Wenn nach der Wahl der Gleichgewichtsmenge durch den Leader der Follower vom Gleichgewicht abweichen würde und eine nicht-optimale Menge wählen würde, würde es nicht nur ihm selbst schaden, sondern auch dem Leader. Würde der Follower eine weitaus größere Menge als seine beste Antwort wählen, so würde der Marktpreis sinken und der Gewinn des Leaders würde erheblich sinken, möglicherweise unter den Gewinn, der im Cournot-Wettbewerb erzielbar wäre. In diesem Fall könnte der Follower dem Leader vor dem Start des Spiels bekanntgeben, dass es für den Fall, dass der Leader nicht die Cournot-Menge wählt, vom Gleichgewicht abweichen wird, sodass der Gewinn des Leaders erhebliche Einbußen erleidet. Grund für die Überlegung ist die Tatsache, dass die Menge, die vom Leader im Gleichgewicht gewählt wird, nur dann optimal ist, wenn der Follower ebenso die Gleichgewichtsmenge wählt. Der Leader ist jedoch in keiner Gefahr. Sobald er seine Gleichgewichtsmenge gewählt hat, ist es irrational für den Follower abzuweichen; denn ein Abweichen würde seine Auszahlung verringern, die dieser ja gerade zu maximieren versucht. Sobald der Leader gewählt hat, ist der Follower gut beraten, den Gleichgewichtspfad zu wählen. Deshalb wäre eine solche Drohung, wie oben vom Follower ausgesprochen, unglaubwürdig (siehe auch Teilspielperfektes Gleichgewicht).
In einem (unendlich oft) wiederholten Stackelberg-Spiel jedoch, würde der Follower möglicherweise eine Bestrafungsstrategie(Tit for Tat) spielen, die den Leader in der jeweiligen Periode für das Spielen des Stackelberg-Gleichgewichts bestraft. Diese Drohung ist glaubwürdig, da es für den Marktfolger rational ist, seine Drohung nicht leer aussehen zu lassen, um den Leader dazu zu bringen, in den kommenden Perioden die Menge aus dem Cournot-Gleichgewicht zu spielen.
Stackelberg im Vergleich mit Cournot
Das Stackelberg-Modell und das Cournot-Modell sind einander ähnlich, da in beiden Fällen in Mengeneinheiten konkurriert wird. Jedoch gibt der erste Zug dem Leader einen entscheidenden Vorteil. Die Annahme der Existenz von Perfekter Information im Stackelberg-Duopol ist essentiell: Der Follower muss die vom Leader gewählte Menge beobachten; sonst landen wir im Cournot-Modell. Bei Imperfekter Information können die oben beschriebenen Drohungen glaubhaft sein. Wenn der Stackelberg-Folger die Wahl des Leaders nicht beobachten kann, ist es nicht mehr länger irrational für ihn zum Beispiel die Menge zu wählen, die er im Cournot-Modell spielen würde(was hier tatsächlich ein Gleichgewicht darstellt.). Jedoch ist es hierzu notwendig, dass Imperfekte Information dahingehend existiert, dass der Follower nicht in der Lage ist, die Aktion des Leaders zu verfolgen, denn es wäre irrational für den Follower, dies nicht zu tun, wenn er dazu in der Lage wäre. Denn wenn er beobachten kann, wird er es tun, um eine optimale Entscheidung zu treffen. Jede Drohung des Followers dahingehend, die Aktion des Leaders nicht zu beobachten, obwohl er dazu in der Lage wäre, ist daher ebenso unglaubwürdig wie die anderen bisher beschriebenen. Dies ist ein Beispiel dafür, dass das Vorhandensein von Information einem Spieler schaden kann. Im Cournot-Wettbewerb ist es die Simultanität des Spiels, die darin resultiert, dass kein Spieler c.p. im Nachteil ist.
Spieltheoretische Überlegungen
Wie bereits erwähnt, führt imperfekte Information dazu, dass Cournot-Wettbewerb herrscht. Im Stackelberg-Duopol sind dennoch einige Cournot-Gleichgewichte als Nash-Gleichgewichte erhalten geblieben, die allerdings als unglaubwürdige Drohungen (wie oben beschrieben) identifiziert werden können, indem man das Lösungskonzept der Teilspielperfektheit anwendet. Es stellt sich heraus, dass genau der Grund, der dafür sorgt, dass das Cournot-Gleichgewicht ein Nash-Gleichgewicht im Stackelberg-Spiel ist, dafür verantwortlich ist, dass es nicht teilspielperfekt ist.
Betrachten wir ein Stackelberg-Spiel (i.e. eines welches die oben beschriebenen Bedingungen zur Existenz eines Stackelberg-Gleichgewichts erfüllen), in dem aus irgendeinem Grund der Leader glaubt, dass, egal welche Aktion er wählt, der Follower die Cournot-Menge wählen wird. (Vielleicht glaubt der Leader, der Follower sei irrational.) Wenn der Leader die Menge aus dem Stackelberg-Gleichgewicht spielt, so glaubt er, würde der Follower mit der Menge aus dem Cournot-Gleichgewicht reagieren. Deshalb ist es nicht optimal für den Leader, die Stackelberg-Menge zu spielen. Tatsächlich besteht seine beste Antwort (nach der Definition des Cournot-Gleichgewichts) darin, die Cournot-Menge zu wählen. Sobald er das getan hat, ist es die beste Antwort des Followers, ebenfalls die Cournot-Menge zu spielen.
Betrachten wir also die folgende Strategiekombination:
Der Leader spielt die Cournot-Menge. Der Follower spielt die Cournot-Menge, egal was der Leader spielt.
Diese Strategiekonfiguration ist ein Nash-Gleichgewicht, da jeder der Spieler, gegeben die Strategie des anderen Spielers, optimal reagiert. Die Cournot-Menge zu wählen, wäre allerdings nicht optimal für den Leader, wenn der Follower auf die Stackelberg-Menge ebenfalls mit der Stackelberg-Menge reagieren würde. In diesem Fall bestünde nämlich die beste Antwort des Leaders darin, die Stackelberg-Menge zu wählen. Was diese Strategiekombination zu einem Nash-Gleichgewicht macht, ist also die Tatsache, dass der Follower nicht die Stackelberg-Menge wählt, falls der Leader dies tut.
Gerade diese Tatsache bedeutet jedoch, dass diese Strategiekombination kein Nash-Gleichgewicht des Teilspiels ist, dass an der Stelle startet, an der der Leader bereits die Stackelberg-Menge gewählt hat.(Dieses Teilspiel liegt außerhalb des Gleichgewichtspfades.) Sobald der Leader die Stackelberg-Menge gewählt hat, ist es die beste Antwort des Followers, ebenfalls die Stackelberg-Menge zu wählen(und damit ist es die einzige Aktion, die ein Nash-Gleichgewicht in diesem Teilspiel erzeugt). Damit ist diese Strategiekombination, die im Cournot-Gleichgewicht resultiert, nicht teilspielperfekt.
Vergleich mit anderen Oligopol-Modellen
Im Vergleich mit anderen Oligopol-Modellen gilt im Gleichgewicht:
- Der Gesamtoutput ist im Stackelberg-Duopol größer als im Cournot-Duopol, aber geringer als im Bertrand-Wettbewerb
- Der Preis ist im Stackelberg-Duopol geringer als im Cournot-Duopol, aber größer als im Bertrand-Wettbewerb
- Die Konsumentenrente ist im Stackelberg-Duopol größer als im Cournot-Duopol, aber geringer als im Bertrand-Wettbewerb
- Der Gesamtoutput ist im Stackelberg-Duopol größer als im Monopol oder Kartell, aber geringer als im perfekten Wettbewerb
- Der Preis ist im Stackelberg-Duopol geringer als im Monopol oder Kartell, aber größer als im Perfekten Wettbewerb.
Siehe auch
Literatur
- Fudenberg, D. and Tirole, J. (1993) Game Theory, MIT Press. (see Chapter 3, sect 1)
- Gibbons, R. (1992) A primer in game theory, Harvester-Wheatsheaf. (see Chapter 2, section 1B)
- Osborne, M.J. and Rubenstein, A. (1994) A Course in Game Theory, MIT Press (see p 97-98)
- Tirole, J.: The Theory of Industrial Organization, Cambridge, 1988
Wikimedia Foundation.