Min-Max-Theorem

Min-Max-Theorem

Das Min-Max-Theorem ist ein grundlegendes Lösungskonzept in der Spieltheorie und wird mitunter als Hauptsatz für 2-Personen-Nullsummenspiele bezeichnet.[1] Die Minimierung der gegnerischen Maximal-Auszahlung beider Spieler steht im Vordergrund und ist Ursache für die Entstehung der Bezeichnung Min-Max-Theorem. Alternativ wird das Min-Max-Theorem in der einschlägigen Literatur als Maximinlösung bezeichnet.[2] Die Grundlage für die duale Begriffsfindung bildet die Tatsache, dass in Nullsummenspielen die Minimierung der gegnerischen Maximal-Auszahlung (Minimax) sowohl der Minimierung des eigenen Maximal-Verlustes als auch der Maximierung des eigenen Minimum-Auszahlung (Maximin) entsprechen.[3]

Inhaltsverzeichnis

Spieltheoretische Formulierung

Der Hauptsatz für 2-Personen-Nullsummenspiele beinhaltet:

In der gemischten Erweiterung (X, Y, G') eines jeden 2-Personen-Nullsummenspiels mit endlichen (reinen) Strategieräumen A und B existiert eine Konstante V und für jeden Spieler mindestens eine (gemischte) Gleichgewichtsstrategie x* bzw. y*, mit der er eine erwartete Auszahlung von mindestens V garantieren kann.

Für Spieler A existiert ein x^* = \lbrace x^*_1, ... x^*_\text{i}, ... x^*_\text{m}\rbrace mit x^*_\text{i}\ge 0 und \sum_{i = 1}^m x^*_\text{i}= 1, so dass \underset{x}{max} \underset{y}{min} G^'\bigl(x,y\bigr)\ = \underset{y}{min} G^'\bigl(x^*,y\bigr) = V.

Für Spieler B existiert ein y^* = \lbrace y^*_1, ... y^*_\text{j}, ... y^*_\text{n}\rbrace mit y^*_\text{j}\ge 0 und \sum_{j = 1}^n y^*_\text{j}= 1, so dass \underset{y}{min} \underset{x}{max} G^'\bigl(x,y\bigr)\ = \underset{x}{max} G^'\bigl(x,y^*\bigr) = V.[4]

Einordnung

Im Folgenden sei angenommen, beide Spieler folgen dem Minimax-Kriterium, das heißt, sie wählen die gemischte Strategie, die für sie selbst die minimale erwartete Auszahlung maximiert (und folglich den maximalen erwarteten Verlust minimiert). Der Satz garantiert beiden Spielern in endlichen Zwei-Personen-Nullsummenspielen einen erwarteten Gewinn V, insofern sie diejenige gemischte Strategie wählen, die nach dem Minimax-Kriterium optimal ist. Dieses Paar von Maximin- und Minimax-Strategien führt dazu, dass keiner der Spieler durch einseitige Veränderung seiner Strategie die eigene Position verbessern kann.[5] Der Minimax-Algorithmus, der ebenfalls auf der Minimax-Strategie beruht, findet im Gegensatz zum Min-Max-Theorem im Bereich der sequenziellen Spiele Anwendung.

Der Satz wurde erstmals von John von Neumann 1928 in seiner Publikation „Zur Theorie der Gesellschaftsspiele“ bewiesen.[6]

Die entstandene Strategienkombination beider Spieler bildet einen Sattelpunkt, der einen Spezialfall des Nash-Gleichgewichts für Zweipersonen-Nullsummenspiele darstellt.[7] Für die Ermittlung dieser Gleichgewichtsstrategie in sehr komplexen Nullsummenspielen wird die Lineare Optimierung genutzt.

Folglich darf Spieler A, wenn er rational spielt, abhängig von der Strategiewahl von Spieler B, mindestens den Betrag V erwarten und Spieler B kann erreichen, wenn er rational spielt, dass Spieler A im Mittel auch nicht mehr als diesen Betrag gewinnt.[8]

Allgemeine Vorgehensweise

Ein 2-Personen-Nullsummenspiel in Matrixform kann folgendermaßen dargestellt werden:

Spieler B:
s1B s2B sn-1B snB
Spieler A:
s1A u1,1 u1,2 u1,n-1 u1,n
s2A u2,1 u2,2 u2,n-1 u2,n
 
sm-1A um-1,1 um-1,2 um-1,n-1 um-1,n
smA um,1 um,2 um,n-1 um,n

Spieler A ist der Zeilenspieler und Spieler B der Spaltenspieler. Das Spiel wird aus Sicht des Spieler A betrachtet, wobei im Strategienvektor s = (sA, sB) die Zeile durch sA und die Spalte sB = s A bezeichnet wird. In den Matrixzellen steht die Auszahlung uA (s) = - uB (s), so dass die Auszahlung des Spielers A gleich dem Verlust des Spielers B entspricht.

Spieler A wählt zuerst eine Strategie sA (Zeile), wobei ihm bewusst ist, dass der Gegner immer das Minimum der Auszahlungen in der Zeile wählen wird, die Spieler A vorgegeben hat. Dementsprechend gibt Spieler A diejenige Strategie sA (Zeile) vor, in der das Zeilenminimum maximal (Maximin-Strategie) ist, so dass die Optimierungsregel für Spieler A lautet:

\underset{s_A}{max}[\underset{s_B}{min}\;u_A(s_A,s_B)]

Diese garantiert ihm ein Auszahlungsminimum, gleichgültig was Spieler B unternimmt. Spieler B versucht seine Verluste zu minimieren und wählt eine Strategie sB (Spalte), die genau die umgekehrte Bedingung erfüllt (Minimax-Regel, Minimax-Strategie), so dass die Optimierungsvorschrift für Spieler B lautet:

\underset{s_B}{min}[\underset{s_A}{max}\;u_A(s_A,s_B)]

Folglich kann er durch seine Minimax-Strategie die Auszahlung des Spielers A auf höchstens gleich diesem Betrag begrenzen, gleichgültig was Spieler A unternimmt.Es gilt dementsprechend:

\underset{s_A}{max}[\underset{s_B}{min}\;u_A(s_A,s_B)] \le \underset{s_B}{min}[\underset{s_A}{max}\;u_A(s_A,s_B)][9]

Der Hauptsatz für 2-Personen-Nullsummenspiele beinhaltet, dass diese beiden optimalen Strategien einen gemeinsamen Wert v besitzen, so dass notwendige und hinreichende Bedingung für den Wert v (Gleichgewicht, Sattelpunkt) lautet:

\underset{s_A}{max}[\underset{s_B}{min}\;u_A(s_A,s_B)]\;=\;\underset{s_B}{min}[\underset{s_A}{max}\;u_A(s_A,s_B)].[10]

Spieler A darf folglich, wenn er intelligent spielt, eine Minimalauszahlung erwarten und Spieler B kann bewirken, wenn er intelligent spielt, dass Spieler A nicht mehr als die Minimalauszahlung gewinnt.[11]

Beispiel

In einem Tennisspiel soll im Folgenden das Min-Max-Theorem verdeutlicht werden. In den Matrixzellen wurden die Auszahlungen durch die entsprechenden Erfolgsquoten der beiden Spieler für jede ihrer reinen Strategien ersetzt. Spieler A schlägt zuerst auf.

Spielerin B:
Vorhand Rückhand
Spieler A: Vorhand 50 80
Rückhand 90 20

Da die Interessen der beiden Spieler genau entgegengesetzt sind, wird Spielerin B versuchen, den Ball erfolgreich zu retournieren und die maximale Erfolgsquote ihres Gegners zu minimieren (Minimax-Strategie). Mit diesem Vorwissen wird Spieler A versuchen, seine eigene Minimum-Erfolgsquote zu maximieren (Maximin-Strategie).
In diesem Beispiel beträgt die Minimum-Erfolgsquote von Spieler A für jede seiner reinen Strategien in der Zeile Vorhand 50 und Rückhand 20. Das Maximum dieser Minima (Maximin) beträgt folglich 50 und garantiert ihm den größtmöglichen Erfolg, wenn er zu 100% auf die Vorhand spielt, insofern Spielerin B in ihren eigenen Interessen so gut wie möglich retourniert. Spieler A würde die Strategie Vorhand wählen.
Die Maximum-Erfolgsquote von Spielerin B für jede ihrer Strategien beträgt in Spalte Vorhand 90 und Rückhand 80. Das Minimum dieser Maxima (Minimax) beträgt 80 und garantiert ihr den größtmöglichen Erfolg, insofern Spieler A in seinen eigenen Interessen so gut wie möglich retourniert. Spielerin B würde die Rückhand wählen.

Spielerin B:
Vorhand Rückhand Zeilenminimun
Spieler A: Vorhand 50 80 50 (Maximin)
Rückhand 90 20 20
Spaltenmaximun 90 80 (Minimax)

Die Minmax- und Maxmin-Werte der beiden Tennisspieler sind unterschiedlich: Maximin Spieler A (50%) < Minimax Spielerin B (80%).

Dementsprechend besitzt dieses Spiel kein Gleichgewicht (Sattelpunkt) in reinen Strategien, denn jeder der beiden Spieler kann seine Position durch Mischen der reinen Strategien Vorhand und Rückhand verbessern und die Erfolgsquote des Gegners schwächen, da die richtige Position nicht mehr vorhersagbar ist.

Die Strategiensets, die sich für die beiden Spieler aus dem Mix ihrer reinen Strategien ergeben, werden zunächst aus der Perspektive von Spieler A betrachtet. Er spielt Vorhand mit der Wahrscheinlichkeit p und Rückhand folglich mit der Wahrscheinlichkeit (1 - p). Der p-Mix gibt, für jede der reinen Strategien von Spielerin B, den zu erwartenden Erfolg des Spielers A für seine gemischte Strategie an.

Spielerin B:
Vorhand Rückhand Zeilenminimun
Spieler A: Vorhand 50 80 50
Rückhand 90 20 20
p-Mix 50p + 90 (1 - p) 80p + 20 (1 - p) min = ?

Wenn Spielerin B Vorhand spielt, entspricht die Erfolgsquote des Spielers A 50p + 90(1-p) und bei Rückhand 80p + 20(1-p). Die Wahrscheinlichkeit p beträgt:

50p + 90 (1 - p) = 80p + 20 (1 - p)
70 (1 - p) = 30p
70 = 100p
p = 0,7 → erwartete Erfolgsquote: 50*0,7 + 90 (1 - 0,7) = 62

Nun werden die Strategiensets aus der Perspektive von Spielerin B betrachtet. Sie spielt Vorhand mit der Wahrscheinlichkeit q und Rückhand folglich mit der Wahrscheinlichkeit (1 - q). Der q-Mix gibt, für jede der reinen Strategien von Spieler A, den zu erwartenden Erfolg der Spielerin B für ihre gemischte Strategie an.

Spielerin B:
Vorhand Rückhand q-Mix
Spieler A: Vorhand 50 80 50q + 80 (1 - q)
Rückhand 90 20 90q + 20 (1 - q)
Spaltenmaximum 90 80 min = ?

Wenn Spieler A Vorhand spielt, entspricht die Erfolgsquote der Spielerin B 50q + 80(1 - q) und bei Rückhand 90q + 20(1 - q). Die Wahrscheinlichkeit q beträgt:

50q + 80 (1 - q) = 90q + 20 (1 - q)
60 (1 - q) = 40q
60 = 100q
q = 0,6 → erwartete Erfolgsquote: 50*0,6 + 80 (1 - 0,6) = 62

Spieler A konnte folglich durch das Mischen von reinen Strategien seine Maximin von 50% auf 62 % anheben. Spielerin B konnte durch das Nutzen ihrer gemischten Strategie ihr Minimax von 80% auf 62% senken. Wenn beide Spieler ihre optimale gemischte Strategie gegeneinander spielen, so entspricht der Maximin des Spielers A, dem Minimax der Spielerin B und keiner kann sich gegenüber dem anderen besser stellen.[12]

Kritik

Gegenwärtig wird dem Min-Max-Theorem eine eher geringe Bedeutung beigemessen, da sich dieses Lösungskonzept ausschließlich für Zweipersonen-Nullsummenspielen eignet. Desgleichen ist die im Min-Max-Theorem getroffene Annahme beider Spieler, der Gegner wähle immer nur die für sich beste Strategie aus, wenig überzeugend. Das Lösungskonzept ist nur unter der Annahme zweckmäßig, dass der gegnerische Spieler die Maximierung seiner Auszahlung anstrebt und keinen Fehler begeht, das heißt optimal und rational handelt.[13]

Literatur

  • Avinash K. Dixit, Susan E. Skeath: Games of Strategy, New York [u.a.], Norton Verlag, 1999, ISBN 0-393-97421-9.
  • Avinash K. Dixit, Barry J. Nalebuff: Spieltheorie für Einsteiger: Strategisches Know-how für Gewinner, Stuttgart, Schäffer Poeschel Verlag, 1999, ISBN 978-3-7910-1239-1.
  • Christian Rieck: Spieltheorie: Eine Einführung, Christian Rieck Verlag, Eschborn, 2006, ISBN 3-924043-91-4.
  • Hans Bühlmann, Hans Loeffel, Erwin Nievergelt: Entscheidungs- und Spieltheorie, Springer Verlag, Berlin , 1975, ISBN 3-540-07462-7.
  • Frederick S. Hillier, Gerald J. Liebermann: Operations Research, Verlag Oldenbourg, München [u.a.], 1996, ISBN 978-3-486-23987-4.
  • John von Neumann: Zur Theorie der Gesellschaftsspiele, Mathematische Annalen Nr. 100, 1928, S. 295-320.
  • John von Neumann, Oskar Morgenstern: Theory of Games and Economic Behavior, Verlag Princeton Paperback, Princeton, 1990, ISBN 0-691-00362-9.
  • Manfred J. Holler, Gerhard Illing: Einführung in die Spieltheorie, Berlin [u.a.], Springer Verlag, 2006, ISBN 978-3-540-27880-1.
  • Melvin Dresher: Strategische Spiele, Theorie und Praxis, Verlag Industrielle Organisation, Zürich, 1961.

Belege

  1. Hans Bühlmann, Hans Loeffel, Erwin Nievergelt: Entscheidungs- und Spieltheorie, Springer Verlag, Berlin , 1975, S. 182.
  2. Manfred J. Holler, Gerhard Illing: Einführung in die Spieltheorie, Berlin [u.a.], Springer Verlag, 2006, S. 55.
  3. Thomas Riechmann: Spieltheorie, München, Vahlen Verlag, 2008, S. 87.
  4. Hans Bühlmann, Hans Loeffel, Erwin Nievergelt: Entscheidungs- und Spieltheorie, Springer Verlag, Berlin , 1975, S. 183.
  5. Frederick S. Hillier, Gerald J. Liebermann: Operations Research, Verlag Oldenbourg, 1996, S. 360.
  6. John von Neumann: Zur Theorie der Gesellschaftsspiele, Mathematische Annalen Nr. 100, 1928, S. 295-320 (Digi-Zeitschriften).
  7. Christian Rieck: Spieltheorie: Eine Einführung, Christian Rieck Verlag, Eschborn, 2006, S. 291.
  8. Melvin Dresher: Strategische Spiele, Theorie und Praxis, Verlag Industrielle Organisation, Zürich, 1961, S. 15.
  9. Melvin Dresher: Strategische Spiele, Theorie und Praxis, Verlag Industrielle Organisation, Zürich, 1961, S. 14-15.
  10. Christian Rieck: Spieltheorie: Eine Einführung, Christian Rieck Verlag, Eschborn, 2006, S. 291.
  11. Melvin Dresher: Strategische Spiele, Theorie und Praxis, Verlag Industrielle Organisation, Zürich, 1961, S. 15.
  12. Avinash K. Dixit, Susan E. Skeath: Games of Strategy, Norton Verlag, New York [u.a.], 1999, S. 194-198.
  13. Christian Rieck: Spieltheorie: Eine Einführung, Christian Rieck Verlag, Eschborn, 2006, S. 292.

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Min-max theorem — Variational theorem redirects here. The term is also sometimes applied to the variational principle. In linear algebra and functional analysis, the min max theorem, or variational theorem, or Courant–Fischer–Weyl min max principle, is a result… …   Wikipedia

  • Max-flow min-cut theorem — In optimization theory, the max flow min cut theorem states that in a flow network, the maximum amount of flow passing from the source to the sink is equal to the minimum capacity which when removed in a specific way from the network causes the… …   Wikipedia

  • Max-Flow-Min-Cut-Theorem — Das Max Flow Min Cut Theorem ist ein Satz der Graphentheorie über den maximalen Fluss in Flussnetzwerken. Er leitet sich aus Mengers Theorem ab. Er besagt: Der maximale Fluss im Netzwerk hat genau den Wert dessen minimalen Schnitts. Anders gesagt …   Deutsch Wikipedia

  • min|i|max — «MIHN ee maks», noun, adjective, verb. –n. 1. that strategy in the theory of games which provides the minimum of a player s maximum possible losses (contrasted with maximin). 2. = minimax theorem. (Cf. ↑minimax theorem) –adj. of or having to do… …   Useful english dictionary

  • Mini-Max — Minimax bzw. Mini Max bezeichnet: Min Max Theorem, ein Spezialfall des Existenzsatzes für Nash Gleichgewichte für Zwei Personen Nullsummenspiele Minimax Algorithmus, ein Algorithmus zur Berechnung solcher Gleichgewichte für Spiele mit perfekter… …   Deutsch Wikipedia

  • Mini Max — Minimax bzw. Mini Max bezeichnet: Min Max Theorem, ein Spezialfall des Existenzsatzes für Nash Gleichgewichte für Zwei Personen Nullsummenspiele Minimax Algorithmus, ein Algorithmus zur Berechnung solcher Gleichgewichte für Spiele mit perfekter… …   Deutsch Wikipedia

  • Max Karl Ernst Ludwig Planck — Max Planck Max Karl Ernst Ludwig Planck (* 23. April 1858 in Kiel; † 4. Oktober 1947 in Göttingen) war ein bedeutender deutscher Physiker und Nobelpreisträger. Er wird als Begründer der Quantenphysik betrachtet …   Deutsch Wikipedia

  • Menger's theorem — In the mathematical discipline of graph theory and related areas, Menger s theorem is a basic result about connectivity in finite undirected graphs. It was proved for edge connectivity and vertex connectivity by Karl Menger in 1927. The edge… …   Wikipedia

  • König's theorem (graph theory) — In the mathematical area of graph theory, König s theorem describes an equivalence between the maximum matching problem and the minimum vertex cover problem in bipartite graphs. Setting A graph is bipartite if its vertices can be partitioned into …   Wikipedia

  • Perron–Frobenius theorem — In linear algebra, the Perron–Frobenius theorem, proved by Oskar Perron (1907) and Georg Frobenius (1912), asserts that a real square matrix with positive entries has a unique largest real eigenvalue and that the corresponding… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”