Zufallsvariable

Zufallsvariable

Eine Zufallsvariable oder Zufallsgröße (selten stochastische Variable oder stochastische Größe) ist ein Begriff aus dem mathematischen Teilgebiet Stochastik. Der Begriff formalisiert die Vorstellung, dass eine Variable einen zufälligen Wert hat beziehungsweise dass der Wert einer Funktion vom Zufall abhängig ist. Man bezeichnet als Zufallsgröße eine Funktion,[1] die den Ergebnissen eines Zufallsexperiments Werte (so genannte Realisationen) zuordnet.

Zum Beispiel kann das Zufallsexperiment des Münzwurfs als Zufallsvariable X modelliert werden. X bildet die Menge der Wurfergebnisse {Kopf,Zahl} auf die Menge der Realisationen {0,1} ab:

X(\omega) = \begin{cases}
0, & \text{wenn }\omega = \text{Kopf},\\
1, & \text{wenn }\omega = \text{Zahl}.
\end{cases}

Die Bedeutung der Zufallsvariable liegt darin, dass durch sie die Verbindung zwischen dem Resultat eines Zufallsexperiments und seiner mathematischen Darstellung (Realisation) hergestellt wird. Auch lassen sich Funktionen von Realisationen des Experiments durch Zufallsvariable beschreiben.

Betrachtet man das zweimalige Werfen einer Münze und bezeichnet das Ergebnis mit \omega=\left(\omega_1,\omega_2\right), so lassen sich beispielsweise folgende Zufallsvariable untersuchen:

  1. X_1(\omega) := X(\omega_1) \in\{0,1\} als Ergebnis des ersten Wurfes,
  2. X_2(\omega) := X(\omega_2) \in\{0,1\} als Ergebnis des zweiten Wurfes,
  3. S(\omega) := X(\omega_1) + X(\omega_2) \in\{0,1,2\} als Summe der zwei Ergebnisse.

Zufallsvariable selbst werden üblicherweise mit einem Großbuchstaben bezeichnet (hier X1,X2,S), während man für die Realisationen die entsprechenden Kleinbuchstaben verwendet (so beispielsweise für \omega=\left(\text{Zahl},\text{Kopf}\right) die Realisationen x1 = 1, x2 = 0, s = 1).

Während früher der von A. N. Kolmogorow eingeführte Begriff Zufallsgröße (manchmal auch Zufallsveränderliche) der übliche deutsche Begriff war, hat sich heute (ausgehend vom englischen random variable) der etwas irreführende Begriff Zufallsvariable durchgesetzt. Zufallsvariable sind jedoch Funktionen und dürfen nicht mit den Variablen verwechselt werden, die üblicherweise in der Mathematik eingesetzt werden.[2]

Inhaltsverzeichnis

Definition

Als Zufallsvariable bezeichnet man eine messbare Funktion von einem Wahrscheinlichkeitsraum in einen Messraum.

Eine formale mathematische Definition lässt sich wie folgt geben:[3]

Es seien (Ω,Σ,P) ein Wahrscheinlichkeitsraum und (Ω',Σ') ein Messraum. Eine (Σ,Σ')-messbare Funktion X:\Omega\to\Omega' heißt dann eine Ω'-Zufallsvariable auf Ω.
Summe von zwei Würfeln: (\Omega,\Sigma,P) \xrightarrow{S} (\Omega',\Sigma', P^S).

Das Experiment, mit einem fairen Würfel zweimal zu würfeln, lässt sich mit folgendem Wahrscheinlichkeitsraum (Ω,Σ,P) modellieren:

  • Ω ist die Menge der 36 möglichen Ergebnisse \Omega=\{(1,1), (1,2), \dots, (6,5), (6,6)\}
  • Σ ist die Potenzmenge von Ω
  • Will man zwei unabhängige Würfe mit einem fairen Würfel modellieren, so setzt man alle 36 Ergebnisse gleich wahrscheinlich, wählt also das Maß P als P\left(\{(n_1,n_2)\}\right) = \frac {1}{36} für n_1, n_2 \in \{1,2,3,4,5,6\}.

Die Zufallsvariablen X1, X2 und S werden als folgende Funktionen definiert:

  1. X_1: \Omega \to \R;\quad\left(n_1,n_2\right) \mapsto n_1,
  2. X_2: \Omega \to \R;\quad\left(n_1,n_2\right) \mapsto n_2, und
  3. S: \Omega \to \R;\quad\left(n_1,n_2\right) \mapsto n_1+n_2,

wobei für Σ' die borelsche σ-Algebra auf den reellen Zahlen gewählt wird.

In der Regel wird auf die konkrete Angabe der zugehörigen Räume verzichtet; es wird angenommen, dass aus dem Kontext klar ist, welcher Wahrscheinlichkeitsraum auf Ω und welcher Messraum auf Ω' gemeint ist.

Bei einer endlichen Ergebnismenge Ω wird Σ meistens als die Potenzmenge von Ω gewählt. Die Forderung, dass die verwendete Funktion messbar ist, ist dann immer erfüllt. Messbarkeit wird erst wirklich bedeutsam, wenn die Ergebnismenge Ω überabzählbar viele Elemente enthält.

Einige Klassen von Zufallsvariablen mit bestimmten Wahrscheinlichkeits- und Messräumen werden besonders häufig verwendet. Diese werden teilweise mit Hilfe alternativer Definitionen eingeführt, die keine Kenntnisse der Maßtheorie voraussetzen:

Reelle Zufallsvariable

Bei reellen Zufallsvariablen ist der Bildraum die Menge \R der reellen Zahlen versehen mit der borelschen σ-Algebra. Die allgemeine Definition von Zufallsvariablen lässt sich in diesem Fall zur folgenden Definition vereinfachen:

Eine reelle Zufallsvariable ist eine Funktion X\colon\Omega\to\R, die jedem Ergebnis ω einer Ergebnismenge Ω eine reelle Zahl X(ω) zuordnet und die folgende Messbarkeitsbedingung erfüllt:
\forall x \in \R:\ \lbrace \omega \mid X(\omega) \leq x \rbrace \in \Sigma

Das bedeutet, dass die Menge aller Ergebnisse, deren Realisation unterhalb eines bestimmen Wertes liegt, ein Ereignis bilden muss.

Im Beispiel des zweimaligen Würfelns sind X1, X2 und S jeweils reelle Zufallsvariable.

Mehrdimensionale Zufallsvariable

Eine mehrdimensionale Zufallsvariable ist eine messbare Abbildung X:\Omega\to\R^n für eine Dimension n\in\Bbb N. Sie wird auch als Zufallsvektor bezeichnet. Damit ist X=(X_1,\dots,X_n) gleichzeitig ein Vektor von einzelnen reellen Zufallsvariablen X_i:\Omega\to\R, die alle auf dem gleichen Wahrscheinlichkeitsraum definiert sind. Die Verteilung von X wird als multivariat bezeichnet, die Verteilungen der Komponenten Xi nennt man auch Randverteilungen. Die mehrdimensionalen Entsprechungen von Erwartungswert und Varianz sind der Erwartungswertvektor und die Kovarianzmatrix.

Im Beispiel des zweimaligen Würfelns ist X = (X1,X2) eine zweidimensionale Zufallsvariable.

Komplexe Zufallsvariable

Bei komplexen Zufallsvariablen ist der Bildraum die Menge \Bbb C der komplexen Zahlen versehen mit der durch die kanonische Vektorraumisomorphie zwischen \Bbb C und \R^2 „geerbten“ borelschen σ-Algebra. X ist genau dann eine Zufallsvariable, wenn Realteil \operatorname{Re}(X) und Imaginärteil \operatorname{Im}(X) jeweils reelle Zufallsvariable sind.

Die Verteilung von Zufallsvariablen, Existenz

Eng verknüpft mit dem eher technischen Begriff einer Zufallsvariablen ist der Begriff der auf dem Bildraum von X\; induzierten Wahrscheinlichkeitsverteilung. Mitunter werden beide Begriffe auch synonym verwendet. Formal wird die Verteilung \;P^X einer Zufallsvariablen X\; als das Bildmaß des Wahrscheinlichkeitsmaßes P\; definiert, also

\;P^X (A) = P \left(X^{-1}(A)\right) für alle  A \in \Sigma'.

Statt \;P^X werden in der Literatur für die Verteilung von X\; auch die Schreibweisen P_X, X(P)\; oder P \circ X^{-1} verwendet.

Spricht man also beispielsweise von einer normalverteilten Zufallsvariablen, so ist damit eine Zufallsvariable mit Werten in den reellen Zahlen gemeint, deren Verteilung einer Normalverteilung entspricht.

Häufig wird von einer Zufallsvariablen lediglich die Verteilungsfunktion angegeben und der zu Grunde liegende Wahrscheinlichkeitsraum weggelassen. Für die mathematische Untersuchung ist der modellierte Vorgang der realen Welt uninteressant; es wird lediglich die von dieser Zufallsvariablen induzierte Verteilung mathematisch untersucht. Dies ist vom Standpunkt der Mathematik erlaubt, sofern es tatsächlich einen Wahrscheinlichkeitsraum gibt, der eine Zufallsvariable mit der gegebenen Verteilung erzeugen kann. Ein solcher Wahrscheinlichkeitsraum (Ω,Σ,P) lässt sich aber zu einer konkreten Verteilung leicht angeben, indem beispielsweise \Omega=\R, Σ als die Borelsche σ-Algebra auf den reellen Zahlen und P als das durch die Verteilungsfunktion induzierte Lebesgue-Stieltjes-Maß gewählt wird.[4]

Die Frage nach der konkreten Gestalt des Wahrscheinlichkeitsraumes tritt also in den Hintergrund, es ist jedoch von Interesse, ob zu einer Schar von Zufallsvariablen mit vorgegebenen gemeinsamen Verteilungen ein Wahrscheinlichkeitsraum existiert, auf dem sie sich gemeinsam definieren lassen. Diese Frage wird für unabhängige Zufallsvariablen durch einen Existenzsatz von É. Borel gelöst, der besagt, dass man im Prinzip auf den von Einheitsintervall und Lebesgue-Maß gebildeten Wahrscheinlichkeitsraum zurückgreifen kann. Ein möglicher Beweis nutzt, dass sich die binären Nachkommastellen der reellen Zahlen in [0,1] als ineinander verschachtelte Bernoulli-Folgen betrachten lassen (ähnlich Hilberts Hotel).[5]

Mathematische Attribute für Zufallsvariable

Verschiedene mathematische Attribute, die in der Regel denen für allgemeine Funktionen entlehnt sind, finden bei Zufallsvariablen Anwendung. Die häufigsten werden in der folgenden Zusammenstellung kurz erklärt:

diskret

Eine Zufallsvariable wird als diskret bezeichnet, wenn sie nur endlich viele oder abzählbar unendlich viele Werte annimmt. Im obigen Beispiel des zweimaligen Würfelns sind alle drei Zufallsvariable X1, X2 und S diskret.

konstant

Eine Zufallsvariable wird als konstant bezeichnet, wenn sie nur einen Wert annimmt: X(ω) = c für alle ω. Sie ist ein Spezialfall der diskreten Zufallsvariable.

unabhängig

Zwei Zufallsvariablen X,Y heißen unabhängig, wenn die von ihnen erzeugten Ereignisräume stochastisch unabhängig sind. Das sind sie, wenn für je zwei Intervalle [a1,b1] und [a2,b2] die Ereignisse E_X := \{ \omega | X(\omega) \in [a_1,b_1] \} und E_Y := \{ \omega | Y(\omega) \in [a_2,b_2] \} stochastisch unabhängig sind. Das sind sie, wenn gilt: P(E_X \cap E_Y ) = P(E_X) P(E_Y).

In obigem Beispiel sind X1 und X2 unabhängig voneinander; die Zufallsvariablen X1 und S hingegen nicht.

Unabhängigkeit mehrerer Zufallsvariablen X_1, X_2, \dots, X_n bedeutet, dass das Wahrscheinlichkeitsmaß PX des Zufallsvektors X=\left(X_1, X_2, \dots, X_n\right) dem Produktmaß der Wahrscheinlichkeitsmaße der Komponenten, also dem Produktmaß von P_{X_1}, P_{X_2}, \dots, P_{X_n} entspricht.[6] So lässt sich beispielsweise dreimaliges unabhängiges Würfeln durch den Wahrscheinlichkeitsraum (Ω,Σ,P) mit

Ω = {1,2,3,4,5,6}3,
Σ der Potenzmenge von Ω und
P\left(\left(n_1, n_2, n_3\right)\right)=\frac{1}{6^3}=\frac{1}{216}

modellieren; die Zufallsvariable "Ergebnis des k-ten Wurfes" ist dann

X_k\left(n_1, n_2, n_3\right)=n_k für k\in\{1,2,3\}.

Die Konstruktion eines entsprechenden Wahrscheinlichkeitsraums für eine beliebige Familie unabhängiger Zufallsvariable mit gegebenen Verteilungen ist ebenfalls möglich. [7]

identisch verteilt

Zwei oder mehr Zufallsvariable heißen identisch verteilt (bzw. i.d. für identically distributed), wenn ihre Verteilungen gleich sind. In Beispiel des zweimaligen Würfelns sind X1, X2 identisch verteilt; die Zufallsvariablen X1 und S hingegen nicht.

unabhängig und identisch verteilt

Häufig werden Folgen von Zufallsvariablen untersucht, die sowohl unabhängig als auch identisch verteilt sind; dieser Fall wird üblicherweise mit u.i.v. bzw. i.i.d. (für independent and identically distributed) bezeichnet.

In obigem Beispiel des dreimaligen Würfelns sind X1, X2 und X3 i.i.d. verteilt. S1,2 = X1 + X2 (die Summe der ersten beiden Würfe) und S2,3 = X2 + X3 (die Summe des zweiten und dritten Wurfs) sind zwar identisch verteilt, aber nicht unabhängig. S1,2 und X3 sind unabhängig, aber nicht identisch verteilt.

Mathematische Attribute für reelle Zufallsvariable

Kenngrößen

Zur Charakterisierung von Zufallsvariablen dienen einige wenige Funktionen, die wesentliche mathematische Eigenschaften der jeweiligen Zufallsvariable beschreiben. Die wichtigste dieser Funktionen ist die Verteilungsfunktion, die Auskunft darüber gibt, mit welcher Wahrscheinlichkeit die Zufallsvariable einen Wert bis zu einer vorgegebenen Schranke annimmt, beispielsweise die Wahrscheinlichkeit, höchstens eine Vier zu würfeln. Bei stetigen Zufallsvariablen wird diese durch die Wahrscheinlichkeitsdichte ergänzt, mit der die Wahrscheinlichkeit berechnet werden kann, dass die Werte einer Zufallsvariablen innerhalb eines bestimmten Intervalls liegen. Des Weiteren sind Kennzahlen wie der Erwartungswert, die Varianz oder höhere mathematische Momente von Interesse.

stetig oder kontinuierlich

Das Attribut stetig wird für unterschiedliche Eigenschaften verwendet.

  • Eine reelle Zufallsvariable wird als stetig (oder auch absolut stetig) bezeichnet, wenn sie eine Dichte besitzt (ihre Verteilung absolutstetig bezüglich des Lebesgue-Maßes ist).[8]
  • Eine reelle Zufallsvariable wird als stetig bezeichnet, wenn sie eine stetige Verteilungsfunktion besitzt.[9] Insbesondere bedeutet das, dass P({X = x}) = 0 für alle x\in\R gilt.

Messbarkeit, Verteilungsfunktion und Erwartungswert

Wenn eine reelle Zufallsvariable X auf dem Ergebnisraum Ω und eine messbare Funktion g: \R \to \R gegeben ist, dann ist auch Y = g(X) eine Zufallsvariable auf demselben Ergebnisraum, da die Verknüpfung messbarer Funktionen wieder messbar ist. g(X) wird auch als Transformation der Zufallsvariablen X unter g bezeichnet. Die gleiche Methode, mit der man von einem Wahrscheinlichkeitsraum (Ω,Σ,P) nach (\R, \mathcal{B}(\R),P^X) gelangt, kann benutzt werden, um die Verteilung von Y zu erhalten.

Die Verteilungsfunktion von Y lautet

F_Y(y) = \operatorname{P}(g(X) \leq y).

Der Erwartungswert einer quasi-integrierbaren Zufallsgröße X von (Ω,Σ,P) nach (\bar{\R}, \mathcal{B}(\bar{\R})) berechnet sich folgend:

\operatorname{E}(X) = \int_\Omega X(\omega)\mathrm{d}P(\omega)\,.

integrierbar und quasi-integrierbar

Eine Zufallsvariable heißt integrierbar, wenn der Erwartungswert der Zufallvariable existiert und endlich ist. Die Zufallsvariable heißt quasi-integrierbar, wenn der Erwartungswert existiert, möglicherweise aber unendlich ist. Jede integrierbare Zufallsvariable ist folglich auch quasi-integrierbar.

Beispiel

Es sei X eine reelle stetig verteilte Zufallsvariable und Y = X2.

Dann ist

F_Y(y) = \operatorname{P}(X^2 \leq y).

Fallunterscheidung nach y:

y < 0:


  \begin{alignat}{2}
    &            & \operatorname P(X^2 \leq y) &= 0\\
    &\Rightarrow & F_Y(y)                      &= 0
  \end{alignat}

y\geq 0:


  \begin{alignat}{2}
    &            & \operatorname P(X^2\leq y) &=\operatorname P(|X|\leq\sqrt y)\\
    &            &                        &= \operatorname P(-\sqrt y\leq X\leq\sqrt y)\\
    &\Rightarrow & F_Y(y)                 &= F_X(\sqrt y) - F_X(-\sqrt y)
  \end{alignat}

Standardisiertheit

Eine Zufallsvariable nennt man standardisiert, wenn ihr Erwartungswert 0 und ihre Varianz 1 ist. Die Transformation einer Zufallsvariable Y in eine standardisierte Zufallsvariable

X=\frac{Y-\operatorname{E}(Y)}{\sqrt{\operatorname{Var}(Y)}}

bezeichnet man als Standardisierung der Zufallsvariable Y.

Sonstiges

  • Zeitlich zusammenhängende Zufallsvariablen können auch als stochastischer Prozess aufgefasst werden
  • Eine Folge von Realisationen einer Zufallsvariable nennt man auch Zufallssequenz

Belege

  1. Die nötigen Voraussetzungen werden im Absatz Definition angegeben.
  2. Jeff Miller: Earliest Known Uses of Some of the Words of Mathematics, Abschnitt R.
  3. Karl Hinderer: Grundbegriffe der Wahrscheinlichkeitstheorie. Springer, Berlin 1980. ISBN 3-540-07309-4 (nicht überprüft)
  4. Robert B. Ash: Real Analysis and Probability. Academic Press, New York 1972. ISBN 0-12-065201-3 (Definition 5.6.2)
  5. Olav Kallenberg: Foundations of Modern Probability, 2. Ausgabe. Springer, New York 2002, ISBN 0-387-95313-2, S. 55.
  6. Robert B. Ash: Real Analysis and Probability. Academic Press, New York 1972. ISBN 0-12-065201-3 (Definition 5.8.1)
  7. Schmidt, Klaus D.: Maß und Wahrscheinlichkeit, Springer-Verlag Berlin Heidelberg 2009, ISBN 978-3-540-89729-3 (Kapitel 11.4)
  8. Marek Fisz: Wahrscheinlichkeitsrechnung und mathematische Statistik. VEB Deutscher Verlag der Wissenschaften, Berlin 1989 (11.Aufl., Definition 2.3.3)
  9. Robert B. Ash: Real Analysis and Probability. Academic Press, New York 1972, S.210. ISBN 0-12-065201-3

Literatur

  • Karl Hinderer: Grundbegriffe der Wahrscheinlichkeitstheorie. Springer, Berlin/Heidelberg/New York 1980, ISBN 3-540-07309-4
  • Erich Härtter: Wahrscheinlichkeitsrechnung für Wirtschafts- und Naturwissenschaftler. Vandenhoeck & Ruprecht, Göttingen 1974, ISBN 3-525-03114-9

Weblinks

Wikibooks Wikibooks: Zufallsvariablen – Lern- und Lehrmaterialien
Wikibooks Wikibooks: Funktionen von Zufallsvariablen – Lern- und Lehrmaterialien

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Zufallsvariable — Zu|falls|va|ri|a|b|le, die (Math.): variable Größe, deren Werte vom Zufall abhängig sind. * * * Zufallsvariable,   Zufallsgröße, Stochastik: eine Funktion auf der Ergebnismenge Ω eines Wahrscheinlichkeitsraums (Ω,, P ; Wahrscheinlichkeitstheorie) …   Universal-Lexikon

  • Zufallsvariable — atsitiktinis kintamasis statusas T sritis automatika atitikmenys: angl. random variable vok. Zufallsvariable, f rus. случайная переменная, f pranc. variable aléatoire, f …   Automatikos terminų žodynas

  • Zufallsvariable — in der Statistik eine Größe, die ihre Werte (Realisationen) mit bestimmten ⇡ Wahrscheinlichkeiten annimmt bzw. deren Werten bestimmte ⇡ Wahrscheinlichkeitsdichten zugeordnet sind. Aus einem ⇡ Zufallsvorgang entsteht eine Z. dadurch, dass jedem… …   Lexikon der Economics

  • Diskrete Zufallsvariable — Eine Zufallsvariable oder Zufallsgröße (selten stochastische Variable oder stochastische Größe) ist ein Begriff aus dem mathematischen Teilgebiet Stochastik. Man bezeichnet damit eine Funktion[1], die den Ergebnissen eines Zufallsexperiments… …   Deutsch Wikipedia

  • Stetige Zufallsvariable — Eine Zufallsvariable oder Zufallsgröße (selten stochastische Variable oder stochastische Größe) ist ein Begriff aus dem mathematischen Teilgebiet Stochastik. Man bezeichnet damit eine Funktion[1], die den Ergebnissen eines Zufallsexperiments… …   Deutsch Wikipedia

  • Varianz einer Zufallsvariable — Dichten zweier normalverteilter Zufallsvariablen mit gleichem Erwartungswert aber unterschiedlichen Varianzen. Die orange Kurve hat eine geringere Varianz (entsprechend der Breite) als die grüne. Die Wurzel der Varianz, die Standardabweichung …   Deutsch Wikipedia

  • mehrdimensionale Zufallsvariable — ⇡ Zufallsvektor …   Lexikon der Economics

  • Prüfvariable — ⇡ Zufallsvariable, mit deren konkreter ⇡ Ausprägung bei ⇡ statistischen Testverfahren überprüft wird, ob ein Stichprobenbefund mit der zu prüfenden ⇡ Nullhypothese verträglich ist oder nicht. Dabei ist die ⇡ Nullverteilung der P., also (bei ⇡… …   Lexikon der Economics

  • IID — Eine Zufallsvariable oder Zufallsgröße (selten stochastische Variable oder stochastische Größe) ist ein Begriff aus dem mathematischen Teilgebiet Stochastik. Man bezeichnet damit eine Funktion[1], die den Ergebnissen eines Zufallsexperiments… …   Deutsch Wikipedia

  • Stochastische Größe — Eine Zufallsvariable oder Zufallsgröße (selten stochastische Variable oder stochastische Größe) ist ein Begriff aus dem mathematischen Teilgebiet Stochastik. Man bezeichnet damit eine Funktion[1], die den Ergebnissen eines Zufallsexperiments… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”