Randverteilung

Randverteilung

Als Randverteilungen oder Marginalverteilung werden in der Stochastik die Wahrscheinlichkeitsverteilungen von Teilfamilien einer gegebenen Familie von Zufallsvariablen bezeichnet. Die Verteilung der gesamten Familie wird zur Verdeutlichung auch gemeinsame Verteilung der Zufallsvariablen genannt. Sind beispielsweise X und Y Zufallsvariable (auf dem gleichen Wahrscheinlichkeitsraum), dann heißen die Verteilungen der einzelnen Variablen X und Y die Randverteilungen des Zufallsvektors (X,Y).

Randverteilungen kann man sowohl für diskrete als auch für stetige Merkmale berechnen. Wie bei Verteilungen allgemein unterscheidet man dementsprechend:

Außerdem kann man die Randverteilung sowohl für absolute Häufigkeiten als auch für relative Häufigkeiten bilden. Die einzelnen Werte der Randverteilung nennt man dann Randhäufigkeiten (auch Marginalhäufigkeiten oder marginale Häufigkeiten). Die Randhäufigkeiten für kategorial unterteilte (distinkte) Merkmale lassen sich am Rand einer Kontingenztafel ablesen. Sie sind hier die Summen der Häufigkeiten über das vernachlässigte Merkmal hinweg.

Inhaltsverzeichnis

Beispiel anhand von Kontingenztafeln

Randverteilungen diskreter Merkmale lassen sich in Kontingenztafeln darstellen. Am Rand dieser Tafel lassen sich die Randhäufigkeiten, die zusammen die Randverteilung bilden, als Summen über das vernachlässigte Merkmal ablesen.

Beispielsweise ist hier eine Kontingenztafel mit absoluten Häufigkeiten zu sehen. Dasselbe wäre auch mit relativen Häufigkeiten denkbar.

Mann Frau Randhäufigkeiten
Klasse 10 10 10 20
Klasse 11 4 16 20
Randhäufigkeiten 14 26 40

Die Randhäufigkeit in der Klasse 10 zu sein unter der Vernachlässigung dessen, ob man männlich oder weiblich ist beträgt 20. Die entsprechende Randhäufigkeit für Klasse 11 ist ebenso 20. Die Randverteilung ist also gleichverteilt, weil es gleichviele Schüler in beiden Klassen gibt. Das Merkmal Klasse ist distinkt, das heißt in klar abgegrenzte Kategorien unterteilt.

Es gibt allerdings auch Merkmale, die sich nicht in Kategorien unterteilt sind, wie zum Beispiel Körpergröße. Diese Merkmale sind stetig, weil es fließende Übergänge, zwischen allen möglichen Ausprägungen des Merkmals gibt. Solche Merkmale lassen sich nicht in Tabellen darstellen. Um die Darstellung in einer Kontingenztafel dennoch zu ermöglichen ist es möglich das Merkmal in Klassen (gemeint sind hier Kategorien) einzuteilen, indem man sogenannte Klassengrenzen festlegt.[1] Das stetige Merkmal Körpergröße könnten man einteilen indem man als Klassengrenze 142cm festlegt und die Personen in Leute >142cm und ≤142cm einteilt. Für diese in Klassen eingeteilte Gruppen lassen sich nun wieder Klassenhäufigkeiten messen die man in einer Kontingenztafel einträgt. Da keine Person die in einer Klasse (>142) ist auch gleichzeitig in einer anderen Klasse (≤142) sein kann, spricht man auch von einer Einteilung in disjunkte Mengen.

Definition

Für n Zufallsvariablen X_1,\dots,X_n mit gemeinsamer Verteilungsfunktion F(x_1,\dots,x_n) nennt man für jedes k\in\{1,\dots,n\} die Funktion F_k (x) = F(c_1,\dots,c_n) mit ck = x und c_{l\ne k}=\infty eine (eindimensionale) Randverteilung von F(x_1,\dots,x_n).

Entsprechend kann man m-dimensionale Randverteilungen definieren, indem nur nm der ci unendlich setzt.

Die zur Randverteilung Fk gehörende Verteilungsdichte wird als Randdichte oder Marginaldichte bezeichnet. Man erhält eine Randdichte aus der gemeinsamen Dichte durch Summation oder Integration über die nicht mehr berücksichtigten Variablen.

Eigenschaften

  • Ein System von n gemeinsam verteilten Zufallsvariablen besitzt \tbinom{n}{m} m-dimensionale Randverteilungen.
  • Für stochastisch unabhängige Zufallsvariablen ist die gemeinsame Verteilung das Produkt der Randverteilungen.
  • Die Randverteilungen einer Gauß'schen Verteilungsfunktion sind ebenfalls Gauß'sch.

Diskrete Verteilungen

Sind X und Y diskrete Zufallsvariablen auf dem gleichen Wahrscheinlichkeitsraum, deren gemeinsame Verteilung durch

P(X = xi,Y = yj) = ρ(xi,yj) mit i \in I, j \in J

gegeben ist, dann berechnet sich die Randverteilung von X durch Summation über alle möglichen Werte von Y

P(X=x_i) = \sum_{j\in J} \rho(x_i, y_j).

Analog gilt für die Randverteilung von Y

P(Y=y_j) = \sum_{i\in I} \rho(x_i, y_j).

Stetige Verteilungen

Sind X und Y stetige Zufallsvariablen auf dem gleichen Wahrscheinlichkeitsraum mit gemeinsamer Dichtefunktion f(x,y), dann erhält man die Randdichten fX(x) von X und fY(y) von Y durch Integration über die jeweils andere Variable:

f_X(x) = \int_{-\infty}^{\infty} f(x,y) \, dy,
f_Y(y) = \int_{-\infty}^{\infty} f(x,y) \, dx.

Literatur

Einzelnachweise

  1. P. Heinz Müller (Herausgeber): Wahrscheinlichkeitsrechnung und mathematische Statistik. Lexikon der Stochastik, Akademie-Verlag, Berlin 1980, S. 116 und S. 124

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Randverteilung — Randverteilung,   Wahrscheinlichkeitstheorie: die beiden Verteilungen mit den Dichten f1 (x) beziehungsweise f2 (y) mit ∞ < x, y < ∞, die aus der Dichte f (x, y …   Universal-Lexikon

  • Randverteilung — bei ⇡ mehrdimensionalen Verteilungen die eindimensionale Verteilung einer der beteiligten ⇡ Variablen …   Lexikon der Economics

  • Marginalverteilung — Als Randverteilungen oder Marginalverteilung werden in der Stochastik Verteilungsfunktionen bezeichnet, die aus einer anderen Verteilungsfunktion durch Vernachlässigung eines Teils der Zufallsvariablen entstehen. Die einzelnen Werte der… …   Deutsch Wikipedia

  • Randhäufigkeit — Als Randhäufigkeiten, Marginalhäufigkeiten oder marginale Häufigkeiten bezeichnet man die Randsummen der Häufigkeiten einer Kontingenztafel, die man am Rand der Tafel ablesen kann. Am Rand einer Kontingenztafel mit relativen Häufigkeiten nennt… …   Deutsch Wikipedia

  • Elektronendichte — Die Elektronendichte ist ein Skalarfeld des dreidimensionalen Ortsraumes, wobei zur Interpretation gilt: ist die Anzahl an Elektronen pro infinitesimalem Volumenelement dV (siehe: Dichtefunktion). Im Gegensatz zum quantenmechanischen… …   Deutsch Wikipedia

  • F-Verteilung — Die F Verteilung oder Fisher Verteilung, auch Fisher Snedecor Verteilung (nach Ronald Aylmer Fisher und George W. Snedecor), ist eine stetige Wahrscheinlichkeitsverteilung. Eine F verteilte Zufallsvariable ergibt sich als Quotient zweier jeweils… …   Deutsch Wikipedia

  • Gewöhnliche stochastische Ordnung — Stochastische Ordnungen sind Ordnungsrelationen für Zufallsvariablen. Sie verallgemeinern das Konzept von größer und kleiner auf zufällige Größen und dienen zum Beispiel dem Vergleich von Risiken in der Versicherungswirtschaft. Die Theorie der… …   Deutsch Wikipedia

  • Korrelationsmatrix — Die gemeinsame Wahrscheinlichkeitsverteilung mehrerer Zufallsvariablen nennt man multivariate Verteilung oder auch mehrdimensionale Verteilung. Inhaltsverzeichnis 1 Formale Darstellung 2 Ausgewählte multivariate Verteilungen 3 Die multivariate… …   Deutsch Wikipedia

  • Marginal — Ein Marginal (lat. margo, marginis = „Rand“) ist etwas am Rande/auf der Grenze Liegendes, Nebensächliches (d. h. am Rande einer Sache, sprich eines Gegenstandsbereichs liegendes). Das Wort muss keine entwertende Nebenbedeutung haben, diese kann… …   Deutsch Wikipedia

  • Multivariate Normalverteilung — Die gemeinsame Wahrscheinlichkeitsverteilung mehrerer Zufallsvariablen nennt man multivariate Verteilung oder auch mehrdimensionale Verteilung. Inhaltsverzeichnis 1 Formale Darstellung 2 Ausgewählte multivariate Verteilungen 3 Die multivariate… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”