- Formelsammlung Stochastik
-
Dies ist eine Formelsammlung zu dem mathematischen Teilgebiet Stochastik einschließlich Wahrscheinlichkeitsrechnung, Kombinatorik, Zufallsvariablen und Verteilungen sowie Statistik.
Inhaltsverzeichnis
Wahrscheinlichkeitsrechnung
Grundlagen
Axiome: Jedem Ereignis aus dem Ereignisraum wird eine Wahrscheinlichkeit P(A) zugeordnet, so dass gilt:
- ,
- ,
- für paarweise disjunkte Ereignisse gilt
Rechenregeln: Aus den Axiomen ergibt sich:
- Für gilt , insbesondere
- Für das Gegenereignis gilt
- Zwei Ereignisse A,B sind unabhängig
Kombinatorik
Fakultät: Anzahl der Möglichkeiten beim Ziehen aller n Kugeln aus einer Urne (ohne Zurücklegen):
wobei 0! = 1! = 1
ohne Wiederholung
(von n Elementen)
mit Wiederholung
(von r + s + ... + t = n Elementen,
von denen jeweils r, s ... t nicht unterscheidbar sind)
Permutation
Binomialkoeffizient "n über k"
Anzahl der Möglichkeiten beim Ziehen von k Kugeln aus einer Urne mit n Kugeln:
ohne Wiederholung
(siehe Hypergeometrische Verteilung)
mit Wiederholung
(siehe Binomialverteilung)
Variation
Kombination
Zufallsvariablen
Diskrete Zufallsgrößen
Eine Funktion f heißt Wahrscheinlichkeitsfunktion einer diskreten Zufallsgröße X, wenn folgende Eigenschaften erfüllt sind:
- Für alle gilt
Eine Zufallsgröße und deren Verteilung heißen diskret, falls es eine geeignete Wahrscheinlichkeitsfunktion mit den Eigenschaften (1) bis (3) gibt.
- für alle
Stetige Zufallsgrößen
Dichtefunktion einer stetigen Zufallsgröße: Eine Funktion f heißt Dichtefunktion einer stetigen Zufallsgröße X, wenn folgende Eigenschaften erfüllt sind:
- Für alle gilt
Eine Zufallsgröße und deren Verteilung heißen stetig, falls es eine geeignete Dichtefunktion mit den Eigenschaften (1) bis (3) gibt.
Für die Wahrscheinlichkeit gilt
- für alle
Erwartungswert und Varianz sind gegeben durch
Erwartungswert, Varianz, Kovarianz, Korrelation
Für den Erwartungswert E(X), die Varianz V(X), die Kovarianz und die Korrelation gelten:
- E(aX + b) = aE(X) + b
- E(X + Y) = E(X) + E(Y), allgemein
- Für unabhängige Zufallsvariablen Xi gilt:
- V(X) = E((X − E(X))2) = E(X2) − E(X)2
- V(aX + b) = a2V(X)
- Für unabhängige Zufallsvariablen Xi gilt:
Spezielle Verteilungen
Binomialverteilung
Gegeben ist n-stufiger Bernoulli-Versuch (d.h. n mal dasselbe Experiment mit nur zwei möglichen Ausgängen und konstanten Wahrscheinlichkeiten) mit der Erfolgswahrscheinlichkeit p und der Misserfolgswahrscheinlichkeit q = 1 − p. Die Wahrscheinlichkeitsverteilung der Zufallsgröße X: Anzahl der Erfolge heißt Binomialverteilung.
Die Wahrscheinlichkeit für k Erfolge berechnet sich nach der Formel:
σ-Regeln
(Wahrscheinlichkeiten von Umgebungen des Erwartungswertes bei Binomialverteilungen) Zwischen dem Radius einer Umgebung um den Erwartungswert und der zugehörigen Wahrscheinlichkeit der Umgebung gelten folgende Zuordnungen (falls σ > 3):
-
Radius der Umgebung Wahrscheinlichkeit der Umgebung 1σ 0,68 2σ 0,955 3σ 0,997
-
Wahrscheinlichkeit der Umgebung Radius der Umgebung 0,90 1,64σ 0,95 1,96σ 0,99 2,58σ
Standardisieren einer Verteilung
- Verschiebe das Histogramm so, dass der Erwartungswert μ an der Stelle z = 0 des (neuen) Koordinatensystems liegt.
- Wähle die Breite der Rechtecke gleich , sodass auf der 1. Achse die Einheiten -3, -2, -1, 0, 1, 2, 3 anstelle der Abschnitte μ-3σ, μ-2σ, μ-1σ, μ, μ+1σ, μ+2σ,μ +3σ treten.
- Das Stauchen der Rechtecke in Richtung der 1. Achse wird dadurch ausgeglichen, dass auf der 2. Achse nicht mehr die Wahrscheinlichkeiten P(X = k) abgetragen werden, sondern die mit der Standardabweichung σ vervielfachten Wahrscheinlichkeiten.
Poisson-Näherung
Gegeben sei eine Binomialverteilung mit großem Stichprobenumfang n ≥ 100 und kleiner Erfolgswahrscheinlichkeit p≤0,1. Mithilfe von kann man dann näherungsweise die Wahrscheinlichkeit für k Erfolge berechnen:
Die Beziehungen lassen sich zusammenfassen zu:
Poisson-Verteilung
Gilt für die Verteilung einer Zufallsgröße X
Näherungsformeln von Moivre und Laplace
Sei X eine binomialverteilte Zufallsgröße mit σ>4 (brauchbare Näherung besser σ>9). Die Wahrscheinlichkeit für genau und höchstens k Erfolge lässt sich näherungsweise berechnen durch:
Wahrscheinlichkeitsberechnung mit Hilfe der Gaußschen Integralfunktion
Gaußsche Dichtefunktion φ (auch als Glockenkurve bekannt)
Gaußsche Integralfunktion Ψ
Näherungsformeln:
Hypergeometrische Verteilung
In einer Grundgesamtheit vom Umfang N seien zwei Merkmalsausprägungen vom Umfang K bzw. N − K vertreten. Eine Stichprobe vom Umfang n werde genommen. Dann nennt man die Verteilung der Zufallsgröße: X: Anzahl der Exemplare der 1. Merkmalsausprägung in der Stichprobe einer hypergeometrischen Verteilung.
Die Wahrscheinlichkeit, dass in der Stichprobe vom Umfang n genau k Exemplare der 1. Merkmalsausprägung sind, ist:
N = Anzahl der Elemente, K = Anzahl der positiven Elemente, n = Anzahl der Ziehungen, k = Anzahl der Erfolge.
Sei der Anteil, mit dem die 1. Merkmalsausprägung in der Gesamtheit vorkommt, dann gilt:
Geometrische Verteilung
Gegeben ist ein Bernoulli-Versuch mit Erfolgswahrscheinlichkeit p. Die Verteilung der Zufallsgröße W: Anzahl der Stufen bis zum ersten Erfolg heißt geometrische Verteilung. Es gilt:
- (Erfolg genau beim k-ten Versuch)
- (k Misserfolge hintereinander bzw. der erste Erfolg kommt erst nach dem k-ten Versuch)
- (Erfolg spätestens beim k-ten Versuch bzw. bis zum k-ten. Versuch tritt mindestens ein Erfolg ein)
Der Erwartungswert ist
Weitere
Die unzähligen weiteren speziellen Verteilungen können hier nicht alle aufgeführt werden, es sei auf die Liste univariater Wahrscheinlichkeitsverteilungen verwiesen.
Approximationen von Verteilungen
Unter gewissen Approximationsbedingungen können Verteilungen auch durcheinander approximiert werden um Berechnungen zu vereinfachen. Je nach Lehrbuch können die Approximationsbedingungen etwas unterschiedlich sein.
Nach Von B(n,p) Po(λ) N(μ,σ) Diskrete Verteilungen Binomialverteilung
B(n,p)-- n > 10, p < 0,05,
λ: = np,
μ: = np, σ2: = np(1 − p)Hypergeometrische Verteilung
Hyp(N,M,n)
n > 10, ,
,Poisson-Verteilung
Po(λ)-- λ > 9,
μ: = λ, σ2: = λStetige Verteilungen Chi-Quadrat-Verteilung
n > 30
μ: = n, σ2: = 2nStudentsche t-Verteilung
tnn > 30
μ: = 0, σ2: = 1Normalverteilung
N(μ,σ)-- Bei dem Übergang von einer diskreten Verteilung zu einer stetigen Verteilung kommt auch noch eine Stetigkeitskorrektur (wenn oder ) in Betracht und insbesondere .[1]
Statistik
Beschreibende Statistik
Lagemaße
Arithmetisches Mittel:
Streuungsmaße
Stichprobenvarianz:
Standardabweichung:
Zusammenhangsmaße
Empirische Kovarianz:
Empirischer Korrelationskoeffizient:
Gleichung der Regressionsgeraden: y = ax + b mit
- ,
wobei und die arithmetischen Mittel bedeuten.
Schließende Statistik
- siehe Signifikanztest, Chi-Quadrat-Test
Einzelnachweise
- ↑ Yates, F. (1934). Contingency table involving small numbers and the χ2 test. Supplement to the Journal of the Royal Statistical Society 1(2): 217-235. JSTOR Archive for the journal
Kategorien:- Liste (Mathematik)
- Formelsammlung
- Stochastik
Wikimedia Foundation.