Mathematische Statistik

Mathematische Statistik

Als mathematische Statistik bezeichnet man das Teilgebiet der Statistik, das die Methoden und Verfahren der Statistik mit mathematischen Mitteln analysiert beziehungsweise mit ihrer Hilfe erst begründet. Gemeinsam mit der Wahrscheinlichkeitstheorie bildet die mathematische Statistik das als Stochastik bezeichnete Teilgebiet der Mathematik. Meist weitgehend synonym werden die Begriffe induktive Statistik und Inferenzstatistik (schließende Statistik) gebraucht, die den zur Beschreibenden Statistik komplementären Teil der Statistik charakterisieren.

Die mathematische Grundlage der mathematischen Statistik ist die Wahrscheinlichkeitstheorie.

Inhaltsverzeichnis

Womit beschäftigt sich Statistik?

Gegenstand der Statistik sind Grundgesamtheiten, deren Mitglieder allesamt ein bestimmtes Merkmal aufweisen. Gesucht sind Aussagen darüber, wie häufig dieses Merkmal innerhalb der Grundgesamtheit seine möglichen Werte annimmt. Oft beschränken sich die Aussagen auf abgeleitete Größen wie zum Beispiel den Durchschnitt der Merkmalswerte, die die Mitglieder der Grundgesamtheit besitzen.

Ein Beispiel ist die häufig als Alterspyramide grafisch dargestellte Altersverteilung, wobei es sich bei der Grundgesamtheit beispielsweise um die deutsche Bevölkerung handeln kann. Da eine präzise Bestimmung der Altersverteilung der Deutschen eine aufwändige Vollerhebung wie eine Volkszählung voraussetzt, sucht man nach Methoden, mit denen weitgehend zuverlässige Aussagen bereits auf Basis von Teilerhebungen möglich sind. Wie im Beispiel des Politbarometers werden dazu nur die Mitglieder zufällig ausgewählter Teilmengen der Grundgesamtheit, sogenannte Stichproben, auf das interessierende Merkmal untersucht.

Methodik der mathematischen Statistik

Wäre die Altersverteilung in der Grundgesamtheit bekannt, könnten mit Formeln der Wahrscheinlichkeitstheorie Wahrscheinlichkeiten für die innerhalb von Stichproben beobachtbaren Altersverteilungen berechnet werden, die aufgrund der Zufallsauswahl der Stichproben zufälligen Schwankungen unterworfen sind. In der mathematischen Statistik nutzt man solche Berechnungen, um umgekehrt vom Stichprobenergebnis auf die Grundgesamtheit schlussfolgern zu können: Dabei werden auf Basis der konkret für eine Stichprobe beobachteten Merkmalswerte jene Häufigkeitsverteilungen innerhalb der Grundgesamtheit charakterisiert, mit denen das gemachte Beobachtungsergebnis in plausibler Weise erklärbar wird. Im Blickpunkt theoretischer Untersuchungen stehen nicht nur die getroffenen Schlussfolgerungen selbst, sondern auch Abschätzungen darüber, wie numerisch genau und wie sicher solche Prognosen sind.

Mathematisch wird eine Häufigkeitsverteilung durch eine Zufallsvariable charakterisiert, deren Wahrscheinlichkeitsverteilung den relativen Häufigkeiten der Merkmalswerte entspricht. Speziell für das angeführte Beispiel der Altersverteilung ist ein realisierter Wert der Zufallsvariablen gleich dem Alter eines zufällig ausgewählten Deutschen. Auf diese Weise können die einer Stichprobe ermittelten Beobachtungswerte als sogenannte Realisierungen stochastisch unabhängiger und identisch verteilter Zufallsvariablen aufgefasst werden. Das Vorwissen wird in diesem Fall durch eine Familie von Wahrscheinlichkeitsverteilungen beziehungsweise durch eine entsprechende Familie von Wahrscheinlichkeitsmaßen repräsentiert. Man spricht von einer Verteilungsannahme. Diese kann sowohl Aussagen über mögliche Merkmalswerte, etwa in Bezug auf deren Ganzzahligkeit, als auch über den Typ der Verteilung, zum Beispiel „die Werte sind normalverteilt“, beinhalten.

Das zentrale Gebiet der mathematischen Statistik ist die Schätztheorie, innerhalb der geeignete Schätzverfahren entwickelt werden. Methodisch wird dabei so vorgegangen, dass man ausgehend von der Verteilungsannahme bestimmte Klassen von Schätzfunktionen untersucht und hinsichtlich verschiedener Qualitätskriterien (etwa Suffizienz oder Effizienz) vergleicht. Bei einer solchen Schätzfunktion kann es sich sowohl um eine einwertige Näherung eines gesuchten Parameters der Grundgesamtheit handeln als auch um eine Bereichsschätzung in Form eines sogenannten Konfidenzintervalls. Konkrete Vermutungen über die Grundgesamtheit können durch geeignete statistische Tests überprüft werden. Dabei wird ausgehend von einer Hypothese auf Basis des Stichprobenergebnisses eine 0-1-Entscheidung über die Verwerfung beziehungsweise Beibehaltung der Hypothese herbeigeführt.

Statistische Modelle

Eine gänzliche Formalisierung auf Basis mathematischer Objekte wird mit dem Begriff des statistischen Modells erzielt, oft auch als statistischer Raum bezeichnet. Abweichend vom bisher beschriebenen, eher anwendungsorientierten Szenario kann dabei auf die Festlegung einer Grundgesamtheit verzichtet werden:

Die möglichen Stichprobenergebnisse x werden zu einer Menge \mathcal{X}, dem Stichprobenraum, zusammengefasst. Die darin beobachtbaren Ereignisse werden formal durch eine zum Stichprobenraum \mathcal{X} definierte σ-Algebra \mathcal{F} charakterisiert. Die Verteilungsannahme, das heißt die in Frage kommenden Wahrscheinlichkeitsverteilungen, entsprechen einer Familie (P_\vartheta)_{\vartheta \in \Theta} von Wahrscheinlichkeitsmaßen auf (\mathcal{X}, \mathcal{F}). Ein statistisches Modell ist damit formal ein Tripel (\mathcal{X}, \mathcal{F}, P_\vartheta : \vartheta \in  \Theta). Ist \vartheta ein reeller Parametervektor, also \Theta \subseteq \R^d, so spricht man von einem parametrischen Modell mit Parameterraum Θ. Den Fall d = 1 eines reellen Parameters nennt man einparametriges Modell.

Eine messbare Funktion S von (\mathcal{X},\mathcal{F}) in einen weiteren Messraum (\mathcal{S}, \Sigma) heißt Stichprobenfunktion oder Statistik. Eine Schätzfunktion oder kurz ein Schätzer für eine Kenngröße \tau(\vartheta) \in \mathcal S des Parameters ist eine Stichprobenfunktion T : \mathcal{X} \to \mathcal{S}.

Beispiel

Eine (möglicherweise gezinkte) Münze wird n = 100 Mal geworfen. Die Wahrscheinlichkeit p, dass bei einem Wurf Kopf fällt, sei unbekannt. Es wird beobachtet, wie oft die Münze Kopf zeigt. Das zugehörige statistische Modell (\mathcal{X}, \mathcal{F}, P_\vartheta : \vartheta \in  \Theta) dafür ist gegeben durch

  • \mathcal{X} = \{0,1,\ldots,n\} als Stichprobenraum,
  • \mathcal{F} die Potenzmenge von \mathcal{X},
  • Θ = [0,1] als Menge der möglichen Werte des unbekannten Parameters \vartheta = p,
  • P_\vartheta ist die Binomialverteilung mit den Parametern n = 100 und \vartheta.

Ein naheliegender Schätzer für den Parameter \tau(\vartheta)=\vartheta ist in diesem Fall gegeben durch die relative Häufigkeit T(x) = \frac{x}{n} = \frac{x}{100} für x \in \mathcal{X}.

Literatur

Weblinks


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • mathematische Statistik — matematinė statistika statusas T sritis fizika atitikmenys: angl. mathematical statistics vok. mathematische Statistik, f rus. математическая статистика, f pranc. statistique mathématique, f …   Fizikos terminų žodynas

  • Statistik — ist die Lehre von Methoden zum Umgang mit quantitativen Informationen (Daten). Sie ist eine Möglichkeit, eine systematische Verbindung zwischen Erfahrung (Empirie) und Theorie herzustellen.[1] Sie ist damit unter anderem die Zusammenfassung… …   Deutsch Wikipedia

  • Statistik (Studienfach) — Statistik ist ein Studienfach, das die Anwendung und theoretischen Grundlagen statistischer Methoden vermittelt. Es kann in Deutschland an der Technischen Universität Dortmund und der Ludwig Maximilians Universität München studiert werden, in… …   Deutsch Wikipedia

  • Mathematische Geodäsie — wird als Sammelbegriff für die mathematischen Grundlagen bzw. Methoden der Geodäsie verwendet. Sie wird meist als Teilgebiet der Theoretischen Geodäsie betrachtet, doch ist die Zuordnung in der Fachwelt nicht einheitlich, daher hat sich nunmehr… …   Deutsch Wikipedia

  • Statistik — Daten; Datenmaterial * * * Sta|tis|tik [ʃta tɪstɪk], die; , en: a) Wissenschaft von der zahlenmäßigen Erfassung, Untersuchung und Auswertung von Massenerscheinungen: vielen BWL Studierenden fällt Statistik schwer. b) schriftliche Zusammenstellung …   Universal-Lexikon

  • Statistik — von Professor Dr. Eberhard Schaich I. Begriff Umfassendes methodisch quantitatives Instrumentarium zur Charakterisierung und Auswertung empirischer Befunde bei gleichartigen Einheiten („Massenphänomenen“) mit breiten Einsatzmöglichkeiten in… …   Lexikon der Economics

  • Statistik (Begriffsklärung) — Als Statistik bezeichnet man ein mathematisches Fachgebiet; siehe Statistik, Mathematische Statistik, Deskriptive Statistik; das Ergebnis von Erhebungen; siehe amtliche Statistik, Bevölkerungsstatistik eine Stichprobenfunktion, mit der in der… …   Deutsch Wikipedia

  • Induktive Statistik — Als mathematische Statistik (auch: schließende Statistik, induktive Statistik, Inferenzstatistik oder inferentielle Statistik) bezeichnet man das Teilgebiet der Statistik, das die Methoden und Verfahren der Statistik mit mathematischen Mitteln… …   Deutsch Wikipedia

  • Schließende Statistik — Als mathematische Statistik (auch: schließende Statistik, induktive Statistik, Inferenzstatistik oder inferentielle Statistik) bezeichnet man das Teilgebiet der Statistik, das die Methoden und Verfahren der Statistik mit mathematischen Mitteln… …   Deutsch Wikipedia

  • Wahrscheinlichkeit und Statistik — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”