Receiver operating characteristic

Die Operationscharakteristik (auch OC-Kurve oder OC-Funktion genannt) ist ein Begriff aus der statistischen Testtheorie.

Gegeben ist eine Zufallsvariable X mit einer Verteilungsfunktion F(x|θ), die von einem unbekannten Parameter θ abhängt. Für die Schätzung des Parameters werden n Beobachtungen der Zufallsvariablen gemacht. Der Parameter kann dann durch eine Schätzfunktion

$\hat \theta = t(X_1, X_2, ..., X_n)$

geschätzt werden. Es soll eine Vermutung bezüglich des wahren, unbekannten Parameters statistisch überprüft werden. Es wird also eine Hypothese bezüglich dieses Parameters aufgestellt, die sogenannte Nullhypothese H₀. Man geht nun davon aus, dass bei Wahrheit der Nullhypothese $\hat \theta$ in der Nähe des wahren Parameter θ liegen müsste und lehnt H₀ ab, wenn die Distanz zu groß ist, wenn also $\hat \theta$ in den Ablehnungsbereich des Tests fällt. Der Ablehnungsbereich AB wird so festgelegt, dass 100%-α aller Stichproben abgelehnt werden, wenn H₀ wahr ist.

Man kann im Hypothesentest zwei Arten von Fehlern begehen:

Man lehnt H₀ ab, obwohl θ₀ der wahre Parameter ist. Es handelt sich also bei α um einen Fehler, den α-Fehler oder Fehler erster Art.
Man lehnt H₀ nicht ab, obwohl ein anderer Parameter θ₁ der wahre Parameter ist. Das ist der β-Fehler oder Fehler zweiter Art.

α wird in der Testprozedur festgelegt, β hängt aber vom wahren Parameter θ₁ ab und ist in aller Regel unbekannt. Man kann für eine Risikoabschätzung einer falschen Entscheidung die β-Fehler für verschiedene alternative Parameterwerte θ₁ berechnen. Der β-Fehler für einen alternativen Parameter θ₁ berechnet sich als Wahrscheinlichkeit, dass $\hat \theta$ in den Nichtablehnungsbereich (NAB) fällt, wenn in Wahrheit θ₁ die Verteilung von $\hat \theta$ regiert:

$\beta = P(\hat \theta \isin NAB| \theta_1).$

β hängt also von θ₁ ab und kann als Funktion von θ₁ dargestellt werden: β = f(θ₁). Diese Funktion wird als Operationscharakteristik (häufig auch als OC) bezeichnet. Die Gegenwahrscheinlichkeit zu β ist die Wahrscheinlichkeit, dass H₀ abgelehnt wird, wenn θ₁ der wahre Parameter ist. Hier ist die Ablehnung erwünscht und die entsprechende Funktion γ(θ₁) = 1 – OC(θ₁) wird daher als Gütefunktion bezeichnet.

Die Gütefunktion und die Operationscharakteristik stellen beide vollständige Charakterisierungen des zugehörigen Tests dar. Man erkennt an ihnen bspw., ob der Test mit wachsender Beobachtungszahl immer besser wird (Konsistenz) und ob die Wahrscheinlichkeit, H₀ abzulehnen größer ist, wenn H₁ zutrifft als wenn H₀ zutrifft (Unverfälschtheit).

Beispiel

Ein Forellenzüchter liefert seinem Großabnehmer Forellen, die im Durchschnitt mindestens 260 g wiegen sollen. Bei Lieferung wird getestet, ob das Durchschnittsgewicht mindestens 260 Gramm beträgt. Wird die Hypothese abgelehnt, wird die Lieferung beanstandet. Es sei bekannt, dass das Gewicht X der Forellen normalverteilt ist mit der Varianz σ² = 64 g² und einem unbekannten Erwartungswert μ. Es werden in einer Stichprobe n = 16 Forellen gewogen, wobei die i-te Forelle x_i g wiegt. Das Durchschnittsgewicht

$\bar x = \frac{1}{n} \sum_{i=1}^n x_i$

dieser Forellen wird ermittelt. Da der Mittelwert bei jedem Versuch anders ausfällt, ist diese Größe ebenfalls eine Zufallsvariable X und normalverteilt mit den Parametern

μ

und ${var \bar X} = \frac {\sigma^2}{n}.$

Die Hypothesen lauten nun H₀: $\mu \ge \mu_0 = 260$ und H₁: $μ < 260$

Soll der Fehler erster Art beispielsweise α = 0,05 betragen, ergibt sich der kritische Wert für die Prüfgröße X als

$\mu_0 - z(1 - \alpha) \cdot \frac {\sigma}{\sqrt n} = 260 - 1,65 \cdot \frac {8}{4} = 256,7$

mit z(1 - α) als (1-α)-Quantil der Standardnormalverteilung.

β-Fehler: Die rote Normalverteilungskurve gibt an, wie X verteilt wäre, wenn μ = 260 g ist. Die rote Fläche ist der α-Fehler 0,05. Die blaue Kurve zeigt die Verteilung von X, wenn μ in Wahrheit 255 ist. Die blaue Fläche ist dann die Wahrscheinlichkeit, dass X ≥ 256,7 ist, dass also H₀ nicht abgelehnt wird. Entsprechendes gilt für μ = 252.

H₀ wird also abgelehnt, wenn x < 256,7 ist, der Ablehnungsbereich ist (- ∞; 256,7). Ist jetzt tatsächlich μ₀ = 260 g wahr, würde in 5% aller Stichproben x in den Ablehnungsbereich fallen, es würde die Lieferung zu Unrecht zurückgeschickt werden.

Es kann aber beispielsweise auch vorkommen, dass das Durchschnittsgewicht in Wahrheit μ₁ = 255 g beträgt, dass aber zufällig x > 256,7 g ist. Das ist der β-Fehler für μ₁ = 255g. Die Prüfgröße X ist nun bei unveränderter Varianz in Wahrheit normalverteilt wie

$\bar X \to N(255;2)$

Die Wahrscheinlichkeit, dass die Nullhypothese nicht abgelehnt wird, ist dann

$P(\bar X \ge 256,7| \mu_1 = 255)$

und berechnet sich mit Hilfe der Normalverteilung als

$1-\Phi(256,7|255;\frac{\sqrt64}{\sqrt16}) = 1 - \Phi_z (\frac{256,7 - 255}{2})$

$= 1-0,8023 = 0,1977 \; ,$

Operationscharakteristik. Der Ordinatenwert der Grafik gibt den β-Fehler in Abhängigkeit vom unbekannten Parameter μ₁ an. Für μ = 260 ist der Wert 0,95, also gerade 1 - α.

wobei Φ(256,7|255;2) der Wert der Normalverteilungsfunktion mit den Parametern 255 und 2 an der Stelle 256,7 ist und Φ_z der entsprechende Wert der Standardnormalverteilung. Es würde also in ca. 20 % aller Stichproben die Lieferung akzeptiert werden, obwohl die Forellen im Durchschnitt untergewichtig sind. Beträgt dagegen in Wahrheit μ₁ = 252, ergibt sich der β-Fehler als

$1-\Phi(256,7|252;2) = 0,0094 \; ,$

hier ist die Gefahr einer falschen Entscheidung nur noch sehr gering. Die Grafik der Operationscharakteristik zeigt, wie mit wachsender Entfernung von μ₀ der β-Fehler sinkt. Man ist bestrebt, möglichst schnell in den Bereich eines kleinen β-Fehlers zu kommen. Mit der Erhöhung des Stichprobenumfangs kann man den β-Fehler reduzieren. Einen Test mit kleinem β-Fehler nennt man auch trennscharf, weil hier die Verteilungen stark getrennt sind.

Siehe auch

Receiver Operating Characteristic

Literatur

Hartung, Joachim/Elpelt, Bärbel/Klösener, Karl-Heinz: Statistik - Lehr- und Handbuch der angewandten Statistik. 9., durchges. Aufl., Oldenbourg, München 1993, insbesondere Seite 135ff und 381ff.

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

Receiver operating characteristic — In signal detection theory, a receiver operating characteristic (ROC), or simply ROC curve, is a graphical plot of the sensitivity vs. (1 specificity) for a binary classifier system as its discrimination threshold is varied. The ROC can also be… … Wikipedia
Receiver Operating Characteristic — Pour les articles homonymes, voir ROC. La courbe ROC de trois estimateurs d épitope La caractéristique de fonctionnement du récepteur ou, en anglais, Receiver Operating Characteristic (dite auss … Wikipédia en Français
Receiver Operating Characteristic — Die Receiver Operating Characteristic (ROC) – Kurve bzw. Grenzwertoptimierungskurve ist eine Methode zur Bewertung und Optimierung von Analyse Strategien. Die ROC Kurve stellt visuell die Abhängigkeit der Effizienz mit der Fehlerrate für… … Deutsch Wikipedia
receiver operating characteristic curve — a curve that plots sensitivity versus [1 − specificity (or false positive error rate)] to help determine the best cutoff point or points for demarcating dimensional data in diagnostic tests for disease, optimizing the balance between… … Medical dictionary
Characteristic — (from the Greek word for a property or attribute (= trait) of an entity) may refer to: In physics and engineering, any characteristic curve that shows the relationship between certain input and output parameters, for example: I V or current… … Wikipedia
characteristic — 1. SYN: character. 2. Typical or distinctive of a particular disorder. receiver operating c. (ROC) a plot of the sensitivity of a diagnostic test as a function of nonspecificity (one minus the specificity). The ROC curve indicates the … Medical dictionary
Superheterodyne receiver — A 5 tube superheterodyne receiver made in Japan around 1955 In electronics, a superheterodyne receiver (sometimes shortened to superhet) uses frequency mixing or heterodyning to convert a received signal to a fixed intermediate frequency, which… … Wikipedia
ROC curve — receiver operating characteristic c … Medical dictionary
Courbe ROC — Receiver Operating Characteristic Pour les articles homonymes, voir ROC. La caractéristique de fonctionnement du récepteur ou, en anglais, Receiver Operating Characteristic (dite aussi ROC[1]) est une mesure de la performance d un classifieur… … Wikipédia en Français
ROC — • receiver operating characteristic; • receiver operating curve; • receptor operated channels; • relative operating characteristic; • resident on call; • residual organic carbon; • right outer canthus … Dictionary of medical acronyms & abbreviations

Academic dictionaries and encyclopedias

Receiver operating characteristic

Beispiel

Siehe auch

Literatur

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Receiver operating characteristic

Beispiel

Siehe auch

Literatur

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link