Zensierte Daten

Zensierte Daten

Zensierten Daten (auch trunkierte (gestutzte) Daten, Eckdaten (engl: Censored, Truncated Data)[1]) sind Daten, bei denen nicht alle Werte einer Statistische Variablen bekannt sind.

Inhaltsverzeichnis

Geschichte

Daniel Bernoulli befasste sich bereits im Jahre 1766 mit dem Problem der zensierten Daten, als er versuchte, die Wirksamkeit der Pockenimpfung durch Kuhpocken nachzuweisen[2]

Arten zensierter Daten

Rechtszensierte Daten

Ist das Ereignis bis zum Ende des Experiments nicht beobachtet worden, nennt man die Daten rechts zensiert.

Man kann drei Haupttypen der rechts zensierten Daten definieren:

Typ I: In Experimenten mit festem Start- und Endpunkt werden alle Beobachtungen am Ende des Experiments zensiert, falls bei diesem Versuchsobjekt das Ereignis noch nicht eingetreten ist. Das heißt beim Typ I sind alle zensierten Beobachtungen gleich der Länge des Experiments.

Typ II: In Experimenten, in welchen der Endpunkt durch das Erreichen einer bestimmten Anzahl von Ereignissen festgelegt ist, spricht man vom Typ II.

Typ III: Sind die Start- und Endpunkte der Versuchsobjekte im Experiment nicht festgelegt, befinden sich aber innerhalb des durch das Experiment beschriebenen Zeitraums, so spricht man vom Typ III. Beobachtungen werden zensiert, wenn man den Endpunkt nicht kennt bzw. das Ereignis zum letzten bekannten Zeitpunkt noch nicht eingetreten ist.

Links zensierte und intervall-zensierte Daten

  • Ist das Ereignis an einem unbekannten Zeitpunkt in der Vergangenheit bereits eingetreten, spricht man von links zensierten Daten.
  • Tritt das Ereignis unbeobachtet zwischen zwei Zeitpunkten a und b so spricht man von intervall-zensierten Daten.

Beispiele und Anwendungen

Einfaches Beispiel in einem Fragebogen ist die Frage nach dem Alter. Wird unter oder über einem bestimmten Alter nicht das genaue Alter sondern lediglich "jünger als... Jahre" bzw. "älter als ... Jahre" abgefragt, spricht man von zensierten Daten.

Zensierte Daten werden beispielsweise verwendet, wenn der Zeitpunkt des Eintretens eines bestimmten Ereignisses beobachtet werden soll (engl.: time-to-event), da das betreffende Ereignis z. B. vor Beginn der Beobachtung schon eingetreten sein kann oder bis zum Ende des Experiments noch nicht eingetreten ist.

Umgang mit zensierten Daten

Um Schlüsse aus einer Stichprobe mit zensierten Daten ziehen zu können, gibt es grundsätzlich zwei Möglichkeiten:

  • Fehlende Werte: die Datensätze werden weggelassen und als fehlende Werte behandelt
  • Schätzung: die Daten zum Ereignis, das nicht beobachtet wurde, werden geschätzt, üblicher Weise durch eine Regression auf die beobachteten Werte.
  • Ein Spezielles Verfahren für zensierte Daten ist das Tobit-Modell.

Siehe auch

Literatur

  • Elisa T. Lee, John Wenyu Wang: Statistical Methods for Survival Data Analysis, 3rd Ed.. 2003, John Wiley & Sons, ISBN 0-471-36997-7.

Einzelnachweise

  1. Artikel "Zensierte, trunkierte (gestutzte) Daten, Eckdaten (engl: Censored, Truncated Data)" in: ILMES - Internet-Lexikon der Methoden der empirischen Sozialforschung]
  2. L. Bradley: Smallpox Inoculation: An Eighteenth Century Mathematical Controversy, Nottingham (1971)

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Analysis of Failure Times — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • Ereignisanalyse — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • Event History Analysis — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • LIFEREG — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • Survival-Analyse — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • Survival Analysis — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • Verlaufsdatenanalyse — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • Verweildaueranalyse — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • Zuverlässigkeitsanalyse — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

  • Überlebensanalyse — Ereigniszeitanalyse ist eine statistische Analyse, bei der die Zeit bis zu einem bestimmten Ereignis ( time to event ) zwischen zwei oder mehr Gruppen verglichen wird, um die Wirkung von prognostischen Faktoren, medizinischer Behandlung oder… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”