- Kovarianzanalyse (Statistik)
-
Die Kovarianzanalyse (englisch analysis of covariance, ANCOVA) ist ein statistisches Verfahren, das Varianzanalyse und lineare Regressionsanalyse verbindet. Ziel ist es, die Auswirkung von in einem konkreten Experiment nicht relevanter (bzw. nicht als relevant angesehener) unabhängigen Faktoren (sogenannte Kovariate oder auch Kovariable) auf die abhängige Variable auszublenden (einer Rauschreduktion entsprechend) und so einen möglichen Effekt einer interessierenden unabhängigen Variable auf die abhängige Variable statistisch nachweisen zu können (Erhöhung der Power).
Inhaltsverzeichnis
Voraussetzungen
Wie bei jedem statistischen Test müssen einige Voraussetzungen der Daten erfüllt sein, damit das generierte Testresultat valide ist. Bei Verwendung der ANCOVA wird wie bei der Nutzung der ANOVA vorausgesetzt, dass die Residuen normalverteilt und homoskedastisch sind. Daneben wird analog zur linearen Regression eine lineare Abhängigkeit der abhängigen von den unabhängigen Variablen vorausgesetzt.
Überlegungen zur Poweranalyse
Einerseits wird die statistische Power zum Nachweis einer Abhängigkeit der abhängigen von der/den unabhängigen Variable(n) erhöht, da ein Teil der Varianz der Messwerte der abhängigen Variable durch die kovariaten Parameter korrigiert wird. Andererseits wird jedoch die Zahl der Freiheitsgrade reduziert. Bei Wahl einer Kovariate mit nur sehr geringem Einfluss auf die Varianz der abhängigen Variable reduziert dies die statische Power des Testes.
Einige Details
- Typischerweise werden Kovariate in einem experimentellen Design berücksichtigt, um äußere Einflüsse weniger stark in die abhängige Variable einfließen zu lassen und so die Varianz der Messwerte zu reduzieren. Vor allem bei kleiner Sample-Größe, sowie gut ausgewählten und gut gemessenen Kovariaten kann die Sensitivität des statistischen Tests verbessert werden.
- Die Anzahl der Kovariaten sollte möglichst klein gehalten werden. Geschätzt sollte diese Anzahl < (0.1 x Sample-Größe) - (Anzahl Gruppen -1) sein.
Mögliche Probleme
- Wie bei allen statistischen Tests müssen die Daten vor Verwendung des Test geprüft werden, ob sie die Voraussetzungen für eine korrekte Testdurchführung überhaupt erfüllen.
- Mit der Definition einer Kovariate kann nicht nur ein systematischer (Mess-)Fehler eines Experiments (Bias) korrigiert werden, sondern ein solcher bei Wahl einer "falschen" Variable als Kovariate auch eingeführt werden.
- Im Rahmen von klinischen Studien sollte man aus diesem Grund darauf verzichten. Allfällige äußere "Fehler" werden gerade durch das Mittel der Randomisierung zuverlässig eliminiert, weshalb dies die Methode der Wahl darstellt.
- Die Methode sollte (wie alle statistischen Methoden) nicht ein letztes Rettungsmittel sein, um nach dem Experiment noch eine signifikante Aussage zu "erzwingen". Wenn man von einer kovariaten Variable ausgehen muss, dann soll diese schon beim Design des Experimentes definiert und im Protokoll festgehalten werden.
Wikimedia Foundation.