- Rangskalierung
-
Das Skalenniveau oder Messniveau oder Skalendignität (selten Skalenqualität) ist in der Statistik und Empirie eine wichtige Eigenschaft von Merkmalen bzw. von Variablen. Je nach der Art eines Merkmals bzw. je nachdem, welche Vorschriften bei seiner Messung eingehalten werden können, lassen sich verschiedene Stufen der Skalierbarkeit unterscheiden:
Skalenniveau mögliche logische bzw. mathematische Operationen Beispielvariable (mit ihren Ausprägungen) (zusätzliche) Lageparameter Nominalskala =/≠ Geschlecht (Mann/Frau) Modus Ordinalskala =/≠ ; </> Bundesligatabelle (Rang 1 bis 18) Median Intervallskala =/≠ ; </> ; +/− Temperatur (-100°C bis 100°C) Arithmetisches Mittel Verhältnisskala =/≠ ; </> ; +/− ; ×/÷ Alter (0-99 Jahre) Geometrisches Mittel Absolutskala =/≠ ; </> ; +/− ; × Einwohnerzahl eines Landes Intervall-, Verhältnis- und Absolutskala werden zur Kardinalskala zusammengefasst. Merkmale auf dieser Skala werden dann als metrisch bezeichnet. Nominal- oder ordinalskalierte Merkmale bezeichnet man auch als kategorial.
Das Skalenniveau bestimmt
- die (mathematischen) Operationen, die mit einer entsprechend skalierten Variable zulässig sind. Dabei können Operationen, die bei Variablen eines bestimmten Skalenniveaus zulässig sind, grundsätzlich auch auf Variablen aller höheren Skalenniveaus durchgeführt werden. Ein auf einem bestimmten Niveau skalierbares Merkmal kann auf allen darunter liegenden Skalenniveaus dargestellt werden, jedoch nicht umgekehrt.
- welche Transformationen mit entsprechend skalierten Variablen durchgeführt werden können, ohne Information zu verlieren bzw. zu verändern.
- welche Information das entsprechende Merkmal liefert, welche Interpretationen Ausprägungen des entsprechenden Merkmals zulassen.
Inhaltsverzeichnis
Nominalskala
Niedrigstes Skalenniveau. Für verschiedene Objekte oder Erscheinungen wird mithilfe eines Vergleichs lediglich eine Entscheidung über Gleichheit oder Ungleichheit der Merkmalsausprägung getroffen (z. B. x ≠ y ≠ z). Es handelt sich also nur um qualitative Merkmale (z. B. Blutgruppen oder Geschlecht). Es gilt die Gleichheitsrelation, also kann man entscheiden, ob zwei Ausprägungen gleich oder ungleich sind. Die Werte können aber nicht der Größe nach sortiert werden, im Sinne von "ist größer als" oder "besser als".
Ordinalskala
Für ein ordinal skalierbares Merkmal bestehen Rangordnungen der Art "größer", "kleiner", "mehr", "weniger", "stärker", "schwächer" zwischen je zwei unterschiedlichen Merkmalswerten (z. B. x > y > z). Über die Abstände zwischen diesen benachbarten Urteilsklassen ist jedoch nichts ausgesagt. Meist handelt es sich um qualitative Merkmale, wie z. B. der in der Frage gesuchte "höchste erreichbare Bildungsabschluss". Ein weiteres Beispiel sind die Schulnoten: Note 1 ist besser als Note 2, ich habe aber keine Auskunft darüber, ob der Unterschied zwischen Note 1 und 2 gleichgroß ist wie der zwischen Note 3 und Note 4.
Eine Sonderform der Ordinalskala ist die Rangskala. Hierbei kann jeder Wert nur einmal vergeben werden. Beispielsweise sind die Platzierung von Rängen im Sport, bei andern Leistungsvergleichen oder die natürliche Ordnung, wie sie im Tierreich oft bei Lebewesen vorkommt, die in sozialen Gruppen leben wie z. B. Hühnervögel, daher auch Hackordnung genannt.
Intervallskala
Die Reihenfolge der Merkmalswerte ist festgelegt, und die Größe des Abstandes zwischen zwei Werten lässt sich sachlich begründen. Als metrische Skala macht sie Aussagen über den Betrag der Unterschiede zwischen zwei Klassen. Die Ungleichheit der Merkmalswerte lässt sich quantifizieren (z. B. Temperatur in °C), und es ist erlaubt, Differenzen zu bilden (z. B. x = y - z). Der Nullpunkt und der Abstand der Klassen (Größe der Einheit) sind jedoch willkürlich festgelegt. Hinweis: Bei den metrischen Skalen werden die diskrete (nur ganze Zahlen) und die stetige (auch Kommazahlen) Variante unterschieden.
Verhältnisskala (auch Ratioskala)
Besitzt das höchste Skalenniveau. Bei ihr handelt es sich ebenfalls um eine metrische Skala, im Unterschied zur Intervallskala existiert jedoch ein absoluter Nullpunkt (z. B. Blutdruck, Temperatur in Kelvin, Lebensalter). Einzig bei diesem Skalenniveau sind Multiplikation und Division sinnvoll und erlaubt. Verhältnisse von Merkmalswerten dürfen also gebildet werden (z. B. x = y · z).
Absolutskala
Achtung: Die Division ist bei der Absolutskala nicht erlaubt! Durch Division könnten Zahlen entstehen, die nicht ganze Zahlen sind, was der Definition einer Absolutskala widerspricht. (J.Ludewig, Software Engineering, 2006, S.20)
Grauzonen zwischen den Skalenniveaus
Es existieren Merkmale, die sich nicht genau einem Skalenniveau zuordnen lassen. So könnte sich z. B. bei einem Merkmal nicht sicher belegen lassen, dass es intervallskaliert ist, man ist sich aber sicher, dass es mehr als ordinalskaliert ist. In einem solchen Fall könnte man eine Interpretation auf einer Intervallskala versuchen, diese Annahme aber bei der Interpretation berücksichtigen und dort entsprechend vorsichtig vorgehen. Ein Beispiel dafür ist die Bildung von Durchschnitten bei Schulnoten als Ziffern kodiert, die eigentlich ein ordinalskaliertes Merkmal darstellen, weil sie in festen Begriffen definiert sind z. Z. in Deutschland von sehr gut bis ungenügend.
Andere Beispiele sind Uhrzeiten ohne Angabe des Datums (zirkadiane Daten) oder Himmelsrichtungen. Hier sind wie bei Intervallskalen Abstände interpretierbar, aber anders als bei Intervallskalen liegt keine Ordnung vor (liegt 2:00 Uhr vor oder nach 22:00 Uhr?).
Probleme bei der Skalierung
Im Einzelfall können natürliche Ordnungen auftreten, die sich zwar prinzipiell mit einer bestimmten Skala beschreiben lassen, aber mitunter einzelne Abweichungen enthalten. Ein Beispiel sind Platzierungen bei Sportereignissen (rangskaliert), wo eigentlich jeder Sportler nur einen Platz einnimmt (erster, zweiter, dritter usw.), aber sich seinen Platz mit einem anderen Sportler teilen muss, wenn dieser exakt denselben Messwert erreicht hat. Je nach Reglement kann dann ein höherer oder niedriger gelegener Rang nicht vergeben werden, so dass die Skala eine Leerstelle aufweist, die es sonst nicht gibt (nicht vergebene Silbermedaille bei zwei ersten Plätzen). Hier liegt streng genommen eine auf Rangskalierung gemaßregelte Ordinalskala vor.
Im Tierreich sind Rangskalierungen manchmal nicht stringent, so dass es innerhalb einer aufsteigenden Hackordnung besonders im unteren Skalenbereich zwischengeschaltete Tripletts oder Multiplets gibt, die sich gegenseitig nach dem Schema A>B>C>A "hacken". Man spricht dabei von Intransitivität. Ein solches Phänomen kann auch nicht durch Überführung in Ordinalskalenniveau erschöpfend beschrieben werden und erfordert eine vollständige Darstellung in einer Matrix oder die Zuhilfenahme eines weiteres Merkmals, z. B. Erfolg bei Futterstreit in gefressenem Futtergewicht, sofern ranghöhere Tier stets mehr fressen als rangniedere, was jedoch oft nicht so ist. Die Matrizendarstellung wird deshalb in solchen Fällen der Skalierung vorgezogen, obgleich sie visuell schwerer erfassbar und statistisch aufwändiger zu verwenden ist.
Literatur
- Fahrmeir, L.; Hamerle, A.; Tutz, G. (Hrsg): Multivariate statistische Verfahren; 2., überarbeitete Auflage Berlin, New York; Walter de Gruyter 1996, ISBN 3-11-013806-9
- Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.: Statistik; Der Weg zur Datenanalyse Berlin, Heidelberg, New York; Springer 1999, ISBN 3-540-67826-3
- Kan, S. H.: Metrics and Models in Software Quality Engineering; Second Edition Boston; Pearson Education 2003, ISBN 0-201-63339-6
- Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R.: Multivariate Analysemethoden. Eine anwendungsorientierte Einführung. 11. Aufl., Springer-Verlag, Berlin u. a. 2005, ISBN 3-540-27870-2, S. 4-6
- Ludewig, J., H. Lichter: Software Engineering – Grundlagen, Menschen, Prozesse, Techniken. dpunkt.verlag Heidelberg, 2007. ISBN 3-89864-268-2; [1]
Weblinks
Wikimedia Foundation.