Skalenniveau

From Teachwiki
Jump to: navigation, search
DIN 4844-2 Warnung vor einer Gefahrenstelle D-W000.png
Please do not cite work from this wiki, since these are mainly students theses which may contain errors!
DIN 4844-2 Warnung vor einer Gefahrenstelle D-W000.png

Dieser Artikel wurde in der deutschsprachigen Wikipedia erstellt und in das teachwiki importiert und bearbeitet. Hierbei wurden Änderungen am Artikel von unterschiedlichen Autoren gemacht. Die Versionsgeschichte und Autorenschaft dazu ist im entsprechenden Artikel der deutschsprachigen Wikipedia zu finden.

Das Skalenniveau oder Messniveau oder Skalendignität (selten Skalenqualität) ist in der Statistik und Empirie eine wichtige Eigenschaft von Merkmalen bzw. von Variablen. Skalen sind eine Art „Messlatte“ für Merkmalsausprägungen. Die Methode und Art einer Analyse hängt sehr von der jeweiligen Skala ab, die die Ausprägungen eines statistischen Merkmals erfasst. In der deskriptiven Statistik existieren folgende hierarisch geordneten Skalen: Nominalskala, Ordinalskala, Intervallskala, Verhältnisskala und Absolutskala. Je höher eine Skala in der Hierarchie, desto mehr mathematischen Operationen sind anwendbar.

Skalenniveau log./math. Operationen Beispiel (zusätzliche) Lageparameter
Nominalskala =/≠ Geschlecht (Mann/Frau) Modus
Ordinalskala =/≠ ; </> Schulnoten ("sehr gut" bis "ungenügend") Median
Kardinalskala
Intervallskala =/≠ ; </> ; +/− Zeitskala (Datum) Arithmetisches Mittel
Verhältnisskala =/≠ ; </> ; +/− ; ×/÷ Alter (0-99 Jahre) Geometrisches Mittel

thumb|400px|Skalenniveaus im Vergleich; rot: Die auf dem jeweiligen Skalenniveau neu hinzugekommenen Eigenschaften. nominal: nur Häufigkeiten, ordinal: Reihenfolge, intervall: Abstände, verhältnisskaliert: Nullpunkt

Intervall- und Verhältnisskala werden zur Kardinalskala zusammengefasst. Merkmale auf dieser Skala werden dann als metrisch bezeichnet. Nominal- oder ordinalskalierte Merkmale bezeichnet man auch als kategorial.

Das Skalenniveau bestimmt

  • die (mathematischen) Operationen, die mit einer entsprechend skalierten Variable zulässig sind. Dabei können Operationen, die bei Variablen eines bestimmten Skalenniveaus zulässig sind, grundsätzlich auch auf Variablen aller höheren Skalenniveaus durchgeführt werden. Ein auf einem bestimmten Niveau skalierbares Merkmal kann auf allen darunter liegenden Skalenniveaus dargestellt werden, jedoch nicht umgekehrt.
  • welche Transformationen mit entsprechend skalierten Variablen durchgeführt werden können, ohne Information zu verlieren bzw. zu verändern.
  • welche Information das entsprechende Merkmal liefert, welche Interpretationen Ausprägungen des entsprechenden Merkmals zulassen.

Geschichte der Einteilung[edit]

„Skalen können danach klassifiziert werden, welche Transformationen für sie zulässig sind.“[1] Diese Klassifikation von Skalen sei aber nicht unumstritten, Kritik hierzu finde man vor allem bei Prytulak (1975)[2] und Duncan (1984:119-156)[3].[1] „Da es unendlich viele zulässige Transformationen einer bestimmten Skala gibt, könnten prinzipiell auch unendlich viele verschiedene Skalenniveaus unterschieden werden. Die meist verwendete Klassifikation geht auf STEVENS (1946)[4] zurück. Dieser unterscheidet Nominal-, Ordinal-, Intervall- und Ratioskalen“[1]. Eine detailliertere Klassifikation zum Beispiel von Narens und Luce (1986)[5] oder von Orth (1974)[6] enthalte meist noch eine "Log-Intervallskala" zwischen der Intervall- und der Ratioskala. Bei einer Log-Intervallskala sind noch Potenztransformationen (x'= s * xr; mit s und r größer 0) zulässig."[1]

Marks (1974)[7] versucht die Möglichkeiten verschiedener Skalenniveaus systematisch zu erfassen. Er schlägt dazu eine allgemeine Transformationsfunktion vor, in der drei Konstanten frei gewählt werden können. Die Konstanten können jeweils entweder positiv (+) oder Null (0) sein. Null zeigt an, dass eine Skalentransformation hier zu einem Informationsverlust führen würde. Ein Pluszeichen zeigt an, dass eine solche Transformation ohne Informationsverlust möglich wäre. Die von ihm vorgeschlagene allgemeine Formel lautet: x'=(a+1)x(b+1)+c

Beispielsweise müssten für eine Intervallskala die Konstanten a positiv, b null, c positiv sein. Damit ergibt sich für eine Intervallskala die Lineartransformation als allgemein zulässige Transformationsregel: x'=ax+b

Dementsprechend kommt Marks auf folgende 8 Skalen, wobei zu sehen ist, dass die Aussagekraft steigt, während gegenläufig die Transformationsmöglichkeiten ohne Informationsverlust abnehmen:

(engl.) Skalenbezeichnung a b c Anzahl zulässiger Transformationen Aussagekraft
Ordinal + + + 3 0
Hyperordinal 0 + + 2 1
Interval + 0 + 2 1
Log interval + + 0 2 1
Difference 0 0 + 1 2
Power 0 + 0 1 2
Ratio + 0 0 1 2
Absolute 0 0 0 0 3

Nominalskala[edit]

Die Nominalskala besitzt das niedrigste aller Skalenniveaus. Sie ist im eigentlichen Sinne keine Skala, sondern die Mess“werte“ sind vielmehr bloße Namen. Für verschiedene Objekte oder Erscheinungen wird mithilfe eines Vergleichs lediglich eine Entscheidung über Gleichheit oder Ungleichheit der Merkmalsausprägung getroffen (z. B. x ≠ y ≠ z). Es handelt sich also nur um qualitative Merkmale. Es gilt die Gleichheitsrelation, also kann man entscheiden, ob zwei Ausprägungen gleich oder ungleich sind. Die Werte können aber nicht der Größe nach sortiert werden, im Sinne von "ist größer als" oder "besser als".

Beispiele einer Nominalskala sind Geschlecht, Religion, Blutgruppe und Nationalität. Schließen sich die Ausprägungen eines Merkmals gegenseitig aus, ist das Merkmal dichotom (z.B Geschlecht: 0=männlich, 1=weiblich) oder binär (z.B.: 1=rot, 2=blau, 3=grün, 4=gelb) . Können auf der anderen Seite für eine Ausprägung eines Merkmals mehrere Einheiten beobachtet werden, ist das Merkmal häufbar (z.B. erlernter Beruf: eine Person kann mehrere Berufe erlernt haben).

Für Nominalskalierungen können lediglich unterschiedliche Merkmalsausprägungen bestimmt werden sowie die Häufigkeit berechnet werden (Modus). Andere Lageparameter sind hier nicht anwendbar.

Ordinalskala[edit]

Ordinale Skalen besitzen eine Rangordnung und stehen somit eine Stufe über den nominalen Skalen. Über die Abstände zwischen diesen benachbarten Urteilsklassen ist jedoch nichts ausgesagt. Meist handelt es sich um qualitative Merkmale, wie z. B. der in der Frage gesuchte "höchste erreichbare Bildungsabschluss". Ein weiteres Beispiel sind die Schulnoten: Note 1 ist besser als Note 2, ich habe aber keine Auskunft darüber, ob der Unterschied zwischen Note 1 und 2 gleichgroß ist wie der zwischen Note 3 und Note 4. . Ebenso sind militärische Dienstgrade, Intelligenz oder Erdbebenstärken ordinal skaliert.

Mit ordinalskalierten Daten kann zusätzlich zum Modus der Median und der Quartilabstand bestimmt werden. Ein Durchschnittswert ist hier dagegen nicht interpretierbar.

Eine Sonderform der Ordinalskala ist die Rangskala. Hierbei kann jeder Wert nur einmal vergeben werden. Beispielsweise sind die Platzierung von Rängen im Sport, bei andern Leistungsvergleichen oder die natürliche Ordnung, wie sie im Tierreich oft bei Lebewesen vorkommt, die in sozialen Gruppen leben wie z. B. Hühnervögel, daher auch Hackordnung genannt.

Intervallskala[edit]

Die Intervallskala gehört zu den metrischen Skalen. Die Reihenfolge der Merkmalswerte ist festgelegt, und die Größe des Abstandes zwischen zwei Werten lässt sich sachlich begründen. Als metrische Skala macht sie Aussagen über den Betrag der Unterschiede zwischen zwei Klassen. Die Ungleichheit der Merkmalswerte lässt sich durch Differenzbildung quantifizieren (z. B. beim Datum könnte das Ergebnis lauten, "drei Jahre früher"). Der Nullpunkt ("nach Christi Geburt") und der Abstand der Klassen (Jahre oder Monde) sind jedoch willkürlich festgelegt. Ein typisches Beispiel für eine Intervallskala ist die Temperaturmessung in Celsius. Die Temperaturdifferenz zwischen 10°C und 20°C ist genauso groß wie zwischen 40°C und 50°C. Die Celcius- Skala besitzt jedoch keinen natürlichen Nullpunkt. 0°C ist ein willkürlich festgelegter Nullpunkt.

Hinweis: Bei den metrischen Skalen werden die diskrete (nur ganze Zahlen) und die stetige Variante (auch Kommazahlen) unterschieden.

Bei Intervallskalen können die Lageparameter Modus, Median und das arithmetische Mittel (Durchschnittswert) bestimmt werden. Desweiteren lassen sich die Standardabweichung, die Kovarianz, die Korrelation und die Regression anwenden.

Verhältnisskala (auch Ratioskala)[edit]

Die Verhältnisskala besitzt das höchste Skalenniveau. Bei ihr handelt es sich ebenfalls um eine metrische Skala mit gleich großen Abständen zwischen den Ausprägungen, im Unterschied zur Intervallskala existiert jedoch ein absoluter Nullpunkt (z. B. Blutdruck, absolute Temperatur, Lebensalter, Längenmaße). Einzig bei diesem Skalenniveau sind Multiplikation und Division sinnvoll und erlaubt. Verhältnisse von Merkmalswerten dürfen also gebildet werden (z. B. x = y · z).

Bei der Verhältnisskala können die Lageparameter Modus, Median sowie das arithmetische Mittel (Durchschnittswert) bestimmt werden und die Standardabweichung, die Kovarianz, die Korrelation und die Regression können angewandt werden. Im Gegensatz zur Intervallskala kann bei der Verhältnisskala jedoch noch zusätzlich das geometrische Mittel benutzt.

Grauzonen zwischen den Skalenniveaus[edit]

Eine Sonderstellung bei den Skalen nimmt die Likert-Skala ein, bei der die Antwortmöglichkeiten meistens von „stimme gar nicht zu“ bis „stimme absolut zu“ oder von „trifft gar nicht zu“ bis „trifft absolut zu“ reichen. Offiziell ist die Likert-Skala eine Ordinalskala, da nicht grundsätzlich davon ausgegangen werden kann, dass der Befragte die Abstände der einzelnen Antwortmöglichkeiten als äquidistant ansieht. Um jedoch mehr Möglichkeiten bei der späteren Analyse der Daten zu erhalten, können die Antwortmöglichkeiten symmetrisch formuliert werden, in dem sie zum Beispiel durchnummeriert werden. In diesem Fall kann die Likert-Skala dann als quasi-metrisch bezeichnet werden und somit wie eine Intervallskala behandelt werden.

Es existieren noch weitere Merkmale, die sich nicht genau einem Skalenniveau zuordnen lassen. So könnte sich z. B. bei einem Merkmal nicht sicher belegen lassen, dass es intervallskaliert ist, man ist sich aber sicher, dass es mehr als ordinalskaliert ist. In einem solchen Fall könnte man eine Interpretation auf einer Intervallskala versuchen, diese Annahme aber bei der Interpretation berücksichtigen und dort entsprechend vorsichtig vorgehen. Ein Beispiel dafür ist die Bildung von Durchschnitten bei Schulnoten als Ziffern kodiert, die eigentlich ein ordinalskaliertes Merkmal darstellen, weil sie in festen Begriffen definiert sind z. Z. in Deutschland von sehr gut bis ungenügend.

Andere Beispiele sind Uhrzeiten ohne Angabe des Datums (zirkadiane Daten) oder Himmelsrichtungen. Hier lassen sich innerhalb von Teilbereichen Werte ordnen und Abstände messen und mit einer entsprechenden Beschränkung für die Größe von Abständen lassen sich sogar beliebig viele Abstände sinnvoll (genauer: ‘eindeutig’) addieren. Ohne eine Beschränkung gilt das nicht mehr (“liegt 2:00 Uhr vor oder nach 22:00 Uhr?” – “sowohl als auch”).

Probleme bei der Skalierung[edit]

Im Einzelfall können natürliche Ordnungen auftreten, die sich zwar prinzipiell mit einer bestimmten Skala beschreiben lassen, aber mitunter einzelne Abweichungen enthalten. Ein Beispiel sind Platzierungen bei Sportereignissen (rangskaliert), wo eigentlich jeder Sportler nur einen Platz einnimmt (erster, zweiter, dritter usw.), aber sich seinen Platz mit einem anderen Sportler teilen muss, wenn dieser exakt denselben Messwert erreicht hat. Je nach Reglement kann dann ein höherer oder niedriger gelegener Rang nicht vergeben werden, so dass die Skala eine Leerstelle aufweist, die es sonst nicht gibt (nicht vergebene Silbermedaille bei zwei ersten Plätzen). Hier liegt streng genommen eine auf Rangskalierung gemaßregelte Ordinalskala vor.

Im Tierreich sind Rangskalierungen manchmal nicht stringent, so dass es innerhalb einer aufsteigenden Hackordnung besonders im unteren Skalenbereich zwischengeschaltete Tripletts oder Multiplets gibt, die sich gegenseitig nach dem Schema A>B>C>A "hacken". Man spricht dabei von Intransitivität. Ein solches Phänomen kann auch nicht durch Überführung in Ordinalskalenniveau erschöpfend beschrieben werden und erfordert eine vollständige Darstellung in einer Matrix oder die Zuhilfenahme eines weiteres Merkmals, z. B. Erfolg bei Futterstreit in gefressenem Futtergewicht, sofern ranghöhere Tier stets mehr fressen als rangniedere, was jedoch oft nicht so ist. Die Matrizendarstellung wird deshalb in solchen Fällen der Skalierung vorgezogen, obgleich sie visuell schwerer erfassbar und statistisch aufwändiger zu verwenden ist.

Einzelnachweise[edit]

  1. 1.0 1.1 1.2 1.3 Rainer Schnell, Paul Hill, Elke Esser: Methoden der empirischen Sozialforschung 2. Auflage, R. Oldenburgverlag München, Wien, 1989, ISBN 3-486-21463-2, S. 137 (8. Auflage online)
  2. L. S. Prytulak: Critique of S. S. Stevens´Theory of Measurement Scales classification in: Perceptual and Motor Skills, 1975 (41, 3, 28).
  3. vermutlich folgender Artikel: O. D. Duncan: Notes on Social Measurement. Historical and Critical, New York, 1984c
  4. S. S. Stevens: On the Theory of Scales of Measurement. In: Science, 1946 (103, S.677-680), online.
  5. L. Narens und R. D. Luce,: Measurement: The Theory of Numerical Assignments. In: Psychological Bulletin, 1986 (99, 2, S.166-180), online
  6. B. Orth: Einführung in die Theorie des Messens. Stuttgart, Berlin, Köln, Mainz 1974
  7. Lawrence E. Marks: Sensory Processes: The New Psychophysics, New York: Academic Press, 1974, S. 247-249

Literatur[edit]

  • Fahrmeir, L.; Hamerle, A.; Tutz, G. (Hrsg): Multivariate statistische Verfahren; 2., überarbeitete Auflage Berlin, New York; Walter de Gruyter 1996, ISBN 3-11-013806-9
  • Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.: Statistik; Der Weg zur Datenanalyse Berlin, Heidelberg, New York; Springer 1999, ISBN 3-540-67826-3
  • Kan, S. H.: Metrics and Models in Software Quality Engineering; Second Edition Boston; Pearson Education 2003, ISBN 0-201-63339-6
  • Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R.: Multivariate Analysemethoden. Eine anwendungsorientierte Einführung. 11. Aufl., Springer-Verlag, Berlin u. a. 2005, ISBN 3-540-27870-2, S. 4-6
  • Template:Literatur
  • Eckstein, P.P. Repetitorium Statistik: Deskriptive Statistik-stochastik-induktive Statistik. Mit Klausuraufgaben und Lösungen. 6. Auflage. Gabler Verlag, 2006ISBN 978-8349-0464-5

Template:Navigationsleiste Skalenniveaus

Kategorie:Messdatenerfassung

en:Level of measurement he:סולם מדידה ja:尺度水準 es:Niveles_de_medida pt:Escala (estatística) zh:标量类别