Levene-Test

From Teachwiki
Jump to: navigation, search
Error creating thumbnail: File missing
Please do not cite work from this wiki, since these are mainly students theses which may contain errors!
Error creating thumbnail: File missing

Dieser Artikel wurde in der deutschsprachigen Wikipedia erstellt und in das teachwiki importiert und bearbeitet. Hierbei wurden Änderungen am Artikel von unterschiedlichen Autoren gemacht. Die Versionsgeschichte und Autorenschaft dazu ist im entsprechenden Artikel der deutschsprachigen Wikipedia zu finden.

Der Levene-Test ist ein statistischer Signifikanztest, der die Gleichheit der Varianzen (Homoskedastizität) von zwei oder mehr Grundgesamtheiten (Gruppen) überprüft. Im Gegensatz zum F-Test (der die Varianz zweier Grundgesamtheiten überprüfen kann) kann der Levene-Test die Varianzhomogenität in mehreren Gruppen überprüfen. Außerdem ist der Levene-Test robust gegenüber der Verletzung der Annahme der Normalverteilung der Daten. Mit Hilfe des Levene-Tests wird in einigen statistischen Tests (z.B. ANOVA oder T-Test) die Annahme der Varianzhomogenität überprüft.

Homoskedastizität liegt vor, da die Größe der Balken, die die Streung der Beobachtungen in jeder der drei Gruppen j um den jeweiligen Gruppenmittelwert angibt, gleich ist.


Der Levene-Test prüft die Nullhypothese, dass alle Gruppenvarianzen gleich sind. Die Alternativhypothese lautet demnach, dass mindestens ein Gruppenpaar ungleiche Varianzen besitzt (Heteroskedastizität):

Nullhypothese: H_0: \sigma^2_1=\sigma^2_2=\ldots=\sigma^2_m

Alternativhypothese: H_1:\sigma^2_j\neq\sigma^2_k für mindestens ein Gruppenpaar j{,}\;k mit j \neq k.

Voraussetzungen[edit]

  • Es gibt m\geq2 Grundgesamtheiten mit den Zufallsvariablen X_1,\ldots,X_m. Auf diese Weise wird die Gleichheit mehrerer Grundgesamtheiten geprüft. (Beim F-Test können wir lediglich die Gleichheit der Varianzen aus 2 Grundgesamtheiten überprüfen.)
  • Die Zufallsvariablen X_1,\ldots,X_m haben in den Grundgesamtheiten stetige Verteilung (Die Normalverteilungsannahme ist nicht unbedingt nötig.)
  • Die Zufallsvariablen X_1,\ldots,X_m sind unabhängig voneinander.
  • Aus jeder Grundgesamtheit wird eine einfache Zufallsstichprobe (X_{1;1},\ldots X_{1,n_{1}} bzw. X_{m;1},\ldots X_{m,n_{m}}) gezogen. Die Stichprobenvariablen in jeder Zufallsstichprobe werden somit identisch verteilt, besitzen die gleiche Verteilungsfunktion wie die Zufallsvariable in der Grundgesamtheit und sind unabhängige Zufallsvariablen. Die Stichprobenumfänge n_1,n_2,\ldots ,n_m müssen nicht gleich sein.
  • Die Stichproben sind unabhängig voneinander.

Teststatistik[edit]

Die Teststatistik des Levene-Tests zieht die absoluten Abweichungen der Stichprobenvariablen  X_{ji}   (j=1,\ldots,m; i=1, \ldots,n_j) vom Mittelwert der jeweiligen Stichprobe \bar{X}_j heran:

Y_{j,i}=|X_{j,1}-\bar{X}_j| mit j=1,\ldots,m und i=1,\ldots,n_j


Die Levene-Teststatistik setzt die Summe der Abweichungsquadrate zwischen den Stichproben (Ausdruck im Zähler), die durch unterschiedliche Zugehörigkeiten zu den Gruppen zustandekommen, ins Verhältnis zur Summe der Abweichungsquadrate innerhalb der Stichproben (Ausdruck im Nenner). Dieses Vorgehen ist äquivalent zum Vorgehen bei der einfaktoriellen Varianzanalyse/ANOVA, dabei werden die Unterschiede in den Varianzen (ANOVA) durch die Unterschiede der Mittelwerte dargestellt:

L=\frac {\frac {\sum_{j=1}^{m}n_j(\bar{Y}_j-\bar{Y})^2}{m-1}}{\frac {\sum_{j=1}^m \sum_{i=1}^{n_{j}}(Y_{j,i}-\bar{Y}_j)^2}{n-m}},

wobei

  • \bar{Y}_j=\frac{1}{n_j}\sum_{i=1}{n_j}Y_{j,i} mittlere absolute Abweichungen der jeweiligen Stichprobe/Gruppe,
  • \bar{Y}=\frac{1}{n}\sum_{j=1}^{m}n_j\bar{Y}_j Mittelwert über alle absoluten Abweichungen und
  • n=\sum_{j=1}^{m}n_j Summe aller Beobachtungen über alle Stichproben bezeichnen.


Mit der Teststatistik L \, wird überprüft, ob die Stichproben aus den Grundgesamtheiten (Verteilungen) mit gleichen mittleren Abweichungen stammen.

Die Teststatistik L \, folgt unter Gültigkeit der H_0 \, einer F-Verteilung mit f_1=m-1 \, und f_2=n-m \, Freiheitsgraden. Die Nullhypothese wird verworfen, wenn L>F_{m-1,n-m;1-\alpha} \, ist.

Hierbei sind F_{m-1,n-m;1-\alpha} \, das (1-\alpha) \,-Quantil der F-Verteilung mit (m-1, n-m) \, Freiheitsgraden und \alpha \, das vorgegebene Signifikanzniveau. Alternativ wird die Nullhypothese abgelehnt, wenn sich der Signifikanzwert des Tests unter einem zuvor bestimmten Niveau befindet.

Interpretation[edit]

Bei der Annahme der Alternativhypothese können wir schließen, dass die Stichproben aus den Grundgesamtheiten (Verteilungen) mit verschiedenen Varianzen stammen. Bei der Nichtablehnung der H_0 \, heißt es, dass es für die vorliegenden Daten auf dem vorgegebenen Signifikanzniveau \alpha \, statistisch nicht bewiesen werden konnte, dass die Stichproben aus den Grundgesamtheiten mit verschiedenen Varianzen stammen.

Quellen[edit]

Einzelnachweise[edit]

  • Howard Levene (1960): Robust tests for equality of variances. In: Ingram Olkin, Harold Hotelling et al (Hrsg.): Contributions to Probability and Statistics: Essays in Honor of Harold Hotelling, S. 278-292, Stanford University Press.
  • Jürgen Janssen, Wilfried Laatz (2007): Statistische Datenanalyse mit SPSS für Windows. 8. Auflage. Springer Verlag, S. 246.

Literatur[edit]

  • Biostatistik (2008): Eine Einführung für Biowissenschaftler. (2008). München: Pearson Studium. S. 150-154.
  • Rönz B.(2001): Computergestützte Statistik I, vorlesungsbegleitendes Skript.