Dixon-Test

From Teachwiki
Jump to: navigation, search
Error creating thumbnail: File missing
Please do not cite work from this wiki, since these are mainly students theses which may contain errors!
Error creating thumbnail: File missing

Dieser Artikel wurde in der deutschsprachigen Wikipedia erstellt und in das teachwiki importiert und bearbeitet. Hierbei wurden Änderungen am Artikel von unterschiedlichen Autoren gemacht. Die Versionsgeschichte und Autorenschaft dazu ist im entsprechenden Artikel der deutschsprachigen Wikipedia zu finden.

Template:Begriffsklärungshinweis

Der Dixon-Test, auch genannt Dixon's r-Statistiken, stellt ein statistisches Verfahren zur Identifikation von Ausreißern innerhalb einer Stichprobe dar. Entwickelt vom US-amerikanischen Statistiker Wilfrid Dixon betrachtet er nicht nur die größte oder kleinste Beobachtung der Stichprobe, sondern bezieht zusätzlich noch weitere Werte mit ein, bei denen es sich um potenzielle Ausreißer handeln könnte. Dadurch wird das sogenannte Phänomen der Maskierung verhindert, bei welchem ein Extremwert nicht als Ausreißer erkannt wird, da es weitere extreme Werte gibt, die den Mittelwert bzw. die Streuung in ihre Richtung verfälschen.

Voraussetzungen[edit]

Der Dixon-Test kann nur für univariate Daten verwendet werden. Er gehört in die Gruppe der parametrischen Tests und setzt eine Normalverteilung der Grundgesamtheit voraus. Des weiteren müssen die vorhanden Daten metrisch skaliert sein.

Hypothesen[edit]

Folgende Nullhypothesen werden beim Dixon-Test aufgestellt:

H_{0}(1) \colon \!\ x_{(1)} ist kein Ausreißer
H_{0}(n) \colon \!\ x_{(n)} ist kein Ausreißer

Hierbei bezeichnet x_{(1)} die erste und x_{(n)} die letzte (oder auch kleinste und größte) Beobachtung der Stichprobe, nachdem diese aufsteigend sortiert wurde.

Teststatistiken[edit]

Für die Überprüfung der H_{0}(1) und H_{0}(n) werden folgende Teststatistiken verwendet:

r_{kg}(1) = \frac{x_{(1+k)}-x_{(1)}}{x_{(n-g)}-x_{(1)}}, k = 1,2; g = 0,1,2
r_{gk}(n) = \frac{x_{(n)}-x_{(n-g)}}{x_{(n)}-x_{(1+k)}}, g = 1,2; k = 0,1,2

Hierbei bezeichnet k die Anzahl der als potenzielle Ausreißer mit kleinen Werten identifizierten Beobachtungen und g die der mit großen Werten.

Die H_{0}(1) bzw. H_{0}(1) werden abgelehnt, wenn gilt:

r_{kg}(1) >\!\ r_{kg;n;\alpha}

bzw.

r_{gk}(n) >\!\ r_{gk;n;\alpha}

\alpha gibt hierbei das gewählte Signifikanzniveau an und n bezeichnet die Stichprobengröße.

Kritische Werte[edit]

Kritische Werte für die Teststatistiken mit Stichprobengrößen bis 30 finden sich z.B. bei Dixon(1951).[1] Für kritische Werte bei Stichproben, die mehr als 30 Beobachtungen umfassen, siehe Weblinks. Kritische Werte der Dixon-Tests zum 1% Signifikanzniveau finden sich in folgender Tabelle:[2]

n r_{1 0.n:0,99} r_{1 1.n:0,99} r_{1 2.n:0,99} r_{2 0.n:0,99} r_{2 1.n:0,99} r_{2 2.n:0,99}
6 0,70 0,81 0,93 0,84 0,95 1,00
7 0,64 0,74 0,84 0,78 0,89 0,95
8 0,59 0,68 0,76 0,71 0,83 0,89
9 0,56 0,64 0,70 0,67 0,78 0,84
10 0,53 0,60 0,66 0,63 0,73 0,79
11 0,50 0,57 0,62 0,60 0,68 0,75
12 0,48 0,54 0,59 0,58 0,64 0,70
13 0,47 0,52 0,55 0,56 0,62 0,67
14 0,45 0,50 0,54 0,54 0,59 0,64
15 0,44 0,49 0,52 0,52 0,57 0,62
20 0,39 0,43 0,46 0,46 0,51 0,54
25 0,36 0,39 0,42 0,43 0,46 0,49
30 0,34 0,37 0,39 0,40 0,43 0,46

Beispiel[edit]

Zur Veranschaulichung wird von folgender beobachteter Messreihe (bereits sortiert) ausgegangen:[2]

Bezeichnung der Messung x_1 x_2 x_3 x_4 x_5 x_6 x_7 x_8 x_9 x_{10} x_{11} x_{12}
Messwert (Geschwindigkeit in m/sec) 36 37 39 39 40 40 41 41 41 42 44 46

Überprüft werden soll nun die Nullhypothese, dass es sich bei der größten Beobachtung x_{(1)} nicht um einen Ausreißer handelt, wobei zwei Beobachtungen mit kleinen Werten und eine mit großem Wert als potenzielle Ausreißer in die Teststatistik mit eingehen (k=2, g=1)

r_{gk}(n) = \frac{x_{(12)}-x_{(11)}}{x_{(12)}-x_{(3)}} = \frac {46-44} {46-39} = 0,285 < 0,59 = r_{12,12;0,99}

Das heißt, die Nullhypothese kann auf dem Signifikanzniveau \alpha=0,01 nicht verworfen werden, die Beobachtung mit dem Wert 46 wird nicht als Ausreißer identifiziert.

Einzelnachweise[edit]

  1. Dixon: Ratios involving extreme values in Annals of Mathematical Statistics, Nr. 22, S. 68-78, 1951
  2. 2.0 2.1 Hartung, J.: Statistik - Lehr- und Handbuch der angewandten Statistik, R. Oldenbourg Verlag München Wien, 13. Auflage, München, 2002

Weblinks[edit]

Kritische Werte für den Dixon-Test in "Grundlagen der Statistik" Kategorie: Statistik