David-Hartley-Pearson-Test

From Teachwiki
Jump to: navigation, search
Error creating thumbnail: File missing
Please do not cite work from this wiki, since these are mainly students theses which may contain errors!
Error creating thumbnail: File missing

Dieser Artikel wurde in der deutschsprachigen Wikipedia erstellt und in das teachwiki importiert und bearbeitet. Hierbei wurden Änderungen am Artikel von unterschiedlichen Autoren gemacht. Die Versionsgeschichte und Autorenschaft dazu ist im entsprechenden Artikel der deutschsprachigen Wikipedia zu finden.

Template:Begriffsklärungshinweis

Der David-Hartley-Pearson-Test wurde 1954 von den Statistikern H.A. David, H.O. Pearson und E.S. Pearson entwickelt.[1] Er stellt ein statistisches Verfahren zur Identifikation von Ausreißern dar und überprüft konkret, ob es wahrscheinlich ist, dass ein beobachteter Extremwert(der kleinste oder der größte) tatsächlich zu einer Stichprobe gehört oder dass es sich um einen Ausreißer handelt.

Voraussetzungen[edit]

Um Aussagen über die Zugehörigkeit eines extremen Beobachtungswerts zu einer Stichprobe treffen zu können, setzt der David-Hartley-Pearson-Test die Normalverteilung der zugrundeliegenden Grundgesamtheit voraus, es handelt sich also um einen parametrischen Test. Des weiteren müssen die vorhanden Daten metrisch skaliert sein.

Hypothese[edit]

Folgende Nullhypothesen werden beim David-Hartley-Pearson-Test aufgestellt:

H_{0}(1) \colon \!\ x_{(1)} ist kein Ausreißer
H_{0}(n) \colon \!\ x_{(n)} ist kein Ausreißer

Hierbei bezeichnet x_{(1)} die kleinste und x_{(n)} die größte Beobachtung der Stichprobe.

Teststatistik[edit]

Für die Überprüfung der H_{0}(1) und H_{0}(n) wird folgende Teststatistik verwendet:

T = \frac{R}{s} = \frac{x_{(n)} - x_{(1)}} {\sqrt{\frac{\sum_{i=1}^n (x_{(i)} - \overline{x} )^2} {n-1} }}

Hierbei wird die Nullhypothese unter dem Signifikanzniveau \alpha nicht verworfen, wenn gilt:

Q_{L;n;\alpha} \le T \le Q_{U;n;\alpha}

Hierbei bezeichnet Q_{L;n;\alpha} den unteren und Q_{U;n;\alpha} den oberen kritischen Wert. Wird die Nullhypothese verworfen, so wird der Extremwert, der den größten Abstand vom Mittelwert hat, als Ausreißer identifiziert. Liegen kleinster und größter Wert im selben Abstand zum Mittelwert, so gelten beide als Ausreißer.[2]

Kritische Werte[edit]

Umfangreiche Tabellen mit kritischen Werten für den David-Hartley-Pearson-Test finden sich bei David et al. (1954)[1]. Eine Auswahl dieser wird in folgender Tabelle dargestellt:[2]

n Q_{n;0,95} Q_{n;0,99}
3 2,00 2,00
4 2,43 2,45
5 2,75 2,80
6 3,01 3,10
7 3,22 3,34
8 3,40 3,54
9 3,55 3,72
10 3,69 3,88
12 3,91 4,13
15 4,17 4,43
20 4,49 4,79
30 4,89 5,25
40 5,15 5,54
50 5,35 5,77
100 5,90 6,36

Beispiel[edit]

Zur Veranschaulichung wird von folgender beobachteter Messreihe (bereits sortiert) ausgegangen:[2]

Bezeichnung der Messung x_1 x_2 x_3 x_4 x_5 x_6 x_7 x_8 x_9 x_{10} x_{11} x_{12}
Messwert (Geschwindigkeit in m/sec) 36 37 39 39 40 40 41 41 41 42 44 46

Aus diesen Daten ergibt sich für die Teststatistik:

R = x_{12} - x_{1} = 46 - 36 = 10 und s = \sqrt{\frac {1} {11} \sum_{i=1}^n (x_{i} - \overline x)^2 } = 2,74,

sodass

T = \frac {R} {s} = \frac {10} {2,74} = 3,65 < 4,13 = Q_{12;0,99}

Damit lässt sich die Nullhypothese nicht verwerfen und weder der größte noch der kleinste Wert werden als Ausreißer identifiziert (auf dem Signifikanzniveau \alpha = 0,01).

Einzelnachweise[edit]

  1. 1.0 1.1 David, H.A., Hartley, H.O., Pearson, E.S.: The distribution of the ratio, in a single, normal sample, of range to standard deviation in Biometrika, Nr. 41, S. 482-493, 1954
  2. 2.0 2.1 2.2 Hartung, J.: Statistik - Lehr- und Handbuch der angewandten Statistik, R. Oldenbourg Verlag München Wien, 13. Auflage, München, 2002

Kategorie:Statistik