Die Rezension zu dem Wikipedia-Artikel „Ausreißer“

From Teachwiki
Jump to: navigation, search

Kategorie: Statistik > Deskriptive Statistik > Ausreißer

Der Artikel scheint auf den ersten Blick informativ genug zu sein. Der Begriff „Ausreißer“ wird definiert und wichtigste Definitionen, wie „Erwartung“ dargestellt. Einige Begriffe, die schwer für Nicht-Statistiker sein könnten werden erklärt mit Hilfe von entsprechenden Links zu anderen Wikipedia Einträgen (wie z.B. Erwartungswert oder Quantilabstand). Die Graphiken in dem Artikel gehören nicht zu den besten. Die Bilder sind zu klein, beinhalten keine Beschriftung von Achsen und befinden sich auf Positionen, die das Lasen schwer machen. In dem Boxplot wird angedeutet, dass ein Ausreißer nur in den unteren Teil vorkommen. Das kann zu Fehler führen. Die Entdeckung von Ausreißern mit Hilfe von Steam-and-Leaf Plot wird nicht angesprochen. Das macht den Artikel nicht vollständig und arm an Darstellung von Möglichkeiten den Ausreißer zu identifizieren.


Im weiteren Teil wird ein Beispiel von einem Messfehler angesprochen. Damit wird der Artikel mehr Praxisbezogen und stellt nicht nur „trockene“ Theorie dar. Das Teil „Ausreißertests“ zeigt mit welchen Methoden man testen kann, ob ein Wert ein Ausreißer ist. Im Vergleich zu dem Skript werden in dem Artikel nur vier Arten von verschiedenen Tests vorgestellt. In dem Artikel fehlen solche Tests wie Grubbs/Beck Test und David-Hartley-Pearson-Test. Zusätzlich wird in dem Artikel der Ausreißertest nach Nalimov vorgestellt. Dieses Test befindet sich nicht in unserem Vorlesungsskript. In weiteren Teil werden Andrews Kurven und Stahel-Donoho Outlyingness präsentiert. In beiden Fällen werden Formeln benutzt. Die Formeln sind groß genug und befinden sich an den richtigen Stellen. Sowohl bei Andrews Kurven als auch bei Stahel-Donoho fehlt eine graphische Repräsentation von der entsprechenden Methode.


Was fehlt in dem Artikel ist die Vorgehensweise, nachdem die Ausreißer identifiziert werden. Der Artikel sollte verschiedene Möglichkeiten (z.B. Eliminierung, Ersetzung, Ausreißerabschätzung) besprechen. Das Teil „Ausreißererkennung im Data Mining“ ist sehr kurz. Das Thema ist sehr interessant und zukunftsorientiert. Es sollte erweitert werden und als separates Wiki-Artikel existieren.
Wie schon anfangs angedeutet, auf den ersten Blick scheint der Artikel informativ genug zu sein. Das ändert sich, wenn man das Thema „Ausreißer“ länger studiert. Es fehlen einige Methoden und Graphiken. Die existierende Bilder sind schwer zu analysieren. Für den Anfang ist der Artikel ausreichend. Ein Wikipedia-Artikel sollte aber mehr und genauere Informationen beinhalten.