Stamm-Blatt-Diagramm

From Teachwiki
Jump to: navigation, search
Error creating thumbnail: File missing
Please do not cite work from this wiki, since these are mainly students theses which may contain errors!
Error creating thumbnail: File missing

Dieser Artikel wurde in der deutschsprachigen Wikipedia erstellt und in das teachwiki importiert und bearbeitet. Hierbei wurden Änderungen am Artikel von unterschiedlichen Autoren gemacht. Die Versionsgeschichte und Autorenschaft dazu ist im entsprechenden Artikel der deutschsprachigen Wikipedia zu finden.

Das Stamm-Blatt-Diagramm (auch Zweig-Blätter- oder Stängel-Blatt-Diagramm[1] sowie in englischer Sprache stem-and-leaf plot oder stemplot) ist ein halbgrafisches Werkzeug der deskriptiven und explorativen Statistik, um Häufigkeitsverteilungen darzustellen.

Diese einfache Veranschaulichung von Häufigkeitsverteilungen, die auf John W. Tukey zurückgeht, ist vor allem für metrische Variablen und nicht allzu große Datensätze geeignet. Der Vorteil des Stamm-Blatt-Diagramms , z.B. gegenüber dem Histogramm, ist, dass die Darstellung der Werte jeder einzelnen Beobachtung mit gewünschter Genauigkeit erhaltenbleibt. Es ist daher transparenter und weist einen höheren Informationsgehalt auf. Aus einem Stamm-Blatt-Diagramm lassen sich statistische Kennzahlen wie Modalwert, Median und Quantile ablesen. Auch Ausreißer kann man im Stamm-Blatt-Diagramm erkennen.Allerdings stößt diese Art der Darstellung bei einer großen Zahl von Merkmalen an ihre Grenzen.

Aufbau[edit]

Das Stamm-Blatt-Diagramm zeigt die numerischen Werte einer Variablen. Das Diagramm besteht aus zwei Spalten. Die linke Spalte enthält als „Stämme“ (Stem) die Äquivalenzklassen/Intervalle, in die die auf der rechten Seite als „Blätter“ (Leafs) dargestellten Merkmale eingeteilt werden. Typisch ist eine Klassenbildung nach dem Dezimalsystem, aber auch andere Unterteilungen sind möglich, zum Beispiel die ersten beiden Ziffern als Stamm zu wählen. Als Daumenregel für die Anzahl der Äquivalenzklassen gilt 10 \cdot \log_{10}(n), wobei n die Anzahl der Datensätze ist.

Allgemein wird ein Stamm-Blatt-Diagramm folgendermaßen erstellt[2]: 1. Zuerst wird der Datenbereich in Intervalle gleicher Breite gegliedert. Die Anzahl der Intervalle ist den vorliegenden Daten anzupassen. Als Faustregel lässt sich sagen, dass ca. 10 bis 25 Intervalle sinnvoll sind. 2. Nun wird die erste Ziffer der Daten im jeweiligen Intervall links als Stamm abgetragen. Dabei ist zu beachten, dass die erste Ziffer eine (implizite) Null sein kann. 3. Zur Eintragung der „Blätter“ werden die Datenwerte auf die nächste Stelle nach dem Stamm gerundet (oder trunkiert). Die sich so ergebenden Werte an dieser Stelle werden einzeln der Größe nach geordnet linksbündig neben dem jeweiligen Stamm abgetragen. Wenn sehr viele Datenwerte vorhanden sind, kann man auch dazu übergehen, dass einzelne Blätter mehrere Fälle repräsentieren.

Damit die Blätter auch gut die Anzahl der Datenwerte veranschaulichen, ist es sinnvoll, die Darstellung in einer Monospace-Schrift vorzunehmen, also einer Schrift, in der alle Zeichen (plus der sie umgebende Raum) gleich breit sind (bspw. Courier, im Gegensatz zu einer Proportionalschrift wie etwa der Times Roman).[3]


Beispiel[edit]

Eine Messreihe hat folgende, schon geordnete, Daten ergeben:

0,3 0,4 2,5 2,5 2,6 2,7 2,8 3,5 3,7

Wählt man die Natürlichen Zahlen als Klasseneinteilung, ergibt sich folgendes Stamm-Blatt-Diagramm. Damit das Diagramm korrekt gelesen werden kann, ist die Angabe der zur Erstellung verwendeten Einheit wichtig[4]:

3 | 5 7
2 | 5 5 6 7 8
1 |
0 | 3 4
Einheit = 0,1

Mit einem modifizierten Stamm-Blatt-Diagramm lassen sich zwei Verteilungen visuell vergleichen. Angenommen, es gäbe eine zweite Messreihe mit folgenden Daten:

0,4 1,2 1,8 2,1 2,1 2,9

Nun kann man diese auf die linke Seite des "Stamms" schreiben:

      | 3 | 5 7
1 1 9 | 2 | 5 5 6 7 8
  2 8 | 1 |
    4 | 0 | 3 4
Einheit = 0,1

Einzelnachweise[edit]

  1. Template:Literatur
  2. Uwe Wagschal: Statistik für Politkwissenschaftler. Oldenbourg München 1999.
  3. Internet-Lexikon der Methoden der empirischen Sozialforschung (ILMES): http://www.lrz.de/~wlm/ilm_s33.htm
  4. Bernd Rönz, Hans G. Strohe (1994), Lexikon Statistik, Gabler Verlag, S. 344

Literatur[edit]

  • Dankwart Vogel, Gertrud Wintermantel: Explorative Datenanalyse - Statistik aktiv lernen, Handreichungen für den Lehrer. Ernst Klett Verlag, ISBN 3-12-720049-8
  • Felix Brosius: SPSS 16. Das mitp-Standardwerk. Mitp Bonn 2008
  • Uwe W. Gehring; Cornelia Weins: Grundkurs Statistik für Politologen und Soziologen. VS Verlag 2009.
  • Volker Müller-Benedict: Grundkurs Statistik in den Sozialwissenschaften. VS Verlag 2006.
  • Rönz, B.: Skript Computergestützte Statistik I, Humboldt-Universität zu Berlin, Wirtschaftswissenschaftliche Fakultät, Institut für Statistik und Ökonometrie.2001.
  • Uwe Wagschal: Statistik für Politkwissenschaftler. Oldenbourg München 1999.
  • Internet-Lexikon der Methoden der empirischen Sozialforschung (ILMES): http://www.lrz.de/~wlm/ilm_s33.htm


Weblinks[edit]

Kategorie:Diagramm Kategorie:Deskriptive Statistik

en:Stemplot eu:Zurtoin-eta-hosto diagrama no:Stilk-og-blad plott pl:Szereg rozdzielczy tl:Balangkas tangkay-at-dahon tr:Dal Yaprak Grafikleri