Alpha-getrimmter Mittelwert

Aus StatWiki
Wechseln zu: Navigation, Suche

Der \alpha\,-getrimmte Mittelwert \overline{x}_{tr,\,\alpha} gehört als robuster Schätzer für einen Lageparameter \mu der Grundgesamtheit zu den L-Schätzern. Bei diesem Schätzer werden \alpha\cdot 100\% der kleinsten und \alpha\cdot 100\% der größten Beobachtungswerte bei der Berechnung des Mittelwertes weggelassen. Der Mittelwert wird aus den (1 -2\alpha)\cdot100 \% der "mittleren" Beobachtungswerte berechnet:

\bar{x}_{tr,\,\alpha} = \sum_{i=1}^n w_{(i)}x_{(i)} = \frac{1}{n(1 - 2 \alpha)} \left\{(1 -g)[x_{v + 1} + x_{n - v}] + \sum_{i=v+2}^{n-v-1} x_{(i)} \right\}.

Darin sind:

  • n der Stichprobenumfang,
  • \alpha\, der beidseitig auszuschließende Anteil von Beobachtungswerten mit 0 \leq \alpha < 0,5; er ist nach einer explorativen Datenanalyse der Stichprobenwerte aufgrund des “Verschmutzungsgrades” der Daten festzulegen,
  • v die größte ganze Zahl, für die gilt v \leq n\cdot\alpha, d.h. die Anzahl der auszuschließenden Stichprobenwerte,
  • g der gebrochene Teil der Trimmung: g = \alpha\,n - v,
  • x_{(i)} die geordneten Stichprobenwerte,
  • w_{(i)} die Gewichte bei diesem L-Schätzer

w_{(i)}=\begin{cases} 
0 & \mbox{wenn }i \leq v\\ 
\tfrac{1 - g}{(1 - 2\alpha)n} & \mbox{wenn } i = v +1 \\
\tfrac{1}{(1 - 2\alpha)n} & \mbox{wenn } v + 1 < i < n - v\\
\tfrac{1 - g}{(1 - 2\alpha)n} & \mbox{wenn } i = n - v \\
0 & \mbox{wenn } i \geq n - v + 1
\end{cases}

Die Bedingung für die Gewichte für L-Schätzer werden eingehalten, denn es ist:

  • 0 \leq w_{(i)} \leq 1 für i = 1,..., n und
  • \sum_{i=1}^n w_{(i)} = \frac{v + 1 - \alpha\,n}{(1 -2\alpha)n}\cdot2 + \frac{1}{(1 - 2\alpha)n} \cdot [(n - v - 1) -(v + 1)] = 1.

Es kann auch einseitig getrimmt werden, wobei die Formeln für die Gewichte und den \alpha-getrimmten Mittelwert entsprechend anzupassen sind.


Midmean[Bearbeiten]

Spezialfall des \alpha-getrimmten Mittelwertes mit \alpha=0,25, womit 50% der mittleren Stichprobenwerte in die Berechnung einbezogen werden. Diese 50% mittleren Stichprobenwerte sind diejenigen Werte, die beim Boxplot innerhalb der Box liegen.