Faktorenanalyse mit Mplus - Nach welchen Kriterien bewerten Arbeitnehmer in Deutschland ihren Arbeitsplatz?

From Teachwiki
Jump to: navigation, search

Einleitung

Gerade bei Umfrageanalysen kann es häufig von Interesse sein, nicht nur die einzelnen Antworten der Teilnehmer als solche zu untersuchen, sondern nach allgemeinen Strukturen zu suchen, die sich hinter den Antwortmustern verbergen. Eine statistische Methode für eine solche Suche nach diesen latenten Strukturen stellt die Faktorenanalyse dar. Dieses Analyseverfahren soll im Folgenden auf einen Datensatz angewandt werden, der sich mit der Einschätzung des Berufslebens der arbeitenden Bevölkerung in Deutschland befasst. Außerdem soll ein Augenmerk auf möglichen Unterschieden zwischen Ost- und Westdeutschen liegen.

Datengrundlage

Die in der nachfolgenden Analyse verwendeten Daten entstammen aus der „allgemeinen Bevölkerungsumfrage der Sozialwissenschaften“ (ALLBUS) aus dem Jahr 2006, die seit den 1980er Jahren vom Zentralarchiv für empirische Sozialforschung Köln und vom Zentrum für Umfragen, Methoden und Analysen (ZUMA) in Mannheim im Vierjahresabstand erhoben wird. Sie dient der Gewinnung von repräsentativen Daten aus verschiedenen für die empirische sozialwissenschaftliche Forschung relevanten Bereichen. Die Umfrage besteht aus einem konstanten und einem variablen Fragenprogramm, welches zum Teil mündlich, zum Teil computergestützt durchgeführt wird. In jüngeren Ausgaben des ALLBUS wird dieser ergänzt durch Umfragemodule des International Social Survey Programm (ISSP). Um eine möglichst hohe Repräsentativität der Umfrageergebnisse gewährleisten zu können, werden für die Stichprobenbildung Adressen aus den Einwohnermeldeämtern gezogen. Die Grundgesamtheit bildet entsprechend die erwachsene Wohnbevölkerung in Privathaushalten in Deutschland. In der folgenden Analyse wurde auf Umfragedaten des ISSP-Moduls „Arbeitsorientierung“ zurückgegriffen. Dieses Modul war als Fragebogen zum eigenständigen Ausfüllen konzipiert und wurde von der Hälfte der an dem ALLBUS-Interview teilnehmenden Probanden ausgefüllt. Im ersten Teil des Moduls wurden die Teilnehmer zu ihren allgemeinen abstrakten Vorstellungen des Berufslebens befragt. Im zweiten Abschnitt wurde um eine Einschhätzung der Umfrageteilnehmer bezüglich ihrer aktuellen beruflichen Situation gebeten. In der nachfolgenden Arbeit soll nun die Einschätzung der in Deutschland arbeitenden Bevölkerung bezüglich ihres Berufslebens näher betrachtet werden. Ein Augenmerk soll außerdem auf etwaigen Unterschieden zwischen Personen in Ost- und in Westdeutschland liegen. Aus dem Modul "Arbeitsorientierung" wurden von insgesamt 87, 20 Items ausgewählt. Folgende Aussagen oder Fragen sollten von den Teilnehmern mit Hilfe von 5 bzw. 3 vorgegeben Antworten kommentiert werden.

  • f1: Meine Berufstellung ist sicher.
  • f2: Mein Einkommen ist hoch.
  • f3: Meine Aufstiegsmöglichkeiten sind gut.
  • f4: Meine Tätigkeit ist interessant.
  • f5: Ich kann selbständig arbeiten.
  • f6: In meinem Beruf kann ich anderen helfen.
  • f7: Mein Beruf ist für die Gesellschaft wichtig.
  • f8: Wie oft kommen Sie nach der Arbeit erschöpft nach Hause?
  • f9: Wie oft müssen Sie schwere körperliche Arbeit verrichten?
  • f10: Wie oft finden Sie ihre Arbeit stressig?
  • f11: Wie oft arbeiten Sie unter gefährlichen Bedingungen?
  • f12: Wie autonom sind Sie in Ihrer Zeiteinteilung?
  • f13: Wie autonom sind Sie in Ihrer Arbeitsorganisation?
  • f14: Wie oft beeinträchtigt Ihre Berufstätigkeit Ihr Familienleben?
  • f15: Wie oft beeinträchtigt Ihr Familienleben Ihre Berufstätigkeit?
  • f16: Wie beschreiben Sie das Verhältnis zwischen Vorgesetzen und Mitarbeitern?
  • f17: Wie beschreiben Sie das Verhältnis zwischen Kollegen?
  • f18: Ich bin bereit für den Erfolg meiner Firma/Organisation härter zu arbeiten als ich muss.
  • f19: Ich bin stolz für meine Firma/Organisation zu arbeiten.
  • f20: Ich würde eine andere, besser bezahlte Stelle ablehnen um zu bleiben.

Alle Items sind ordinalskaliert, unterscheiden sich jedoch teilweise bezüglich der Art und Anzahl der Ausprägungen. Es lassen sich diesbezüglich insgesamt vier Kategorien herausstellen:

Die Items f1-f7 und f18-f20 können folgende Ausprägungen annehmen:

  • 1 ≡ Trifft voll und ganz zu
  • 2 ≡ Trifft zu
  • 3 ≡ Weder noch
  • 4 ≡ Trifft nicht zu
  • 5 ≡ Trifft überhaupt nicht zu

Für die Items f8-f11, f14, f15 gilt:

  • 1 ≡ immer
  • 2 ≡ oft
  • 3 ≡ manchmal
  • 4 ≡ selten
  • 5 ≡ nie

f16 und f17 können folgende Ausprägungen annehmen:

  • 1 ≡ sehr gut
  • 2 ≡ reltiv gut
  • 3 ≡ weder noch
  • 4 ≡ relativ schlecht
  • 5 ≡ sehr schlecht


Für f12 und f13 gilt:

  • 1 ≡ absolut unautonom
  • 2 ≡ innerhalb bestimmter Grenzen autonom
  • 3 ≡ völlig autonom

Es wurden 924 berufstätige Personen befragt, davon 479 Männer und 445 Frauen. Da der Proporz von ost- und westdeutschen Befragten nicht der tatsächlichen Verteilung entspricht, beruht die Analyse für Gesamtdeutschland auf gewichteten Daten. (Dem ALLUS-Datensatz ist ein Ost-West-Gewichtungsschlüssel beigefügt, mit dem sich unter SPSS der Datensatz entsprechend gewichten lässt.) Die nach Ost und West getrennte Auswertung beruht natürlich auf ungewichteten Daten.

Fehlende Werte

Ein häufig auftretendes Problem bei der statistischen Auswertung von Fragebögen stellen fehlende Werte, also nicht beantwortete Fragen dar. Auch wenn in diesem Datensatz die Rücklaufquote erstaunlich hoch ist – der Anteil der fehlenden Werte beträgt je nach Item meist zwischen 1-5 Prozent (Abb. 1) – ist es im Vorfeld einer Faktorenanalyse zwingend notwendig, sich diesem Problem anzunehmen.

Abb. 1: Prozentanteil fehlender Werte je Item

Hierzu gibt es eine Reihe unterschiedlicher Methoden. Zunächst wurden die fehlenden Werte durch den entsprechenden bedingten Modus ersetzt. Nachteil dieser Methode ist, dass so allen fehlenden Werten eines Items derselbe numerische Wert zugewiesen wird, was die Streuung der Antwortmuster künstlich verändert. Aus diesem Grund wurde, auf Anraten von Herrn Klinke, auf die ML-Methode zurückgegriffen, um die fehlenden Werte zu schätzen. Für die Berechnung stellte mir Herr Klinke ein R-Programm zu Verfügung, indem der ML-Algorithmus zur Imputierung der fehlenden Werte implementiert war.

Deskriptive Analyse

Obwohl das Hauptanliegen dieses Aufsatzes darin liegt, latente Strukturen mit Hilfe der Faktorenanalyse aufzudecken, ist es zum tieferen Verständnis der Datenbasis sinnvoll einige grundlegende Informationen zu Verteilung und Zusammenhängen der Items mit einfachen statistischen Methoden zu gewinnen.

Univariate Analyse

Zunächst ist es sinnvoll die Antwortmuster der Befragten etwas genauer zu untersuchen, also der Frage nachzugehen, wie sich die Antworten der Umfrageteilnehmer auf die gegebenen Antwortkategorien verteilen. Schon eine einfache grafische Veranschaulichung kann einen Eindruck über die Verteilung geben. In Abb. 2-3 sind die Ausprägungen der Items - gegliedert nach o.g. Ausprägungsmerkmalen - visualisiert.


Abb.2: Antwortmuster Kategorie 1
Abb.3:Antwortmuster Kategorie 2


Es ist ersichtlich, dass die Ausprägungen der Items in den meisten Fällen nicht annähernd gleichverteilt sind. Eine wichtige Erkenntnis ist jedoch, dass sich für keine Variable eine starke Konzentration auf einer einzigen Ausprägung feststellen lässt, was u.U. auf eine unglücklich oder unpassend formulierte Frage schließen würde. Trotzdem wird deutlich, dass das Antwortverhalten in den meisten Fällen relativ homogen ist und sich nur tendenziell unterscheidet. Besonders die Fragen nach der Arbeitsplatzsicherheit (f1), der Höhe des Einkommens (f2) und der Karrierreperspektive (f3) wurden auffällig heterogen beantwortet; interessanterweise die am wenigsten subjektiv zu beantwortenden Fragen. Auf die Interpretation der Verteilung soll im Falle jedes einzelnen Items nicht weiter eingegangen werden. So steht nicht die Interpretation und Auswertung der Umfrage als solches im Zentrum dieses Aufsatzes, sondern vielmehr die Aufdeckung von Zusammenhängen und latenten Strukturen zwischen bzw. „hinter“ den Variablen. Um die grafischen Ergebnisse zu überprüfen empfiehlt sich Bei ordinal- (bzw. kategoriell-) skalierten Variablen die Verwendung von Modus und Entropie. Ist der Modus einer Häufigkeitsverteilung schlicht der Wert der am häufigsten auftritt, also der Wert mit der höchsten Wahrscheinlichkeit, ist die Entropie ein etwas komlizierteres Maß zur Beurteilung der Verteilung. Die Entropie  H einer Häufigkeitsverteilung mit  N Ereignissen ist definiert als

 H = -\sum_{i=1}^N f(x_i) ln(f(x_i)) , wobei f(x_i) der Wahrscheinlichkeit entspricht mit der  x_i eintritt.

Die Entropie stellt für ordinale Daten - ähnlich wie die Varianz für metrische Daten - ein geeignetes Maß zur Streuung von Zufallsvariablen dar. Ein Wert nahe 1 legt eine breite Streuung nahe, wohingegen ein kleiner Wert nahe 0 eine Konzentration um den Modus nahe legt. In Tabelle 1 und 2 sind die Ergebnisse für Gesamtdeutschland bzw. jene jeweils für West- und Ostdeutschland zusammengefasst.

Tabelle 1: Entropie und Modus Gesamtdeutschland
Tabelle 2: Entropie und Modus Ostst- und Westdeutschland


Die Ergebnisse bestätigen im Wesentlichen die aus der grafischen Analyse. So lässt der Modus vielfach eine schiefe Verteilung erkennen. Außerdem nimmt der Wert der Entropie nie einen Wert unter 0,6 an, was nicht für eine starke („problematische“) Konzentration um den Modus spricht. Der Unterschied zwischen Ost- und Westdeutschland ist im Hinblick auf die Entropie als Maß der Streuung nicht signifikant. Auch der Modus unterscheidet sich nur in zwei Fällen (f2, f20), was darauf hindeuten kann, dass die Unterschiede in den Antwortmustern von Ost- und Westdeutschen nicht besonders groß zu sein scheinen. Die unterschiedlichen Modi sollen zum Anlass genommen werden, um die Antwortmuster beider Items getrennt nach Ost- und Westerhebung zu betrachten.

Abb.4: Ost-West-Vergleich des Antwortmusters von f2
Abb.5: Ost-West-Vergleich des Antwortmusters von f20

Im Fall von f2 unterscheidet sich die Verteilung von ost- und westdeutschen Antworten nicht so stark, wie es ein unterschiedlicher Modus vielleicht vermuten lassen könnte. Zwar ist die Häufigste Antwort der Westdeutschen, dass sie eher kein hohes Einkommen haben wohingegen die meisten Ostdeutschen ihr Einkommen weder als hoch noch als niedrig einschätzen. Die Mehrheit aller Deutschen, sowohl im Westen als auch im Osten, sind allerdings bei der Einschätzung ihrer Einkommenshöhe eher pessimistisch. Der auffälligste Unterschied ist, dass insgesamt mehr Westdeutsche ihr Einkommen als hoch einschätzen als Ostdeutsche. Diese etwas breitere Streuung spiegelt sich auch in der Entropie wieder. Für f20 ergibt sich ein etwas anders Bild. Hier sind die Unterschiede zwischen ost- und westdeutschen Befragten offensichtlicher. Ostdeutsche sind offenbar eher bereit zugunsten eines besseren Gehaltangebots ihre Stelle zu wechseln. Wohingegen in Westdeutschland eine auffällig hohe Zahl der Befragten, finanziellen Anreizen zum Trotz, ihrer Firma/Organisation die Treue halten würde.

Bivariate Analyse

Ziel dieser Arbeit ist es, wie erwähnt, die Dimension der Daten – also die Anzahl der manifesten Variablen – zu reduzieren, indem übergeordnete, Variablen zusammenfassende Konstrukte gefunden werden sollen. Hierzu wird die explorative Faktorenanalyse angewandt. Diese latenten Strukturen „hinter“ den Variablen verlangen natürlich, dass entsprechende, ein Konstrukt bildende, Variablen zusammenhängen bzw. korrelieren. Die Abhängigkeit einzelner manifester Variablen untereinander kann also als eine Art Vorraussetzung für die Existenz der latenten Strukturen betrachtet werden, die mit Hilfe der Faktorenanalyse aufgedeckt werden sollen. Um diese Abhängigkeiten aufzudecken empfiehlt sich bei der Analyse kategorieller Daten den (Pearson) Chi-Quadrat-Test anzuwenden.

Chi-Quadrat-Test auf Unabhängiket

Dieser Test testet auf die Unabhängigkeit zweier (ordinalskalierter) Variablen  X_{(1xJ)} und  Y_{(1xK)} . Entsprechend sind die zu testenden Hypothesen formuliert als:

 H_0  : X und Y sind voneinander unabhängig, d.h.  f(X=j,Y=k) = f(X=j) f(Y=k) \forall j,k
 H_1 : X und Y sind nicht unabhängig voneinander, d.h.  f(X=j, Y=k) \neq f(X=j) f(Y=k) \forall j,k

Es kann gezeigt werden, dass sich die Teststatistik zu Überprüfung der Nullhypothese ergibt zu:

 V = \sum_{j=1}^J \sum_{k=1}^K \frac{(h_{jk} - \hat{e_{jk}})^2} \hat{e_{jk}}

Wobei  h_{jk} der beobachteten absoluten Häufigkeit entspricht und  \hat{e_{jk}} der erwarteten absoluten Häufigkeit, unter der Annahme das die Nullhypothese hält, entspricht.

Es kann weiterhin gezeigt werden, dass die Teststatistik für große Sample approximativ \chi^2-Verteilt ist mit (J-1)(K-1) Freiheitsgraden. Die Verteilungsannahme kann allerdings nur aufrecht erhalten werden, wenn folgende zwei Annahmen erfüllt sind

  • \hat{e_{jk}} > 1 \forall j,k
  • Mindestens 20% der \hat{e_{jk}} sind kleiner als 5

Die Resultate des Tests für die manifesten Variablen sind in Tabelle 3 zusammengefasst.


Die Ergebnisse verdeutlichen, dass die Hypothese der Unabhängigkeit für alle gültigen Teststatistiken weithin abgelehnt werden kann. Zwar reagiert der Chi-Quadrat-Test empfindlich auf die Samplegröße – d.h. bei kleinen Samples ist der Wert der Teststatistik eher zu hoch geschätzt, vice versa – doch wird die Unabhängigkeit in diesem Fall so klar abgelehnt, dass selbst deutliche Über- bzw. Unterschätzungen an dem Ergebnis kaum etwas ändern würden. Aus diesem Grund wird an dieser Stelle auf andere Maßgrößen des Zusammenhangs – wie Kontingenz- und Unsicherheitskoeffizient, Kendalls Tau u.a. – verzichtet. Analog zu dem gesamtdeutschen Datensample wurden die in Ost- und Westdeutschland erhobenen Daten separat auf Unabhängigkeit getestet. Die Nullhypothese der Unabhängigkeit wird allerdings ebenfalls deutlich abgelehnt.

Explorative Faktorenanalyse (EFA)

Die Faktorenanalyse der ordinalskalierten Variablen steht im Mittelpunkt dieser Arbeit. Da es sich bei den zu analysierenden Items nicht um stetige, sondern um ordinal skalierte manifeste Variablen handelt, wird zum Aufdecken der Konstrukte ein spezielles modellbasiertes Verfahren angewandt. Aus diesem Grund soll auch auf eine Einführung in die explorative Faktorenanalyse stetiger Variablen verzichtet werden und ausschließlich auf die verwendete Methode eingegangen werden. Bei der folgenden Analyse soll auf den in Mplus implementierten Ansatz der Underlying Variables zurückgegriffen werden.

Underlying Variables – Ansatz

Grundannahme dieses Ansatzes ist es, dass jede ordinalskalierte (kategorielle) Variable x_i mit m_i Kategorien durch eine zugrundeliegende (underlying), unbeobachtbare, stetige Variable  x_i^* generiert wird. Diese zugrundeliegenden Variablen sind multivariat normalverteilt mit \mu_i und \sigma_i^2. Die Verbindung zwischen x_i und x_i^* ist folgende:

Für die Variable x_i existieren m_i -1 Schwellenwerte: \tau_{i(1)}, \dots, \tau_{i(m_i-1)} und es gilt:
x_i=s <=> \tau_{i(s-1)}<x_i^*\leq \tau_{i(s)} (s=1,2,\dots,m_i)

wobei

\tau_{i(0)}=-\infty, \tau_{i(1)}<\tau_{i(2)}<,\dots,<\tau_{i(m_i-1)},\tau_{i(m_i)} = +\infty

Analog zum Ansatz der Faktorenanalyse wird x_i^* als Linearkombination der latenten Variablen y_i, der Faktorladungen \alpha_{iq}^* sowie den Residuen e_i formuliert:

x_i^* =\alpha_{i1}^*y_1 + \alpha_{i2}^*y_2 +\dots+\alpha_{iq}^*y_q+ e_i

unter den weiteren Annahmen, dass

- die latenten Variablen standardnormalverteilt sind, d.h. y_i ~ N(0,1).
- die Residuen unabhängig und Normalverteilt mit Mittelwert 0 und Varianz \sigma_i^2.


Die Schätzung der Parameter dieses Modells geschieht in drei Schritten:

1. Zunächst werden die \tau_i aus den univariaten Randverteilungen der beobachtbaren Werte der x_i geschätzt.
2. Dann wird die bivariate Korrelation der Underlying Variables x_i^* via ML geschätzt (polychoric correlation).
3. Die polychoric correlation Matrix dient als Grundlage zur Schätzung des Faktorlmodells, welches nun mittels gewöhnlicher Faktorenanalyse geschätzt werden kann. Als Schätzmethode empfehlen Muthen & Muthen (2007) WLSMV (weighted least squares mean and variance adjusted).

Ergebnisse der explorativen Faktorenanalyse

Da, wie festgestellt, die Ausprägungen (Antworten) der Items nicht unabhängig voneinander sind, sollten sich gemeinsame Faktoren „hinter“ den Daten verbergen. Im Folgenden sind die Ergebnisse der explorativen Faktorenanalyse - durchgeführt mit Mplus - zusammengefasst.

Tabellen 4-6 zeigen die Eigenwerte der (polychorischen) Korrelationsmatrix der Datensamples. Die Anzahl der Faktoren wurde nach dem standartgemäßen Kriterium ermittelt, dass die Anzahl der Faktoren auf die Anzahl der Eigenwerte größer 1 beschränkt. Nach diesem Kriterium wurden für den gesamt- sowie für den west- und ostdeutschen Datensatz 7 Faktoren ermittelt.

In Tabellen 7-9 sind die signifkanten Ladungen a_{iq} (> 0,5) der einzelnen Items auf die entsprechenden Faktoren für den gesamten und die gesplitteten Umfragedaten dargestellt. Abgesehen von f20 sind die Ladungen hinreichend hoch. Es handelt sich bei der Ladungsmatrix um eine bereits rotierte Version. Die verwendete Varimax-Rotation ist ein Rotationsverfahren, das die Faktoren so lange „dreht“, bis dass die Varaianz der Ladungsquadrate maximiert wird, so dass höhere und niedrigere Ladungen deutlicher hervortreten.

Tab.7: Gesamt

Auffällig ist, dass alle Items – in jedem Fall (Gesamt, Ost, West) - nur auf einen einzigen Faktor signifikant hoch laden, dies erleichtert die entsprechende Interpretation der Faktoren.


Modellgüte

Der Chi-Quadrat-Test verwirft natürlich die Hypothese, dass die gegebene Anzahl der Faktoren die Daten vollständig erklärt. In dem 7-Faktormodell steht dem entsprechenden Wert der \chi^2-Verteilung (Geamt: 352/West: 233 / Ost: 120) der aus 54 (West 49 / Ost 46) Freiheitsgraden resultierende kritische Wert (95%) von \approx 30 gegenüber. Da der Chi-Quadrat-Anpassungstest testet, ob das spezielle Modell exakt in der Grundgesamtheit gilt, werden Modelle die nur approximativ in der Grundgesamtheit gelten stets falsifiziert (wie in diesem Fall geschehen). Aus diesem Grund ist es sinnvoller zur Beurteilung der Modellgüte eher etwaige Approximationsfehler zu betrachten. Eine solche Maßzahl stellt der Root Mean Square Error of Approximation (RMSEA) dar.

 RMSEA: \sqrt{\frac{\chi^{2}/df-1}{N-1}}

Wobei df die Freiheitsgrade und N die Stichprobengröße beziffert. Diese Kennzahl ist robust gegenüber der Stichprobengröße und kann nach Brown & Cudeck (1993) nach folgender Daumenregel interpretiert werden:

  • RMSEA \leq 0,05: Die Anpassung ist gut und das Modell kann bestätigt werden.
  • 0,05 \leq RMSEA \leq 0,08: Die Anpassung ist mäßig und das Modell wird tendenziell bestätigt.

Der RMSEA aller drei Stichproben legt in jedem Fall zumindest eine mäßige Modellanpassung nahe (Gesamt: 0,077, West: 0,078, Ost: 0,072) und kann so die via EFA geschätzten Modelle tendenziell bestätigen. Eine anderes Maß zur Beurteilung der Modellgüte ist die Wurzel des mittleren quadrierten Residuums (Root Mean square Residual: RMR). Hierbei handelt es sich um die Größe des geschätzten durchschnittlichen Residuums. Mit einem Wert von 0,03 in allen drei Fällen bestätigt das RMR das geschätzte Modell als ausreichend gut.

Interpretation der Faktoren

Da die Ladungen der Items jeweils nur auf einem Faktor signifikant sind, wird die Interpretation stark erleichtert. Auch bei der einzelnen Betrachtung der nach Ost und West getrennten Umfragedaten ergeben sich nur geringe Abweichungen zur gesamtdeutschen Analyse. Im Unterschied zur für Gesamtdeutschland durchgeführten EFA (s.u.) lädt f10 („Wie oft finden Sie ihre Arbeit stressig?“) im Falle Westdeutschlands signifikant hoch auf den Faktor 6 („Physische und Gesundheitliche Auswirkungen der Arbeit“). In der separat für Ostdeutschland durchgeführten EFA lädt f8 („Wie oft kommen Sie nach der Arbeit erschöpft nach Hause?“) stärker auf den Faktor 7 („Psychische Auswirkungen und Einschränkungen des Privatlebens“). Außerdem lädt hier f5 („Ich kann selbständig arbeiten.“) fast gleichermaßen stark auf zwei Faktoren: Faktor 4 („Gesellschaftliche und persönliche Bedeutung der Arbeit“) und Faktor 5 („Selbstbestimmung im Arbeitsleben“). Da sich entsprechende Ladungen der Items im Sinne beider Faktoren sehr gut interpretieren lassen, handelt es sich bei diesen Abweichungen nicht um einen grundlegenden qualitativen, die Interpretation der Faktoren ändernden Unterschied. Deshalb wird im Folgenden auch nur die Interpretation der Faktoren für den gesamtdeutschen Datensatz betrachtet.

Faktorinterpretation für die mit dem gesamtdeutschen Datensatz durchgeführten EFA:

  • Faktor 1: „Materielle Sicherheit und Karriereperspektive“
„Meine Berufststellung ist sicher.“ (f1)
„Mein Einkommen ist hoch.“ (f2)
„Meine Aufstiegsmöglichkeiten sind gut.“ (f3)
  • Faktor 2: „Zwischenmenschliche Situation am Arbeitsplatz“
„Wie beschreiben Sie das Verhältnis zwischen Vorgesetzen und Mitarbeitern?“ (f16)
„Wie beschreiben Sie das Verhältnis zwischen Kollegen?“ (f17)
  • Faktor 3: „Identifikation mit der Organisation/Firma“
„Ich bin bereit für den Erfolg meiner Firma/Organisation härter zu arbeiten als ich muss.“ (f18)
„Ich bin stolz für meine Firma/Organisation zu arbeiten.“ (f19)
„Ich würde eine andere, besser bezahlte Stelle ablehnen um zu bleiben.“ (f20)
  • Faktor 4: „Gesellschaftliche und persönliche Bedeutung der Arbeit“
„Meine Tätigkeit ist interessant.“ (f4)
„Mein Beruf ist für die Gesellschaft wichtig.“ (f6)
„In meinem Beruf kann ich anderen helfen.“ (f7)
  • Faktor 5: „Selbstbestimmung im Arbeitsleben“
„Ich kann selbständig arbeiten.“ (f5)
„Wie autonom sind Sie in Ihrer Arbeitsorganisation?“ (f12)
„Wie autonom sind Sie in Ihrer Zeiteinteilung?“ (f13)
  • Faktor 6: „Physische und Gesundheitliche Auswirkungen der Arbeit“
„Wie oft kommen Sie nach der Arbeit erschöpft nach Hause?“ (f8)
„Wie oft müssen Sie schwere körperliche Arbeit verrichten?“ (f9)
„Wie oft arbeiten Sie unter gefährlichen Bedingungen?“ (f11)
  • Faktor 7: „Psychische Auswirkungen und Einschränkungen des Privatlebens“
„Wie oft finden Sie ihre Arbeit stressig?“ (f10)
„Wie oft beeinträchtigt Ihre Berufstätigkeit Ihr Familienleben?“ (f14)
„Wie oft beeinträchtigt Ihr Familienleben Ihre Berufstätigkeit?“ (f15)

Konfirmatorische Faktorenanalyse (KFA)

Die konfirmatorische Faktorenanalyse hat keine Datenreduktion zum Ziel, sondern sie prüft ein theoretisch fundiertes Modell auf Übereinstimmung mit den zugrundeliegenden Daten. Im Gegensatz zur explorativen Analyse laden die Items ausschließlich auf einen vorgegeben Faktor. Das Modell – also die freien Parameter (factor scores) – werden unter Mplus mit Hilfe eines Probit-Regressionsverfahrens geschätzt. D.h. via Probit-Regressionen werden die beobachtbaren ordinalen Variablen (Faktorindikatoren) auf die latenten metrischen Variablen (Faktoren) regressiert; die geschätzten factor scores sind also Probit-Regressionskoeffizienten und auch als solche zu interpretieren. Als Schäzter des Modells wird unter Mplus standartgemäß WLSMV angewandt.

Ergebnisse der konfirmatorischen Faktorenanalyse

Im Falle Gesamt- und Westdeutschlands verläuft die konfirmatorische Faktorenanalyse anhand der durch die EFA vorgegebenen Faktormodelle reibungslos. Im Falle des für Ostdeutschland durch die EFA konzipierten Faktormodells gelingt die Bestätigung durch die KFA nicht. Unter Mplus konvergiert selbst unter Berücksichtung entsprechender Startwerte das Modell nicht. Aus diesem Grund wurde die Faktorzahl auf ein Modell mit nur noch sechs Faktoren reduziert. Hierzu wurden die Faktoren „Gesellschaftliche und persönliche Bedeutung der Arbeit“ und „Selbstbestimmung im Arbeitsleben“ zu dem vereinheitlichten Faktor „ Außen- und Innenwahrnehmung der Arbeit“ zusammengefasst. Die Ergebnisse der Parameterschätzung, sowie die kritischen Werte sind in Tabellen 10-12 dargestellt.

Tab.10: Gesamt

Für die Schätzung der Parameter muss für jedes Konstrukt ein Startwert vorgeben sein, der unter Mplus standartgemäß den Wert 1 annimmt. In der ersten Spalte finden sich die geschätzten Koeffizienten, in der zweiten der Standartfehler und in der dritten die Division aus beidem. Der letztgenannte Term ist deshalb von Relevanz, da er der Teststatistik entspricht, welche die Nullhypothese testet, dass der geschätzte Parameter gleich Null ist. Die Teststatistik folgt einer standardisierten Normalverteilung mit Erwartungswert 0 und Varianz 1. In allen Fällen kann die Nullhypothese auf einem Signifikanzniveau von 1% verworfen werden, so dass alle geschätzten Parameter signifikant ungleich von Null sind.

Modellgüte

Natürlich wird auch hier die Hypothese des Chi²-Anpassungstest in allen Fällen verworfen. Auch der RMSEA (Gesamt: 0,1, West: 0,097, Ost: 0,13) deutet nicht auf ein gutes Schätzmodell hin. Der RMR, ein Indiz auf praktische (nicht statistische) Signifikanz (Vgl. Langer 2002) bewertet in seiner standardisierten Form das Modell positiver, da in allen Fällen der Wert unter 0,11 liegt (Gesamt: 0,074, West: 0,069, Ost: 0,1).

Eine weitere Maßzahl zur Beurteilung der Modellgüte stellen CFI (Comparative-Fit-Index) und TLI (Tucker-Lewis-Index) dar. Der erstgenannte vergleicht das gegebene Modell mit einem Modell mit unkorrelierten Variablen (Nullmodell) und errechnet sich wie folgt:

CFI=1-\frac{max[(\chi^{2}_{1}-df_1),0]}{max[(\chi^{2}_{0}-df_0),(\chi^{2}_{1}-df_1),0]}

Bei einem Wert nahe 1 kann von einem guten Modell gesprochen werden. Vorteil dieser Maßgröße ist, dass der CFI robust ist gegenüber der Stichprobengröße und Verletzungen der Verteilungsannahme. Nachteil ist allerdings, dass der Wert empfindlich auf die Komplexität des Modells reagiert, so dass komplexere Modelle eher zu gut bewertet werden und weniger komplexere zu schlecht. Für die betrachteten Modelle ergibt sich für alle ein CFI von etwa 0,8, was zumindest ein akzeptables Ergebnis attestiert. Der TLI ist wie der CFI robust gegenüber Verteilungsverletzungen und ähnelt sich auch in der Interpretation. Allerdings ist der Index nicht sonderlich robust gegenüber der Stichprobengröße. Er berechnet sich aus:

TLI=\frac{\chi^{2}_{0}/df_{0}-\chi^{2}_{1}/df_{1}}{\chi^{2}_{0}/df_{0}-1}

Im Gegensatz zum CFI reagiert der TLI weniger empfindlich auf die Komplexität des Modells. So dass, beide Indizes zur Beurteilung des „Overall-fits“ herangezogen werden sollten. Ein TLI von ungefähr 0,9 für alle Modelle spricht ebenfalls von einer zumindest akzeptablen Qualität.

Die KFA kann also durchaus das aus der EFA theoretisch fundierte Faktormodell bestätigen.

Fazit

Es konnte mittels Faktorenanalyse gezeigt werden, dass sich in der betrachteten Umfrage hinter den Antworten zu sehr spezifischen Fragen über das Berufs- und Arbeitsleben allgemeine (latente) Bewertungskriterien des Arbeitsplatzes verbergen. So lassen sich sieben verschiedene Kategorien erkennen nach denen Befragte Personen ihren Arbeitsplatz bewerten. Bei der separaten Betrachtung von Ost- und Westdeutschland konnte trotz kleiner Differenzen kein eindeutiger Unterschied festgestellt werden. Diese durch die EFA herausgestellten Konstrukte lassen sich im wesentlichen auch durch die KFA bestätigen.

Literatur

  1. Browne, M.W., Cudeck, R: Alternative ways of assessing model fit, 1993 In: Langer, W.: Skript Lisrel-Modelle, 2002
  2. Härdle, W., Simar, L.: Applied Multivariate Satistics, 2002
  3. Langer, W.: Skript Lisrel-Modelle, 2002
  4. Muthen, L., Muthen, B.: Mplus User guide, 2007
  5. Rönz, B.: Skript Generalisierte Lineare Modelle, 2001
  6. Rönz, B.: Skript Computergestützte Statistik II, 2000
  7. Wikipedia (2007), wikipedia.org

Kommentare

  • ein paar links zu ALLBUS etc. wären möglich gewesen
  • warum die Betonung, dass auf mein "Anraten hin ..."?
  • warum steht im Text "meist zwischen 1-5 Prozent", wenn doch die Grafik etwas anderes zeigt?
  • Entropie - Mass für die Konzentration nicht Streuung!
  • Womit wurde die Nichtsignifikanz der Entropie zwischen Ost und West nachgewiesen?
  • Tabelle 3 etwas unleserlich
  • Bei den Eigenwerte wäre die Faktorzahl Extraktion nach Horn besser gewesen, insbesondere da Faktor 2 nur 2 Items enthält
  • Wie wurden die signifikanten Ladungen festgelegt? Konkret: welcher Test?
  • Was ist WLSMV?
  • Sehr schön zu lesen