Zur Nutzerwahrnehmung von Privatsphäre-Aspekten in einem Online-Social-Network

From Teachwiki
Jump to: navigation, search

Contents

Einleitung[edit]

Online-Social-Networks (OSN) werden für viele Internetnutzer zu einem immer wichtigeren Mittel der Kommunikation und Selbst-Repräsentation durch das Austauschen von Nachrichten, Chats und der Veröffentlichung von Statusmeldungen und Fotos auf der eigenen Profilseite. Der beliebteste Anbieter - die amerikanische Plattform Facebook - agiert dabei länderübergreifend und ist in der Lage die durch die fortschreitende kulturelle Globalisierung entstandenen Kontakte und sozialen Netzwerke abzubilden. Es wurde bislang angenommen, dass der Wettbewerb um die Nutzerbasis darüber entschieden werden konnte, inwiefern eine OSN in der Lage ist, kulturelle Besonderheiten zu adressieren. Im Gegensatz dazu ist aber eine länderübergreifende Plattform wie Facebook gerade deshalb so erfolgreich, da sie kulturelle Besonderheiten nivelliert und einen einheitlichen, "globalisierten" Zugang anbietet. Autoren wie Krasnova et al. (2008; 2009) argumentieren weiterhin, dass der Erfolg eines OSN wesentlich durch das Ausmaß der Nutzerpartizipation bestimmt wird. Damit wird deutlich, dass ein OSN nur dann mittel- bis längerfristigen Erfolg hat, wenn ein OSN die Interaktion der Nutzer untereinander befördert. Nichts desto trotz ist es eine heikle Angelegenheit, Nutzer zu motivieren private Informationen online zu teilen, denn die Nutzer werden sich mehr und mehr des privaten Charakters ihrer preisgegebenen Informationen bewusst. Die durch die Benutzung von OSN entstehende Möglichkeit des Missbrauchs solcher Informationen durch andere Mitglieder, aber auch den Betreiber eines OSN ist groß und die Mitglieder von OSN nutzen mittlerweile verstärkt die technologischen Möglichkeiten der Einschränkung des Zugriffs auf private Daten oder reduzieren das Ausmaß ihrer Aktivitäten auf einer Plattform - das schlechteste Szenario für einen OSN-Betreiber.

Eine empirische Untersuchung der Nutzerwahrnehmung von Privatsphäre-Aspekten kann dabei aus verschiedenen Perspektiven vorgenommen werden - wie etwa der Analyse des Trade-Offs zwischen dem antizipierten Nutzen der Teilnahme in einem OSN und der gleichzeitigen Wahrnehmung von Risiken durch die mögliche Verletzung der Privatsphäre. Das impliziert, das die Mitglieder eines OSN in der Lage sind, die Chancen und Grenzen ihrer Aktivitäten auf einem OSN abzuschätzen (Dinev und Hart 2006). Im Fokus dieser Arbeit soll dagegen ein interkultureller Blickwinkel die Dynamiken hinter der Wahrnehmung von Privatsphäre-Aspekten in einer riskanten Umgebung wie einem OSN ausgelotet werden.

Konzeptueller Hintergrund und Studiendesign[edit]

Die vom Institut für Wirtschaftsinformatik der Humboldt-Universität zu Berlin in Kooperation mit der University of Tampa, Florida durchgeführte empirische Studie untersucht die Wahrnehmung von Privatsphäre-Aspekten anhand der folgenden theoretischen Konzepte:

  • Vertrauen in den Anbieter ("Trust Facebook") und Vertrauen in andere OSN-Mitglieder ("Trust Facebook Members") sowie das Wissen über den Umgang mit privaten Informationen ("Knowledge") (Dwyer et al. 2007) als direkte Einflussfaktoren des Teilens von Informationen in OSN,
  • weiterhin Aspekte der Sorge um die Verletzung der Privatsphäre ("Privacy Concerns") (Krasnova et al. 2009),
  • und der Glaube an die Effektivität legaler Strukturen - konzeptualisiert als Vertrauen in die Wahrung rechtlicher Regelungen ("Legal Assurance")(McKnight et al. 2002).

Diese bereits empirisch validierten Konzepte werden zur Konstruktion des Fragebogens verwendet (Anhang). Um mögliche Unterschiede in der Nutzerwahrnehmung von Privatsphäre-Aspekten entlang verschiedener Einflussfaktoren zu untersuchen, wird ein englischsprachiger Online-Fragebogen verwendet, bei dem jedes Konstrukt - das mehrere Items enthält - über eine 7-stufige Skala gemessen wird. In den meisten Fällen wird eine Likert-Skala verwendet mit: 1 = Starke Ablehnung; 2 = Ablehnung; 3 = Leichte Ablehnung; 4 = Neutral; 5 = Leichte Zustimmung; 6 = Zustimmung; 7 = Starke Zustimmung. Die für das Konstrukt Aspekte der Sorge um die Verletzung der Privatsphäre verwendete Skala entspricht in ihrer Dimensionierung der Likert-Skala mit 1 = Überhaupt nicht besorgt bis 7 = Sehr stark besorgt.

Als weitere demografische Variablen für die folgende Analyse sind das anonymisierte Erhebungsland (1, 2, 3) und das Geschlecht der Befragten verfügbar.

Die Stichprobe umfasst Facebook-Nutzer aus drei Ländern. Die Daten sind online erhoben worden im Verlauf von jeweils einer Woche in der zweiten Hälfte des Jahres 2009 (N = 541). Von den Befragten stammen 36% aus Land 1; 25% aus Land 2 und 39% aus Land drei. 42% der Befragten sind männlich und 58% weiblich (N = 537).

Probleme für die statistische Analyse der über den Online-Fragebogen gewonnenen Daten resultieren aus der Nicht-Repräsentativität der Stichprobe: Aussagen die im Verlauf der statistischen Analyse gewonnen werden, sind nur auf die Stichprobe selbst anwendbar und lassen keine Rückschlüsse auf die Grundgesamtheit aller Facebook-Nutzer in den jeweiligen Ländern zu. Im Rahmen des englischsprachigen Forschungsfeldes "Information Systems" ist dies allerdings eine gängige Vorgehensweise, um Einstellungen und Wahrnehmungen des Nutzerverhaltens in Interaktion mit einer Informationstechnologie zu untersuchen.

Forschungsfragen und Analyse[edit]

Auf der Grundlage dieses länderübergreifenden Datensets zur Wahrnehmung von Privatsphäre-Aspekten im OSN Facebook beabsichtigt die vorliegende Arbeit die explorative Auslotung von drei Forschungsfragen:

  1. Wie gestaltet sich allgemein die Wahrnehmung der Nutzer von Privatsphäre-Aspekten auf Facebook länderübergreifend? In welchem Ausmaß nehmen die Nutzer dabei einen möglichen Datenmissbrauch war und in welchen erhobenen Einstellungen zeigt sich dies besonders?
  2. Welche Unterschiede in den der Nutzerwahrnehmung von Privatsphäre-Aspekten treten bei Unterscheidung der verschiedenen Erhebungsländer sowie Geschlecht auf?
  3. Kann länderübergreifend eine Abhängigkeit des Wissens darüber, wie Facebook mit den privaten Informationen umgeht, vom Vertrauen in andere Facebook-Nutzer und des Vertrauens in die Wahrung rechtlicher Regelungen durch Facebook nachgewiesen werden?

Die Beantwortung dieser Forschungsfragen wird durch den Einsatz verschiedener statistischer Verfahren erfolgen. Für die Bearbeitung der ersten Forschungsfrage wird eine Faktorenanalyse mit Hauptachsen-Extraktionsverfahren durchgeführt. Daran setzt eine Reliabilitätsanalyse von aus den Faktoren zugeordneten Items in Form von synthetischen Variablen an, die anschließend Basis für die Berechnung der entsprechenden reliablen Skalen über die Mittelwerte der Summenscores ist. Anhand dieser gemittelten Summenscores werden deskriptive Statistiken erzeugt, die schließlich Auskunft über die allgemeine, länderübergreifende Nutzerwahrnehmung von Privatsphäre-Aspekten auf Facebook geben. Die Beantwortung der zweiten Forschungsfrage erfolgt über den Vergleich der Lagemaße wie Mittelwert und zentrale Tendenz der berechneten Skalen, differenziert nach Ländern und Geschlecht. Für die Beantwortung der dritten Forschungsfrage wird eine lineare Regressionsanalyse auf der empirischen Grundlage der eingangs gewonnenen Skalen durchgeführt. Abschließend werden Resultate und Einschränkungen des Einsatzes der verwendeten statistischen Methoden diskutiert.

Länderübergreifende Untersuchung der Nutzerwahrnehmungen[edit]

Die Untersuchung der ersten Forschungsfrage beginnt mit der Durchführung einer Faktorenanalyse, die als geeignete Methode erscheint die Nutzerwahrnehmungen länderübergreifend zu erfassen, da sie eine Vielzahl von Einflussfaktoren (Variablen) untersucht. Eines der Hauptaufgaben hierbei ist die Herausstellung voneinander unabhängiger Einflussfaktoren (Faktoren) aus der Vielzahl der Erklärungsvariablen zur weiteren Verwendung in folgenden Analysen im Sinne einer Datenreduktion. Das Vorgehen bei der Durchführung einer Faktorenanalyse gestaltet sich dabei wie folgt (Backhaus et al. 2003: 268):

  1. Variablenauswahl und Errechnung der Korrelationsmatrix;
  2. Extraktion der Faktoren;
  3. Bestimmung der Kommunalitäten;
  4. Zahl der Faktoren;
  5. Faktorintepretation;
  6. Bestimmung der Faktorwerte.

Vor der Auswahl der Variablen und Errechnung der Korrelationsmatrix muss jedoch geklärt werden, mit welchem Extraktionsverfahren die Faktoren im zweiten Schritt generiert werden. Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden, wobei zwei Verfahren von besonderer Bedeutung sind, deren Unterscheidung eng mit der im dritten Schritt erfolgenden Bestimmung von Kommunalitäten zusammenhängt: die Hauptkomponenten-Analyse und die Hauptachsenanalyse. Die Unterschiede zwischen beiden Verfahren werden bei der Kommunalitätenschätzung deutlich: Die Hauptkomponenten-Analyse geht davon aus, dass die Varianz einer Ausgangsvariablen vollständig durch die Extraktion von Faktoren erklärt werden kann. Sie unterstellt damit, dass keine Einzelrestvarianz (also spezifische Varianz zuzüglich Meßfehlervarianz) in den Variablen existiert. Das bedeutet, dass als "Startwert" bei der Kommunalitätenschätzung immer der Wert 1 vorgegeben wird und die Kommunalität von 1 auch immer dann vollständig reproduziert wird, wenn ebenso viele Faktoren wie Variablen extrahiert werden. Die Hauptachsen-Analyse unterstellt dagegen, dass die Varianz einer Variablen immer in die Komponenten Kommunalität und Einzelrestvarianz aufteilt. Ziel der Hauptachsen-Analyse ist es, lediglich die Varianzen der Variablen in Höhe der Kommunalitäten zu erklären. Das bedeutet, dass als "Startwert" bei der Kommunalitätenschätzung immer Werte kleine 1 vorgegeben werden.

Damit gehen beide Verfahren von unterschiedlichen theoretischen Modellen aus: Das Ziel der Hauptkomponenten-Analyse liegt dabei in der möglichst umfassenden Reproduktion der Datenstruktur durch möglichst wenige Faktoren. Deshalb wird auch keine Unterscheidung zwischen Kommunalitäten und Einzelrestvarianz vorgenommen. Damit nimmt die Hauptkomponenten-Analyse keine kausale Interpretation der Faktoren vor. Dem gegenüber liegt das Ziel der Hauptachsen-Analyse in der Erklärung der Varianz der Variablen durch hypothetische Größen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitäten und Einzelrestvarianz erforderlich. Korrelationen werden hier also kausal interpretiert. Diese Unterschiede schlagen sich nicht in der Rechentechnik, sondern in der Interpretation der Faktoren nieder (ebd.: 291ff)

Diesen Unterschieden der Kommunalitätenschätzung folgend, muss sich vor Durchführung der Faktorenanalyse für eine der beiden folgenden Interpretationsfragen entschieden werden, die von sachlichen und inhaltlichen Aspekten bestimmt ist:

  • Für die Durchführung einer Hauptkomponenten-Analyse: Wie lassen sich die auf einen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen?
  • Für die Durchführung einer Hauptachsen-Analyse: Wie lässt sich die Ursache bezeichnen, die für die hohen Ladungen der Variablen auf diesen Faktor verantwortlich ist?

Für die hier zu beantwortende Fragestellung wird nach der Ursache gefragt - somit wird eine Faktorenanalyse mit dem Hauptachsen-Extraktionsverfahren durchgeführt.

Faktorenanalyse mit Hauptachsen-Faktorenextraktion[edit]

Variablenauswahl und Errechnung der Korrelationsmatrix[edit]

Für die Ermittlung der Faktoren mit dem Hauptachsen-Extraktionsverfahren werden alle 25 Items des Fragebogens verwendet. Die hieraus errechnete Korrelationsmatrix wird nun auf Eignung nach dem Kaiser-Meyer-Olkin-Kriterium (KMO-Kriterium) untersucht, das in der Literatur auch als das beste zur Verfügung stehende Verfahren zur Prüfung der Korrelationsmatrix angesehen wird. Auf eine Darstellung der Korrelationsmatrix wurde hier verzichtet, zugunsten der Schilderung der Eignung der Korrelationsmatrix nach dem KMO-Kriterium und der zu Grunde liegenden Anti-Image-Kovarianz-Matrix.

Das Kaiser-Meyer-Olkin-Kriterium entwickelt eine Prüfgröße - die "measure of sampling adequacy" (MSA) auf Basis der Anti-Image-Korrelationsmatrix (Tabelle 2: MSA-Kriterium) . Der Begriff Anti-Image stammt aus der Image-Analyse. Es wird davon ausgegangen, dass sich die Varianz einer Variablen in zwei Teile zerlegen lässt: das Image und das Anti-Image. Das Image beschreibt dabei den Anteil der Varianz, der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse erklärt werden kann, während das Anti-Image denjenigen Teil darstellt, der von den übrigen Variablen unabhängig ist. Da die Faktorenanalyse unterstellt, dass den Variablen gemeinsame Faktoren unterliegen, ist es unmittelbar einsichtig, dass die Variablen nur dann für eine Faktorenanalyse geeignet sind, wenn das Anti-Image der Variablen möglichst gering ausfällt. Das aber bedeutet, dass die Nicht-Diagonal-Elemente der Anti-Image-Kovarianz-Matrix nahe bei Null liegen müssen, bzw. diese Matrix eine Diagonalmatrix darstellen sollte. Die Korrelationsmatrix gilt dann als ungeeignet für die Faktorenanalyse, wenn der Anteil der Nicht-Diagonal-Elemente, die ungleich Null sind (>0,09) in der Anti-Image-Kovarianzmatrix 25% oder mehr beträgt (ebd.: 275f) .

Für die Anwendung auf das Datenset zeigt der Auszug aus der Anti-Image-Kovarianzmatrix, dass die Forderung nach einer Diagonalmatrix erfüllt ist und auch nach diesem Kriterium die Korrelationsmatrix für faktoranalytische Auswertungen geeignet ist (Siehe Tabelle 1: Auszug aus Anti-Image-Kovarianzmatrix). Das MSA-Kriterium zeigt nun darauf folgend an, in welchem Umfang die Ausgangsvariablen zusammengehören und dient damit als Indikator dafür, ob eine Faktorenanalyse sinnvoll erscheint oder nicht. Das MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt, als auch einzelner Variablen; sein Wertebereich liegt zwischen 0 und 1. Es kann folgende Beurteilung vorgeschlagen werden (nach Kaiser und Rice 1974 in Backhaus et al. 2003: 276). Hier liegt ein MSA größer als 0,8 vor - insofern ist die Korrelationsmatrix sehr gut für die Faktorenanalyse geeignet (Tabelle 3: Ergebnis des KMO-Tests)

Faktorenanalyse1.jpg

Extraktion der Faktoren und Bestimmung der Kommunalitäten[edit]

Als nächster Schritt werden die Kommunalitäten in der Hauptachsen-Extraktion bestimmt. Kommunalitäten geben dabei die gesamte durch gemeinsame Faktoren erklärte Varianz jeweils einer Variablen an und zeigen wie viel Prozent der Varianz des Items durch die gefundenen Faktoren erklärt wird (Tabelle 4: Kommunitäten nach Hauptachsenextraktionsverfahren). Unterschiede zwischen der Kommunalitätenbestimmung zwischen Hauptkomponenten- und Hauptachsen-Faktorextraktion wurden eingangs geschildert.

Inhaltlich aussagekräftiger als die Darstellung der Kommunalitäten für die Interpretation ist allerdings die Abbildung der erklärten Gesamtvarianz (Tabelle 5: Auszug aus Darstellung der erklärten Gesamtvarianz). Die Tabelle zeigt, dass sechs Faktoren extrahiert werden konnten, deren Eigenwert nach dem Kaiser-Kriterium größer als 1 ist und die insgesamt 69% der Varianz erklären. Der hier verwendete Eigenwert ist der durch einen Faktor erklärte Teil der Gesamtvarianz. Je größer der Eigenwert ist, desto mehr Erklärungswert hat der Faktor (Janssen und Laatz 2010: 563).

Da der sechste Eigenwert nur sehr knapp das Kaiser-Kriterium von Eigenwert größer 1 mit dem Wert 1,009 erfüllt, soll eine Parallelanalyse nach Horn durchgeführt werden, um zu klären, ob dieser extrahierte Faktor tatsächlich relevant für die Durchführung der Faktorenanalyse ist, oder ob stattdessen nur fünf Faktoren extrahiert werden - was auch dem inhaltlichen Modell der fünf Konstrukte besser entspricht. Die Parallelanalyse wird nicht in SPSS standardmäßig bereitgestellt, es wurde eine entsprechende Syntax verwendet.

Die als Parallelanalyse bezeichnete Modifikation legt über das Eigenwertediagramm (Scree-Plot) der korrelierten Daten ein zweites Eigenwertediagramm, das auf Eigenwerten für Zufallskorrelationen basiert. Nur diejenigen untersuchten Eigenwerte, die höher sind als die Zufallseigenwerte des 95%-Quantils, gelten als bedeutsam (vlg. Bortz 2005: 545).

Als Ergebnis der Parallelanalyse können wie dargestellt fünf Faktoren gefunden werden deren Eigenwerte höher sind, als die Zufallseigenwerte. Demnach wird ein Fünf-Faktorenmodell für die nun folgende Hauptachsenanalyse verwendet (Abbildung 1: Eigenwertediagramm mit Scree-Test und Parallelanalyse nach Horn).

Faktorenanalyse2.jpg

Das Fünf-Faktorenmodell[edit]

Auf Basis der Ergebnisse der Parallelanalyse wird eine Faktorenanalyse mit fünf festen Faktoren durchgeführt (Tabelle 6: Faktorenmatrix). Die Interpretation der Faktoren entspricht bei Verwendung der Hauptachsen-Analyse als Suche nach der "Ursache" für die auf einen Faktor hoch ladenden Variablen. Die dargestellte Faktorenmatrix weist dabei eine sogenannte "Einfachstruktur" auf, d.h. die Variablen laden immer nur auf einen Faktor hoch und auf alle anderen Faktoren niedrig. (Backhaus et al. 2003: 298f)

Laden allerdings mehrere Variablen auf mehrere Faktoren gleich hoch, dann ist es häufig unmöglich, unmittelbar eine sinnvolle Faktorinterpretation zu erreichen. Hierzu ist die Anwendung einer rotierten Komponentenmatrix sinnvoll. Sofern angenommen wird, dass die Faktoren untereinander nicht korrelieren, können orthogonale Methoden der Rotation verwendet werden wie die Varimax-Methode. Die Analytische Rotation (Varimax) ist eines von vielen Rotationstechniken. Als orthogonale Rotationstechnik hat sie das Ziel auf analytischem Weg eine möglichst gute Einfachstruktur für die bedeutsamen Faktoren herzustellen. Das Einfachstrukturkriterium verlangt dabei, dass pro Faktor einige Variablen möglichst hoch und andere möglichst niedrig laden, was mit der Forderung gleichzusetzen ist, dass die Varianz der Faktorladungen pro Faktor möglichst groß sein soll. Die gesamte aufgeklärte Varianz wird aber durch die Rotation nicht verändert, sondern lediglich ihre Verteilung auf die Faktoren.

  • Als bedeutsame Faktorladungen für eine nachfolgende Interpretation gelten (Bortz 2005: 548fff):
  • Ein Faktor kann dann interpretiert werden, wenn mindestens vier Variablen eine Ladung über 0,60 aufweisen.
  • Die am höchsten ladenden Variablen sind die "Markiervariablen" für die Interpretation. Ein Faktor kann interpretiert werden, wenn mindestens zehn Variablen Ladungen über 0,40 haben.
  • Haben weniger als zehn Variablen eine Ladung über 0,40, sollte nur interpretiert werden, wenn der Stichprobenumfang mindestens N > 300. Haben weniger als zehn Variablen eine Ladung über 0,40 und ist der Stichprobenumfang kleiner als 300, muss mit zufälligen Ladungsstrukturen gerechnet werden.

Die Ergebnisse (Tabelle 7: Rotierte Faktorenmatrix) zeigen, dass die Faktorladungen auf die jeweiligen Faktoren jeweils noch höher geworden sind. Für die Interpretation der bedeutsamen Faktorladungen wurde auf den Ansatz Bezug genommen, dass die Faktorladungen größer als 0,6 sein sollen. Die geringe Anzahl an Items macht es notwendig, den fünften Faktor mit nur drei Items zu akzeptieren. Dafür wird deutlich, dass die farblich markierten Faktoren den jeweiligen, im Fragebogen verwendeten Konstrukten entsprechen, was wiederum deren empirische Validierung deutlich macht.

Faktorenanalyse3.jpg

Auf eine Bestimmung der Faktorwerte über eine Koeffizientenmatrix der Faktorenwerte wurde verzichtet, da eine regressionsanalytische Schätzung der Faktorwerte deren Unabhängigkeit erzwingt. Das kann hier problematisch sein, da häufig ein Zusammenhang zwischen den verschiedenen Konstrukten existiert. Als Alternative zur Berechung der Faktorwerte werden im Folgenden die Dimensionsausprägungen durch einen gemittelten Summenscore erfasst (Fromm 2008: 341).

Reliabilitätsanalyse der Faktoren und Skalenbildung[edit]

Im Folgenden wird eine Reliabilitätsanalyse der zu den Faktoren zugehörigen Items stattfinden. Im Vordergrund steht immer noch die Fragestellung wie sich die Nutzerwahrnehmung von Privatsphäre-Aspekten länderübergreifend gestaltet. Aus den zu den fünf Faktoren zugehörigen Items sollen daher additiv synthetische Variablen (Skalen) gebildet werden, die eine Datenreduktion ermöglichen. Der Sinn der Zusammenfassung mehrerer gleichwertiger Messungen über verschiedene Items in einem theoretischen Konstrukt besteht darin, die Zuverlässigkeit der Messung einer solchen synthetischen Variablen zu erhöhen. Bei im Prinzip nur sehr ungenau messbaren Sachverhalten wie Einstellungen ist die Summe oder der Durchschnitt der Werte mehrerer gleichwertiger Messungen ein besserer Schätzwert des "wahren Wertes" als das Ergebnis einer einzelnen Messung. Die Werte dieser einzelnen Stellungnahmen werden dabei zu einem Gesamtwert aufsummiert. (Janssen und Laatz 2010: 585)

Die Reliabilitätsanalyse und Skalenbildung findet hier in folgenden Schritten statt:

  1. Skalenkonstruktion durch Auswahl geeigneter Teilinstrumente (Items) aus einem vorläufigen Itempool mit Hilfe der Itemanalyse;
  2. Überprüfung der Zuverlässigkeit der Items;
  3. Skalenbildung über Summenscore.

Die Konstruktion einer solchen Skala beginnt mit der Sammlung eines Pools geeigneter Variablen: Hier werden die den Faktoren zugehörigen Items verwendet. Diese Items sollten dieselbe synthetische Variable messen und gleich schwer sein - d.h. denselben Mittelwert und dieselbe Streuung aufweisen. Dies wird als Konsistenzzuverlässigkeit bezeichnet. Im einfachsten und verbreitetsten Fall wird eine hohe Korrelation zwischen den einzelnen Items verlangt. Als Hauptkriterium für die Brauchbarkeit eines Items gilt die Korrelation der Messwerte dieses Items mit denen der Gesamtmessung (Totalscore). Diese wird durch die Item-zu-Totalscore- oder die Item-zu-Rest-Korrelation ermittelt. Erkannt wird diese Korrelation über den Zuverlässigkeitskoeffizienten Cronbachs Alpha unter Ausschluss des geprüften Items im Vergleich zum Einschluss dessen Werts mit dem Ergebnis unter Einschluss des Items. Für die Itemanalyse sind in den folgenden Tabellen der Item-Skala-Statistiken die Spalten "Korrigierte Item-Skala-Korrelation" und "Cronbachs Alpha, wenn Item weggelassen" am wichtigsten: Ersteres stellt den Item-zu Rest-Korrelationskoeffizienten dar; letzteres ist eigentlich ein Maß zur Reliabilität der Gesamtskala. Wenn allerdings ein Item weggelassen wird und sich Cronbachs Alpha dadurch erhöht, gibt dies Aufschluss über die Qualität des Items. Falls sich dieser Wert erhöht, ist das entsprechende Item aus der Skala zu entfernen. Cronbachs Alpha beruht auf der Messung der Anzahl der einbezogenen Items und auf dem Verhältnis der durchschnittlichen Inter-Items-Kovarianz zur durchschnittlichen Varianz der Items. Der Wertebereich von Cronbachs Alpha liegt dabei zwischen 0 und 1: Je größer sein Wert ist, umso zuverlässiger beschreiben die Items die synthetische Variable. (ebd.)

Die für die anschließenden Analysen zu verwendenden Summenscores addieren für jeden Fall die Werte bei allen Items einer Skala und bilden deren Mittelwert. Voraussetzung ist, dass alle Items gleich dimensioniert und gepolt sind und dass alle das gleiche Antwortspektrum besitzen. Aus den originalen, intervallskalierten Items werden in diesem Schritt metrische Variablen erzeugt, die aufgrund der Bildung des Mittelwerts die gleiche Spannweite besitzen wie die originalen Items (6). Die Berechnung erfolgt für die einzelnen Skalen wie im Beispiel:

COMPUTE Skala_1= MEAN(Item_1, Item_2,..., Item_n).

Der Skalenwert einer Person ist damit bestimmt durch den Mittelwert der summierten Variablen.

Skala 1: "Vertrauen in andere OSN-Mitglieder"[edit]

Für die Skalenkonstruktion von Skala 1 werden die ursprünglichen sechs Items des Fragebogens zum Konstrukt überprüft. Bei Integration aller sechs Items beträgt Cronbachs Alpha 0,924. Bei Interpretation der Item-Skala-Statistiken wird sichtbar dass Item TM_6_MUD eine sowohl vergleichsweise geringe Korrelation zu den anderen Items aufweist und dass sich die Gesamtreliabilität der Skala erhöht, wenn es ausgeschlossen wird. Nach Ausschluss dieses Items kann die Reliabilität der Skala auf 0,936 erhöht werden, was eine sehr hohe Zuverlässigkeit der Beschreibung von Skala 1 durch die integrierten Items bedeutet (vgl. Tabelle 8). Dieser Vorgang kann noch erhöht werden, denn bei erneuter Berechnung der Item-Skala-Statistiken zeigt sich, dass auch TM_5g_MUD eine vergleichsweise geringe Korrelation zu den anderen Items besitzt (0,522). Nach erneutem Ausschluss dieses Items kann die Reliabilität auf 0,941 erhöht werden (Tabelle 9). Für die Berechnung des Summenscores werden daher vier Items verwendet.

Skala 2: "Vertrauen in den Anbieter"[edit]

Für die Skalenkonstruktion von Skala 2 werden fünf Items des Fragebogens verwendet. Die Gesamtreliabilität der originalen Items beträgt 0,888 und kann nicht durch den Ausschluss eines Items erhöht werden. Die fünf originalen Items messen also sehr gut die synthetische Variable. Für die Berechnung des Summenscores werden alle Items verwendet.

Skala 3: "Wissen über den Umgang mit privaten Informationen"[edit]

Für die Skalenkonstruktion von Skala 3 werden vier Items des Fragebogens verwendet. Die Gesamtreliabilität der originalen Items beträgt 0,916 und kann nicht durch den Ausschluss eines Items erhöht werden. Die vier originalen Items messen also ebenfalls sehr gut die synthetische Variable. Für die Berechnung des Summenscores werden alle Items verwendet.

Skala 4: "Aspekte der Sorge um die Verletzung der Privatsphäre"[edit]

Für die Skalenkonstruktion von Skala 4 werden sieben Items des Fragebogens verwendet. Die Gesamtreliabilität der originalen Items beträgt 0,888 und kann nicht durch den Ausschluss eines Items erhöht werden. Die sieben originalen Items messen daher sehr gut die synthetische Variable. Für die Berechnung des Summenscores werden alle Items verwendet.

Skala 5: "Vertrauen in die Wahrung rechtlicher Regelungen"[edit]

Für die Skalenkonstruktion von Skala 5 werden drei Items des Fragebogens verwendet. Die Gesamtreliabilität der originalen Items beträgt 0,914 und kann nicht durch den Ausschluss eines Items erhöht werden. Die drei originalen Items messen sehr gut die synthetische Variable. Für die Berechnung des Summenscores werden alle Items verwendet.

Reliabilitaetsanalyse.jpg

Deskriptive Statistiken der Skalen[edit]

Mithilfe deskriptiver Statistiken kann einerseits die erste Forschungsfrage beantwortet werden und zudem die Verteilungsform der Skalen als Voraussetzung für die nachfolgenden statistischen Analysen überprüft werden. Dafür werden eingangs deskriptive Kennzahlen der Verteilung interpretiert und anschließend erfolgt die Prüfung der Verteilungsform anhand von Grafiken und statistischer Tests.

Lagemaße der Skalen[edit]

Die Auseinandersetzung mit den statistischen Kennzahlen zeigt aufgrund der Bildung des Summenscores über den Mittelwert Werte im 1 (Minimum) bis 7 (Maximum) an. Die Mittelwerte variieren zwischen 3 und 5. Interpretiert man diese Werte im Sinne der ordinalen Likert-Skalen der Original-Items, so zeigt sich etwa dass Skala 3 "Wissen über den Umgang mit privaten Informationen" im Mittelwert um 4 variiert - was bedeutet das die Nutzer von Facebook nicht exakt wissen was mit ihren auf Facebook veröffentlichten Informationen geschieht und die Nutzer auf Skala 4 "Aspekte der Sorge um die Verletzung der Privatsphäre" sind leicht besorgt, dass ihre Privatsphäre bei den preisgegebenen Informationen nicht gewahrt wird. Der Median, als robustes Lagemaß, besitzt ähnliche Werte wie der Mittelwert.

Für die Beantwortung der Forschungsfrage ergibt sich daher aufgrund der Kennzahlen, die wieder anlehnend die originalen ordinalen Likert-Skalen interpretiert werden, dass die Facebook-Nutzer sowohl im Mittelwert, als auch im Medium länderübergreifend (vgl. Tabelle 14 : Auszug aus den deskriptiven Statistiken der Skalen)

  • Eher geringes bis neutrales Vertrauen Facebook als Betreiber gegenüber besitzen (Skala 1);
  • Anderen Facebook-Nutzern dagegen relativ neutral gegenüber stehen was die Wahrung der Privatsphäre betrifft (Skala 2);
  • Weniger genau wissen, wie Facebook eigentlich mit den von ihnen veröffentlichten Informationen umgeht (Skala 3);
  • Leicht besorgt sind, was die Wahrung ihrer Privatsphäre auf Facebook angeht (Skala 4);
  • Eine leicht unsichere bis neutrale Haltung bei der Einschätzung der Wahrung der rechtlichen Lage zum Schutz ihrer Privatsphäre durch Facebook einnehmen.

Überprüfung der Verteilungsform[edit]

Die grafische Überprüfung der Verteilungsform in Form von Histogrammen zeigt bereits eine deutliche Abweichung von der Normalverteilung (Abbildung 2: Histogramme der Skalen).

Im Gegensatz zu den deskriptiven Lagemaßen lässt das Boxplot eine andere Interpretation zu: Bei der Fragestellungen wie Nutzer den Schutz ihrer Privatsphäre auf Facebook allgemein wahrnehmen zeigt sich, dass vor allem die Skala 4, welche direkt die Sorge einer möglichen Verletzung der Privatsphäre adressiert, die höchsten Werte aufweist - was in Bezug auf die original Likert-Skalierung eine mittlere bis besorgte Einstellung wiedergibt. Im Vergleich der Einstellungen zwischen dem allgemeinen Vertrauen in Facebook als Provider und dem Vertrauen in andere Mitglieder lässt sich feststellen, dass die Nutzer tendenziell dem Anbieter ein größeres Vertrauen entgegen bringen, als anderen Nutzern. Auch die Skala 3 macht deutlich, dass die Nutzer nicht genau gewissen, was eigentlich mit ihren preisgegeben Daten passiert. Das wird ebenfalls durch die Einstellungen, die in Skala 5 zur rechtlichen Lage festgehalten werden illustriert: Die Nutzer fühlen sich eher weniger bis mäßig sicher, dass Facebook die rechtlich vorgegeben Regelungen zur Wahrung ihrer Privatsphäre einhält (Abbildung 3: Boxplot der Skalen).

Das Boxplot verdeutlicht zudem noch einmal die Interpretation der Lagemaße und die im Histogramm sichtbaren Verteilungsformen. Keine der fünf Skalen weist eine symmetrische Verteilungsform auf - der Median in der Box ist entweder im Bereich des 25-50%-Quantils zu finden (Skala 2, 4) oder aber häufiger im Bereich des 50-75%-Quantils (Skala 1, 3, 5).

Aufgrund der Grafiken kann die Annahme einer Normalverteilung der metrischen Skalen verworfen werden. Die im Boxplot ausgewiesenen Ausreißer können aufgrund der Bildung über Summenscore nur als Extremwerte gedeutet werden. Ausreißertests sind weiterhin nur dann durchführbar, wenn eine normalverteilte Grundgesamtheit vorliegt und werden hier deshalb nicht durchgeführt.

Ein nun durchzuführender statistischer Test auf Normalverteilung überprüft wie gut die empirische Verteilung mit einem theoretischen Verteilungsmodell übereinstimmt. Ein solcher Anpassungstest testet anhand einer Nullhypothese, ob die Verteilung der Stichprobe aus einer Grundgesamtheit mit der einer theoretischen Verteilung übereinstimmt. Beim hier anzuwendenden Kolmogorov-Smirnov-Test sind weiterhin folgende Voraussetzungen zu erfüllen (ebd.: 259):

  • Die Variablen müssen metrisches Skalenniveau aufweisen.
  • Die Variablen dürfen nicht klassiert vorliegen.

Beide Voraussetzungen zur Erfüllung des Tests sind erfüllt.

Wie Tabelle 15 zeigt, wird bei einem Signifikanzniveau von 95% die Nullhypothese der Normalverteilung verworfen, da die ausgewiesene Signifikanz von 0,000 kleiner als p = 0,05 ist. Alle Ergebnisse zeigen somit mit an Sicherheit grenzender Wahrscheinlichkeit (0,000), dass die beobachtete Verteilung nicht aus einer normalverteilten Grundgesamtheit stammt. Dies bedeutet für die nachfolgenden statistischen Analysen, dass alle Verfahren, die dies voraussetzen nicht angewendet werden können.

Deskriptiv Skalen.jpg

Differenzierung der Nutzerwahrnehmungen nach demografischen Variablen[edit]

Die nächste Fragestellung untersucht, ob es wesentliche Unterschiede in der Verteilung, bzw. den Parameter der Verteilung der metrischen Skalen gibt, die nach den Ausprägungen einer zweiten, demografischen Variable separiert werden. Diese demografische, nominalskalierte Variable sind das Erhebungsland, das als Faktorvariable die Faktorstufen Land 1, Land 2 und Land 3 (Country 1, Country 2, Country 3) besitzt und andererseits das Geschlecht der Befragten (Male, Female). Da die Merkmalsausprägungen der demografischen Faktorvariablen festgelegt sind, können diese theoretisch zur Identifizierung der Grundgesamtheiten dienen - auch wenn im hier untersuchten Fall aufgrund der Nichtrepräsentativität der Stichprobe keine Schlüsse die Grundgesamtheit betreffend gezogen werden können. Die dabei gewonnen Aussagen werden zwar als unabhängige Stichproben im statistischen Sinne verwendet, allerdings sind die Rückschlüsse nicht auf alle Facebook-Nutzer übertragbar, sondern nur auf die in der Stichprobe enthaltenen.

Die folgenden explorativen Vergleiche werden sich auf den Mittelwert, die zentrale Tendenz und die Varianz der Verteilungen der nach demografischen Variablen separierten Gruppen (Skalen) beziehen. Die Vergleichsprüfungen finden statt anhand:

  1. Der Interpretation statistischer Kennzahlen;
  2. Grafischer Möglichkeiten der Exploration;
  3. Des Einsatzes statistischen Signifikanztests.

Lagemaße[edit]

Die Analyse der Mittelwerte dient zur Untersuchung des Zusammenhangs zwischen verschiedenen Variablen. Zur Überprüfung einer Abhängigkeit wird berechnet ob sich die Mittelwerte zwischen den verschiedenen Vergleichsgruppen - hier Land oder Geschlecht - unterscheiden oder nicht. Unterscheiden sie sich, so kann dies als Indiz gelten, dass die unabhängige Variable einen Einfluss auf die abhängige Variable besitzt (ebd.: 342). Eingangs wird daher betrachtet, ob sich die Mittelwerte der Skalen nach einzelnen Ländern separiert unterscheiden, allerdings ohne eine Unterscheidung der Spannweite da diese bei allen abhängigen Variablen aufgrund der Bildung über den Mittelwert der Summenscores gleich ist (Tabellen 16 und 17: Skalenmittelwerte nach Land und Geschlecht). Es wird sichtbar, dass aufgrund der Mittelwerte nur bei Skala 3 deutliche Unterschiede zwischen Land 1 und Land 2 auftreten. Bei allen anderen Skalen wird aufgrund der Kennzahlen bislang von keinem Einfluss des Landes auf die Einstellungen der Befragten geschlussfolgert. Bei Untersuchung der Skalenmittelwerte nach Geschlecht differenziert, sind die Unterschiede sehr gering - es wird daher anhand der Lagemaße von keinem Einfluss des Geschlechts auf die Einstellungen der Befragten geschlussfolgert.

Grafische Darstellung der Mittelwerte[edit]

Für die grafische Überprüfung von Mittelwert-Unterschieden wird ein Fehlerbalkendiagramm verwendet. Dieses dient dazu, für jede Kategorie der demografischen Variablen die Streuung der metrisch skalierten Skalen um ihren durchschnittlichen Wert zu visualisieren. Die auszuwertenden Fälle werden dabei theoretisch als eine Zufallstichprobe aus einer Grundgesamtheit interpretiert. Die im Fehlerbalkendiagramm dargestellten Konfidenzintervalle geben an, in welchen Grenzen der unbekannte Mittelwert des Antwortverhaltens in den Skalen für die Grundgesamtheit mit einer vorzugebenden Wahrscheinlichkeit von 95% in Höhe von 1-Alpha erwartet werden kann. (ebd.:664f)

Da sich wie in Abbildung 4 dargestellt die Fehlerbalken pro Skala untereinander überschneiden, besteht offensichtlich kein grafisch erkennbarer eindeutiger Unterschied in der mittleren Nutzerwahrnehmung von Privatsphäre-Aspekten zwischen den verschiedenen Ländern. Auch in der grafischen Darstellung der Fehlerbalken in Abbildung 5 pro Skala kann kein eindeutiger Unterschied in der mittleren Nutzerwahrnehmung nach Geschlecht separiert erkannt werden, da sich die Fehlerbalken überschneiden.

Lagemasse.jpg

Vergleich von Mittelwerten und zentralen Tendenzen anhand statistischer Signifikanztests[edit]

Untersucht man den Zusammenhang zwischen einer kategorialen unabhängigen Variablen (demografische Variable) und einer metrischen abhängigen (Skala), so wird bei vielen statistischen Tests vorausgesetzt, dass die Varianz der Werte der metrischen Skalen in den Gruppen der unabhängigen Varianzen in etwa gleich ist. Dazu wird der Levene-Test durchgeführt, der als weitere Verteilungsannahme die Homogenität der Varianzen überprüft und der gegenüber anderen Tests wie dem F-Test den Vorteil hat, nichts selbst von der Voraussetzung einer Normalverteilung in der Grundgesamtheit abzuhängen. Bei der Durchführung des Levene-Tests wird für jeden einzelnen Fall die absolute Abweichung vom Gruppenmittelwert gebildet. Dann wird eine Einweg-Varianzanalyse der Varianz dieser Differentation durchgeführt.

Bei Geltung der Nullhypothese, unterscheiden sich die Variation innerhalb der Gruppen nicht signifikant - die Varianzen sind gleich (ebd.: 253). Ob die Mittelwert-Unterschiede statistisch signifikant oder nur ein zufälliges Ergebnis sind muss anschließend überprüft werden. Aber aufgrund der Verletzung der Voraussetzung der Normalverteilung kann nicht der T-Test angewendet werden, für den die Unterscheidung gleicher oder ungleicher Varianzen zentral ist (Bortz 2005: 140). Stattdessen wird auf nicht-parametische Tests wie den Mann-Whitney-Wilcoxon-Test (U-Test) und den Kruskall-Wallis-Test zurückgegriffen.

Der U-Test wird für die Untersuchung der Unterschiede nach Geschlecht verwendet und als Voraussetzungen der abhängigen Variable mindestens ordinales Skalenniveau und eine stetige Verteilung(ebd.: 150). Der U-Test kann allerdings nur zwei Gruppen untersuchen. Deshalb wird für eine Untersuchung der Gruppenunterschiede nach Ländern der Kruskal-Wallis-Test benutzt, der dann geeignet ist, wenn drei oder mehr Gruppen untersucht werden.[1]

Auf der Grundlage des Levene-Tests werden für die Anwendung des U- und Kruskal-Wallis-Tests nur die Skalen verwendet, deren Varianzen gleich sind, da ungleiche Varianzen sonst zu unkorrekten Ergebnissen führen können.[2] Über die nicht integrierten Gruppen können bei Verwendung der nicht-parametrischen Tests keine Aussagen getroffen werden.

LeveneTest.jpg

Der Levene-Tests für die Unterscheidung nach Erhebungsland zeigt (Tabelle 18), dass für Skala 2 und Skala 5 die Werte niedriger sind als das Signifikanzniveau p = 0,05 und muss die Nullhypothese, dass die Gruppen dieselben Varianzen haben abgelehnt werden. Für die Skalen 1, 3 und 4 kann die Nullhypothese gleicher Varianzen angenommen werden, da die Signifikanz höher als das Signifikanzniveau ist.

Beim Test auf Gleichheit der Varianzen bei der Unterscheidung nach Geschlecht (Tabelle 19) zeigt sich, dass für Skala 1 die Annahme der Nullhypothese verworfen werden muss, da die Signifikanz von 0,001 kleiner als das Signifikanzniveau von 0,05 ist. Für die Skalen 2,3,4 und 5 kann die Nullhypothese der Gleichheit der Varianzen angenommen werden, da hier die Signifikanz höher ist als das Signifikanzniveau.

Da aufgrund der Verletzung der Voraussetzungen der T-Test nicht durchgeführt werden kann, ist wie schon genannt, die Anwendung eines voraussetzungsärmeren Verfahrens notwendig, dass lediglich die ordinale Information der Daten auswertet. Im Unterschied zu den Intervalldaten voraussetzenden Verfahren wie dem T-Test wird es bei Anwendung des U-Tests von Mann-Whitney um die den Vergleich zweier Stichproben (nach Geschlecht differenziert) hinsichtlich ihrer zentralen Tendenz gehen, da bei ordinalen Daten das arithmetische Mittel nicht definiert ist (ebd.). Auf Basis der Ergebnisse des Levene-Tests werden nur Skala 2,3, und 4 untersucht, da für diese Gruppen die gleiche Varianz statistisch nachgewiesen wurde. Die Nullhypothese des U-Tests prüft dabei, ob die untersuchten Stichproben aus einer identischen Verteilung stammen - die Unterschiede in den Gruppen als nicht signifikant sind.

Wie der U-Test in Tabelle 20 zeigt, wird für Skala 4 und 5 die Nullhypothese, dass die untersuchten Stichproben aus einer Verteilung stammen abgelehnt, da die Signifikanz kleiner ist als p = 0,05. Es wird geschlussfolgert, dass die zentralen Tendenzen in den Gruppen somit signifikant verschieden sind bei einem Signifikanzniveau von 0,05. Für Skala 2 und 3 muss die Nullhypothese der gleichen Verteilung nach Geschlecht dagegen angenommen werden, da die Werte der asymptotischen Signifikanz größer als p = 0,05 sind.[3]

Die nachgewiesenen Gruppenunterschiede werden auch im Boxplot sichtbar (Abbildung 6): Frauen sind demnach mehr um die Verletzung ihrer Privatsphäre besorgt als Männer. Die Einstellungen gegenüber der Wahrung rechtlicher Vorgaben zum Schutz der Privatsphäre wird von Frauen homogener und positiver bewertet als bei Männern, deren Einstellungen breiter im negativen Bereich streuen.

Die Untersuchung der Gruppenunterschiede nach Ländern erfolgt nach dem Kruskal-Wallis-Test, der drei oder mehr Gruppenunterschiede prüfen kann. Für die Anwendung des Tests werden nur die Gruppen einbezogen, für die im Levene-Test eine Gleichheit der Varianzen ermittelt werden konnte (Skala 1, 3,4). Die Nullhypothese des Kruskal-Wallis-Tests prüft hier ebenfalls, ob die untersuchten Stichproben aus einer identischen Verteilung stammen und die Unterschiede zwischen den Gruppen nicht signifikant sind. Für alle Skalen muss die Nullhypothese bei p = 0,05 abgelehnt werden - es wird also mit der Alternativhypothese keine identische Verteilung angenommen. Das bedeutet, dass die Differenz in den Einstellungen zwischen den drei verschiedenen Ländern mit an Sicherheit grenzender Wahrscheinlichkeit signifikant ist.Cite error: Closing </ref> missing for <ref> tag

Das lässt sich auch im Boxplot grafisch veranschaulichen (Abbildung 7). Die abgebildeten Gruppenunterschiede zwischen den Ländern lassen sich dabei wie folgt interpretieren: Land 1 besitzt bei den drei untersuchten Skalen im Median ähnliche Einstellungen, allerdings konzentriert sich der Hauptteil der Einstellungen gegenüber dem Missbrauch ihrer privaten Daten (Skala 4) im neutralen bis besorgten Bereich. Die Einstellungen, die auf der Skala 3 gemessen werden, umfassen im Vergleich zu den anderen Ländern die größte Streuung und liegt mit einem vergleichsweise hohen Median im eher neutralen Bereich was die Einschätzung des eigenen Wissens über den Umgang mit privaten Informationen auf Facebook betrifft. Das Vertrauen in andere Nutzer ist relativ homogen und umfasst den Bereich eines geringen Skeptizismus gegenüber der Wahrung der eigenen Privatsphäre durch andere Nutzer und reicht bis zu einer neutralen Einstellung. In Land 2 ist sofort der hohe Bereich von Einstellungen im niedrigen Bereich in der Skala 3 auffällig, deren Median deutlich macht, dass die Nutzer relativ wenig darüber wissen wie auf Facebook mit ihren privaten Informationen umgegangen wird. Nichts desto trotz fällt die Einschätzung des Missbrauchs von privaten Daten relativ neutral aus wie ebenso das Vertrauen gegenüber anderen Facebook-Nutzern neutral erscheint, mit Abweichungen zwischen leicht besorgt bis mäßig besorgt. Für Land 3 ist die höchste Sorge um den Missbrauch privater Daten erkennbar - ein Großteil des Antwortverhaltens liegt dabei im zustimmenden Bereich. Dagegen ist das Wissen, was mit den eigenen Informationen geschieht und das Vertrauen in andere Facebook-Nutzer vergleichsweise gering bis neutral zu bewerten.

U-KW-Tests.jpg

Lineare Abhängigkeit der Nutzerwahrnehmungen untereinander[edit]

Die Beantwortung der dritten Forschungsfrage wird durch die Untersuchung und Quantifizierung der Abhängigkeit zwischen verschieden Einstellungen (Skalen) stattfinden. über die Durchführung einer linearen Regressionsanalyse soll eine Funktion gefunden werden, welche die Abhängigkeit des Wissens über den Umgang mit privaten Informationen von zwei anderen Skalen - dem Vertrauen in andere OSN-Nutzer sowie dem Vertrauen in die Wahrung rechtlicher Regelungen - quantifiziert. In Form einer multiplen Regression wird versucht, die abhängige Variable (Skala 3) durch die unabhängigen Variablen (Skala 1 und Skala 5) zu beschreiben. In einer relativ einfachen Form soll diese Art der linearen Regression als deskriptives Werkzeug der Analyse verwendet werden.

Die im Folgenden gefundenen Abhängigkeiten sind zwar sehr gering, sollen aber in erster Linie der Darstellung des Verfahrens der linearen Regressionsanalyse mit dem vorhandenen Datensatz dienen. Die Vorgehensweise wird sich im Folgenden an die übliche Abfolge der Analyseschritte orientieren (Backhaus et al. 2003: 53):

  1. Modellformulierung;
  2. Schätzung der Regressionsfunktion;
  3. Prüfung der Regressionsfunktion;
  4. Prüfung der Regressionskoeffizienten;
  5. Prüfung der Modellprämissen.

Modellformulierung der linearen Regression[edit]

Eine erste Annäherung an die Untersuchung dieses Zusammenhangs kann über die Visualisierung in einem Streudiagramm vorgenommen werden, dass die Abhängigkeit der Skala "Wissen über den Umgang mit privaten Informationen" in Abhängigkeit der Skala "Vertrauen in die Wahrung rechtlicher Regelungen" zeigt (Abbildung 8: Streudiagramm Skala 5 : Skala 3). Es wird ersichtlich, dass es sich bei dieser Abhängigkeit um eine - wenn auch nur sehr schwache - existierende lineare Beziehung handelt.

Bezeichnet man das Wissen der Skala "Umgang mit privaten Informationen" als abhängige Variable und die Skala "Vertrauen in die Wahrung rechtlicher Regelungen" als unabhängige Variable, so lässt sich der Messwert der Variablen und die Beziehung der zwischen den Variablen durch eine lineare Gleichung beschreiben. Nur für den Fall, dass ein Punkt auf des Streudiagramms auf der Regressionsgeraden liegt, haben beide Variablen den gleichen Wert. Die Abweichung davon wird Residualwert genannt. Die Koeffizienten der Regressiongleichung werden als Regressionskoeffizienten bezeichnet (Jansen und Laatz 2010: 407).

Auch in dieser Darstellung der Abhängigkeit von Skala 3 zur zweiten untersuchten Skala (Abbildung 9: Streudiagramm Skala : Skala 3) wird eine sehr schwache lineare Beziehung zwischen der Skala "Vertrauen in andere OSN-Nutzer" und der Skala "Wissen über den Umgang mit privaten Information" erkennbar. Im Vergleich zum anderen Streudiagramm wird aber deutlich, dass die Punkte noch stärker um die Regressionsgerade streuen. Daher geht es bei der linearen Regression nicht nur darum, die Koeffizienten der linearen Gleichung numerisch zu bestimmen, sondern mit Hilfe eines statistischen Maßes muss auch herausgefunden werden, wie gut die gewonnene lineare Gleichung geeignet ist, die Werte der abhängigen Variable hervorzusagen. Dies gelingt umso besser, je enger die Punkte des Streudiagramms um die durch die Gleichung beschriebene Gerade liegen. Ein solches Maß zum Ausweis der Vorhersagegüte der Regressionsgleichung ist das Bestimmtheitsmaß.

Die Berechung der Regressionskoeffizienten basiert auf der Methode der kleinsten Quadrate. Die senkrechte Abweichung zwischen einem Beobachtungswert und dem mit Hilfe der Regressionsgleichung hervorgesagten Wert ist der Residualwert. Die Methode der kleinsten Quadrate bestimmt die Regressionskoeffizienten derart, dass die Summe der quadrierten Residualwerte für alle Beobachtungen ein Minimum annimmt. (ebd.: 407f)

Die per linearer Regression untersuchten Daten werden als eine Zufallstichprobe aus einer realen Grundgesamtheit aufgefasst. Für diese Grundgesamtheit wird nun postuliert, dass ein linearer Zusammenhang zwischen abhängiger und unabhängiger Variable besteht und dieser additiv von einer Zufallsvariable überlagert wird. So wird hier beispielsweise angenommen, dass die Wahrnehmung des Wissen darüber wie Facebook mit privaten Informationen umgeht, linear vom Vertrauen in die Wahrung rechtlicher Regelungen und dem Vertrauen in andere OSN-Nutzer abhängig ist. Daneben gibt es eine Vielzahl weiterer Einflussgrößen auf das Wissen über den Umgang mit privaten Daten durch Facebook, die aber nur geringfügig wissenserhöhend oder wissensvermindernd wirken können.

Bezeichnet man die Skala "Wissen über den Umgang mit privaten Information" mit y, die Skala "Vertrauen in die Wahrung rechtlicher Regelungen" mit x1 und die Skala "Vertrauen in andere OSN-Nutzer" mit x2 sowie die Zufallsvariable mit e für einen Beobachtungsfall i, so lässt sich das theoretische Regressionsmodell für die Grundgesamtheit wie folgt formulieren:

Reg1.png

Der Regressionskoeffizient Beta 1 gibt für die Grundgesamtheit an, um wie viel das Wissen über den Umgang mit privaten Informationen steigt, wenn bei Konstanz des Vertrauens in andere OSN-Nutzer das Vertrauen in die Wahrung rechtlicher Regelungen um eine Einheit steigt. Beta 1 kann daher auch als partieller Regressionskoeffizient bezeichnet werden. Analog dazu gibt Beta 2 an, um wie viel das Wissen über den Umgang mit privaten Informationen sinkt, bei Erhöhung des Vertrauens in andere OSN-Nutzer um eine Einheit und Konstanz des Vertrauen in die Wahrung rechtlicher Regelungen.

Damit die Methode der kleinsten Quadrate zu bestimmten gewünschten Schätzeigenschaften führt (beste lineare unverzerrte Schätzwerte, englisch BLUE) sowie Signifikanzprüfungen für die Regressionskoeffizienten durchgeführt werden können, werden für die Zufallsfehlervariable unter anderem folgende Eigenschaften ihrer Verteilung vorausgesetzt:

  1. Die Varianz der Verteilung der Zufallsvariable ist für jede Beobachtung der nicht-stochastischen Werte konstant. Sie ist damit von der Höhe der erklärenden Variablen unabhängig. Ist diese Bedingung erfüllt, so besteht Homoskedastizität der Fehlervariablen. Ist diese Bedingung nicht erfüllt, so handelt es sich um Heteroskedastizität.
  2. Die Kovarianz der Zufallsvariablen ist für verschiedene Beobachtungen gleich 0, d.h. die Verteilungen der Zufallsvariablen für verschiedene Messwerte sind unabhängig voneinander. Ist diese Bedingung nicht erfüllt, so liegt Autokorrelation vor.
  3. Die untersuchten metrischen Variablen sind normalverteilt. Die Erfüllung dieser Voraussetzung ist aber nur dann erforderlich, wenn Signifikanzprüfungen der Regressionskoeffizienten durchgeführt werden sollen.

Regressionanalyse1.jpg

Schätzung der Regressionsfunktion[edit]

Es soll ermittelt werden, wie Skala 3 durch die Variablen Skala 1 und Skala 5 bestimmt wird. In einem ersten Schätzansatz wird Skala 3 gemäß der Regressionsgleichung durch Skala 1 und Skala 5 vorhergesagt.

In Tabelle 22 werden die Regressionskoeffizienten des Regressionsmodells sowie Angaben zur Signifikanzprüfung der Koeffizienten aufgeführt. Modell 1 enthält als erklärende Variablen Skala 5 und Skala 1. In der Spalte Regressionskoeffizient B werden die nicht standardisierten Regressionskoeffizienten für die genannten Variablen aufgeführt.

Schätzungsgleichung für das lineare Modell[edit]

Demnach lautet die Schätzgleichung für das lineare Modell:

Schaetz.png

Signifikanzprüfung der Koeffizienten[edit]

Da die für die lineare Regressionsanalyse verwendeten Variablen nicht normalverteilt sind, wird auf eine inhaltliche Interpretation der Signifikanzprüfung der Regressionskoeffizienten (T-Werte und Signifikanz) über eine Nullhypothese (kein linearer Zusammenhang) verzichtet.[4]

Beta-Koeffizienten: Erklärungsbeitrag der unabhängigen Variablen[edit]

In der Spalte Beta (Tabelle 22: Regressionskoeffizienten) werden die Beta-Koeffizienten (standardisierte Regressionskoeffizienten) für beide Erklärungsvariablen aufgeführt. Beta-Koeffizienten würden sich als Regressionskoeffizienten ergeben, wenn vor der Anwendung der linearen Regression alle Variablen standardisiert (in z-Werte transformiert) würden. Mit der Standardisierung werden die Abweichungen der Messwerte der Variablen von ihrem Mittelwert in Standardabweichungen ausgedrückt. Sie sind dann dimensionslos. Der Mittelwert einer standardisierten Variablen beträgt 0 und die Standardabweichung 1. Im Unterschied zu den Regressionskoeffizienten sind die Beta-Koeffizienten deshalb von der Dimension der erklärenden Variablen unabhängig und somit miteinander vergleichbar. (ebd.: 418)

Es zeigt sich, dass der absolute Beta-Koeffizient für Skala 5 (0,366) den für Skala 1 (0,85) übersteigt. Damit wird deutlich, dass Skala 5 als bedeutsame Variable den größeren Erklärungswert liefert. Aus den unstandardisierten Regressionskoeffizienten wird dies nicht deutlich. Das bedeutet, dass Vertrauen in die Wahrung rechtlicher Regelungen einen größeren Erklärungswert für den Umfang des Wissens über den Umgang mit privaten Information liefert, als das Vertrauen in andere OSN-Mitglieder.

Prüfung der Regressionsfunktion[edit]

Bestimmtheitsmaß[edit]

In der Modellzusammenfassung wird die Anpassungsgüte des Modells ausgegeben.

Das Bestimmtheitsmaß R2 ist definiert als der Anteil der durch die Variation der unabhängigen Variablen erklärten Variation an der gesamten Variation der abhängigen Variablen. R2 wird maximal gleich 1, wenn alle Beobachtungspunkte des Streudiagramms auf der Regressionsgerade liegen und damit alles Residualwerte gleich 0 sind. R2 nimmt den kleinsten Wert 0 an, wenn die Regressionsgleichung nichts erklärt.

Wie in Tabelle 23 zur Modellzusammenfassung ausgegeben wird, liegt das Bestimmtheitsmaß R2 hier bei 0,159 und ist im Bereich zwischen 0 und 1 nahe 0 - was bedeutet, dass das Model nur in sehr geringem Maße in der Lage ist, die Variation von Skala 3 durch die Variation von Skala 1 und Skala 5 zu erklären. Es ist also kein guter Fit des Modells vorhanden.

Standardfehler des Schätzers[edit]

Der Standardfehler des Schätzers ist die Standardabweichung des Schätzfehlers. Er ist ein Maß für die Güte der Vorhersagequalität der Gleichung und zeigt an, wie stark die abhängige Variable um die Regressionsgerade streut. Im Vergleich zu R2 ist er aber abhängig von der Maßeinheit der abhängigen Variablen. (Backhaus et al. 2005: 73)

Bezogen auf den Stichprobenmittelwert der Skala 3 = 3,0860 in der Tabelle Regressionskoeffizienten, beträgt der Standardfehler des Schätzers s = 1,39835, also 45%. Das entspricht einer sehr hohen Streuung von Skala 3 um die Regressionsgerade und macht deutlich, dass die Vorhersagequalität der Gleichung sehr gering ist (siehe Tabelle 23: Modellzusammenfassung)

Varianzzerlegung und F-Test[edit]

Es werden weiterhin Informationen zur varianzanalytischen Prüfung des Regressionsmodells mit dem F-Test bereitgestellt. Analog zum Signifikanztest für Regressionskoeffizienten ist aber auch hier eine Normalverteilung der Variablen Voraussetzung, die nicht gegeben ist.[5]

Auf eine Überprüfung des Konfidenzintervalls mittels Signifikanzprüfung wird wegen der Verletzung der Normalverteilungsannahme der untersuchten Variablen ebenfalls verzichtet.

Prüfung der Modellprämissen[edit]

Multikollinearität[edit]

Das lineare Regressionsmodell basiert auf der Prämisse, dass die Regressoren (erklärende Variablen) nicht exakt linear abhängig sind - ein Regressor darf sich also nicht als lineare Funktion der übrigen Regressoren darstellen lassen. In diesem Fall würde perfekte Multikollinearität bestehen und die Regressionsanalyse ließe sich rechnerisch nicht durchführen. (ebd.: 88). Die statistischen Informationen die zur Kollininearitätsdiagnose verwendet werden, dienen zur Beurteilung der Stärke der Multikollinearität, d.h. der Abhängigkeit der erklärenden Variablen untereinander. Toleranz ist dabei ein Maß für die Stärke der Multikollinearität. Hat eine Variable eine kleine Toleranz bei Werten zwischen 0 und 1, so ist sie fast eine Linearkombination der anderen Variablen.

Hier beträgt die Toleranz 0,916 (siehe Tabelle 22: Regressionskoeffizienten), was bedeutet, dass ein hoher Zusammenhang zwischen den Variablen besteht.

Aus den Eigenwerten der Korrelationsmatrix der Erklärungsvariablen leitet sich der Konditionsindex ab. Als Faustregel gilt, dass bei einem Konditionsindex zwischen 10 und 30 moderate bis starke und über 30 sehr starke Multikollinearität vorliegt (Janssen und Latz 2010: 425).

Für das hier vorliegende Regressionsmodell ist nach Tabelle 24 zur Kollinearitätsdiagnose feststellbar, dass keine sehr starke Multikollinearität vorliegt mit Werten zwischen 1,000 und 6,622.

Weitere Überprüfungen der Modellannahmen des Regressionsmodells basieren auf der Analyse der empirischen Residualwerte. Grundlage für diese Vorgehensweise ist der Sachverhalt, dass für ein angemessenes Regressionsmodell die empirischen Residualwerte ähnliche Eigenschaften haben sollen wie die der Grundsgesamtheit. Für die Überprüfung kann man sich grafischer Analysen und Testverfahren bedienen.

Regressionsanalyse1.jpg

Autokorrelation der Residualwerte und Verletzung der Linearitätsbedingung[edit]

Das lineare Regressionsmodell basiert auf der Annahme, dass die Residuen in der Grundgesamtheit unkorreliert sind. Wenn diese Bedingung nicht gegeben ist, liegt Autokorrelation vor. Autokorrelation kann zur Verzerrungen bei der Ermittlung des Standardfehlers der Regressionskoeffizienten führen und auch die Linearitätsbedingungen der Regressionsgleichung verletzen.

Zur Aufdeckung kann eine grafische Überprüfung vorgenommen werden, bei der die Residuen gegen die geschätzten Werte von Y geplottet werden. Bei positiver Autokorrelation liegen aufeinanderfolgende Werte nahe beieinander; bei negativer Autokorrelation schwanken sie stark. (ebd.: 87) Da grafische Überprüfungen aber generell nicht eindeutig interpretiert werden können (vgl. Abbildung 10: Residuenplot), wird ein statistischer Test zur Prüfung der Autokorrelation verwendet.

Durbin/Watson-Test[edit]

Diese Teststatistik erlaubt eine Überprüfung der Autokorrelation der Residualwerte. Hierbei wird untersucht, ob der Residualwert positiv oder negativ vom Residualwert der vorherigen Beobachtung abhängig ist. Die Prüfgröße kann dabei zwischen 0 und 4 schwanken. Besteht keine Korrelation aufeinanderfolgender Residualwerte, so liegt die Prüfgröße d nahe bei 2. Besteht eine positive Autokorrelation, so liegen die Residualwerte nahe beieinander mit der Konsequenz dass d kleiner 2 wird. Besteht eine negative Korrelation so folgen auf positive Werte negative und umgekehrt - d wird größer als 2. Demnach besteht bei einer Prüfgröße d wesentlich kleiner als 2 eine positive und bei d wesentlich größer als 2 eine negative Autokorrelation. (Jansen und Laatz 2010: 425f)

Der Wert der Durbin/Watson-Statistik (Tabelle 23: Modellzusammenfassung) beträgt hier 1,793 und liegt damit nahe bei 2. Es kann geschlussfolgert werden, dass keine Autokorrelation vorliegt.

Homoskedastizität[edit]

Wenn die Streuung der Residuen in einer Reihe von Werten der geschätzten abhängigen Variablen konstant ist, liegt Homoskedastizität vor - eine Prämisse des linearen Regressionsmodells. Homoskedastizität beinhaltet, dass die Varianz der Fehlervariablen für alle Beobachtungen homogen ist. Falls dies nicht gegeben ist, liegt Heteroskedastizität vor, was zu Ineffizienz der Schätzung führt und den Standardfehler des Regressionskoeffizienten verfälscht. (Backhaus et al. 2005: 84f) Dies lässt sich grafisch überprüfen, indem die Residuen gegen die geschätzten Werte von Y geplottet werden (vgl. Abschnitt Autokorrelation). Ein derartiges Streudiagramm kann Hinweis dafür geben, ob die Bedingungen der Homoskedastizität erfüllt sind.

Bei der Abbildung 10 zum Residuenplot ist allerdings nicht eindeutig erkennbar, ob die Streuung der Residualwerte nicht systematisch mit der Höhe der Vorhersagewerte variiert. Der Plot ist größtenteils eine Punktwolke, die Homoskedastizität vermuten lässt, aber es sind auch einige Abweichungen erkennbar - etwa im höheren Bereich der vorhergesagten Werte was als Mangel an Homoskedastizität interpretiert werden kann.

Normalverteilung der Residualwerte[edit]

Ist die Modellbedingung der Normalverteilung verletzt, so dürfen keine statistischen Signifikanztests durchgeführt werden. Die Überprüfung der Residualwerte im Vergleich zur Normalverteilung kann einerseits durch Grafiken und auch durch statistische Tests stattfinden (Vgl. Abbildung 11 : Histogramm Residualwerte und Abbildung 12 : P-P-Plot Residualwerte).

Wie das Histogramm und der P-P-Plot der Residualwerte verdeutlichen, gibt es insbesondere im mittleren Bereich der Verteilung Abweichungen von der Normalverteilung. Aufgrund der Verletzung der Voraussetzung der Normalverteilung werden daher auch keine Ausreißertests und Verfahren zur Bereinigung von Ausreißern durchgeführt.

Regressionsanalyse2.jpg

Eine mögliche Transformation der Variablen zum Erreichen der Modellbedingung der Normalverteilung wird im Rahmen dieser Arbeit nicht mehr vorgenommen.

Ergebnisse[edit]

Länderübergreifende Untersuchung der Nutzerwahrnehmungen[edit]

Für die Beantwortung der Forschungsfrage ist ein breites Spektrum an statistischen Verfahren verwendet worden. Hierbei sind zwei Hauptaufgaben bewältigt worden: erstens, die Ergebnisse der Faktorenanalyse bestätigen die Aussagekraft der verwendeten theoretischen Konstrukte, da die im Fragebogen verwendeten Items alle auf jeweils zugehörigen fünf Konstrukte laden. Zweitens kann über Anwendung der Reliabilitätsanalyse die Zuverlässigkeit und Homogenität der verwendeten Konstrukte erhöht werden, indem Skalen gebildet worden sind, die einerseits eine hohe Homogenität aufweisen mit Cronbachs Alpha zwischen 0,8 bis 0,9 und andererseits die in den Konstrukten gemessenen Einstellungen in Form eines Summenscores, der über den Mittelwert gebildet wurde, besser wiedergeben als die einzelnen Items. Problematisch ist hierbei nur, dass für die Bildung der Skala 2 (Vertrauen in den Anbieter) zwei Items ausgeschlossen wurden, was gegebenenfalls zu einer zu geringen Anzahl von eingeschlossenen Items und Fällen für diese Skala führt.

Bei der anhand der metrischen Skalen vorgenommenen deskriptiven Analyse sind schließlich allgemeine, länderübergreifende Interpretationen der Einstellungen gegenüber Facebook möglich. Interessant hierbei ist besonders, dass Facebook zwar von der Interaktion der Nutzer untereinander lebt, diese dem Anbieter aber ein höheres Vertrauen entgegenbringen was den Schutz ihrer Privatsphäre betrifft, als anderen OSN-Nutzern. Und trotz der relativ hohen Besorgtheit um die Verletzung ihrer Privatsphäre besitzen die Nutzer vergleichsweise wenig Wissen darüber, was mit ihren online preisgegebenen Daten geschieht. Dies korrespondiert schließlich mit dem relativ mäßigen Vertrauen darin, dass der Anbieter die vorhandenen rechtlichen Regelungen zum Schutz der Privatsphäre einhält.

Differenzierung der Nutzerwahrnehmungen nach demografischen Variablen[edit]

Forschungsfrage zwei setzt sich dann intensiver mit dem Datensatz auseinander, indem der Einfluss demografischer Variablen Erhebungsland und Geschlecht thematisiert wird. Der Vergleich der Lagemaße in den nun als unabhängige Stichproben interpretierbaren Gruppen gestaltete sich jedoch schwierig: Das für den Mittelwerte-Vergleich herangezogene Fehlerbalkendiagramm ist nicht geeignet für eine sinnvolle Interpretation der Ergebnisse, da aufgrund der Nicht-Repräsentativität der Stichprobe keine Rückschlüsse auf die Grundgesamtheit gezogen werden können. Im Fehlerbalkendiagramm sind zugleich keine Gruppenunterschiede erkennbar, die allerdings anhand des Einsatzes verschiedener statistischer Tests nachgewiesen werden konnten. Trotz der Problematik der nicht-repräsentativen Stichproben aufgrund der Datengewinnung über einen Online-Fragebogen ist es aber gängige Praxis im Forschungsfeld statistische Signifikanztests anzuwenden. Hier werden die Gruppenunterschiede in den Skalen mit Hilfe des Levene-Tests zur Untersuchung der Gleichheit der Varianzen untersucht. Die Varianzgleichheit ist Voraussetzung für die Anwendung statistischer Signifikanztests wie des T-Tests. Da für den T-Test aber die Voraussetzungen der Normalverteilung nicht erfüllt sind, werden deshalb nicht-parametrische Tests verwendet, die resistent gegenüber einer Abweichung von der Normalverteilung sind. Die Gruppenunterunterschiede nach Erhebungsland werden bei gleichen Varianzen in der Skalen 1 (Vertrauen in andere OSN-Mitglieder), 3 (Wissen über den Umgang mit privaten Informationen) und 4 (Aspekte der Sorge um die Verletzung der Privatsphäre) mit dem Kruskall-Wallis-Test untersucht, der die Daten auf ordinalem Niveau hinsichtlich von Rangunterschieden untersucht. Für die drei untersuchten Skalen konnten dabei Unterschiede in den Einstellungen zwischen den drei verschiedenen Ländern mit sehr hoher Signifikanz festgestellt werden (p = 0,05). In der darauffolgenden Darstellung der Gruppenunterschiede anhand eines Boxplots wird dies auch grafisch sichtbar. Die Grafik ermöglicht schließlich die Interpretation der Gruppenunterschiede, die sowohl in der Streuung der Einstellungen pro Skala variieren, als auch wesentliche Unterschiede zwischen den Ländern erkennen lassen. Hierbei sind vor allem die Unterschiede der Skala 4 (Aspekte der Sorge um den die Verletzung der Privatsphäre) zu nennen, die am meisten zwischen den Ländern differieren.

Die Untersuchung der Gruppenunterschiede nach Geschlecht wird mit Hilfe des U-Tests vollzogen. Analog zum Kruskall-Wallis-Test werden die Daten auf Ordinalskalen-Niveau behandelt. Für die Anwendung dieses Tests werden ebenfalls nur Gruppen mit gleicher Varianz einbezogen. Bei einem Signifikanzniveau von = 0,05 sind Gruppenunterschiede nach Geschlecht schließlich in den Skalen 4 (Wissen über den Umgang mit privaten Information) und 5 (Vertrauen in die Wahrung rechtlicher Aspekte) mit dem U-Test nachweisbar. Auch hier verdeutlicht ein Boxplot die Gruppenunterschiede: Allgemein ist feststellbar, dass Frauen mehr um die Verletzung ihrer Privatsphäre besorgt sind als Männer. Die Einstellungen gegenüber der Wahrung rechtlicher Vorgaben zum Schutz der Privatsphäre werden dagegen von Frauen homogener und positiver bewertet als bei Männern. Zum Vergleich ist jeweils parallel ein T-Test durchgeführt worden, der trotz Verletzung der Abweichung von der Normalverteilung der metrischen Variablen bei gleichen und ungleichen Varianzen zum selben Ergebnis führt wie die verwendeten nicht-parametrischen Tests. Dieses Vorgehen entspricht ebenfalls der üblichen Methodologie des Forschungsfeldes.

Lineare Abhängigkeit der Nutzerwahrnehmungen untereinander[edit]

Die abschließend durchgeführte Regressionsanalyse versucht die Abhängigkeit der Skala 3 (Wissen über den Umgang privater Informationen) von Skala 1 (Vertrauen in andere OSN-Mitglieder) und Skala 5 (Vertrauen in die Wahrung rechtlicher Regelungen) zu beschreiben und zu quantifizieren. Die hierbei gefundene geschätzte Regressionsfunktion ist allerdings nur in sehr geringem Ausmaß in der Lage die Variation von Skala 3 durch die Variation von Skala 1 und Skala 5 zu erklären. Die Regressionsgleichung gibt schließlich an, um wie viel das Wissen um den Umhang mit privaten Informationen steigt, wenn bei Konstanz des Vertrauens in andere OSN-Nutzer das Vertrauen in die Wahrung rechtlicher Regelungen um eine Einheit steigt. Mit einem sehr niedrigen R2 von 0,159 ist kein guter Fit des Modell erreicht worden - andere Einflussfaktoren bestimmen den Umfang an Wissen über den Umgang mit privaten Informationen. Auf eine Transformation der Variablen wurde zugunsten der ausführlichen Darstellung der Methode verzichtet im Rahmen der Arbeit verzichtet.

Einschränkungen der Analyse[edit]

Probleme der Arbeit beziehen sich einerseits auf die nicht-repräsentative Stichprobe, die theoretisch keine Rückschlüsse auf die Grundgesamtheit erlaubt und demnach auch den Einsatz aller verwendeter parametrischer Verfahren in Frage stellt. Zudem sind Einschränkungen des Datensets zu sehen: Wegen der Anonymisierung der Erhebungsländer sind keine tatsächlichen Rückschlüsse auf mögliche kulturelle Ursachen für Gruppenunterschieden nach Land und Geschlecht möglich, die sich etwa beim Vertrauen in den Anbieter, dem Vertrauen in die Wahrung rechtlicher Regelungen und beim Split nach Geschlecht ergeben würden. Weiterhin sind Limitationen bei der Beantwortung der zweiten Fragestellung zu sehen, für deren ausführliche Bearbeitung eine mehrfaktorielle Varianzanalyse hilfreich gewesen wäre, die hier allerdings aufgrund der nicht normalverteilten Variablen nicht durchgeführt werden konnte. Die Durchführung der Regressionsanalyse ist aufgrund des schlechten Fits des Modells und der nicht erfolgten Transformation der Variablen - die nach Sichtung des Residuenplots notwendig wäre - auch nur begrenzt aussagefähig.

Schließlich können aufgrund der Besonderheit jedes Online-Social-Networks keine allgemeingültigen Aussagen zur Nutzerwahrnehmung plattformübergreifend getroffen werden. Die hier ermittelten Ergebnisse können nur als Tendenzen der Nutzerwahrnehmung von Privatsphäre-Aspekten interpretiert werden.

Literatur[edit]

  1. K. Backhaus, B. Erichson, W. Plinke, und R. Weiber, "Multivariate Analysemethoden", 10. Auflage, Springer, Berlin, 2003.
  2. J. Bortz, "Statistik für Human und Sozialwissenschaftler", 6. Auflage, Springer, Berlin 2005.
  3. T. Dinev and P. Hart, "An Extended Privacy Calculus Model for E-Commerce Transactions”, Information Systems Research, 17, 1, Michigan, 2006, pp. 61-80.
  4. C. Dwyer, S.R. Hiltz, and K. Passerini, "Trust and Privacy Concern within Social Networking Sites: A Comparison of Facebook and MySpace”, Proceedings of the Thirteenth AMCIS, Keystone, Colorado, 2007.
  5. S. Fromm, "Datenanalyse mit SPSS für Fortgeschrittene", 2. Auflage, Springer, Berlin 2008.
  6. J. Jansen und W. Laatz, "Statistische Datenanalyse mit SPSS", 7. Auflage, Springer, Berlin 2010.
  7. H. Krasnova, T. Hildebrand, O. Günther, S. Kovrigin, and A. Nowobilska, "Why Participate In An Online Social Network: An Empirical Analysis”, Proceedings of ECIS 2008, Galway, 2008.
  8. H. Krasnova, E. Kolesnikova, and O. Günther, "It Won't Happen To Me!": Self-Disclosure in Online Social Networks“, 15th Americas Conference on Information Systems, San Francisco, 2009.
  9. D.H. McKnight, V. Choudhury, and C. Kacmar, "The Impact of Initial Consumer Trust on Intentions to Transact with a Web site: a Trust Building Model”, Journal of Strategic Information Systems (11), December 2002, pp. 297 - 323

Referenzen[edit]

  1. Die Interpretation des Outputs des U- und Kruskall-Wallis-Tests erfolgte nach http://web.fu-berlin.de/biometrie/ - Kurze Beschreibung statistischer Verfahren, Zugriff am 24.03.2010.
  2. Vgl.http://udel.edu/~mcdonald/statkruskalwallis.html, Zugriff 24.03.10.
  3. Die parallele Durchführung des T-Tests trotz der nicht erfüllten Voraussetzung der Normalverteilung, die nur für kleine Stichprobenumfänge relevant ist (Bortz 2005: 141), kam zu den gleichen Ergebnissen: Bei ungleicher Varianz treten für Skala 1 und bei gleicher Varianz für Skala 2 und 3 keine signifikanten Unterschiede der Gruppen in den Mittelwerten bei p = 0,05 auf - die Gruppenunterschiede nach Geschlecht sind also nicht signifikant. Bei Skala 4 und 5 ist bei gleicher Varianz eine signifikante Differenz in den Mittelwerten nachweisbar bei p = 0,05 - die Gruppenunterschiede nach Geschlecht sind also signifikant.
  4. Wären die verwendeten Variablen normalverteilt, würde die Signifikanzprüfung ergeben, dass bei p = 0,05 und einer Nullhypothese über keinen linearer Zusammenhang die Signifikanzwerte beider Regressionskoeffizienten kleiner als 0,05 sind (Signifikanz Skala 5 = 0,000; Skala 1 = 0,040) und damit ein linearer Zusammenhang besteht (Alternativhypothese).
  5. Unter der Annahme einer Normalverteilverteilung würde die Varianzzerlegung prüfen, ob mehrere Variablen einen regressionsanalytischen Erklärungsbeitrag leisten. Da das Signifikanzniveau ( 0,000) kleiner als p = 0,05 ist, würden beide Variablen unter Bestätigung der Normalverteilung einen Erklärungsbeitrag leisten.

Anhang[edit]

Fragebogen-Items und Variablen-Benennung

TRUST FACEBOOK In general, Facebook:
Tr_B_1_MUD ...is open and receptive to the needs of its members
Tr_B_2_MUD ...makes good-faith efforts to address most member concerns
Tr_I_1_MUD ...is honest in its dealings with me
Tr_I_2_MUD ...keeps its commitments to its members
Tr_I_3_MUD ...is trustworthy
TRUST FB MEMBERS Generally, I trust that Facebook users:
TM_1_MUD ...will not to misuse my sincerity on Facebook
TM_2_MUD ...will not embarrass me for some information they learned about me through Facebook
TM_3_MUD ...will not use the information they found about me in Facebook against of me
TM_4_MUD ...will not use the information about me in a wrong way
TM_5g_MUD ...are trustworthy
TM_6_MUD ...are open and delicate to each other
KNOWLEDGE I know exactly:
Know1_MUD ... how the information I provide on Facebook is allowed to be used by other users or companies
Know2_MUD ... how the information I provide on Facebook can and cannot be used by Facebook
Know3_MUD ...how existing laws regulate the use of my information on Facebook
Know4_MUD I am well-informed about the Facebook privacy policies
FB PRIVACY CONCERN How much are you concerned that the information submitted on Facebook:
Con_1a_MUD ...can be used in a way you did not foresee
Con_2a_MUD ...can be used against you by someone
Con_3c_MUD ...can be used for commercial purposes (e.g. market research, advertising)
Con_4a_MUD ...can become available to someone without your knowledge
Con_5a_MUD ...can become available to someone you don’t want (e.g. "ex”, parents, teacher, employer, unknown person, etc.)
Con_6a_MUD ...can be misinterpreted
Con_7a_MUD ...can be continuously spied on (by someone unintended)
Legal Assurance (Trust)  
LegT_1_MUD I feel confident that existing laws protect me against abuse of my information on Facebook
LegT_2_MUD Existing laws adequately protect my information on Facebook
LegT_3_MUD The existing legal framework is good enough to make me feel comfortable using Facebook