Kostenstrukturerhebung in kleinen und mittleren Unternehmen (KSE-KMU) 1999

From Teachwiki
Revision as of 20:24, 18 April 2008 by WikiSysop (Talk | contribs) (Kommentare)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Einleitung und Datensatzbeschreibung[edit]

Die folgende Datenanalyse der Kostenstrukturerhebung (KSE) des Statistischen Bundesamtes stellt zunächst den vorliegenden Datensatz (Campus-Use-File KSE-KMU) vor und soll zu ausgewählten Themen Ergebnisse liefern. Die behandelten Inhalte werden in erster Linie benutzt, um die in der Lehrveranstaltung "Computergestützte Statisik Wintersemester" behandelten Analyseverfahren vorzustellen. Zu Beginn jedes Themas wird eine kurze Einführung und Fragestellungen geliefert, die nicht abschliesend beantwortet werden sollen, sondern vielmehr im Rahmen der zur Verfügung stehenden Verfahren als Illustration dienen. Als Analyseprogramm kommt SPSS zum Einsatz.

Verwendete Methoden der statistischen Datenanalyse[edit]

  • Univariate Analyse mittels deskriptiver Statistik
  • Robuste Schätzer
  • Extremwertuntersuchungen, Ausreißertest
  • Verteilungsuntersuchung
  • Varianzanalyse
  • Parametervergleiche

Datensatzbeschreibung[edit]

Tab.1 Zusammenstellung der Variablen
Tab.2 Beschreibung Wirtschaftszweig und Klassifikation nach WZ93

Bei der Kostenstrukturerhebnung im Bergbau und Verarbeitenden Gewerbe (KSE) werden Mikrodaten für Unternehmen erhoben. Der betrachtete Berichtszeitraum ist das Jahr 1999. Der hier verwendete Datensatz enthält 36 Variablen für 500 Unternehmen mit bis zu 250 Mitarbeiter. Die erhobenen Daten umfassen u. A.: Tätige Personen insgesamt, Gesamtumsatz, Bruttogehalts- und -lohnsumme, Kosten für Leiharbeiter sowie die Nettowertschöpfung. Für eine abschliessende Auflistung siehe Tab. 1 (Vergrößerung möglich).

In den Daten finden sich Unternehmen verschiedener Branchen, die nach der Klassifikation der Wirtschaftzweige von 1993 (WZ93) ausgewiesen werden. Eine Gegenüberstellung der Klassifikationskennziffer und einer Beschreibung der Branche findet sich in Tab. 2.

Die verschiedenen Branchen sind mit folgender Häufigkeit im Datensatz vertreten. Ksekmu brn.jpg

Der hier verwendete Datensatz ist ein Campus Use File des Statistischen Bundesamtes, der aufgrund des uneingeschränkten Nutzerkreises härteren Anonymisierungsbedingungen unterliegt. Diese schränken die Aussagekraft der Daten ein und werden im Folgenden kurz vorgestellt.

Anonymisierungsmaßnahmen[edit]

  • Beschränkung auf Unternehmen mit max. 250 Beschäftigten
  • Verzicht auf WZ-Abteilungen, die der Geheimhaltung unterliegen.
  • Ersatz der administrativen Gebietsschlüssel durch den siedlungsstrukturellen Kreistyp BBR9
  • Streichen von Unternehmen, die in der Grundgesamtheit einmalige Ausprägungskombinationen in den diskreten Merkmalen BBR9 und zweistelliger WZ93 aufweisen.
  • Beschränkung auf 500 Unternehmen (aus rund 13.000)

Spezifische Anonymisierungsmaßnahmen für die 500 Datensätze[edit]

  • Die Wirtschaftsklassifikation (WZ93) wurde von vier bzw. fünf auf zwei Stellen gekürzt
  • Es wurde eine 10prozentige Fehlerüberlagerung des siedlungsstrukturellen Kreistyps durchgeführt (die veröffentlichte Ausprägung des BBR9 im Public-Use-File stimmt nur noch mit einer Wahrscheinlichkeit von 90% mit der Ausprägung in den Originaldaten überein).
  • Jedes stetige Merkmal wurde jeweils einzeln mikroaggregiert. Bei der Mikroaggregation werden immer mindestens drei Merkmalsträger (Unternehmen) gesucht, die in dem zu anonymisierenden Merkmal die größte Ähnlichkeit aufweisen. Aus den Merkmalsausprägungen der drei Merkmalsträger wird ein Durchschnittswert ermittelt. Die „wahren“ Werte werden in den veröffentlichten Daten mit diesen Durchschnitt ersetzt. Durch dieses Vorgehen ist jede Merkmalsausprägung bei mindestens drei Merkmalsträgern vorhanden, d.h. jede Ausprägung kommt in den Daten mindestens dreimal vor.

Analyse der Nettowertschöpfung der verschiedenen Branchen[edit]

Wie unterscheidet sich die Nettowertschöpfung zu Faktorkosten in den verschiedenen Branchen? Die in den Daten ausgewiesene Nettowertschöpfung kann als Ertrag wirtschaftlicher Tätigkeit betrachtet werden. Die absolute Größe ist für den Branchenvergleich nur bedingt geeignet, da die Technologie der Branchen und damit die Betriebsgröße per se unterschiedlich sind. Weiter soll hier keine Aussage getroffen werden, wie und wem diese Wertschöpfung zugeschrieben wird oder in welcher Höhe Kosten dadurch gedeckt werden. Zunächst kann ein Boxplot mit der Beschreibung des Wirtschaftszweiges auf der Category Axis einen Überblick bieten. Leider ist mit SPSS die Gruppierung mit String-Variablen nur nach den ersten acht Zeichen möglich, daher sei auf Tab. 2 mit der Beschreibung der Branchen und der verwendeten WZ-Klassifikation verwiesen.

Abb.1: Boxplot Nettowertschöpfung in den Branchen

Abb. 2: Meanplot der Nettowertschöpfung

Das Label der Extremwerte zeigt den Gesamtumsatz in tausend DM an. Der Mittelwert des Gesamtumsatzes liegt bei 26.530.964 DM. Die Extremwerte weisen einen höheren Gesamtumsatzes auf. Es liegt nahe eine generelle Abhängigkeit der absoluten Größen von Umsatz und Nettowertschöpfung zu vermuten. Es zeigt sich, dass die Pearson Korrelation zwischen Gesamtumsatzes und Nettowertschöpfung bei 0,751** liegt. Dies überrascht nicht, da jeder Umsatz eine bestimmte Wertschöpfung beinhalten sollte und daher die aggregierte Größe positiv beeinflusst.

  • Der Mittelwert der Nettowertschöpfung aller 500 Unternehmen liegt bei 7.004.603,158 DM
  • Der Median aller 500 Unternehmen liegt bei 4.396.678 DM
  • Der Meanplot in Abb.2 gibt einen weiteren Eindruck über die unterschiedlichen Mittelwerte in den Branchen.
Tab.3: Test of Homogeneity of Variances

Der Levene Test liefert einen Wert von 3,018 (siehe Tab. 3) und lehnt auf dem Signifikanzniveau von 5% die Nullhypothese der Varianzhomogenität in den verschiedenen Branchen ab.

Tab.4: Tests of Normality

Auch der Kolmogorov-Smirnov Test auf Normalverteilung liefert für die Mehrheit der Branchen keine Signifikanz. Die beobachteten Extremwerte in den Gruppen sind nicht unvorsichtig als Ausreißer zu interpretieren. Vielmehr müssen Sie genau wie die Heteroskedastizität als charakteristisch für die Verteilung angenommen werden, da sie potentiell Informationen über die Technologie bedingten Skaleneffekte in den Branchen beinhalten.

Mittelwerte des Umsatzes in den Branchen[edit]

Betrachtet man die oben beobachtete Korrelation erneut in einem geeigneten Diagramm, so fällt auf, dass die relative Umsatzstärke (1 = Mittelwert der Stichprobe) einer Branche mit der relativen Nettowertschöpfung (1 = Mittelwert der Stichprobe) in den Branchen positiv korreliert.

Abb.3: Umsatz und Nettowertschöpfung

Es ist also gerechtfertigt und sinnvoll die Nettowertschöpfung relativ zum Umsatz zu betrachten, da dadurch eine geeignete Vergleichsgröße erreicht wird.

Nettowertschöpfung im Verhältnis zum Umsatz[edit]

Der Quotient aus Nettowertschöpfung zu Faktorkosten und Gesamtumsatz ist eine Annäherung für eine besser vergleichbare relative Ertragsstärke der Unternehmen. Diese Größe wird erneut nach Branchen getrennt als Boxplot in Abb. 4 dargestellt.

Abb.4: Boxplot Nettowertschöpfung zu Umsatz

Tab.5: Tests of Normality
Tab.6: Test of Homogeneity of Variances
Tab.7: Kruskal-Wallis Test
  • Der Mittelwert aller 500 Unternehmen liegt bei 0, 3673556 DM.

Zwei Beobachtungen weisen eine deutlich negative Nettowertschöpfung pro Umsatz aus. Es ist plausibel den Marktaustritt zumindest aber keine dauerhafte negative Nettowertschöpfung bei diesen Beobachtungen anzunehmen. Will man also die Branchen untereinander vergleichen, so ist es gerechtfertigt diese Unternehmen nicht zu berücksichtigen, da ihre Ausprägungen in der langen Frist nicht zu erwarten sind. Die Ausprägungen der Beobachtungen 434 und 447 werden auf Grund dieser ökonomischen Bedingung durch den Mittelwert ersetzt.

Möchte man auf die Gleichheit der Mittelwerte der Branchen testen, so ist zunächst zu überprüfen, ob die Voraussetzungen für eine ANOVA gegeben sind.

Der Kolmogorov-Smirnov Test liefert für alle Branchen eine Bestätigung der Normalverteilungsannahme auf dem 5% Konfidenzniveau mit Ausnahme der Branche 31 mit einer Signifikanz von 4,5 %. Bei Betrachtung der Ergebnisse des Shapiro-Wilk Test ergibt sich für alle Gruppen eine Normalverteilung.

Der Levene-Test liefert keine Bestätigung der Varianzgleichheit. Daher kommt als Test auf Mittelwertgleichheit der nichtparametrische Kruskal-Wallis-H-Test in Betracht. Allerdings bietet dieser Test keine Post-Hoc Verfahren also eine hypothetische Gruppierung der einzelnen Branchen in homogene Untergruppen. Der Test lehnt die Nullhypothese auf dem globalen Signifikanzniveau von 5% ab. Welche Branchen hierfür verantwortlich sind, kann man mit Hilfe eines Error Bar Plots zumindest grafisch analysieren.

Abb.5: Boxplot Nettowertschöpfung zu Umsatz

Aufgrund der unvollständigen Darstellung der String Variablen sei erneut auf Tab. 2 verwiesen. Als Ergebnis kann festgestellt werden, dass die Mittelwerte zweier Branchen der Medizin, Meß, -Steuer und Regelungstechnik, Optik sowie Herstellung von Büromaschinen, Datenverarbeitungsgeräten von der überwiegenden Mehrheit den 95% Konfidenzintervallen der anderen Branchen nicht überdeckt werden. Diese Branchen bilden tendenziell am wahrscheinlichsten eine nach oben abweichende Untergruppe.

Analyse der Kosten für Leiharbeit[edit]

Abb. 6: Entwicklung der Leiharbeit

Leiharbeit stellt Unternehmen ein Instrument zur Verfügung, das es erlaubt Arbeitskraft flexibler und der jeweiligen Auftragslage entsprechend einzusetzen. Die Beschäftigung in der Leiharbeit hat in Deutschland stark zugenommen wie Abb. 6 zeigt. Üblicherweise ist diese Art der Beschäftigung für den Entleiher mit höheren Kosten verbunden, er bezahlt demnach einen Aufschlag für die Flexibilität . Wieviele und in welchem Maße sind kleine und mittlere Unternehmen Nachfrager von Leiharbeit? Kann man Aussagen treffen in welchen Branchen Leiharbeit verstärkt zum Einsatz kommt?

Verteilung der Kosten für Leiharbeitnehmer[edit]

Abb. 7: Verteilung Kosten der Leiharbeit für Nachfrager von Leiharbeit
Abb. 8: Verteilung Kosten der Leiharbeit in der gesamten Stichprobe

Betrachtet man sich die Verteilung der Kosten für Leiharbeitnehmer in der Gesamtheit der 500 Unternehmen, so fällt zunächst auf:

  • nur 174 der 500 Unternehmen fragen Leiharbeit nach
  • der Mittelwert der 500 Unternehmen liegt bei 119.026,28 DM
  • Abb. 8 zeigt eine Rechtsschiefe und starke Abweichung von einer Normalverteilung der Nachfrage
  • Auch in der Gruppe der 174 Nachfrager zeigt Abb. 7 eine deutliche Differenz der empirischen Verteilung und einer hypothetischen Normalverteilung.

Aus dem Boxplot können offensichtliche Extremwerte erkannt werden.

Das Label der Datenpunkte ist der Quotient aus Kosten für Leiharbeit und Gehaltssumme plus Sozialabgaben. Hier fällt auf, dass eine Extremwertstelle ein besonders hohes Verhältnis von 5,11456 zu 1 aufweist. Wie wir später sehen werden, kann dieser verdächtig hohe Wert seine Ursache in der Mikroaggregation haben.

Abb.9 Boxplot Kosten für Leiharbeitnehmer

Robuste Schätzer für den Mittelwert in den verschiedenen Branchen[edit]

Trotz der relativ geringen Anzahl von Nachfragern nach Leiharbeit finden sich alle Branchen wieder. Der Vergleich der Mittelwerte liefert die höchste Nachfrage nach Leiharbeitnehmern in den Branchen 33, 25, 34 und 29. Hierbei handelt es sich um Medizin, Meß, -Steuer und Regelungstechnik sowie Herstellung von Gummi und Kunststoffen, Herstellung von Kraftwagen und Kraftwagenteilen und Maschinenbau. Hier ist es plausibel je nach Auftragslage einen schwankenden Beschäftigtenbedarf zu unterstellen und so scheint die Auswahl mit der Theorie vereinbar.

Tab. 8: Mittelwerte der Kosten für Leiharbeitnehmer nach Branchen


Vergleicht man diese Werte mit den Huber M-Estimator aus der Gruppe der Robusten Schätzern für den Mittelwert so fällt auf, dass die höchste Nachfrage bei den Branchen 34, 21, 31 und 29 auftritt. Obwohl die Branchen 34 und 29 im oberen Viertel bleiben, muss die auf Grundlage der einfachen Mittelwerte getroffene Aussage hinterfragt werden.

Betrachtet man weiter einen redescending M-Estimator wie den Tuckey's Biweight so sinken die Werte bei den meisten (18 bleibt gleich, 21 steigt nochmal leicht) Branchen erwartungsgemäß. Dies folgt aus der Tatsache, dass die Gewichtsfunktion des Tukey-Schätzers an den Enden auf Null fällt. Da die Gewichte auch bei großem Abstand vom Schätzwert für den Huber M Schätzer nicht auf Null abfallen, bleibt der Einfluß extremer Beobachtungswerte in gewissem Maße erhalten. Bei positiven Extremwerten sind die Schätzungen demnach größer.

Die höchsten Werte des Tuckey-Schätzers weisen nun 34, 21, 31 und 25 auf. Von den ursprünglichen Ergebnissen bei einfachem Mittelwertvergleich finden sich also teilweise die gleichen Branchen auch bei Verwendung der Robusten Schätzern in den oberen Viertel der Nachfrager wieder. Die Mittelwertschätzer unterscheiden sich offensichtlch in erster Linie durch das Abweichen einzelner Beobachtungen nach oben. Die Branche 33 scheint besonders deutlich durch einen Extremwert beeinflusst (hier sinkt der Mittelwert von 810.970,13 DM auf 37.639,035 beim Tuckey's Biweight Schätzer).


Untenstehende Tabelle fasst zusammen, ob eine bestimmte Branche im oberen Viertel der Nachfrager nach Leiharbeit zu finden war oder nicht.

Branche Mean Huber's M-Estimator Tukey's Biweight
33 ja nein nein
25 ja nein ja
34 ja ja ja
29 ja ja nein
21 nein ja ja
31 nein ja ja
Tab.9: Untersuchung der Extremwerte bei Kosten für Leiharbeitnehmer

Weitere Probleme entstehen durch die bei metrischen Variablen vorgenommene Mikroaggregation. So stehen alle im Boxplot (Abb. 9) gezeigten Datenpunkte und damit insbeondere der äußerste Extremwert eigentlich für drei Beobachtungen, die so auch potenziell in drei Brachen das Ergebnis beeinflussen. Die Ausprägungen der drei Unternehmen, die der Extremwert darstellt, werden in Tab. 9 verglichen. Besonders bei Betrachtung der letzten Spalte fällt eine Folge der Mikroaggragation (siehe 2.2) auf. Es ist überaus unplausibel, dass ein Unternehmen fünfmal mehr für Leiharbeitnehmer als für seine Stammbelegschaft ausgibt. Dieser Wert kann fast nur durch Durchschnittsbildung mit ähnlichen Unternehmen entstanden sein. Da dieses Problem in einem Datensatz von nur 174 Nachfragern einen großen Einfluss hat, erscheinen weitere Untersuchungen der Kosten für Leiharbeitnehmer auf Grundlage dieser Daten nicht sinnvoll.

Analyse der Gehaltsumme/Tätige Mitarbeiter[edit]

Abb.10: Histogramm Gehaltssumme/Tätige Mitarbeiter

Die Verteilung der durchschnittlichen Gehaltskosten pro Mitarbeiter berechnet als der Quotient von Gehaltssumme und Tätigen Mitarbeitern ist in Abb. 10 als Histogramm zu sehen. Interpretiert man diese Größe von der Kostenseite, so kann man fragen, ob ein tätiger Inhaber diese Kosten signifikant senkt. Der Quotient kann auch als durchschnittlicher Bruttolohn der Mitarbeiter verstanden werden. In welchen Branchen ist dieser ausgewiesene Verdienst besonders gering?

Wieviel höher sind die Kosten bei Berücksichtigung der Sozialabgaben?

Tab. 10 zeigt neben der Gehaltsumme/Tätige Mitarbeiter auch die ersten zwei Momente der Verteilung des Quotienten der Summe von Gehalt und gesetzlichen sowie sonstigen Sozialkosten zu tätigen Mitarbeitern. Es zeigt sich, dass der Mittelwert um rund 21,6 % höher liegt.Ein Vergleich mit den anteiligen Sozialversicherungsabgaben des Arbeitgebers für Rente-, Kranken-, Pflege-,Arbeitlosen- und Unfallversicherung sowie Lohnfortzahlung im Krankheitsfall kann dieses Ergebnis theoretisch gut begründen. Tab.: 10 Descriptive Statistics

Gehaltskosten pro Mitarbeiter bei tätigem Inhaber[edit]

Abb.11: Bar Chart Count der Tätigen Inhaber
Abb.12: Bar Chart Mittelwert der Gehaltsumme/Tätige Mitarbeiter
Tab.12: Tests of Normality
Tab.11: Test of Homogeneity of Variance
Tab.13: Mann-Whitney-U Test

Im Datensatz ist ausgewiesen, ob und wieviele Inhaber im Betrieb tätig sind. Abb. 11 zeigt die Häufigkeiten mittels eines Bar-Chart Diagramms.

  • Bei 371 der 500 Unternehmen ist kein Inhaber tätig
  • von den restlichen 25,8 % sind über 60 % (15,6% der 500) Unternehmen mit einem tätigen Inhaber.
  • mehr als 4 Inhaber sind in keinem Unternehmen tätig

Abb. 12 zeigt die Gehaltskosten pro Mitarbeiter getrennt nach einer Hilfsvariablen, die 1 ist, wenn ein oder mehr Inhaber tätig sind und 0 sonst.

  • in Unternehmen mit tätigen Inhaber liegt der Mittelwert bei 50282,57 DM.
  • in Unternehmen ohne tätigen Inhaber liegt der Mittelwert bei 55125,17 DM.


Die beiden nach der Hilfsvariablen getrennten Gruppen weisen Varianzhomogenität auf. Der Levenne Test liefert eine Signifikanz von 0,288 bis 0,312 je nach Basis des Test. Die Gruppen sind allerdings nicht normalverteilt (siehe Tab. 12). Daher kommt als Test auf Parametergleichheit der Mann-Whitney-U Test zur Anwendung dessen Ergebnis die Bestätigung der Differenz der Mittelwerte liefert. Die Hypothese der Mittelwertgleichheit wird auf dem 5% Signifikanzniveau nicht angenommen (siehe Tab.13).

Mittelwertvergleich Gehalt pro Mitarbeiter in den verschiedenen Branchen[edit]

Tab.14: Mittelwerte in den Branchen

Wie unterscheiden sich die Gehaltskosten pro Mitarbeiter in den verschiedenen Branchen und somit auch die Bruttolöhne der Beschäftigten? Tab. 14 gibt eine Auflistung aller Mittelwerte in den Branchen.

Um einen weiteren Überblick zu bieten, dient der Boxplot getrennt nach Branchen. Das Label zeigt die Forschungsaufwendungen des Unternehmens relativ zum Mittelwert der Stichprobe. Es kann vermutet werden, dass zumindest bei einem Teil der Extremwerte und Outliers die relative Forschungsintensität und die damit verbundenen höheren Gehälter ursächlich sind. Abb.13: Boxplot Gehalt pro Mitarbeiter in verschiedenen Branchen

Testet man auf Normalverteilung in den verschieden Branchen, so zeigt der Kolmogorov-Smirnov, dass die Normalverteilungsannahme nicht verletzt ist.

Tab.15: Tests of Normality

Beim Shapiro- Wilk Test (nur sinnvoller Vergleich für N<50) ist geringe Signifikanz für 18, 20, 31, 34, 36 gegeben. Branche 18 wird im Folgendem von der Analyse ausgeschlossen.

Abb. 14: QQ-Plot Branche 31
Abb. 15: QQ-Plot Branche 36

Betrachtet man sich die QQ-Plots für die Branchen 31 und 36 (Abb. 14 und Abb. 15) so erkennt man ein eher unsystematisches Abweichen von der Normalverteilung. Zusammen mit den Ergebissen des Kolmogorov-Smirnov Test kann man die Verteilung in diesen Branchen für die Durchführung einer ANOVA zwar kritisch aber wohl als hinreichend normal betrachten.

Tab. 16: Wert der Teststatisitk des Extremwertes 398
Abb. 16: Grubbs Statistik 20
Abb. 17: Grubbs Statistik 34
Tab. 17: Wert der Teststatisitk des Extremwertes 133
Tab. 18: Tests of Normality

Bei den Branchen 20 und 34 werden mit Hilfe des Grubbs Test auf Ausreißer die Extremwerte überprüft unter der Annahme, dass der Kolmogorov-Smirnov Test das richtige Ergebnis der Normalverteilung geliefert hat.

  • Zunächst wird eine Normalverteilung mit den Werten der beiden Gruppen 10000 mal zufällig simuliert.
  • Die resultierende Verteilung wird als Teststatistik verwendet und als Histogramm in Abb. 16, 17 gezeigt.
  • Für die konkreten Ausprägungen der Extremwerte wird der Wert der Grubbs-Teststatistik berechnet.
  • T1 =(x(398) − Mittelwert(Branche 20))/Standardabweichung in Tab. 16
  • T2 =(x(133) − Mittelwert(Branche 34))/Standardabweichung in Tab. 17
  • Dann wird überprüft, ob die verdächtigen Beobachtungen außerhalb des 95% Konfidenzintervalls der simulierten Verteilung liegen.
  • Der Grubbs Test bestätigt, dass die Beobachtung 398 mit Wert 106784,6 DM in Branche 20 als Ausreißer betrachtet werden kann.
  • Der Grubbs Test bestätigt die Beobachtung 133 mit Wert 100182,6 DM in Branche 34 als Ausreißer
  • Die Ausprägungen beider Ausreißer werden durch den Mittelwert der Gruppe ersetzt.

Nach der Behandlung und dem Ausschluss der Branche 18 liegen nach Kolmogorov-Smirnov und Shapiro- Wilk normalverteilte Branchen vor.

Allerdings lassen sich keine Varianz-homogenen Gruppen gewinnen, die für einen Scheffé-Test gebraucht würden. Wie der Levene Test in Tab. 19 zeigt, muss die Hypothese der gleichen Varianz in den verschiedenen Branchen auf dem üblichen Signifikanzniveau abgelehnt werden.

Tab.19: Tests of Homogeneity of Variance

Tab.20: Kruskal-Wallis Test

Daher kommt erneut der Kruskal-Wallis Test zur Anwendung und potentielle Untergruppen können so nur mit Hilfe der grafischen Analyse identifiziert werden. Der nichtparametrische Test auf multiple Mittelwertgleichheit liefert die Ablehnung der Hypothese. Tab. 20 zeigt eine deutlich geringere Signifikanz als plausible alphas.

Betrachtet man die Plots der 95 % Konfidenzintervalle der einzelnen Branchen, so fällt auf, dass erneut zwei Branchen nach oben abweichen.

Abb.18: Error Bar

  • Die Mittelwerte der Chemischen Industrie und der Verlags-, Druckgewerbe, Vervielfältigungsbranche sind oberhalb der Mehrheit der KI anderer Branchen.
  • Aufschläge für gesundheitliche Belastung und Risiken sowie Gewerkschaftliche Organisation könnten mögliche Erklärungen sein.
  • Deutlich nach unten versetzt sind die Konfidenzintervalle für die Gehaltssumme pro tätigem Mitarbeiter in den Branchen Ernährungsgewerbe und dem Textilgwerbe.
  • Hier dürften ungelernte Arbeitskräfte und größere internationale Konkurrenz auf den Absatzmärkten eine Rolle spielen.

Die Beschäftigten dieser beiden Branchen müssten nach den hier vorhandenen Daten von einem Mindestlohn am ehesten betroffen sein.

Bei der Untersuchung der Gehaltskosten pro Mitarbeiter also einer Approximation des Verdienstes wurden in anderen Branche positive Abweichungen bei den Mittelwerten festgestellt als bei der Untersuchung der Nettowertschöpfung pro Umsatz. Die leicht negative Korrelation zwischen Gehaltskosten pro Mitarbeiter und Nettowertschöpfung/Umsatz von -0,107* bekräftigt dies. Gleichwohl liegt die Korrelation nach Pearson für Gehaltskosten pro Mitarbeiter und Nettowertschöpfung zu Faktorkosten bei 0,482**. Wollte man eine Aussage treffen, wer die Wertschöpfung in welcher Höhe verdient, so müsste hier weiter untersucht werden.

Analyse der Branchen nach Siedlungstypologie[edit]

Abb. 19:Siedlungsstrukturelle Kreistypen in Deutschland

Wo siedeln sich Unternehmen mit geringer Nettowertschöpfung an? Entstehen Unternehmen ertragsstarker Branchen überwiegend in einem bestimmten Siedlungsraum? Der Datensatz weist den Standort des Unternehmens mit Hilfe eines Schlüssels aus, der die siedlungsstrukturellen Kreistypen beschreibt. Um den großräumigen Kontext zu berücksichtigen, wird nicht ausschliesslich nach der Bevölkerungsdichte unterschieden sondern weiter nach der Lage im siedlungsstrukturellen Regionstyp differenziert. Mit dieser Einordnung wird der Überlegung Rechnung getragen, dass die Lebensbedingungen in den Kreisen sowie ihre Entwicklung wesentlich auch von der Entwicklung und der Struktur der jeweiligen Region bzw. des Regionstyps abhängig ist. Es wird wie folgt unterschieden.

  • Regionsgrundtyp 1: Agglomerationsräume
  • Kreistyp 1: Kernstädte Kreisfreie Städte über 100 000 Einwohner
  • Kreistyp 2: Hochverdichtete Kreise Kreise mit einer Dichte über 300 Einwohner/km²
  • Kreistyp 3: Verdichtete Kreise Kreise mit einer Dichte über 150 Einwohner/km²
  • Kreistyp 4: Ländliche Kreise Kreise/Kreisregionen mit einer Dichte unter 150 Einwohner/km²
  • Regionsgrundtyp 2: Verstädterte Räume
  • Kreistyp 5: Kernstädte Kreisfreie Städte über 100 000 Einwohner
  • Kreistyp 6: Verdichtete Kreise Kreise/Kreisregionen mit einer Dichte über 150 Einwohner/km²
  • Kreistyp 7: Ländliche Kreise Kreise/Kreisregionen mit einer Dichte unter 150 Einwohner/km²
  • Regionsgrundtyp 3: Ländliche Räume
  • Kreistyp 8: Ländliche Kreise höherer Dichte Kreise/Kreisregionen mit einer Dichte über 100 Einwohner/km²
  • Kreistyp 9: Ländliche Kreise geringerer Dichte Kreise/Kreisregionen mit einer Dichte unter 100 Einwohner/km²
Abb. 20:Boxplot der relativen Nettowertschöpfung nach Regionsgrundtypen
Tab. 22:Test auf Mittelwertgleichheit der relativen Nettowertschöpfung in den Regionsgrundtypen

Als Gruppierungsvariable wird der Regionsgrundtyp benutzt. Hierzu wurden die genaueren Kreistypen durch den zugehörigen Wert ersetzt. Bei der zu untersuchenden Variable wird jedem Unternehmen die durchschnittliche Nettowertschöpfung der zugehörigen Branche durch die durchschnittliche Nettowertschöpfung der Stichprobe zugewiesen. Somit erhält man die relative Nettowertschöpfung der jeweiligen Branche gemittelt über alle Unternehmen, die in dem entsprechenden Regionsgrundtyp ansässig sind. Hierbei fällt auf, dass die Unternehmen in Agglomerationsräumen und in den verstädterten Räumen zu leicht überdurchschnittlichen Branchen gehören. Die relativ geringe Anzahl an Unternehmen im ländlichen Raum gehört dagegen im Durchschnitt zu Branchen mit geringerer Nettowertschöpfung.

Tab. 21:Mittelwerte nach Regionsgrundtypen

Die Abweichungen von eins sind allerdings in allen Fällen nicht groß. Der Kruskal-Wallis-H Test in Tab. 22 bestätigt, dass es keine signifikante Differenz der Mittelwerte gibt. Die ausgegebene asymptotische Signifikanz liegt bei 0,386.


Tab. 23:Test of Homogeneity of Variances
Tab. 24:Kruskal-Wallis-H Test

Weiter kann man auf Unterschiede bezüglich der Variablen Nettowertschöpfung/ Umsatz testen, um Unterschiede auf der Ebene der einzelnen Unternehmen zu identifizieren.

  • Die drei Regionsgrundtypen haben eine homogene Varianz, wie der Levene Test bestätigt.
  • In Tab. 23 erkennt man, dass die Signifikanz der Varianzgleichheit bei 0,693 liegt.
  • Allerdings ergibt der Kolmogorov-Smirnov Test in Tab. 25 auf Normalverteilung beim Regionsgrundtyp 2 eine Ablehnung der Hypothese auf dem 5 % Signifikanzniveau.
Tab. 25:Test of Normality

Daher testen wir auf Parametergleichheit mit Hilfe des Kruskal-Wallis Test, der wiederum bestätigt, dass sich nach der Aufteilung der Unternehmen nach den Regionsgrundtypen die Wertschöpfung nicht signifikant unterscheidet.



Siedlungsraumtypologie und Fremdfinanzierungskosten[edit]

Lässt sich bei kleinen und mittleren Unternehmen, die in ländlichen Regionen ansässig sind eine schlechtere Kreditversorgung feststellen? Sind die Fremdfinanzierungskosten bei diesen Unternehmen höher als bei Unternehmen, denen größere Vielfalt und Möglichkeiten der Fremdkapitalbeschaffung zur Verfügung stehen? In den Daten sind Angaben zu den Fremdfinanzierungskosten enthalten. Um eine geeignete Vergleichsvariable zu erhalten, betrachten wir den Anteil dieser Kapitalkosten an den Gesamtkosten. Weiterhin ist von Interesse, wieviel Prozent des Umsatzes die Kapitaldienste ausmachen. Für beide Größen wird in Tab. 26 nach den Regionsgrundtypen unterschieden und die Mittelwerte sowie der Median ausgegeben.

Tab. 26:Mittelwerte der relativen Fremdfinanzierungskosten nach  Siedlungsstrukturellen Kreistypen

Es fällt auf, dass die Fremdkapitalkosten an den Gesamtkosten bei Unternehmen im Regionsgrundtyp 3 über 3% liegen, während Sie in dem durchschnittlichem Unternehmen der Regionsgrundtypen 1 und 2 für etwas mehr als 2,2 % verantwortlich sind.

Tab. 27:Kruskal-Wallis-H Test

Die gleiche Aussage trifft für die Fremdkapitalkosten pro Umsatz zu. Der am Umsatz gemessene Anteil ist um rund 0,4 % höher. Obwohl es keine signifikanten Unterschiede zwischen Ertragsstärke der Branchen und Nettowertschöpfung pro Umsatz der Unternehmen in den verschiedenen Regionsgrundtypen gab, scheinen die Mittelwerte hier doch zu divergieren.

Diese Unterschiede werden durch den Kruskal-Wallis Test allerdings nicht als signifikant bestätigt.

Eine stiktere Aufteilung nach der Bevölkerungsdichte könnte das Ergebnis des Testes verändern. Allerdings wäre dies nur teilweise gerechtfertigt, da die Bevölkerungsdichte bei der Standortwahl von Banken als typische Bereitsteller von Fremdkapital eine Rolle spielt, allerdings der Einzugsbereich von Filialen in benachbarten Kreisen dann keine Berücksichtigung finden würde.

Literatur[edit]

  1. Vorgrimmler, D., Sturm, R.: Konzeption des Public Use Files KSE-KMU 1999 (2003), Statistisches Bundesamt
  2. Vorgrimmler, D., Sturm, R.: Datensatzbeschreibung Public Use Files KSE-KMU 1999 (2003), Statistisches Bundesamt
  3. Rönz, B.: Skript Computergestützte Statistik 1 (2001), Humboldt- Universität zu Berlin
  4. Bundesamt für Bauwesen und Raumordnung: Karte der Kreistypen in Deutschland, www.bbr.bund.de
  5. Bundesagentur für Arbeit: Zeitreihe Arbeitnehmerüberlassungsstatistik der BA, www.arbeitsagentur.de