Kindersterblichkeit und Lebenserwartung in den 27 EU-Mitgliedstaaten im Zeitraum 1996-2008

From Teachwiki
Revision as of 17:38, 1 March 2010 by Navperto (Talk) (Zusammenhang zwischen dem BIP in KKS und der Kindersterblichkeit)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Error creating thumbnail: File missing
Please do not cite work from this wiki, since these are mainly students theses which may contain errors!
Error creating thumbnail: File missing

Einleitung[edit]

Dieser Artikel beschreibt die Lebenserwartung und die Kindersterblichkeit der Bevölkerung in den 27 EU-Mitgliedstaaten im Zeitraum 1996 bis 2008. Aufgrund der ähnlichen Bedingungen in diesen Ländern, können relativ homogene Ergebnisse bezüglich dieser zwei Faktoren erwartet werden.

Im ersten Teil wird die Kindersterblichkeit auf potenzielle Ausreißer untersucht. Die Verteilung der Variable wird mit dem Ziel analysiert, die Voraussetzungen für die Ausreißertests zu prüfen. Im zweiten Teil wird die Lebenserwartung der Männer und Frauen in Ost- und Westeuropa betrachtet. Die entscheidende Frage hier ist, ob belegt werden kann, dass sich die mittlere Lebenserwartung der Männer und Frauen in Osteuropa von derjenigen in Westeuropa unterscheidet. Nachfolgend wird der Zusammenhang zwischen dem Bruttoinlandsprodukt in Kaufkraftstandard pro Kopf (BIP in KKS) und der Kindersterblichkeit betrachtet. Abschließend wird noch untersucht, ob eine lineare Abhängigkeit zwischen dem BIP in KKS und der Lebenserwartung der Männer und Frauen besteht.

Datensatz und Variablen[edit]

Das Ziel der Arbeit ist es die Methoden, welche im Kurs "Computergestütze Statistik" an der Humboldt Universität zu Berlin im Wintersemester 2009/2010 vorgestellt wurden, praktisch mithilfe des Softwareprogramms SPSS 17.0 anzuwenden. Zu diesem Zweck wird ein selbst gesuchter Datensatz analysiert. Die meisten Daten stammen aus dem U.S. Census Bureau Homepage, mit der Ausnahme der Daten zum BIP in KKS. Diese wurden aus der Eurostat Homepage entnommen.

Wichtig anzumerken ist, dass im Rahmen der Arbeit die Grundgesamtheit betrachtet wird und keine Zufallsstichprobe gezogen wurde. Somit kann eine Interpretation der Testergebnisse im Sinne eines Rückschlusses auf die Grundgesamtheit nicht vorgenommen werden.

Die Variablen, welche im Rahmen dieser Arbeit untersucht werden, sind:

  • Kindersterblichkeit (IMR Both Sexes), metrisch
  • Lebenserwartung Männer (Life Expectancy Male), metrisch
  • Lebenserwartung Frauen (Life Expectancy Female), metrisch
  • Bruttoinlandsprodukt in Kaufkraftstandard pro Kopf (GDP in PPS), metrisch
  • Jahr (Year), metrisch
  • Land (Country), nominal

Zusätzlich zu den oben genannten Variablen, wurde eine neue nominale Variable „EU Region“ erstellt. Diese wird im späteren Verlauf benötigt, um die Unterschiede zwischen Ost- und Westeuropa zu untersuchen. Die Länder, welche als osteuropäische Staaten im Rahmen dieser Arbeit betrachtet werden, sind Bulgarien, Estland, Griechenland, Lettland, Litauen, Polen, Rumänien, Slowakei, Slowenien, Tschechien, Ungarn und Zypern. Die westeuropäischen Länder sind alle restlichen innerhalb der EU - Belgien, Dänemark, Deutschland, Finnland, Frankreich, Irland, Italien, Luxemburg, Malta, Niederlande, Österreich, Portugal, Schweden, Spanien, Vereinigtes Königreich. Diese Aufteilung ergibt sich aus historischen, geographischen und ökonomischen Hintergründen.

Die Variable „IMR Both Sexes“ für die Kindersterblichkeit steht für die Anzahl von Todesfällen bei Kindern gemessen pro 1000 zwischen der Geburt und dem ersten Lebensjahr. Die Variable „GDP in PPS“ misst das Bruttoinlandsprodukt in einer fiktiven Geldeinheit (Kaufkraftstandard), welche die Verzerrungen aufgrund von Unterschieden im Preisniveau verschiedener Länder ausschaltet. Der EU Durchschnitt ist 100 BIP in KKS pro Kopf.

Auswertung[edit]

Untersuchung der Kindersterblichkeit auf Extremwerte[edit]

Der nach Jahren gruppierte Boxplot für die Variable „IMR Both Sexes“ zeigt, dass Extremwerte über den gesamten Zeitraum von 1996 bis 2008 bei zwei Ländern zu beobachten sind - Bulgarien und Rumänien. Dort ist die Kindersterblichkeit am höchsten mit Werten von 35,6 in Rumänien und 25,3 Todesfällen in Bulgarien im Jahr 1996. Wie aus dem Boxplot ersichtlich ist, liegt der Median über den gesamten Zeitraum konstant bei circa 5 bis 7 Todesfällen pro 1000 Kinder. Außerdem liegen 50 Prozent der Daten in den einzelnen Jahren fast immer im gleichen Bereich - zwischen 4 und 10 Todesfälle (siehe Boxplot unten). Dies deutet darauf hin, dass die EU-Länder über diesen Zeitraum relativ konstante Werte im Bezug auf die Kindersterblichkeit ausweisen, ausgenommen Bulgarien und Rumänien.

Alt


Wenn die Entwicklung der Kindersterblichkeit in Bulgarien und Rumänien im Zeitraum 1996 bis 2008 näher betrachtet wird, kann eine sinkende Tendenz festgestellt werden. Diese lässt sich auch anhand eines 3D-Balkendiagramms veranschaulichen (siehe Abbildung unten). Die drei Dimensionen des Balkendiagramms sind „Year“, „Country“ und „Mean IMR Both Sexes“. Diese Entwicklung könnte durch einen Konvergenzprozess erklärt werden, obwohl beide Länder erst ab Januar 2007 der EU beigetreten sind. Nichtsdestotrotz könnte aufgrund der Lage der Länder in der europäischen Region, ein gewisser Anpassungsdruck entstanden sein.

Alt

Im Jahr 2008 liegen die Werte der Kindersterblichkeit in den beiden EU-Ländern deutlich niedriger als im Jahr 1996. Die Werte haben sich auf 23,7 für Rumänien und auf 18,5 für Bulgarien verbessert. Im Gegensatz dazu weisen die Länder Schweden, Finnland und Frankreich die niedrigste Kindersterblichkeit über den gesamten Zeitraum auf. Dies kann anhand der 5 niedrigsten und höchsten Werte im Auszug aus der SPSS Tabelle „Extreme Values“ belegt werden (siehe Tabelle unten).

Boxplot 1996-2008

Um genauer untersuchen zu können, ob die Extremwerte bei den beiden Ländern Bulgarien und Rumänien im Boxplot Ausreißer sind, müssen geeignete Ausreißertests angewendet werden. Eine Voraussetzung für die statistische Prüfung mittels Ausreißertests ist die Normalverteilung der untersuchten Variablen. Zu diesem Zweck wird im nächsten Abschnitt die Verteilungsform der Variable „IMR Both Sexes“ geprüft.

Prüfung der Verteilungsform der Kindersterblichkeit[edit]

Wie das Histogramm für die Variable „IMR Both Sexes“ zeigt, handelt es sich um eine linksteile und rechtsschiefe Verteilung (siehe Abbildung unten).

Histogramm Kindersterblichkeit

Die Asymmetrie der Verteilung wird durch die Kennzahl Schiefe gemessen. Diese liegt deutlich über den Wert für eine symmetrische Verteilung (Schiefe=0) bei 2,767 und deutet auf eine rechtsschiefe Verteilung hin. Die Kurtosis ist eine weitere Kennzahl, welche die Abweichung von der Steilheit der Normalverteilung misst. Die Kurtosis für die Variable „IMR Both Sexes“ ist 7,779. Da dieser Wert deutlich über Null liegt, ist die Verteilung der Variable steiler als die erwartete Normalverteilung.

Alt

Grafisch kann mittels Wahrscheinlichkeitsplots geprüft werden, ob die empirische Verteilung einer stetigen Variable einer angenommenen Testverteilung entspricht. Im Folgenden werden zwei Plots verwendet - der normale Quantil-Quantil-Plot und der trendbereinigte (detrended) Quantil-Quantil-Plot. Der normale Q-Q Plot ergibt sich, indem die empirischen Quantile gegen die entsprechenden unter der Annahme einer Normalverteilung erwarteten Quantile in ein Koordinatensystem eingetragen werden. Wie aus dem Q-Q-Plot ersichtlich, liegt eine starke Abweichung von der Winkelhalbierenden vor. Dies lässt darauf schließen, dass eine andere als die Normalverteilung vorliegt. Beim trendbereinigter Q-Q-Plot werden die geordneten Beobachtungswerte gegen die Differenz der beobachteten standardisierten Werte und den unter der Normalverteilung erwarteten Werten aufgetragen. Da diese Punkte für die Variable „IMR Both Sexes“ nicht auf der horizontalen, durch den Nullpunkt verlaufenden Gerade liegen, liegt keine Normalverteilung vor.

Quantil-Quantil-Plot für die Kindersterblichkeit

Die bisher verwendeten grafischen Methoden für die Prüfung der Verteilungsform der Variable sind nicht ausreichend, um eine genaue Aussage über die Gestalt der Häufigkeitsverteilung treffen zu können. Weitere statistische so genannte Anpassungstests müssen durchgeführt werden. Zwei Tests werden hier in Betracht gezogen - der Kolmogorov-Smirnov-Test und der Chi-Quadrat-Anpassungstest. Diese nicht parametrischen Tests prüfen die Hypothese, ob die Verteilung einer Stichprobe aus einer Grundgesamtheit mit einer theoretischen Verteilung übereinstimmt. Da in diesem Fall die Grundgesamtheit anstatt einer Zufallsstichprobe untersucht wird, wird eine der Vorraussetzungen für die Anpassungstests nicht eingehalten.

Bei dem Kolmogorov-Smirnov-Test wird die Gleichheit der empirischen Verteilung und der Normalverteilung (Nullhypothese) gegen die Altenativhypothese geprüft. Die Teststatistik misst den größten absoluten vertikalen Abstand zwischen der empirischen und hypothetischen Verteilungsfunktion. In diesem Fall soll eine Prüfung auf dem vorgegebenen Signifikanzniveau von 5 Prozent erfolgen. Da die Testergebnisse immer eine Signifikanz kleiner als das vorgegebene Niveau von 0,05 aufweisen, wird die Nullhypothese verworfen. Daher entspricht die empirische Verteilung der Variable „IMR Both Sexes“ nicht der Normalverteilung.

Alt

Der zweite Test zur Prüfung der Verteilungsform der Variable ist der Chi-Quadrat-Anpassungstest. Da die Variable für die Kindersterblichkeit „IMR Both Sexes“ als eine stetige Variable betrachtet wird, muss eine Intervallbildung der beobachteten Werte in aneinander angrenzenden Klassen vorgenommen werden. Diese ist eine der Voraussetzungen, um den Chi-Quadrat-Anpassungstest durchführen zu können. Die Daten für die Kindersterblichkeit wurden in 16 Klassen zusammengefasst und eine neue klassierte Variable wurde erstellt - „IMR Both Sexes_binned“.

Bei dem Chi-Quadrat-Anpassungstest wird die gleiche Null- beziehungsweise Alternativhypothese wie bei dem Kolmogorov-Smirnov-Test geprüft. Auf einem Signifikanzniveau von 5 Prozent soll mit dem Chi-Quadrat-Anpassungstest getestet werden, ob die Variable normalverteilt ist. Da die asymptotische Signifikanz kleiner als das vorgegebene Niveau von 5 Prozent ist, wird die Nullhypothese abgelehnt. Demzufolge ist die zu untersuchende Variable nicht normalverteilt.

Klassierung der Daten und Chi-Quadrant-Anpassungstest

Transformation der Variable Kindersterblichkeit[edit]

Die bisher angewendeten Methoden haben gezeigt, dass die Variable für die Kindersterblichkeit keine Normalverteilung aufweist. Aus diesem Grund können die Ausreißertests nicht sinnvoll durchgeführt werden, da eine der Grundvoraussetzungen verletzt ist. Eine Möglichkeit eine approximativ symmetrische Verteilung zu erreichen ist die Transformation der Daten. Ein potenzieller Nachteil dieser Vorgehensweise ist die erschwerte Interpretation der erzielten Ergebnisse.

Es wird die Potenztransformation mit der Konstante c=0 gewählt, da keine negativen Werte in den Daten vorliegen. Der Exponent p wird kleiner als 0 gesetzt, da eine rechtschiefe Verteilung vorhanden ist. Somit wird bewirkt, dass kleinere Werte eine größere Ausdehnung erfahren als große Werte. Die Variable wird iterativ solange mit p<0 transformiert bis annähernd der gleiche Abstand vom 25-Prozent-Perzentil zum Median und vom 75-Prozent-Perzentil zum Median erreicht wird. Diesem Kriterium entspricht die Variable „IMR Both Sexes_Transformed13“, welche als Basis die ursprüngliche Variable „IMR Both Sexes“ hat und einen Exponent von 1/13 hat (siehe Tabelle unten). Diese approximativ symmetrisch verteilte Variable wird zunächst mittels des Kolmogorov-Smirnov-Tests gegen die Normalverteilung geprüft.

Transformation der Variable "IMR Both Sexes"

Die Ergebnisse des Kolmogorov-Smirnov-Tests lehnen die Nullhypothese ab (siehe Abbildung oben). Weiterhin liegt keine Normalverteilung für die Variable Kindersterblichkeit vor. Aus diesem Grund wird auf die Verwendung der Ausreißertests im Rahmen dieser Arbeit verzichtet.

Obwohl keine Normalverteilung für die Variable „IMR Both Sexes“ gegeben ist und keine Ausreißertests sinnvoll durchgeführt werden können, kann schließlich behauptet werden, dass die Extremwerte für die Kindersterblichkeit bei den beiden Ländern Bulgarien und Rumänien Ausreißer sind. Der Grund dafür ist, dass diese Werte sehr weit vom Durchschnitt und deutlich außerhalb des „upper fence“ im Boxplot liegen. Demzufolge werden diese Extremwerte aus dem Datensatz entfernt und die dadurch bereinigten Daten weiterhin benutzt.

Untersuchung der Lebenserwartung der Männer und Frauen in Ost- und Westeuropa[edit]

In diesem Abschnitt wird untersucht wie sich die Lebenserwartung der Männer und Frauen in Osteuropa von derjenigen in Westeuropa unterscheidet. Drei Verfahren kommen hier in Betracht - Fehlerbalkendiagramm, Varianzhomogenitätsprüfung und T-Tests zur Prüfung der Mittelwerte in den Grundgesamtheiten. Alle diese drei Methoden setzten eine Zufallsstichprobe voraus, auf deren Basis Rückschlüsse auf die Grundgesamtheit gezogen werden können. Da aber in diesem Fall die Grundgesamtheit anstatt einer Zufallsstichprobe untersucht wird, ist eine Interpretation der Ergebnisse in Bezug auf die Grundgesamtheit nicht möglich.

Im Allgemeinen, werden im Fehlerbalkendiagramm die Unterschiede zwischen den Mittelwerten der Stichproben grafisch dargestellt. Die Querbalken im Diagramm stellen den 95%-Konfidenzintervall für den Mittelwert in der Grundgesamtheit dar. Das heißt, dass der Mittelwert der Grundgesamtheit mit einer Wahrscheinlichkeit von 95 Prozent im Bereich zwischen den Querbalken liegt. Die gerundeten Punkte im Diagramm repräsentieren die Lage der Stichprobenmittelwerte. Wie schon erwähnt, ist das Verfahren in diesem Fall weniger aussagekräftig, da keine Zufallsstichproben vorliegen.

Zuerst wird die Lebenserwartung der Männer in Ost- und Westeuropa betrachtet. Wie aus dem Fehlerbalkendiagramm erkennbar, liegt die mittlere Lebenserwartung der Männer in Westeuropa bei 75,5 Jahren, während diese in Osteuropa den deutlich niedrigeren Wert von 69,5 Jahren aufweist. Die Konfidenzintervalle der beiden Kategorien überschneiden sich nicht, was auf signifikante Unterschiede in den Mittelwerten hindeutet.

Alt

Aus dem Fehlerbalkendiagramm für die Lebenserwartung der Frauen geht hervor, dass die mittlere Lebenserwartung in Osteuropa bei 77,6 Jahren liegt, während diese in Westeuropa 81,5 Jahre beträgt. Die Konfidenzintervalle überschneiden sich nicht. Daher existieren signifikante Unterschiede zwischen den Mittelwerten der beiden Kategorien. Insgesamt lässt sich auch erkennen, dass Frauen innerhalb der EU im Durchschnitt länger leben als Männer.

Alt

Um die Mittelwertdifferenzen zu testen, muss zuerst die Prüfung der Stichprobenvarianzen auf Gleichheit beziehungsweise Ungleichheit stattfinden. Bei beiden Variablen, Lebenserwartung der Männer und Frauen, wird der Levene Test zur Prüfung der Gleichheit von Varianzen angewendet. Dieser eignet sich besser als der F-Test, da keine Normalverteilung der Variablen vorausgesetzt wird. Da die Prämisse für die Zufallsstichproben auch in diesem Fall nicht erfüllt ist, hat das Ergebnis nur eine eingeschränkte Aussagekraft.

Die Nullhypothese auf Gleichheit der Varianzen wird bei beiden Variablen getestet. Sowohl bei der Lebenserwartung der Männer, als auch bei der Lebenserwartung der Frauen in Ost- und Westeuropa ist die Signifikanz kleiner als das vorgegebene Signifikanzniveau von 5 Prozent. Daher wird die Nullhypothese bei beiden Variablen abgelehnt. Dies bedeutet, dass eine Varianzheterogenität vorliegt. Nach dieser Erkenntnis kann die Prüfung der Gleichheit der Mittelwerte mittels parametrischer Tests stattfinden.

Levene Test

In diesem Fall handelt es sich um einen Test der Mittelwerte zweier Grundgesamtheiten mit ungleichen, unbekannten Varianzen. Der so genannte T-Test ist ein Zweistichprobentest, der auf den Ergebnissen zweier Zufallsstichproben beruht. Da diese im Rahmen der Arbeit nicht gegeben sind, sondern die Grundgesamtheit untersucht wird, sind die Testergebnisse mit Vorsicht zu handhaben.

Verschiedene Fälle sind bei diesem Test möglich - eine einseitige Fragestellung oder eine zweiseitige Fragestellung. Der zweite Fall testet die Nullhypothese (Gleichheit der beiden Mittelwerte) gegen die Alternativhypothese (Ungleichheit der beiden Mittelwerte). Bei der einseitigen Fragestellung handelt es sich entweder um einen linksseitigen oder einen rechtsseitigen Test. Bei der Lebenserwartung der Männer und Frauen geht es um einen linksseitigen Test, da die Teststatistik in beiden Fällen einen negativen Wert annimmt. Die Null- und Alternativhypothese werden für beide Variablen folgendermaßen definiert:

  • Ho: μ East ≥ μ West
  • H1: μ East < μ West

Es soll auf einem Signifikanzniveau von 5 Prozent geprüft werden, ob die Lebenserwartung der Männer in Osteuropa einen größeren Mittelwert aufweist als die der Männer in Westeuropa. Analog soll die gleiche Nullhypothese auch bei der Variable Lebenserwartung der Frauen getestet werden.

Die zu interpretierende Zeile in den T-Test Ergebnissen ist die „Equal variances not assumed“ Zeile, da der Levene Test die Varianzheterogenität bewiesen hat. In SPSS wird stets ein zweiseitiger T-Test durchgeführt. Da aber in diesem Fall ein linksseitiger Test vorliegt, soll die ausgegebene Signifikanz durch 2 geteilt werden. Erst dann kann die ausgegebene Signifikanz mit dem vorgegebenen Signifikanzniveau von 5 Prozent verglichen werden. Sowohl bei der Lebenserwartung der Männer, als auch bei der Lebenserwartung der Frauen ist die ausgegebene Signifikanz kleiner als 5 Prozent. Somit wird die Nullhypothese verworfen und die Alternativhypothese angenommen. Das heißt, dass die mittlere Lebenserwartung der Frauen und der Männer in Osteuropa kleiner ist, als diejenige in Westeuropa.

T-Test zur Prüfung der Mittelwerte

Zusammenhang zwischen dem BIP in KKS und der Kindersterblichkeit[edit]

Um den Zusammenhang zwischen den Variablen Bruttoinlandsprodukt in Kaufkraftstandard („BIP in KKS“) und Kindersterblichkeit („IMR Both Sexes“) zu untersuchen, wird ein einfaches Streudiagramm erstellt. Da die Extremwerte bei der Variable Kindersterblichkeit schon im Vorfeld aus den Daten entfernt wurden, soll nun auch die Variable Bruttoinlandsprodukt auf potenzielle Ausreißer untersucht werden. Da die Variable „BIP in KKS“ keine Normalverteilung hat und keine Ausreißertests durchgeführt werden können, basiert die Analyse der potenziellen Ausreißer nur auf dem Boxplot. Dort erkennt man Extremwerte für das Bruttoinlandsprodukt von Luxemburg konstant über den gesamten Zeitraum 1997-2008 (siehe Abbildung unten). In diesem Fall findet die Betrachtung erst ab 1997 anstatt ab 1996 statt, da keine Daten zum BIP für das Jahr 1996 vorliegen.

Alt

Da diese Werte für Luxemburg weit über den „upper fence“ im Boxplot liegen und der EU Durchschnitt 100 BIP in KKS pro Kopf beträgt, kann der Rückschluss getroffen werden, dass diese Extremwerte als Ausreißer zu betrachten sind. Somit werden sie von den Daten ausgenommen.

Nachdem die Daten von Extremwerten bereinigt wurden, kann ein Scatterplot für den Zusammenhang der zwei Variablen erstellt werden. Hier wird das Bestimmtheitsmaß R^2 betrachtet, um festzustellen, wie viel Prozent Streuung in der abhängigen Variable sich auf die unabhängige Variable zurückführen lassen. In diesem Fall wird angenommen, dass die abhängige Variable die Kindersterblichkeit („IMR Both Sexes“) und die unabhängige das BIP in KKS ist. Das Bestimmtheitsmaß ist gleich 1, wenn alle Punkte im Streudiagramm exakt auf der Regressionsgeraden liegen und dies auf einen perfekten lineareren Zusammenhang hindeutet. Das Bestimmtheitsmaß ist 0, wenn zwischen den Merkmalen keinerlei linearer Zusammenhang besteht.

Wenn die Entwicklung über den Zeitraum 1997-2008 betrachtet wird, können folgende Bestimmtheitsmaße für die einzelnen Jahren errechnet werden: R^2_{1997} = 0,559, R^2_{1998} = 0,46, R^2_{1999} = 0,487, R^2_{2000} = 0,378, R^2_{2001}= 0,359, R^2_{2002} = 0,348, R^2_{2003}= 0,337, R^2_{2004}= 0,335, R^2_{2005} = 0,316, R^2_{2006} = 0,335, R^2_{2007} = 0,327, R^2_{2008} = 0,329.


Scatterplot Kindersterblichkeit und BIP in KKS 1997-2008
Scatterplot IMR Both Sexes 97-00.jpg
Scatterplot IMR Both Sexes 01-04.jpg
Scatterplot IMR Both Sexes 04-08.jpg

Insgesamt kann kein linearer Zusammenhang zwischen den beiden Variablen Kindersterblichkeit und Bruttoinlandsprodukt in Kaufkraftstandard pro Kopf festgestellt werden.

Zusammenhang zwischen dem BIP in KKS und der Lebenserwartung von Männern und Frauen[edit]

Um den Zusammenhang zwischen den Variablen BIP in KKS und Lebenserwartung von Männern und Frauen zu untersuchen, wird ein „Overlay Scatterplot“ oder ein überlagertes Streudiagramm erstellt. Bei diesem Diagramm wird wieder das Bestimmtheitsmaß der linearen Regression betrachtet, um einen Rückschluss auf den linearen Zusammenhang der Variablen erzielen zu können. Die blaue Farbe im Streudiagramm repräsentiert die Lebenserwartung der Männer und die grüne Farbe - die Lebenserwartung der Frauen (siehe Abbildung unten). Insgesamt wird aus den Streudiagrammen ersichtlich, dass Frauen in der EU eine höhere Lebenserwartung als Männer haben.

Die Entwicklung des Bestimmtheitsmaßes über den Zeitraum 1997-2008 in den einzelnen Jahren deutet auf einen stark ausgeprägten linearen Zusammenhang hin. Folgende Werte ergeben sich für den linearen Zusammenhang zwischen BIP in KKS und der Lebenserwartung der Männer: R^2_{1997} = 0,794, R^2_{1998} = 0,764, R^2_{1999} = 0,77 , R^2_{2000}= 0,776 ,R^2_{2001}= 0,766, R^2_{2002} = 0,747 ,R^2_{2003}= 0,733,R^2_{2004}= 0,71, R^2_{2005} = 0,69 ,R^2_{2006} = 0,67 , R^2_{2007} = 0,643,R^2_{2008}= 0,661.

Es besteht jedoch kein perfekter linearer Zusammenhang und diese Tendenz wird sogar über den Zeitraum insgesamt schwächer, wie aus den Werten abzulesen ist.

Eine ähnliche Entwicklung ist auch zwischen den Variablen Lebenserwartung der Frauen und BIP in KKS zu beobachten. Das Bestimmtheitsmaß nimmt in diesem Fall folgende Werte in den einzelnen Jahren an: R^2_{1997} = 0,737,R^2_{1998} = 0,753, R^2_{1999} = 0,707 , R^2_{2000}= 0,69 ,R^2_{2001}= 0,684, R^2_{2002} = 0,662 , R^2_{2003}= 0,66, R^2_{2004}= 0,623, R^2_{2005}= 0,612, R^2_{2006} = 0,602 , R^2_{2007} = 0,588, R^2_{2008}= 0,601.


Scatterplot Lebenserwartung Männer/Frauen und BIP in KKS 1997-2008
Scatterplot BIP Life Expectancy 97-00.jpg
Scatterplot BIP Life Expectancy 01-04.jpg
Scatterplot BIP Life Expectancy 05-08.jpg

Fazit[edit]

Die Ergebnisse der Untersuchung der Kindersterblichkeit liefern ein relativ homogenes Bild innerhalb der EU, mit Ausnahme von zwei Ländern - Bulgarien und Rumänien. Der Median liegt über den gesamten Zeitraum 1996 bis 2008 im Bereich zwischen 5 und 7 Todesfälle pro 1000 Kinder. Die Situation bei den zwei Ländern mit Extremwerten hat sich in den letzten Jahren in Bezug auf die Kindersterblichkeit verbessert und die Extremwerte nahmen im Laufe der Zeit ab. Dies könnte als ein Hinweis auf einen laufenden Konvergenzprozess innerhalb der EU verstanden werden.

Nichtsdestotrotz bestehen immer noch bedeutende Unterschiede zwischen der Lebenserwartung der Männer und Frauen in Ost- und Westeuropa. Zum einen könnte sich dies aus der Aufteilung der Länder in Ost- und Westeuropa ergeben. Diese Dichotomisierung der Variable „Country“ in einer neuen Variable „EU Region“ wurde vorgenommen, indem geographische, historische und ökonomische Hintergründe berücksichtigt wurden. Trotzdem kann keine scharfe Trennung vorgenommen werden, welche gewisse Länder als eindeutig osteuropäisch oder westeuropäisch eingruppiert. Andererseits könnte der signifikante Unterschied zwischen Ost- und Westeuropa auch dadurch erklärt werden, dass die Lebenserwartung und das BIP in KKS einen relativ starken linearen Zusammenhang ausweisen. Demzufolge resultiert hieraus eine niedrigere Lebenserwartung in denjenigen Ländern, welche auch ein niedrigeres BIP in KKS pro Kopf haben. Im Rahmen der Arbeit hat sich gezeigt, dass kein linearer Zusammenhang zwischen den Variablen BIP in KKS und der Kindersterblichkeit existiert.

Das primäre Ziel der Arbeit war die zwei Merkmale Kindersterblichkeit und Lebenserwartung innerhalb der EU zu untersuchen. Um die Hypothese eines Konvergenzprozesses innerhalb der EU prüfen zu können, müssen weitere soziodemographische Faktoren analysiert werden. Es könnte auch von Bedeutung sein, die einzelnen Länder innerhalb der EU zu betrachten anstatt diese in Regionen zu gruppieren, um besser Unterschiede eingrenzen zu können.

Literatur und Quellen[edit]