Mehr Geld, mehr Gerechtigkeit?
Ungleichheit der Länder global

Daniel Kogan, Moritz Mundhenke, Patrick Lowinski-Loh, Stefan Sousa & Tim Schäfer

Mehr Geld, mehr Gerechtigkeit?

Korrelation aus der Ungleichheit und der wirtschaftlichen Entwicklung

Die Wirtschaft wächst und wächst, aber der Spalt zwischen Arm und Reich wird nicht kleiner. Was läuft da schief? 1

Mit dieser inhaltvollen Schlagzeile macht ein Artikel aus DIE ZEIT Anfang 2018 auf eine vermeidlich herrschende Grundproblematik aufmerksam. Doch ist das wirklich so? Wird die Welt immer ungerechter, obwohl es immer mehr Ländern wirtschaftlich immer besser geht? Im Rahmen eines studentischen Projekts an der Hochschule Mannheim wurde dieser Sachverhalt eingehend untersucht. Die folgende Dokumentation soll die Motivation,
Grundidee und Durchführung des Projekts genauer beleuchten. Es wird in den kommenden Abschnitten explizit auf die Analyse der erhobenen Daten, die Implementierung des Prototyps, und die daraus gewonnenen Erkenntnissen eingegangen.


Inhalt

  1. Einführung
  2. Motivation und Konzept
  3. Hypothesen
  4. Daten
    4.1. Datenquellen
    4.2. Datenanalyse
    4.3. Datenaufbereitung
  5. Prototyp
  6. Fazit
    6.1. Erkenntnisse
    6.2. Ausblick

Einführung

Dieses Projekt ist im Rahmen des Moduls Grundlagen der Informationsvisualisierung (GDV) durchgeführt worden. Die Lehrveranstaltung steht allen Studenten eines Informatik-Studiengangs als Wahlpflichtfach zur Verfügung. Nach einer Auseinandersetzung mit den Grundkonzepten und Methoden der Informationsvisualisierung ist es in der zweiten Hälfte des Semesters üblich, dass sich die Studierenden in Gruppen mit einem Themengebiet
auseinandersetzen und gemeinsam darauf basierend ein Visualisierungsprojekt erarbeiten. Das Thema wird durch den Dozenten Herrn Prof. Dr. Till Nagel vorgegeben. In diesem
Semester (Wintersemester 2018/2019) bildeten die sogenannten
Sustainable Development Goals” der Vereinten Nationen den Themenschwerpunkt. Dabei handelt es sich um 17 von der UNO definierten Ziele zur nachhaltigen Entwicklung der Welt auf wirtschaftlicher, sozialer und ökologischer Ebene, beispielsweise Kein Hunger,
Klimaschutz, oder Gute Bildung.


17 Sustainable Development Goals

Zu einem oder mehreren dieser SDGs sollen die Studierenden Daten aus verschiedenen Quellen auswählen und diese mit unterschiedlichen Visualisierungstechniken interaktiv sichtbar machen. Weitere Vorgaben waren nicht gegeben. Daher bot die Aufgabenstellung einen enorm großen Spielraum hinsichtlich darauf, welche SDGs ausgewählt und welche möglichen Fragestellungen und Hypothesen durch die Daten überprüft und beleuchtet
werden sollen.

Motivation und Konzept

Um dieses weite Themenspektrum systematisch anzugehen, bestand der erste Schritt
logischerweise darin, sich mit den einzelnen SDGs auseinanderzusetzen um einen Überblick zu gewinnen. Relativ schnell gab es im Projektteam einen Konsens darüber sich mit einem wirtschaftlichen Thema zu befassen. Insbesondere war der Schwerpunkt “Arm und Reich” von besonderem Interesse, da in den Medien immer wieder die auseinandergehende Schere zwischen Arm und Reich thematisiert wird. Aus diesem Grund wurden die SDGs Menschenwürdige Arbeit und Wirtschaftswachstum (Decent work and economic growth, #8) und Verringerung der Ungleichheit (Reduced inequalities, #10) für dieses Projekt ausgewählt. Aus der Überlegung heraus, dass von einer sich entwickelnden und wachsenden Wirtschaft in einem Land die gesamte Bevölkerung davon profitieren sollte, wurden erste Gedanken für eine Hypothese abgeleitet. Parallel dazu wurden erste Ideen und Konzepte für die
Endanwendung als Paper-Prototype festgehalten.

Erste Ideen in Form eines Paper-Prototypes

Im weiteren Schritt wurden Datenquellen bezüglich den ausgewählten SDGs recherchiert. Auf der offiziellen Seite des United Nations Development Programme (UNDP) werden zahlreiche statistische Datensätze zur Verfügung gestellt, die eine weitere Analyse
ermöglichen. Nach einem Vergleich der dort angebotenen Indikatoren und Daten, entschied man sich für den sogenannten Coefficient for Human Inequality. Dieser bot eine gute Möglichkeit, die Ungleichheit in einer Bevölkerung im zeitlichen Verlauf zu betrachten. Konkret handelt es sich dabei um eine statistische Kennzahl der Ungleichheit einer Bevölkerung in den Bereichen Gesundheit, Einkommen und Bildung. Zusätzlich wurden für diesen Index Werte über mehrere Jahre angeboten, was wie erwähnt eine zeitliche
Betrachtung der Ungleichheit in verschiedenen Ländern ermöglicht. Demgegenüber wurde eine geeignete Quelle für das wirtschaftliche Wachstum recherchiert. Die Webseite der World Bank bot hierfür Datensätze zum Wachstum des Bruttoinlandsprodukts pro Kopf (GDP growth per capita) für verschiedene Länder an. Bei der ersten Exploration der Daten wurde der Ansatz jedoch wieder verworfen, da folgende Problemstellung auftrat:
Im Coefficient for Human Inequality wurde das Wachstum des Pro-Kopf-Einkommens bereits miteinberechnet. Daher wurde im ersten Visualisierungsansatz eine Proportionalität
zwischen den beiden Größen im Schaubild erkennbar. Aus diesem Grund wurde für weitere Betrachtungen das Gross domestic product (GDP) per capita in absoluten Zahlen
genommen, statt des reinen Wachstums. Der Datensatz hierfür konnte erneut auf der Seite des UNDP gefunden werden.

Hypothesen

Aus den anfänglichen Überlegungen und der Exploration der Datensätze wurden folgende Hypothesen aufgestellt, die in diesem Projekt untersucht werden sollen:

  • Bei einer steigenden/wachsenden Wirtschaft in einem Land sollte die Ungleichheit in der Bevölkerung sinken
  • Umgekehrt sollte die Ungleichheit in der Bevölkerung steigen, wenn die Wirtschaft des Landes sinkt

Daten

Datenquellen

Im Rahmen des United Nations Development Programme (UNDP) veröffentlicht das
Human Development Report Office (HDRO) jährliche Berichte, die die menschliche
Entwicklung weltweit beschreiben. Diese Daten dienen als Grundlage für politische
Diskussionen rund um die menschliche Entwicklung. Das HDRO greift auf unterschiedliche Maßnahmen zurück, um die höchste Qualität der Daten sicherzustellen. Darunter zählt die regelmäßige Kommunikation mit nationalen und internationalen Statistikämtern. Trotz dieser Zielsetzung weist das HDRO darauf hin, dass einige Probleme mit der Datenqualität bestehen. Diese werden zusammen mit den Daten auf der Webseite veröffentlicht.
Für die Hypothese standen zwei Dimensionen der Human Development Data im Fokus:

  • Inequality
  • Income/Composition of resources

Für die Beschreibung der Ungleichheit in einem Land wurde der Coefficient of Human Inequality herangezogen. Diese künstlich berechnete Kennzahl setzt sich aus den Ungleichheiten in den Bereichen Gesundheit, Bildung und Einkommen zusammen. Als Kennzahl für die wirtschaftliche Lage in einem Land wurde auf das Bruttoinlandsprodukt (BIP) pro Einwohner (engl. Gross domestic product per capita) zurückgegriffen.2 Das BIP ist das
wichtigste gesamtwirtschaftliche Produktionsmaß und stellt den Wert aller Güter und
Dienstleistungen dar, die in einem Jahr innerhalb der Landesgrenzen einer Volkswirtschaft erwirtschaftet wurde.3 Die Kaufkraftparität (engl. purchasing power parity, PPP) dient dazu, Wechselkursschwankungen zu berücksichtigen. 4 5

Datenanalyse

Zu Beginn der Analyse wurden die Daten für Coefficient of Human Inequality und
Gross domestic product (GDP) per capita aus den CSV-Dateien auf Auffälligkeiten exploriert. Erste Auffälligkeit war das ungünstige Format der Daten. Die Daten der einzelnen Länder waren nach Komma als Trennungszeichen separiert. Für die erste Analyse wurde das
Format angepasst und eine Trennung nach Spalten vorgenommen. Im neuen Format wurde festgestellt, dass leere Spalten zwischen den Jahren existierten. Beim Vergleich beider Datensätze für Coefficient of Human Inequality und Gross domestic product (GDP) per capita ist aufgefallen, dass die Zeiträume abweichen. Für den Datensatz Gross domestic product (GDP) per capita lagen Daten für die Jahre zwischen 1990 und 2017 vor, während beim Coefficient of Human Inequality nur die Daten zwischen den Jahren 2010 und 2017 vorhanden waren. Eine weitere Erkenntnis aus der Datenanalyse war die Präsenz einiger leerer Felder. Nicht für alle Jahre und für alle Länder lagen Daten vollständig vor. Nach dem Abgleich dieser Datensätze mit den ISO-Ländercodes wurde ebenso eine Differenz bei der Anzahl der
Länder festgestellt. Für eine erste Darstellung der Daten wurden die Datensätze mittels Tableau visualisiert, um erste inhaltliche Erkenntnisse zu ziehen.

Datenaufbereitung

Im ersten Schritt der Datenaufbereitung wurden überflüssige Spalten aus beiden Datensätzen entfernt. Dazu gehörten die leeren Spalten sowie die Spalte „HDI Rank (2017)“, welche für die Visualisierung keine Verwendung fand. Aufgrund der Abweichung der Zeiträume und um eine Gegenüberstellung der Daten zu ermöglichen, wurde ein
einheitlicher Zeitraum (2010 bis 2017) festgelegt. Dies hatte zur Folge, dass aus dem Datensatz Gross domestic product (GDP) per capita die Jahre 1990, 1995, 2000 und 2005 entfernt wurden. Für das Problem mit leeren Feldern musste eine Entscheidung getroffen
werden. Die zentrale Frage war, ab wann ein Land nicht weiter berücksichtigt werden soll. Entscheidend war wie viele Jahre zur Verfügung stehen. Bei zu wenigen Daten war es nicht mehr möglich, eine zeitliche Entwicklung darzustellen bzw. Erkenntnisse daraus zu ziehen. Aufgrund dessen wurde folgende Regel definiert: Ein Land wird aussortiert, falls keine Jahre oder weniger als vier Jahre auf einem der Datensätze vorliegen.

Aussortierte Länder (aufgrund mangelnder Daten)

• Algeria • Bahamas • Barbados • China • Eritrea • Djibouti • Fiji • Gambia • Hong Kong, China (SAR) • Iran (Islamic Republic of) • Micronesia (Federated States of) • Myanmar • New Zealand • Singapore • Solomon Islands • South Sudan • Sudan • Turkmenistan


Zusätzlich wurden bei großen Lücken (= mehr als 2 fehlenden Jahren) die Randwerte entfernt, da bei der Visualisierung durch ein Liniendiagramm die Ergebnisse verfälscht wären.

Südafrika mit unbereinigten Daten
Südafrika mit bereinigten Daten


Der nächste Schritt bestand im Abgleich der Länder zwischen den Datensätzen
Gross domestic product (GDP) per capita und Coefficient of Human Inequality. Schlussendlich wurden mithilfe von Tableau Prep Diskrepanzen identifiziert und bereinigt.

Betrachtete Länder (nach Abgleich)

• Afghanistan • Albania • Angola • Argentina • Armenia • Australia • Austria • Azerbaijan • Bangladesh • Belarus • Belgium • Belize • Benin • Bhutan • Bolivia (Plurinational State of) • Bosnia and Herzegovina • Botswana • Brazil • Bulgaria • Burkina Faso • Burundi • Cabo Verde • Cambodia • Cameroon • Canada • Central African Republic • Chad • Chile • Colombia • Comoros • Congo (the) • Congo (the Democratic Republic of the) • Costa Rica • Croatia • Cyprus • Czechia • Côte d'Ivoire • Denmark • Dominican Republic • Ecuador • Egypt • El Salvador • Estonia • Eswatini • Ethiopia • Finland • France • Gabon • Georgia • Germany • Ghana • Greece • Guatemala • Guinea • Guinea-Bissau • Guyana • Haiti • Honduras • Hungary • Iceland • India • Indonesia • Iraq • Ireland • Israel • Italy • Jamaica • Japan • Jordan • Kazakhstan • Kenya • Kiribati • Korea (the Republic of) • Kyrgyzstan • Lao People's Democratic Republic • Latvia • Lebanon • Lesotho • Liberia • Lithuania • Luxembourg • Madagascar • Malawi • Maldives • Mali • Malta • Mauritania • Mauritius • Mexico • Moldova (the Republic of) • Mongolia • Montenegro • Morocco • Mozambique • Namibia • Nepal • Netherlands • Nicaragua • Niger (the) • Nigeria • Norway • Pakistan • Palestine, State of • Panama • Paraguay • Peru • Philippines (the) • Poland • Portugal • Romania • Russian Federation • Rwanda • Saint Lucia • Sao Tome and Principe • Senegal • Serbia • Sierra Leone • Slovakia • Slovenia • South Africa • Spain • Sri Lanka • Suriname • Sweden • Switzerland • Tajikistan • Tanzania, United Republic of • Thailand • Macedonia (the former Yugoslav Republic of) • Timor-Leste • Togo • Trinidad and Tobago • Tunisia • Turkey • Uganda • Ukraine • United Kingdom of Great Britain and Northern Ireland • United States of America • Uruguay • Uzbekistan • Vanuatu • Venezuela (Bolivarian Republic of) • Viet Nam • Yemen • Zambia • Zimbabwe

Prototyp

Im Folgenden wird der Prototyp und seine Funktionalität beschrieben. Bei dem Prototypen handelt es sich um eine interaktive Webseite. Die Visualisierungen wurden (mit Ausnahme der Choroplethenkarte) mithilfe von D3.js in TypeScript umgesetzt. D3.js ist ein Framework für dynamische und interaktive Visualisierungen in Webseiten. Dies wird meist durch SVG, HTML5 und CSS-Standards erreicht. Bei TypeScript handelt es sich um eine Variante von JavaScript und ist daher auch mit D3 kompatibel. Um das Frontend passend
anzuordnen wurde Bootstrap verwendet. Bootstrap ist eines der verbreitesten Frontend-Frameworks und ermöglicht schnelle und optisch ansprechende Lösungen. Es wurden
ausschließlich clientseitige Technologien verwendet, wodurch der finale Prototyp auf GitHub Pages veröffentlicht werden konnte. Dadurch ist die Anwendung öffentlich zugänglich. Der Code des Prototypen ist auf GitHub zu finden.

Scatter Plot
Übersicht der Länder im zeitlichen Verlauf

Das Streudiagramm dient dazu das Verhältnis zwischen der wirtschaftlichen Stärke (GDP pro Kopf) und der Ungleicheit (Coefficient for Human Inequality) als Übersicht der einzelnen Länder zu zeigen. Die Achse des Bruttoinlandsprodukts ist logarithmisch skaliert um eine übersichtlichere Verteilung der Datenpunkte zu erhalten. Die Länder sind farblich nach Kontinenten unterteilt. Länder können zur genaueren Betrachtung ausgewählt werden, wodurch sie im Plot hervorgehoben und im Liniendiagramm dargestellt werden. Mithilfe der Kontinentenlegende können alle Länder eines Kontinents markiert und ausgewählt werden. Diese werden dann auch im neben stehenden Liniendiagramm dargestellt.
Eine Animation erlaubt das Betrachten der Verhältnisse im zeitlichen Verlauf.

Line Charts
Darstellung selektierter Länder

Es sind zwei verschiedene Arten des Liniendiagramms im Prototyp vorhanden. Die erste Art steht in direkter Verbindung zum Scatter Plot und ermöglicht den direkten Vergleich mehrerer Länder. Zusätzlich zu der Coordinated View aus Liniendiagramm und Scatter Plot gibt es eine Übersicht aller Länder jeweils als separates Liniendiagramm. Im Folgenden wird nur auf die Coordinated View eingegangen, da man dadurch die separaten Darstellungen erschließen kann. Das Liniendiagramm zeigt den zeitlichen Verlauf des GDP und
der Ungleichheit mit jeweils einer Linie. Um diese zu unterscheiden ist die GDP-Linie gestrichelt und die Linie für die Ungleichheit durchgezogen dargestellt.
Wenn mehrere Länder ausgewählt sind, werden die beiden Linien nach Land farblich kodiert. Die Achsen des Diagramms werden abhängig von der Auswahl skaliert, da bei einer absoluten Skalierung Wertänderungen nicht erkennbar sind.

Choropleth Map
Ungleichheit der Länder global

Die Choroplethenkarte (Weltkarte), welche mit Tableau erstellt wurde, ist als Bilddatei in die Webanwendung miteingebunden. Die Karte ist in einem Info-Menü zu finden und
erlaubt eine Übersicht über die Ungleichheit aller Länder. Unter der Karte sind Hyperlinks mit empfohlenen Länderauswahlen zu finden. Diese Hyperlinks verändern das
Liniendiagramm im Hintergrund.

Fazit

Erkenntnisse

Tatsächlich zeigt sich bei der Mehrheit der Länder weltweit eine positive Entwicklung, was unsere anfängliche Hypothese bestätigt:

Steigt die Wirtschaft eines Landes, so sinkt die Ungleichheit in der Bevölkerung; bzw. sie bleibt konstant, wenn diese bereits einen niedrigen Wert aufweist.

Zudem gibt es auch Beispiele, die den umgekehrten Fall der Korrelation aufweisen,
beispielsweise die Zentralafrikanische Republik: Die Wirtschaft sinkt, wodurch die
Ungleichheit steigt.

Jedoch gibt es vereinzelt Länder, die von der Korrelation abweichen, beispielsweise
Bulgarien: Trotz wachsender Wirtschaft, steigt die Ungleichheit in der Bevölkerung.

Ausblick

Ausgehend vom erhaltenen Feedback auf der iExpo ergaben sich die folgenden möglichen Verbesserungsvorschläge:

  • Suchfunktion zur Auswahl von Ländern
  • Durchschnittswerte für Kontinente zum Vergleich
  • Keine blauen Icons auf blauem Hintergrund
  • Höhere Auflösung der Visualisierungen
  • Auswahl von max. 2 Ländern
  • Start- und Endpunkt der Animation differenziert darstellen


Credits

Das Projekt wurde realisiert durch:

  • Daniel Kogan
  • Moritz Mundhenke
  • Patrick Lowinski-Loh
  • Stefan Sousa
  • Tim Schäfer

Grundlagen der Informationsvisualisierung (GDV), Wintersemester 2018/2019 bei
Herrn Prof. Dr. Till Nagel, Hochschule Mannheim