Sascha Betzwieser, Markus Klatt, Eugen Krizki, Felix Navas und Anusan Ranjan
Visualisierung der weltweiten Mordrate
Im Rahmen des Projektes wurden Daten verschiedener öffentlich zugänglicher Quellen, vornehmlich der UN, zur Thematik der Sustainable Development Goals (SDG) visualisiert. In einem stetig wachsenden und sich entwickelnden Zeitalter ist es nur logisch, dass sich nicht alle Menschen weltweit gleichermaßen nachhaltig entwickeln können. Mithilfe der Visualisierung der Mordraten gehen wir der Frage nach, wie sich die Lebensumstände, die Qualität von Bildung, die Wirtschaftlichkeit und die Verteilung von Wohlstand auf die Mordrate auswirken können und ob es Gemeinsam- oder Auffälligkeiten gibt.
Inhalt
1 Konzeption
Dem Entwicklungsprozess ist eine Konzeptionsphase vorangegangen. In dieser Phase sind Ideen zu einer intuitiven Weboberfläche gesammelt worden, um Daten nutzerfreundlich darzustellen. Ziel ist es auch gewesen, durch die Visualisierung Information zu gewinnen, die in den Rohdaten nicht direkt ersichtlich sind. Eine Auswahl und Beschreibung dieser Ideen hierzu finden Sie unter Punkt 3.2 Visualisierungsprozess.
1.1 Einführung
Ziel des Projektes ist es gewesen durch eine Visualisierung Korrelationen zwischen Mordrate und Lebensumstände zu untersuchen. Als Lebensumstände sind von uns das Bruttoinlandsprodukt (BIP), der GINI-Index und der Bildungsindex ausgewählt worden.
1.2 Motivation
Motiviert aus der Möglichkeit einzelne Kontinente, Subregionen und Staaten einfach miteinander vergleichen zu können stießen wir bei der Datenrecherche auf ein Paper.
“Whats causes violent crime?”
Pablo Fajnzylber, European Economic Review 2000
Welches die Auswirkungen bestimmter Lebensumstände auf die Mordrate eines Landes behandelt. Was indirekt zur zusätzlichen Motivation der Darstellung bzw. Prüfung von Inhalten aus diesem führte. Weiterhin stießen wir auf Projekte, die diverse Ähnlichkeiten aufwiesen, wodurch die qualitative Anforderung entstand ggf. die Darstellungen existierender ähnlicher Ansätze falls möglich zu verbessern. Die interessantesten Ansätze finden Sie unter Punkt 3.1 Verwandte Arbeiten & Inspiration.
1.3 Fragestellung
Aus einer Reihe an konzeptionellen Fragestellungen führten uns die folgenden zur Kernthematik.
- Welchen Einfluss haben Bildung, Wohlstand und Verteilung von Reichtum auf die Rate von Gewaltverbrechen und Morden?
- Führt eine große Kluft zwischen Arm und Reich zu mehr Gewaltverbrechen?
- Führen schlechte Bildung und Armut zu einer erhöhten Gewaltbereitschaft?
Lebensumstände und deren Auswirkungen auf Mordraten
2 Datenbasis
Im Folgenden werden, die für die Visualisierung zugrunde liegenden Daten und deren Quellen beschrieben.
2.1 Datenquellen
Unser Themenschwerpunkt spiegelt sich vor allem in den vier folgenden SDGs und deren Indikatoren wieder.
- SDG 4 - Hochwertige Bildung
(UN Human Development Reports, Education Index, Human Development Index) - SDG 8 - Menschenwürdige Arbeit und Wirtschaftswachstum
(8.1.1 Annual growth rate of real GDP per capita) - SDG 10 - Weniger Ungleichheiten
(OECD Income inequality) - SDG 16 - Frieden, Gerechtigkeit und starke Institutionen
(16.1.1 Number of victims of intentional homicide per 100.000 population)
Nach Sichtung verschiedener Daten auf Basis der oben genannten SDGs und dem Vergleich mit unseren Anforderungen entschieden wir uns folgende Quellen für die geplante Visualisierung zu berücksichtigen.
- UN Education index
- UN Intentional homicide per 100,000 population
- Worldbank GDP per capita
- Worldbank GINI index
Zur Anzeige aller Länder in einer Karte und ihrer Gruppierung zu Sub-Regionen und Kontinenten wurden außerdem folgende Datenquellen verwendet:
Außerdem wurden für die Akkumulierung der Indizes in Relation zur Bevölkerungsgröße für Sub-Regionen und Kontinente die jeweiligen Bevölkerungszahlen benötigt.
2.2 Datenerhebung
Auffällig war, dass es verhältnismäßig sehr viel Zeit in Anspruch nahm, ansatzweise vielfältige und vollständige Datensätze zu finden. Da es keine zentrale Erfassung der von uns gesuchten Daten gibt und diese von Land zu Land unterschiedlich gehandhabt werden sind zumeist viele Zusammenstellungen mit verschiedenen Werten vorzufinden. Insbesondere Datenlücken in bestimmten Zeitintervallen erschwerte eine so detailreiche Darstellung wie von uns geplant bzw. durch die Aussagen im Paper vorausgesetzt. Die vielversprechendste Lösung war die Idee der Bildung eines Mittelwerts über einen fest definierten Zeitraum.
2.3 Datenauswertung
Die Auswertung der Daten und dessen Qualität erfolgte ausschließlich manuell. Detailliertere Informationen zur Qualität der verwendeten Daten finden Sie unter 3.3 Visualisierungsexperimente.
2.4 Datenaufbereitung
Die Bearbeitung der Datensätze war ein aufwendiger Prozess. Am Anfang war es schwer, konsistente Daten zu finden. Unsere erste Idee war es verschiedene Quellen zu benutzen, um fehlende Daten aufzufüllen. Nach einer Besprechung mit Professor Nagel haben wir uns aber entschieden nur mit einer Informationsquelle pro Kategorie zu arbeiten, da man sich nicht sicher sein konnte, ob alle Quellen die Daten nach den selben Kriterien erheben. Daher entschieden wir uns für eine vertrauenswürdige und weltweit anerkannte Quelle - die United Nations (UN). Für den Bildungs-Index und den GINI-Index haben wir die World Bank Datenbank benutzt. Danach ging es um die Verarbeitung der Informationen. Viele Faktoren haben die Lücken in den Daten hervorgerufen, wie z.B. Kriege, Umweltkatastrophen, Embargos (Nord-Korea). Um die fehlenden Einträge zu eliminieren haben wir uns entschlossen den Bereich von 2007 bis 2016 zu benutzen und die Daten in diesem Zeitraum zu mitteln. Diesen Mittelwert haben wir dann verwendet, um unser Dashboard umzusetzen. Unsere Datenaufbereitung erwies sich in einem ersten prototypischen Visualisierungsexperiment als sinnvoll und praktikabel. Wodurch wir in unsere Datenbasis bestätigt wurden. Die Ergebnisse besagter Visualisierungsexperimente finden Sie unter Punkt 3.3 Visualisierungsexperimente.
3 Entwicklungsprozess
Im folgenden Abschnitt werden die inhaltliche Entwicklung der Darstellung und Visualisierungsmöglichkeiten des Prototyps geschildert.
3.1 Verwandte Arbeiten & Inspiration
Während der Datenrecherche stießen wir neben dem oben genannten Paper auch noch auf einige Interessante verwandte Arbeiten mit Visualisierungen, die wir zur Inspiration nahmen und als Nebeneffekt zu unserem Prototyp sinnvoll ergänzen bzw. ggf. verbessern wollten.
World Income, Inequality and Murder Dieses Projekt untersucht den Einfluss der Einkommensungleichverteilung auf die Mordrate von Ländern, durch eine Visualisierung des GINI-Index im Vergleich zur Mordrate. Innerhalb eines Koordinatensystems werden die einzelnen Staaten in einem Punktdiagramm über die Farbe ihren jeweiligen geografischen Regionen zugeordnet. Die Größen der Punkte stellen hierbei die Bevölkerung dar. Weiterhin wird über die Farbe eine Trendlinie dargestellt. Anhand der gewählten Darstellungsmittel kann in einer Animation die Zu- und oder Abnahme der Mordraten von Regionen und einzelner Staaten über mehrere Jahre hinweg übersichtlich dargestellt werden. |
World Income, Inequality and Murder |
Homicide Monitor Der Homicide Monitor veranschaulicht die weltweite Mordrate und nimmt Bezug auf Metadaten wie die Gesamtbevölkerung, die Mordwaffen, das Geschlecht sowie das Alter der Opfer. |
Homicide Monitor |
WHO Global Health Estimates Der Bericht “WHO Global Health Estimates” nutzt ebenfalls die Daten einer globalen Mordrate, sowie der Differenzierung zwischen Geschlechtern und dem Alter. Visualisiert ist dies sehr simpel auf einer Weltkarte über verschieden große Rauten und setzt auf Details on Demand. Generell eine sehr simple aber überschaubare Darstellung. |
WHO Global Health Estimates |
UNODV Global Study on Homicide Die “Global Study on Homicide” sticht vor allem durch sehr spezifische und Daten und dessen Vielfalt hervor. |
UNODV Global Study on Homicide |
3.2 Visualisierungsexperimente
Um sicherzustellen, dass unsere Datensätze eine angemessene Qualität haben, visualisierten wir die Daten ähnlich dem Projekt in 3.1 World Income, Inequality and Murder. Die Ergebnisse spiegelten ähnliche Werte wie in den betrachteten verwandten Arbeiten wieder. Weiterhin konnten wir auch die Aussage treffen, dass der GINI-Index und das BIP offensichtlich mit der Mordrate korrelieren. Der Education Index scheint hierbei jedoch nicht relevant. | Visualisierungsexperiment Vergleich Mordrate zu Wohlstandsverteilung |
Visualisierungsexperiment Vergleich Mordrate zu Bildung | Visualisierungsexperiment Vergleich Mordrate zu Wohlstand |
3.3 Erkenntnisse
Wir konnten die Aussagen aus dem Paper erwartungsgemäß bestätigen. Es gab klar erwartete Ergebnisse aber auch Werte die zunächst vermeintlich zufällig – fast wahllos ohne Anzeichen auf Zusammenhänge aufgetreten sind. Die Begründung hierfür liegt in der Aggregation einzelner Staaten zu Regionen bzw. diese wiederum zu Kontinenten. Man kann also klar die Aussage treffen, dass die Qualität von Bildung auf Basis unserer Daten einen Einfluss auf die Mordrate nimmt, die Faktoren BIP sowie GINI-Index mit den Mordraten korrelieren und die Qualität der Bildung keine Auswirkungen bewirkt.
4 Prototyp
In diesem Abschnitt werden technische Details und besondere Herausforderungen in der Umsetzung, sowie eine Funktionsbeschreibung durchgeführt. Der Prototyp ist verfügbar auf github.com.
4.1 Verwendete Tools & Frameworks
Zur Entwicklung des Prototyps wurden node.js zusammen mit express.js für das Backend verwendet. Das Frontend wurde mittels JavaScript und d3.js, einer JavaScript-Bibliothek zur Erstellung dynamischer, interaktiver Datenvisualisierungen in Webbrowsern, realisiert. Für das Design des Frontends wurde zusätzlich Bootstrap für ein responsive Design eingebunden, um die Portierbarkeit auf unterschiedliche Bildschirmgrößen zu gewährleisten.
4.2 Systemarchitektur
Das Backend wurde als REST API implementiert, welche die von uns gefundenen Datenquellen über mehrere Endpunkte zur Verfügung stellt. Hierfür wird die jeweilige CSV-Datei eingelesen und als JSON-Objekt versendet.
Das Frontend wurde als Single Page Applikation realisiert. Dabei werden die Inhalte dynamisch in eine Seite geladen, anstatt die Seite komplett neu zu laden, was dabei hilft, die Usability zu verbessern, da das Laden neuer Seiten entfällt und der Benutzer dadurch unterbrechungsfrei mit der Applikation interagieren kann.
4.3 Herausforderungen
Eine Herausforderung bestand in der Größe der geojson-Dateien, die wir für die Generierung der Weltkarte benötigten. Anfänglich speicherten wir die Dateien im Backend und wollten diese ebenfalls per REST API Endpunkt zur Verfügung stellen. Allerdings hatten diese Daten eine Größe von 56 MB was dazu führte, dass die Seite sehr lange benötigte um sich aufzubauen, da allein die Übertragung der geojson-Daten 2-3 Minuten dauerte. Daraufhin entschieden wir uns, die Daten für das Erstellen der Karte im Frontend zu belassen um die Geschwindigkeit des Seitenaufbaus zu verbessern. Durch Nutzung einer kleineren geojson-Datei, mit niedrigerem Detailgrad, konnte die Ladegeschwindigkeit der Karte weiter verbessern, sodass diese nun in ca. 1-2 Sekunden geladen wird, wie im folgenden Bild zu sehen. Das hatte aber auch zur Folge, dass besonders kleine Länder nicht mehr über die Karte anwählbar waren.
Verbesserung der Ladezeit
4.4 Implementierung
Visualisiert wurde in einem interaktiven Screen dessen obere Hälfte eine Weltkarte und in dessen unterer Hälften jeweils 2 Diagramme passend zur oben getroffenen Auswahl liegen. Prototyp des Dashboards
Die Karte ist eine sogenannte Choroplethenkarte in welcher wir auf drei Ebenen interagieren und auswählen können vgl. Abbildung Kontinentenebene, Subregionsebene und Länderebene. Die oberste Ebene bildet die Kontinente, die nächst tiefer Ebene das UN-Geoscheme und die tiefste Ebene die einzelnen Staaten ab.
Kontinentenebene | Subregionsebene | Länderebene |
Der Scatterplot wurde nach der ersten Vorstellung des Prototyps ergänzt. Die Motivation dahinter ist es gewesen, einen Gesamtüberblick der Korrelation zwischen Mordraten und Lebensumständen aller geografischen Regionen zu geben. Bis dahin ist es nur möglich gewesen, zwei gewählte Elemente auf Grundlage dieser Faktoren miteinander zu vergleichen, eine Einordnung in den Gesamtkontext konnte bis dahin nicht vorgenommen werden. Im Scatterplot werden den drei Ebenen entsprechen die Kontinente, die Subregionen und die einzelnen Staaten abhängig von der entsprechenden Ansicht in der Karte angezeigt. Tätigt man nun eine Auswahl auf der Karte wird das entsprechende Element im Scatterplot in der gleichen Farbe dargestellt. Weiterhin kann man über drei Buttons entsprechend wählen, ob die Mordrate im Zusammenhang mit der Bildungsqualität, dem GINI-Index oder dem Bruttoinlandsprodukt dargestellt werden soll. | Scatterplot auf Länderebene |
In den Diagrammbereichen haben wir zwei Arten von Diagrammen benutzt vgl. Abbildung Diagrammbereich zum Vergleich zweier geografischer Regionen. Dieser Bereich dient dem Vergleich zweier geografischer Regionen, welche auch aus unterschiedlichen Ebenen stammen können. So ist es beispielsweise möglich, Länder mit Subregionen zu vergleichen.
Diagrammbereich zum Vergleich zweier geografischer Regionen
Ein klassisches Balkendiagramm, dass die Mordrate in der ausgewählten Region sowie zum direkten Vergleich der darüberliegenden Ebene anzeigt. | Balkendiagramm mit Mordraten |
Das zweite Diagramm ist ein Netzdiagramm und zeigt die Faktoren und deren Intensität mittels einer Fläche, welche auf 3 Achsen läuft die einen gemeinsamen Ursprung haben vgl. Abbildung XY. Erwähnenswert ist hier die Negation des GINI-Indexes damit dieser wie alle anderen Faktoren auch nach dem Prinzip je höher der Wert desto besser ist er dargestellt werden kann. Weiterhin ist i.d.R. zumeist im Hintergrund auch noch ein zweites Dreieck zu erkennen, welches wie in den Balkendiagrammen auch, den Vergleich zur nächst höheren Ebene darstellt. | Netzdiagramm |
5 Fazit
Abschließend kann man sagen, dass die Thematik durch die Unmengen an Daten und fast schon beliebig vielfältige Faktoren die eventuell Einflussnahme haben könnten ein sehr großes Potential für viele Darstellungsvarianten bietet.
Wir haben in Bezug auf unsere Kernthematik sehr viele Informationen ansammeln und vor allem den Bezug zu dem Paper herstellen können. Insbesondere der Vergleich auf mehreren Ebenen, die mögliche Einflussnahme bestimmter Faktoren, als auch die schnelle Klassifizierung konnten realisiert werden.
Auffällig sind die beliebigen Möglichkeiten, den hier vorgestellten Prototyp zu erweitern und oder zu verbessern.
5.1 Ergebnisse
Generell haben wir unser Ziel einer visuellen Übersicht, einer Möglichkeit des Vergleichs sowie dem bekräftigen des Papers erreicht. Dieser Prototyp ist durch die visuelle Kartendarstellung, die Vergleichsmöglichkeiten zwischen Kontinenten, UN-Geoscheme und einzelnen Staaten sowie der Darstellung von Lebensqualität beschreibenden Faktoren vor allem für einen Vergleich der weltweiten Mordrate geeignet.
5.2 Ausblick
Ein möglicher nächster Schritt in der Aussagekraft ist die Erhöhung des Detailgrads an Informationen, sodass man von einer zunächst recht oberflächlichen und stark aggregierten Betrachtung die Möglichkeit hat spezifische Werte, Daten und auch Trends zeigen zu können. Für einen besseren Überblick könnten auch Details on Demand auf der Karte und den Diagrammen sorgen. Weiterhin wäre es durchaus interessant, spezifische Daten und Zeiträume untersuchen zu können und hierbei vor allem auch Datenlücken aufzuzeigen, welche wiederum mit Medienberichten verknüpft werden könnten, um auf die möglichen Ursachen u.U. direkter schließen zu können. Rein technisch bieten sich hier ebenfalls noch Optionen, die verwendeten Daten nicht nur wie bisher statisch zu integrieren, sondern eine API-Anbindung zu den betreffenden Datensammlungen zu implementieren, um neue Informationen direkt visualisieren zu können. Zur Gewährleistung einer höheren Transparenz sollten die Quellen und Erhebungszeiträume der dargestellten Daten angezeigt werden. Eine weitere mögliche Optimierung wäre es, wenn die Legende der Weltkarte nicht nur die Extremwerte der Mordraten anzeigt, sondern das gesamte Farbspektrum der Mordrate samt dazugehörigen Werten. Des Weiteren ist uns bei der Vorstellung des Prototyps aufgefallen, dass die Usability nicht optimal ist. Den Testern ist die Funktion zum Ändern der Sichtebene der Weltkarte unbekannt gewesen, welche durch einen Doppelklick auf die Karte ausgelöst wird. Eine Möglichkeit dies zu verbessern, wäre zum Beispiel das Hinzufügen von drei Buttons, mit welchem durch die drei Ansichten navigieren kann. Außerdem wäre es von Vorteil, die klickbare Fläche der einzelnen Elemente der Karte zu vergrößern, damit es einfach ist, kleine Länder auswählen zu können.