Visualisierung der weltweiten Mordrate

Sascha Betzwieser, Markus Klatt, Eugen Krizki, Felix Navas und Anusan Ranjan

Visualisierung der weltweiten Mordrate

Im Rahmen des Projektes wurden Daten verschiedener öffentlich zugänglicher Quellen, vornehmlich der UN, zur Thematik der Sustainable Development Goals (SDG) visualisiert. In einem stetig wachsenden und sich entwickelnden Zeitalter ist es nur logisch, dass sich nicht alle Menschen weltweit gleichermaßen nachhaltig entwickeln können. Mithilfe der Visualisierung der Mordraten gehen wir der Frage nach, wie sich die Lebensumstände, die Qualität von Bildung, die Wirtschaftlichkeit und die Verteilung von Wohlstand auf die Mordrate auswirken können und ob es Gemeinsam- oder Auffälligkeiten gibt.

Inhalt

1 Konzeption

Dem Entwicklungsprozess ist eine Konzeptionsphase vorangegangen. In dieser Phase sind Ideen zu einer intuitiven Weboberfläche gesammelt worden, um Daten nutzerfreundlich darzustellen. Ziel ist es auch gewesen, durch die Visualisierung Information zu gewinnen, die in den Rohdaten nicht direkt ersichtlich sind. Eine Auswahl und Beschreibung dieser Ideen hierzu finden Sie unter Punkt 3.2 Visualisierungsprozess.

1.1 Einführung

Ziel des Projektes ist es gewesen durch eine Visualisierung Korrelationen zwischen Mordrate und Lebensumstände zu untersuchen. Als Lebensumstände sind von uns das Bruttoinlandsprodukt (BIP), der GINI-Index und der Bildungsindex ausgewählt worden.

1.2 Motivation

Motiviert aus der Möglichkeit einzelne Kontinente, Subregionen und Staaten einfach miteinander vergleichen zu können stießen wir bei der Datenrecherche auf ein Paper.

“Whats causes violent crime?”
Pablo Fajnzylber, European Economic Review 2000

Link zum Paper

Welches die Auswirkungen bestimmter Lebensumstände auf die Mordrate eines Landes behandelt. Was indirekt zur zusätzlichen Motivation der Darstellung bzw. Prüfung von Inhalten aus diesem führte. Weiterhin stießen wir auf Projekte, die diverse Ähnlichkeiten aufwiesen, wodurch die qualitative Anforderung entstand ggf. die Darstellungen existierender ähnlicher Ansätze falls möglich zu verbessern. Die interessantesten Ansätze finden Sie unter Punkt 3.1 Verwandte Arbeiten & Inspiration.

1.3 Fragestellung

Aus einer Reihe an konzeptionellen Fragestellungen führten uns die folgenden zur Kernthematik.

  • Welchen Einfluss haben Bildung, Wohlstand und Verteilung von Reichtum auf die Rate von Gewaltverbrechen und Morden?
  • Führt eine große Kluft zwischen Arm und Reich zu mehr Gewaltverbrechen?
  • Führen schlechte Bildung und Armut zu einer erhöhten Gewaltbereitschaft?

Lebensumstände und deren Auswirkungen auf Mordraten

2 Datenbasis

Im Folgenden werden, die für die Visualisierung zugrunde liegenden Daten und deren Quellen beschrieben.

2.1 Datenquellen

Unser Themenschwerpunkt spiegelt sich vor allem in den vier folgenden SDGs und deren Indikatoren wieder.

  • SDG 4 - Hochwertige Bildung
    (UN Human Development Reports, Education Index, Human Development Index)
  • SDG 8 - Menschenwürdige Arbeit und Wirtschaftswachstum
    (8.1.1 Annual growth rate of real GDP per capita)
  • SDG 10 - Weniger Ungleichheiten
    (OECD Income inequality)
  • SDG 16 - Frieden, Gerechtigkeit und starke Institutionen
    (16.1.1 Number of victims of intentional homicide per 100.000 population)

Nach Sichtung verschiedener Daten auf Basis der oben genannten SDGs und dem Vergleich mit unseren Anforderungen entschieden wir uns folgende Quellen für die geplante Visualisierung zu berücksichtigen.

Zur Anzeige aller Länder in einer Karte und ihrer Gruppierung zu Sub-Regionen und Kontinenten wurden außerdem folgende Datenquellen verwendet:

Außerdem wurden für die Akkumulierung der Indizes in Relation zur Bevölkerungsgröße für Sub-Regionen und Kontinente die jeweiligen Bevölkerungszahlen benötigt.

2.2 Datenerhebung

Auffällig war, dass es verhältnismäßig sehr viel Zeit in Anspruch nahm, ansatzweise vielfältige und vollständige Datensätze zu finden. Da es keine zentrale Erfassung der von uns gesuchten Daten gibt und diese von Land zu Land unterschiedlich gehandhabt werden sind zumeist viele Zusammenstellungen mit verschiedenen Werten vorzufinden. Insbesondere Datenlücken in bestimmten Zeitintervallen erschwerte eine so detailreiche Darstellung wie von uns geplant bzw. durch die Aussagen im Paper vorausgesetzt. Die vielversprechendste Lösung war die Idee der Bildung eines Mittelwerts über einen fest definierten Zeitraum.

2.3 Datenauswertung

Die Auswertung der Daten und dessen Qualität erfolgte ausschließlich manuell. Detailliertere Informationen zur Qualität der verwendeten Daten finden Sie unter 3.3 Visualisierungsexperimente.

2.4 Datenaufbereitung

Die Bearbeitung der Datensätze war ein aufwendiger Prozess. Am Anfang war es schwer, konsistente Daten zu finden. Unsere erste Idee war es verschiedene Quellen zu benutzen, um fehlende Daten aufzufüllen. Nach einer Besprechung mit Professor Nagel haben wir uns aber entschieden nur mit einer Informationsquelle pro Kategorie zu arbeiten, da man sich nicht sicher sein konnte, ob alle Quellen die Daten nach den selben Kriterien erheben. Daher entschieden wir uns für eine vertrauenswürdige und weltweit anerkannte Quelle - die United Nations (UN). Für den Bildungs-Index und den GINI-Index haben wir die World Bank Datenbank benutzt. Danach ging es um die Verarbeitung der Informationen. Viele Faktoren haben die Lücken in den Daten hervorgerufen, wie z.B. Kriege, Umweltkatastrophen, Embargos (Nord-Korea). Um die fehlenden Einträge zu eliminieren haben wir uns entschlossen den Bereich von 2007 bis 2016 zu benutzen und die Daten in diesem Zeitraum zu mitteln. Diesen Mittelwert haben wir dann verwendet, um unser Dashboard umzusetzen. Unsere Datenaufbereitung erwies sich in einem ersten prototypischen Visualisierungsexperiment als sinnvoll und praktikabel. Wodurch wir in unsere Datenbasis bestätigt wurden. Die Ergebnisse besagter Visualisierungsexperimente finden Sie unter Punkt 3.3 Visualisierungsexperimente.

3 Entwicklungsprozess

Im folgenden Abschnitt werden die inhaltliche Entwicklung der Darstellung und Visualisierungsmöglichkeiten des Prototyps geschildert.

3.1 Verwandte Arbeiten & Inspiration

Während der Datenrecherche stießen wir neben dem oben genannten Paper auch noch auf einige Interessante verwandte Arbeiten mit Visualisierungen, die wir zur Inspiration nahmen und als Nebeneffekt zu unserem Prototyp sinnvoll ergänzen bzw. ggf. verbessern wollten.

World Income, Inequality and Murder
Dieses Projekt untersucht den Einfluss der Einkommensungleichverteilung auf die Mordrate von Ländern, durch eine Visualisierung des GINI-Index im Vergleich zur Mordrate. Innerhalb eines Koordinatensystems werden die einzelnen Staaten in einem Punktdiagramm über die Farbe ihren jeweiligen geografischen Regionen zugeordnet. Die Größen der Punkte stellen hierbei die Bevölkerung dar. Weiterhin wird über die Farbe eine Trendlinie dargestellt. Anhand der gewählten Darstellungsmittel kann in einer Animation die Zu- und oder Abnahme der Mordraten von Regionen und einzelner Staaten über mehrere Jahre hinweg übersichtlich dargestellt werden.
drawingWorld Income, Inequality and Murder
Homicide Monitor
Der Homicide Monitor veranschaulicht die weltweite Mordrate und nimmt Bezug auf Metadaten wie die Gesamtbevölkerung, die Mordwaffen, das Geschlecht sowie das Alter der Opfer.
drawingHomicide Monitor
WHO Global Health Estimates
Der Bericht “WHO Global Health Estimates” nutzt ebenfalls die Daten einer globalen Mordrate, sowie der Differenzierung zwischen Geschlechtern und dem Alter. Visualisiert ist dies sehr simpel auf einer Weltkarte über verschieden große Rauten und setzt auf Details on Demand. Generell eine sehr simple aber überschaubare Darstellung.
drawingWHO Global Health Estimates
UNODV Global Study on Homicide
Die “Global Study on Homicide” sticht vor allem durch sehr spezifische und Daten und dessen Vielfalt hervor.
drawingUNODV Global Study on Homicide

3.2 Visualisierungsexperimente

Um sicherzustellen, dass unsere Datensätze eine angemessene Qualität haben, visualisierten wir die Daten ähnlich dem Projekt in 3.1 World Income, Inequality and Murder. Die Ergebnisse spiegelten ähnliche Werte wie in den betrachteten verwandten Arbeiten wieder. Weiterhin konnten wir auch die Aussage treffen, dass der GINI-Index und das BIP offensichtlich mit der Mordrate korrelieren. Der Education Index scheint hierbei jedoch nicht relevant. drawingVisualisierungsexperiment Vergleich Mordrate zu Wohlstandsverteilung
drawingVisualisierungsexperiment Vergleich Mordrate zu Bildung drawingVisualisierungsexperiment Vergleich Mordrate zu Wohlstand

3.3 Erkenntnisse

Wir konnten die Aussagen aus dem Paper erwartungsgemäß bestätigen. Es gab klar erwartete Ergebnisse aber auch Werte die zunächst vermeintlich zufällig – fast wahllos ohne Anzeichen auf Zusammenhänge aufgetreten sind. Die Begründung hierfür liegt in der Aggregation einzelner Staaten zu Regionen bzw. diese wiederum zu Kontinenten. Man kann also klar die Aussage treffen, dass die Qualität von Bildung auf Basis unserer Daten einen Einfluss auf die Mordrate nimmt, die Faktoren BIP sowie GINI-Index mit den Mordraten korrelieren und die Qualität der Bildung keine Auswirkungen bewirkt.

4 Prototyp

In diesem Abschnitt werden technische Details und besondere Herausforderungen in der Umsetzung, sowie eine Funktionsbeschreibung durchgeführt. Der Prototyp ist verfügbar auf github.com.

4.1 Verwendete Tools & Frameworks

Zur Entwicklung des Prototyps wurden node.js zusammen mit express.js für das Backend verwendet. Das Frontend wurde mittels JavaScript und d3.js, einer JavaScript-Bibliothek zur Erstellung dynamischer, interaktiver Datenvisualisierungen in Webbrowsern, realisiert. Für das Design des Frontends wurde zusätzlich Bootstrap für ein responsive Design eingebunden, um die Portierbarkeit auf unterschiedliche Bildschirmgrößen zu gewährleisten.

4.2 Systemarchitektur

Das Backend wurde als REST API implementiert, welche die von uns gefundenen Datenquellen über mehrere Endpunkte zur Verfügung stellt. Hierfür wird die jeweilige CSV-Datei eingelesen und als JSON-Objekt versendet.

Das Frontend wurde als Single Page Applikation realisiert. Dabei werden die Inhalte dynamisch in eine Seite geladen, anstatt die Seite komplett neu zu laden, was dabei hilft, die Usability zu verbessern, da das Laden neuer Seiten entfällt und der Benutzer dadurch unterbrechungsfrei mit der Applikation interagieren kann.

4.3 Herausforderungen

Eine Herausforderung bestand in der Größe der geojson-Dateien, die wir für die Generierung der Weltkarte benötigten. Anfänglich speicherten wir die Dateien im Backend und wollten diese ebenfalls per REST API Endpunkt zur Verfügung stellen. Allerdings hatten diese Daten eine Größe von 56 MB was dazu führte, dass die Seite sehr lange benötigte um sich aufzubauen, da allein die Übertragung der geojson-Daten 2-3 Minuten dauerte. Daraufhin entschieden wir uns, die Daten für das Erstellen der Karte im Frontend zu belassen um die Geschwindigkeit des Seitenaufbaus zu verbessern. Durch Nutzung einer kleineren geojson-Datei, mit niedrigerem Detailgrad, konnte die Ladegeschwindigkeit der Karte weiter verbessern, sodass diese nun in ca. 1-2 Sekunden geladen wird, wie im folgenden Bild zu sehen. Das hatte aber auch zur Folge, dass besonders kleine Länder nicht mehr über die Karte anwählbar waren.

imageVerbesserung der Ladezeit

4.4 Implementierung

Visualisiert wurde in einem interaktiven Screen dessen obere Hälfte eine Weltkarte und in dessen unterer Hälften jeweils 2 Diagramme passend zur oben getroffenen Auswahl liegen. imagePrototyp des Dashboards

Die Karte ist eine sogenannte Choroplethenkarte in welcher wir auf drei Ebenen interagieren und auswählen können vgl. Abbildung Kontinentenebene, Subregionsebene und Länderebene. Die oberste Ebene bildet die Kontinente, die nächst tiefer Ebene das UN-Geoscheme und die tiefste Ebene die einzelnen Staaten ab.

image Kontinentenebene imageSubregionsebene image Länderebene
Der Scatterplot wurde nach der ersten Vorstellung des Prototyps ergänzt. Die Motivation dahinter ist es gewesen, einen Gesamtüberblick der Korrelation zwischen Mordraten und Lebensumständen aller geografischen Regionen zu geben. Bis dahin ist es nur möglich gewesen, zwei gewählte Elemente auf Grundlage dieser Faktoren miteinander zu vergleichen, eine Einordnung in den Gesamtkontext konnte bis dahin nicht vorgenommen werden. Im Scatterplot werden den drei Ebenen entsprechen die Kontinente, die Subregionen und die einzelnen Staaten abhängig von der entsprechenden Ansicht in der Karte angezeigt. Tätigt man nun eine Auswahl auf der Karte wird das entsprechende Element im Scatterplot in der gleichen Farbe dargestellt. Weiterhin kann man über drei Buttons entsprechend wählen, ob die Mordrate im Zusammenhang mit der Bildungsqualität, dem GINI-Index oder dem Bruttoinlandsprodukt dargestellt werden soll. drawingScatterplot auf Länderebene

In den Diagrammbereichen haben wir zwei Arten von Diagrammen benutzt vgl. Abbildung Diagrammbereich zum Vergleich zweier geografischer Regionen. Dieser Bereich dient dem Vergleich zweier geografischer Regionen, welche auch aus unterschiedlichen Ebenen stammen können. So ist es beispielsweise möglich, Länder mit Subregionen zu vergleichen.

DiagrammbereichDiagrammbereich zum Vergleich zweier geografischer Regionen


Ein klassisches Balkendiagramm, dass die Mordrate in der ausgewählten Region sowie zum direkten Vergleich der darüberliegenden Ebene anzeigt. drawingBalkendiagramm mit Mordraten
Das zweite Diagramm ist ein Netzdiagramm und zeigt die Faktoren und deren Intensität mittels einer Fläche, welche auf 3 Achsen läuft die einen gemeinsamen Ursprung haben vgl. Abbildung XY. Erwähnenswert ist hier die Negation des GINI-Indexes damit dieser wie alle anderen Faktoren auch nach dem Prinzip je höher der Wert desto besser ist er dargestellt werden kann. Weiterhin ist i.d.R. zumeist im Hintergrund auch noch ein zweites Dreieck zu erkennen, welches wie in den Balkendiagrammen auch, den Vergleich zur nächst höheren Ebene darstellt. image Netzdiagramm

5 Fazit

Abschließend kann man sagen, dass die Thematik durch die Unmengen an Daten und fast schon beliebig vielfältige Faktoren die eventuell Einflussnahme haben könnten ein sehr großes Potential für viele Darstellungsvarianten bietet.

Wir haben in Bezug auf unsere Kernthematik sehr viele Informationen ansammeln und vor allem den Bezug zu dem Paper herstellen können. Insbesondere der Vergleich auf mehreren Ebenen, die mögliche Einflussnahme bestimmter Faktoren, als auch die schnelle Klassifizierung konnten realisiert werden.

Auffällig sind die beliebigen Möglichkeiten, den hier vorgestellten Prototyp zu erweitern und oder zu verbessern.

5.1 Ergebnisse

Generell haben wir unser Ziel einer visuellen Übersicht, einer Möglichkeit des Vergleichs sowie dem bekräftigen des Papers erreicht. Dieser Prototyp ist durch die visuelle Kartendarstellung, die Vergleichsmöglichkeiten zwischen Kontinenten, UN-Geoscheme und einzelnen Staaten sowie der Darstellung von Lebensqualität beschreibenden Faktoren vor allem für einen Vergleich der weltweiten Mordrate geeignet.

5.2 Ausblick

Ein möglicher nächster Schritt in der Aussagekraft ist die Erhöhung des Detailgrads an Informationen, sodass man von einer zunächst recht oberflächlichen und stark aggregierten Betrachtung die Möglichkeit hat spezifische Werte, Daten und auch Trends zeigen zu können. Für einen besseren Überblick könnten auch Details on Demand auf der Karte und den Diagrammen sorgen. Weiterhin wäre es durchaus interessant, spezifische Daten und Zeiträume untersuchen zu können und hierbei vor allem auch Datenlücken aufzuzeigen, welche wiederum mit Medienberichten verknüpft werden könnten, um auf die möglichen Ursachen u.U. direkter schließen zu können. Rein technisch bieten sich hier ebenfalls noch Optionen, die verwendeten Daten nicht nur wie bisher statisch zu integrieren, sondern eine API-Anbindung zu den betreffenden Datensammlungen zu implementieren, um neue Informationen direkt visualisieren zu können. Zur Gewährleistung einer höheren Transparenz sollten die Quellen und Erhebungszeiträume der dargestellten Daten angezeigt werden. Eine weitere mögliche Optimierung wäre es, wenn die Legende der Weltkarte nicht nur die Extremwerte der Mordraten anzeigt, sondern das gesamte Farbspektrum der Mordrate samt dazugehörigen Werten. Des Weiteren ist uns bei der Vorstellung des Prototyps aufgefallen, dass die Usability nicht optimal ist. Den Testern ist die Funktion zum Ändern der Sichtebene der Weltkarte unbekannt gewesen, welche durch einen Doppelklick auf die Karte ausgelöst wird. Eine Möglichkeit dies zu verbessern, wäre zum Beispiel das Hinzufügen von drei Buttons, mit welchem durch die drei Ansichten navigieren kann. Außerdem wäre es von Vorteil, die klickbare Fläche der einzelnen Elemente der Karte zu vergrößern, damit es einfach ist, kleine Länder auswählen zu können.