Ethnien London
Teaser

Baris Kacmaz, Bianca Fabian, Heike Welter & Aygün Selvi

Ethnien London

Dokumentation des Projektes 'Ethnien in London' zum Thema 'Urbanität und Smartcities' des Kurses 'Grundlagen der Datenvisualisierung' von Herrn Prof. Dr. Till Nagel im Wintersemester 2019/2020 der Hochschule Mannheim

[Abstract] London - eine Stadt mit viel Kultur und ethnischen Gruppen. In diesem Projekt geht es um den Vergleich und der Ungerechtigkeit des Einkommens der ethnischen Gruppen in den Stadtteilen Londons. Wir zeigen die Stadtteile Londons mit vier ethnischen Gruppen. Hierbei ist es unser Ziel die Einkommen dieser Gruppen zu untersuchen um potenzielle Ungerechtigkeiten aufzudecken. Zusätzlich wollten wir untersuchen, wie die ethnischen Gruppen in den verschiedenen Stadtteilen Londons verteilt sind.

Einführung

In der Veranstaltung GDV wurde den Studierenden die Aufgabe gestellt, eine Visualisierung zum Thema “Urbanität und Smart Cities” zu entwickeln. Hierfür sollte für das Thema eine Untersuchung durchgeführt werden. Die folgende Dokumentation wird die Motivation für die Wahl “Ethnien in London” erläutern und das jeweilige Konzept dafür vorstellen. Im darauffolgenden Kapitel Daten wird die Herkunft der Daten sowie die verwendeten Tabellen vorgestellt. Danach wird ein Experiment, das im Rahmen einer Datendarstellung entstand, vorgestellt. Im Kapitel Wireframes werden erste Überlegungen einer möglichen Darstellung in Form von zwei Mockups vorgestellt. Darauf folgt eine Beschreibung des entworfenen Prototypen mit weiteren Erläuterungen, weshalb verschiedene Visualisierungen aus dem Wireframe nicht umgesetzt werden konnten. Im Kapitel Implementierung wird die Wahl für Vega Lite näher beschrieben sowie Schwierigkeiten bei der Implementierung, die im Laufe des Projektes aufgetreten sind. Zum Abschluss werden die Ergebnisse der Untersuchung mit den gestellten Hypothesen verglichen und ein Ausblick für die Zukunft gegeben.

Konzept

London besitzt aufgrund seiner Größe und Beliebtheit viele unterschiedliche Gruppen in der Bevölkerung, auch ethnische Gruppen genannt. Zur Untersuchung der Ungerechtigkeiten des Einkommens zwischen der ethnischen Gruppe WHITE und den anderen Gruppen werden zuerst die Stadtteile betrachtet, in denen bestimmte ethnische Gruppen am meisten vertreten sind. Als weitere Untersuchung wird das Einkommen der Londoner Stadtteile verglichen. Hierbei wird das Einkommen der Stadtmitte mit den äußeren Stadtteilen betrachtet, um so herauszufinden, ob die äußeren Stadtteile im Durchschnitt weniger verdienen. Anschließend soll ein Bezug zum Einkommen und der im jeweiligen Stadtteil lebenden ethnischen Gruppen hergestellt werden. Hierfür wählten wir die Stadt London.

London, die Hauptstadt Großbritanniens, hat 8,9 Millionen Einwohner und ist in 33 Stadtteilen untergliedert. Aufgrund der Größe und der Bevölkerungszahl ist sie für die Untersuchung von urbanen Lebensräumen geeignet. Eine weitere Motivation ist die Bekanntheit/Beliebtheit der Stadt Londons, da sie viel Kultur und viele beliebte Sehenswürdigkeiten zu bieten hat.

Hypothesen

Durch das Projekt sollen folgende Hypothesen (evtl. Ungerechtigkeiten) belegt oder widerlegt werden:

  • Sinkt der Verdienst der Einwohner in einem Stadtteil, je weiter es vom Stadtzentrum entfernt ist?
  • Ist in äußeren Stadtteilen der Anteil an asiatischen, schwarzen oder gemischten ethnischen Gruppen höher, als in Stadtteilen, die geographisch näher am Zentrum liegen?
  • Ist die Ungerechtigkeit dermaßen vorhanden, dass in Stadtteilen, in denen überwiegend weiße wohnen, das Durchschnittseinkommen höher ist?

Daten

Die Daten wurden aus einer staatlichen Datenquelle (https://data.london.gov.uk/) erhoben. Durch die Überprüfung der Daten sind ein paar Fehler, der Ethnischen Gruppen nach Stadtbezirk, aufgedeckt und beseitigt worden. Der Fehler war die Addition sämtlicher ethnischer Gruppen, eines Stadtteils, in Gesamt. Die ausgewählten Daten wurden in einer Tabelle zusammengefasst.

Datenquellen

Alle Daten sind aus einer Datenquelle (London Datastore) erhoben worden. In folgenden zwei verwendeten Tabellen wurde jeweils das Jahr 2018 betrachtet.

  1. Verdienst nach Arbeitsplätzen, Stadtbezirk
    • Verwendung des wöchentlichen Durchschnittseinkommens
    • keine Unterscheidung zwischen männlich/weiblich https://data.london.gov.uk/dataset/earnings-place-residence-borough
  2. Ethnische Gruppen nach Stadtbezirk
    • Verwendung der vier ethnischen Gruppen: Weiße, Schwarze, Asiaten und Gemischt/Andere

Experiment

Streudiagramme nach ethnischen Gruppen, wöchentliches Einkommen in männlich/weiblich und Stadtteilen

Zur Betrachtung der Daten sind in der Tableau Software mehrere Streudiagramme erstellt worden. Jedes Diagramm repräsentiert eine ethnische Gruppe. Die x-Achse gibt jeweils die Einwohnerzahl an, währenddessen die y-Achse entweder das wöchentliche Einkommen in Vollzeit der Frauen oder der Männer angibt. Die Punkte stellen die Stadtteile Londons dar. Trotz der Unübersichtlichkeit kann man erkennen, dass ein paar wenige Stadtteile, im Vergleich zu den anderen, ein höheres Einkommen besitzen. Weiter lassen sich keine greifbaren Unterschiede zwischen dem Einkommen der ethnischen Gruppen erkennen.

Wireframes

Mockup 1: Darstellung der Stadtteile Londons mit Pie-Charts

Unsere erste Überlegung, wie im Mockup zu sehen, war es den prozentualen Anteil der ethnischen Gruppen in Form von Pie-Charts auf der Stadtkarte Londons anzuzeigen. Pie Charts bieten dem Benutzer, da wir insgesamt nur vier verschiedene Daten zu Veranschaulichen haben, einen schnellen Überblick über die verschiedenen, ethnischen Gruppen. Leider konnten wir diese mit Vega Lite nicht in der gegebenen Zeit umsetzen und mussten eine Alternative dazu wählen.

Dem Benutzer soll außerdem die Möglichkeit geboten werden, einen Stadtteil auswählen zu können und dadurch eine detaillierte Verteilung der ethnischen Gruppen über die Jahre hinweg in einem separaten Bereich angezeigt zu bekommen. Dies sollte in Form eines Liniendiagramm geschehen, da ein solches sich außerordentlich gut für den Vergleich der ethnischen Gruppen anhand einer zeitlichen Spanne anbietet.

Mockup 2: Darstellung der Stadtteile Londons als Choroplethenkarte mit dem Einkommen

Eine weitere Überlegung war eine Darstellung der Londoner Boroughs mittels einer Choroplethenkarte: Je höher das Einkommen, desto dunkler die Farbe im entsprechenden Stadtteil. Der Benutzer sollte die Möglichkeit haben, zwei Stadtteile auswählen zu können, damit der Vergleich zwischen den Stadtteilen und den ethnischen Gruppen erleichtert wird. Die Auswahl sollte in Form von zwei Kreisdiagrammen dargestellt werden. Wie später in den Prototypen zu sehen, konnten keine der beiden Mockups vollständig umgesetzt werden. Es wurden Teile der beiden Mockups und dem Experiment gemischt.

Prototyp / Ergebnisse

Unser Prototyp stellt eine interaktive Möglichkeit dar, die Stadtteile Londons zu betrachten und nähere Informationen zu den ethnischen Gruppen und wöchentlichen Einkommen zu erhalten. Er besteht aus

  • Choroplethenkarte zur visuellen Darstellung des durchschnnittlichen wöchentlichen Einkommens in Londons.
  • Streudiagramme zum Vergleich Einwohnerzahl und Einkommen pro Stadtteil für jede der vier ethnischen Gruppen.
Screenshot des funktionsfähigen Prototypen: Stadtteile Londons mit wöchentlichen Einkommen als Choroplethenkarte (links). Streudiagramme zur Darstellung der Einwohnerzahl der Stadtteile mit dem Einkommen nach ethnischer Gruppe (rechts).

Der Prototyp repräsentiert nur das Jahr 2018, da es uns aufgrund des gewählten Tools in der gegebenen Zeit nicht möglich war, weitere Jahre im Prototyp umzusetzen. Wir konnten jedoch, wie in Mockup 1 und 2 zu sehen, London und dessen Stadtteile übersichtlich darstellen.

Aus Mockup 2 wurde die Darstellung des Einkommens auf einer Choroplethenkarte, sowie die Legende entnommen. Die Legende wurde nach dem durchschnittlichen wöchentlichen Einkommen angepasst. Uns war es nicht möglich, die in Mockup 1 und 2 dargestellten Pie-Charts, aufgrund des Tools, umzusetzen.

Die vier Streudiagramme sind eine Adaption des Experiments: Sie sind untergliedert nach den vier betrachteten, ethnischen Gruppen und stellen auch das wöchentliche Durchschnittseinkommen der Stadtteile dar. Hierbei ist bewusst auf die Untergliederung von männlich/weiblich, infolge der Umsetzung, verzichtet worden. Unter den vier betrachteten ethnischen Gruppen befinden sich folgende Nationalitäten:

  • White: White British, Irish, Gypsy or Irish Traveller and Other
  • Black: Black African, Caribbean and Other
  • Asian: Indian, Pakistani, Bangladeshi, Chinese and Other
  • Mixed/Other: White and Black Caribbean, White and Asian, White and Black African, Other Mixed, Arab and any Other ethnicity not covered above

Jeder Punkt im Streudiagramm repräsentiert ein Stadtteil, welcher mit der Karte Londons in Verbindung steht.

Der Benutzer kann Interaktionen auf der Stadtkarte und den Streudiagrammen durchführen: Eine einfache Mausbewegung reicht aus, um einen Stadtteil in der Karte zu markieren, welcher analog in den vier Streudiagrammen mittels einem größeren Punktes hervorgehoben wird. Außerdem wird bei diesen Interaktionen der Name des Stadtteils angezeigt.

Wir haben uns bewusst für das Streudiagramm und gegen unsere ursprüngliche Idee, zwei Stadtbezirke auswählen zu können, die dann in zwei Pie-Charts dargestellt werden, entschieden. Man kann zwar durch die Gegenüberstellung zweier Boroughs gut dessen Unterschiede sehen, doch war es in unseren Fall jedoch nicht die richtige Wahl, um die Gesamtheit der Einwohnerzahlen und der ethnischen Gruppen aller Boroughs auf einen Blick zu sehen.

Stattdessen kann man im Streudiagramm Informationen ganz einfach auf einem Blick sehen: Der Verdienst in pounds auf der y-Achse und die Einwohnerzahl der ethnische Gruppe auf der x-Achse. Dadurch, dass wir die einzelnen Ethnien gruppiert haben, ist der Vergleich untereinander sehr einfach, da es jeweils nur vier Streudiagramme, eines für jede ethnische Gruppierung, gibt.

Erkenntnisse

Die Erkenntnisse haben sich den Erwartungen überraschend entgegengestellt: Wir haben erwartet, dass es deutlich zu sehen wäre, wie sehr sich die durchschnittlichen Einkommen der Stadtteile in Betracht zur ethnischen Bevölkerungsteilen schwanken. Dabei haben wir festgestellt, dass es weniger mit den ethnischen Gruppen, sondern vielmehr um die Lage der Stadtteile auf sich hat. An der Karte ist zu erkennen, dass die meist verdienenden Stadtteile in der Mitte angesiedelt sind. Beispiele hierfür sind Tower of Hamlets, Westminster, Southwark, Lambeth, Wandsworth, Hackney und Islingston.

In Betracht zur ethnischen Gruppen fällt der Stadtteil Newham auf, denn er ist nah an der Mitte von London und hat eine höhere Population mit asiatischer Abstammung als Weiße. Dabei ist der Durchschnittseinkommen relativ gering im Vergleich zu den anderen Stadtteilen. Damit können wir keine Abhängigkeiten von ethnischen Gruppen und Verdienst schließen, aber auch nicht ausschließen. Die Möglichkeit, dass die ethnische Gruppe, wenn es denn tatsächlich ein Faktor ist, eher eine kleine Rolle für den Verdienst in London spielen.

Implementierung

Zunächst haben wir Tableau zur explorativen Datenanalyse verwendet. Dadurch konnten wir uns bereits Gedanken machen, welche Visualisierungsart wir für welche Daten verwenden wollen. Zur Darstellung haben wir uns für Vega-Lite entschieden. Vega-Lite hat sich als eine attraktive Alternative zu D3.js, R/RStudio angeboten, da die Grafiken im JSON-Format sind und somit für uns ohne große Einarbeitungszeit verständlich sind. Vega-Lite ist wie der Name bereits andeutet, eine vereinfachte Version der Vega Visualisierung. Bei Vega-Lite liegt der Schwerpunkt mehr auf dem schnellen Erstellen von Grafiken statt der Individualisierung von den Grafiken, sowie Interaktionen. Da jeder von uns bereits mit JSON-Formaten in ein oder anderen Art in Kontakt kam, hat sich dies als eine einfach und schnelle Möglichkeit angeboten Grafiken zu erstellen. Aus demselben Grund haben wir Vega-Lite statt Vega verwendet, bei Vega-Lite muss man nur die notwendigsten Angaben wie z.B Datenquelle, Farbe, Höhe und Breite tätigen, um bereits eine funktionsfähige Grafik zu erhalten. Wir waren uns bewusst, dass es sich hierbei nicht um ein vollausgesmücktes Framework handelt, womit wir alle mögliche Arten von Interaktionen und Grafiken erstellen können. Uns war die relativ einfache Bedienung und schnelle Erstellung von Visualisierungen wichtiger, als die Erstellung von speziellen bzw. Komplexeren Interaktionen zwischen Darstellungen. Alle Grafiken sowie Interaktionen wurden in Vega-Lite erstellt und in eine HTML Seite eingebunden.

Die Zusammenarbeit an dem Projekt erfolgte über unser GitHub-Repository, als Entwicklungsumgebung haben wir IntelliJ verwendet. Zum Hosten der Webseite verwenden wir lokal einen NodeJs Server.

Probleme bei der Implementierung:

Wir hatten uns zum Ziel gesetzt, mit Standard-Interaktionen und anderen Templates zurechtkommen, ohne viel Aufwand in die Einarbeitung zu stecken.

Die Erstellung der Choroplethenkarte ging sehr schnell, was unsere Idee verstärkte, dass Vega-Lite die beste Lösung für dieses Projekt war.

Leider haben wir jedoch die Grenzen der möglichen Darstellungen und Interaktionen entdeckt. Die Struktur der Grafiken ist zwar ein JSON-Format und relativ einfach verständlich, doch im Nachhinein mussten wir uns trotzdem mehr in die Funktionsweise von Vega-Lite einarbeiten. Je mehr Zeit wir mit Vega-Lite verbracht haben, desto klarer wurde es uns, dass Vega-Lite nicht die passende Wahl war.

Beispielsweise ist die Anzahl an Datenquellen, die in einer Grafik / Darstellung verwendet werden können, limitiert auf eine einzige Quelle. Dies hat uns einiges an Problemen verursacht, da wir natürlich mit nur einer Datenquelle nicht viel anfangen konnten. Somit mussten wir mittels “unsauberen” Umwegen unsere Daten in die View bekommen und vereinigten unsere Datenquellen per JOIN. Dies brachte Probleme mit sich, jedoch schien das die einzige Lösung.

In einem Punkt glänzt Vega Lite unserer Meinung nach: Der Dokumentation. Im ersten Moment schien diese schwer verständlich und man wurde auf viele verschiedene Seiten verlinkt. Nach kurzer Einarbeitungszeit jedoch erschließt sich einem, wo man alle wichtigen Informationen entnehmen kann. Leider fiel uns negativ auf, dass es keine große Community besitzt und kaum Tutorials zu Vega Lite vorhanden sind.

Fazit

Betrachten wir nochmal unsere drei Hypothesen…

  • Sinkt der Verdienst der Einwohner in einem Stadtteil, je weiter es vom Stadtzentrum entfernt ist?
    Wie erwartet können wir diese Frage getrost mit einem Ja beantworten. Im Zentrum Londons wird deutlich mehr verdient, als in den äußeren Bezirken.
  • Ist in äußeren Stadtteilen der Anteil an asiatischen, schwarzen oder gemischten ethnischen Gruppen höher, als in Stadtteilen, die geographisch näher am Zentrum liegen?
    Dies ist aus unseren Datenquellen herauslesbar, jedoch ist dies nicht durch unsere Visualisierung erkennbar.
  • Ist die Ungerechtigkeit dermaßen vorhanden, dass in Stadtteilen, in denen überwiegend weiße wohnen, das Durchschnittseinkommen höher ist?
    Hier können wir freudigerweise sehen, dass es anscheinend keinen Zusammenhang zwischen der Verteilung ethnischer Gruppen und dem Verdienst in den Londoner Boroughs gibt.

Unser Ziel, all unsere Fragen zu klären, haben wir durch die gewählten Visualisierungen größtenteils erreicht und freuen uns, dass es in London wenig Ungerechtigkeiten im Punkt Verdienst gibt. Diese Erkenntnis ist insofern Hilfreich, da an vielen Orten heutzutage immer noch Benachteiligungen existieren und London nicht dazu zählt.

Ausblick

Ein möglich nächster Schritt wäre es, mehrere Städte in Betracht zu ziehen und mit London im Vergleich zu stellen. Hier ist zu untersuchen, ob es Städte gibt, in denen immer noch große Ungerechtigkeiten existieren. Solche Erkenntnisse geben erst einmal nur einen groben Indikator: Natürlich muss man mit noch feineren Daten arbeiten und weitere Umstände in Betracht ziehen, wie beispielsweise die Lebensumstände und das Geschlecht.

Natürlich kann man auch noch weiter an der jetzigen Visualisierung arbeiten und unsere ursprüngliche Idee umzusetzen, einen zeitlichen Verlauf zu sehen. War 2018 vielleicht ein Jahr, wo es wenig Ungerechtigkeiten im Verdienst gab? Wie war es Früher? Wie hat es sich über die Zeit verändert uns warum? All diese Fragen sind noch interessant, um ein viel feineres Bild des Themas zu schaffen. Dafür braucht es allerdings auch die richtigen Daten, die gerade so noch gar nicht existieren.