Kriminalität in London
Kriminalität in London

Kübra Cikrikcioglu, Stefan Hauk, Dominik Holweck, Marius Perle & Esma Yüksel

Kriminalität in London

Gibt es mehr Verbrechen an Standorten mit stärkeren Tourismus?

London ist eines der bestüberwachtesten Städte in Europa, taucht aber weiterhin in den Medien vermehrt in Verbindung mit Kriminalitätsverbrechen auf.

Um diesen Zusammenhang und dessen Kausalitäten verstehen zu können, wurde im Rahmen des Kurses GDV von Studenten der Hochschule Mannheim ein Tool entwickelt, dass unterschiedliche Daten aus unterschiedlichen Jahren in einer gebrauchstauglichen Visualisierung anzeigt. Durch das Tool ist zu erkennen, dass es einen potentiellen Zusammenhang zwischen Tourismus und erhöhtem Personaldiebstahl gibt. Letztendlich wird festgestellt, dass es sehr viele Faktoren für Kriminalität geben kann und dass das erstellte Tool lediglich ein erster Schritt zu einem größeren Analysewerkzeug zur Verbrechens-Erkennungssoftware ist.

Einführung/ Konzept

Durch die steigende Anzahl von Delikten steigt bei vielen Bewohnern Londons und Touristen die Angst vor einem unsicheren Aufenthalt. Bekannt ist die Metropole London in erster Linie für ihre gut erhaltene Geschichte, die sich über verschiedene Bezirke erstreckt. Diese wurden im Laufe der Zeit zu beliebten Touristenattraktionen. Betrachtet man diese Faktoren stellt sich die Frage, inwiefern der Tourismus die Kriminalität beeinflusst und ob überhaupt ein Zusammenhang erkennbar ist.

Um diese Fragestellung genauer betrachten zu können ist es notwendig eine Analyse über die Stadtteile Londons durchzuführen. London besteht aus 32 Einzelbezirken und dem Verwaltungsbezirk City of London.

Die Hypothese hierbei ist, dass vor allem im Stadtteil Westminster und City of London, die sich beide im Zentrum Londons befinden, besonders viele Verbrechen vorkommen.

Um dies optimal zu visualisieren, werden einzelne Punkte, die für unterschiedliche Verbrechen stehen, auf der Karte analysiert.

Daten / Auswertung /Prozess

Schon von Anfang an gab es Visualisierungsideen. So entstanden die Herausforderungen des Findens von guten geo-räumlichen Daten, das Gruppieren dieser und das Kombinieren mit weiteren Datenquellen um repräsentative Darstellungen zu erstellen.

Erhebung und Verarbeitung

Die Polizei für ganz Großbritannien bietet sämtliche Verbrechensdaten mit Geoinformationen, Verbrechensarten und Ausgängen der Straftaten an. Die Ausgänge der Straftaten haben wir nicht beachtet, weil diese in unserer Fragestellung keine hohe Priorität hatten. Hierbei ist es wichtig zu wissen, dass London wesentlich größer ist als die City of London. Die Datensätze mussten somit für die City of London Police und für die Metropolitan Police Service angefordert werden. Daraus resultieren zwei CSV-Dateien pro Monat. Es ergaben sich somit 72 CSV-Dateien, weil wir zum Zeitpunkt des Projekts die Daten im Zeitraum von November 2016 bis Oktober 2019 betrachtet haben, da nur diese auf der Website der Polizei Großbritanniens verfügbar waren.

Aufgrund der Menge an CSV-Dateien, die zusammengefügt werden mussten, wurde ein Python Skript geschrieben, welches Pandas und Glob verwendet, um aus allen CSV-Dateien eine Einzelne zu aggregieren. Die neue Datei war über 700MB groß, was zu Performanceproblemen auf dem Rechner führte. Das Problem bei der großen Datei ist, dass jedes Verbrechen eine Zeile verbraucht. Die Lösung für dieses Problem ist es, eine künstliche Gruppierung der Verbrechen zu erzeugen. Hierfür wurden die Längen- und Breitengradangaben der Geoinformationen genutzt. Nach einigen Versuchen wurden die besten Ergebnisse erzielt, indem auf die dritte Nachkommastelle der Grade gerundet wurde. Ebenfalls wurde die Verbrechensart “Antisoziales Verhalten” aufgrund von mangelnder Dokumentation ignoriert. Die resultierende Datei war daraufhin circa 70MB groß.

Ebenfalls wurden die Verbrechen in einer weiteren Datei auf die Stadtteile, die Boroughs genannt werden, gruppiert. Diese Datei war kleiner als 1 MB. Bei diesen Dateien wurden auch alle Beschreibungen übersetzt und in UTF-8 gespeichert.

Alle gesammelten Datensätze sind die, welche bei der Polizei gemeldet wurden. Möglicherweise kann die unbekannte Anzahl von bestimmten Vorkommnissen höher sein.

Für die Auswertungsmethode der Boroughs wurden die Umrisse der Boroughs mit einer dbf-Datei geladen. Diese Datei ist Teil eines größeren Datensatzes, welche im London Datastore auffindbar sind. Die vorher gesammelten Daten der Verbrechen wurden nur ein weiteres Python Skript auf Boroughs gruppiert. Bei dieser und bei den anderen Gruppierungen fielen die langen Berechnungszeiten auf. Diese Skripte mit einer schlechten Laufzeit wurden nicht optimiert, da diese nur einmal vor der Erstellung der Visualisierungen ausgeführt wurden. Die Rohdaten und die berechneten Daten wurden bis zum Schluss des Projektes in einer Cloud gespeichert, um jederzeit zu überprüfen, ob die Komprimierungsmethoden fehlerhaft waren.

Visualisierung

Der Papierprototyp (siehe Abbildung 1) besteht aus einer Choroplethenkarte (links oben), einem dazugehörigen Filter (rechts oben), einem Liniendiagramm (links unten), sowie einer Treemap (rechts unten). In der Choroplethenkarte sind Toggles zu sehen, die die Anzahl der Verbrechen in den Boroughs darstellen. Diese stehen in Verbindung mit den Filtern. Für das Liniendiagramm war eine Visualisierung der Verbrechensanzahl für ausgewählte Sehenswürdigkeiten, wie zum Beispiel dem Big Ben geplant. Diese sollten für die Jahre von 2016 bis 2019 auswählbar sein. Diese Funktion haben wir letztendlich nicht implementiert, da nicht ersichtlich war, ob ein Verbrechen genau an einer Sehenswürdigkeit stattgefunden hat oder nicht. Für unsere Hypothese ist die geographische Lage entscheidend, da wir die Boroughs mit den Sehenswürdigkeiten sehen möchten. Wir haben vom Papierprototypen folgende Funktionen übernommen:

  • die Choroplethenkarte
  • die Treemap mit den Verbrechen
  • einen Zeitverlauf mit allen Jahren zusammen

Für unsere zweite Visualisierung haben wir zusätzlich die Filter für die Verbrechen übernommen, sowie einen Filter für die Jahre und Monate.

Abbildung 1: Papierprototyp

Des Weiteren wurde versucht für eine mögliche Detailanalyse eine Heatmap zu erstellen. Eine gute Heatmap bezüglich einer Kriminalitätsanalyse für Puerto Rico hat den Versuch inspiriert.

Abbildung 2: Eine gescheiterte Heatmap (die meisten Muster sahen so aus)

Hier ist leider kaum etwas zu erkennen, außer dass es in der Innenstadt mehr Verbrechen gibt. Beim Heranzoomen konnten andere Muster erkannt werden, aber eine Legende zu den Farben konnte nicht angezeigt werden. Eine Heatmap ist hier eher nicht geeignet, weil die Boroughs und deren Grenzen nicht zu sehen sind.

Da die Daten zu diesem Zeitpunkt bereits in einem Grid Muster vorlagen, wurde versucht dieses als Darstellungsoption zu nutzen. Nach einigen Experimenten wurde ein doppeltes Coding genutzt. Die Anzahl der Verbrechen wurde somit mit der Punktgröße und der Färbung kommuniziert. Dies macht es wesentlich einfacher Ausreißer zu finden.

Prototyp

Interaktivität mit den Prototypen stand von Anfang an im Mittelpunkt. So entstanden zwei unterschiedliche Visualisierungsideen, welche am Ende mit Tableau umgesetzt wurden.

Aufgrund der geo-räumlichen Daten und dem Vorwissen, welches in dem Fach vermittelt wurde, fiel die Werkzeugwahl auf Tableau.

Unser Dashboard ist aufgeteilt in 3 Bereiche. Links oben ist eine Treemap mit den Verbrechen und ihren Anteilen erkennbar an der Fläche zu sehen. Rechts davon ist der Zeitverlauf von Januar bis Dezember mit den aggregierten Daten und der Anzahl der Fälle zu sehen. Im unteren Bereich ist die Karte Londons mit den Boroughs zu sehen.

Folgende Interaktionen mit dem Dashboard sind möglich:

  • Klicken auf eine oder mehrere Verbrechen
  • Klicken auf ein oder mehrere Gebiete

Bei beiden Interaktionen passt sich der Zeitverlauf sowie der Rest der Diagramme an. Wird beispielsweise ein Verbrechen ausgewählt, ist in der unteren Karte erkennbar, in welchen Gebieten dieses Verbrechen häufig vorkommt. Bemerkbar macht sich das durch Grauabstufungen. Wird in der unteren Karte wiederum ein Gebiet ausgewählt, so passt sich die Treemap an und zeigt die Verteilung und Gewichtung der Verbrechen im selektierten Bezirk. Beide Auswahlen sind auch gleichzeitig anwendbar. So ist eine zeitliche Analyse von bestimmten Verbrechensarten in ein oder mehreren Stadtteilen möglich. Falls nur eine Option als Filter ausgewählt ist, kann dies aufgehoben werden, indem der Nutzer erneut auf die Auswahl klickt.

Bei all diesen Interaktionen ist zu erkennen, dass die Verbrechensarten in Abbildung 3 eine bestimmte Farbe haben, um diese Verbrechensarten sowohl in der Treemap als auch in dem gestapelten Diagramm zu erkennen. Dies ist der Grund für die Graustufen als Farbkodierung in der Gebietskarte.

Abbildung 3: Übersichtskarte vom Prototypen

In einer weiteren Visualisierung haben wir eine ZoomIn-Karte gewählt (siehe Abbildung 4), um die Standorte von besonderen Sehenswürdigkeiten, Parks, sowie Bus- und Bahnstationen anzuzeigen. Für die ZoomIn-Karte ist eine aktive Internetverbindung notwendig.

Abbildung. 4: Zoomin Karte mit den Filtern: Gewalt und Sexualdelikte, Dezember

Auf der rechten Leiste sind Filter für die Verbrechensarten zu sehen, die beliebig ausgewählt werden können. Die Farbskala und die Größe der Toggles zeigen die Anzahl der Verbrechen an. Desweiteren kann das Jahr und der Monat ausgewählt werden und im zeitlichen Verlauf in langsamen oder schnellen Tempo betrachtet werden. Somit ist es möglich unsere Hypothesen zu untersuchen und Weitere aufzustellen.

Abbildung 5 zeigt wie sich der Prototyp bei einem Zoom-In verändert. Es werden mehr Informationen zu den Standpunkten angezeigt. Beim Hovern über einen der Toggle wird das Auslesen der Punkte auf der Karte ermöglicht. Diese Informationen sind zum einen die Anzahl der Verbrechen, sowie der genaue Standpunkt.

Abbildung . 5: Nutzung der Zoomin-Karte

Erkenntnisse

Eine unserer Hypothesen war, dass vor allem im Bezirk Westminster gehäuft Verbrechen vorkommen. Betrachten wir die Karte Londons (siehe Abbildung 6) ohne die Auswahl eines Verbrechens, sehen wir, dass die Grauabstufung in Westminster am dunkelsten ist, was bedeutet, dass dort die meisten Verbrechen aufgetreten sind.

Abbildung 6: Karte Londons mit Vorkommen der Verbrechen

Zum anderen wurden die Personaldiebstähle analysiert. Hierbei wurde ein Touristen Hotspot als Ort für die meisten gemeldeten Personaldiebstähle ausgemacht (siehe Abbildung 7). Desweiteren ist in der Abbildung 7 zu erkennen, dass die Stationen Marble Arch, Bond Street, Oxford Circus und Tottenham Court Road besonders herausstechen im Bezug auf die gewählte Art des Verbrechens.

Abbildung 7: die meisten Personen Diebstähle insgesamt

Wie im Netzplan zu erkennen ist, sind all diese Stationen bis auf Marble Arch Umsteigemöglichkeiten von Linien, welche zu Touristenorten führen. Jubilee, die Umsteigemöglichkeit an der Bond Street, hat Baker Street, Westminster, Waterloo und die London Bridge auf der Route. Beim Oxford Circus ist es möglich auf die Linien Bakerloo und Victoria umzusteigen. Tottenham Courtroad bietet die Möglichkeit an von einer Ost-West Richtung zu einer Nord Süd Richtung zu wechseln.

All diese Stationen werden von der Linie zentral angefahren. Um solche Erkenntnisse schneller zu gewinnen ist es wünschenswert, wenn ein realistisch proportionierter Netzplan in der Abbildung darstellbar wäre.

Inspirationen

Der Kriminalitätsatlas Berlin ist die Inspiration für die Aufteilung in Stadtteile. Die Interaktion zwischen den Komponenten empfand dieses Team als schwach, da dieses Tool nur Hervorhebungen macht und keine veränderbaren Darstellungen anbietet. Der Kriminalitätsatlas Berlin brachte uns auf die Idee eine Vergleichsdarstellung für die Verbrechen zu erstellen. Zunächst wurden die Verbrechen in der Übersichtskarte (Abbildung 3) mittels eines Tortendiagramms verglichen. Erst durch weiteres Ausprobieren wurden bessere Darstellungsmethoden für die vorhandenen Daten ermittelt.

Ein Analyse-Tool zur Trendanalyse von Kriminalität innerhalb der USA, welches mittels Tableau erstellt wurde, verdeutlichte die Zusammenhänge zwischen Verbrechen und Zeit.

Deshalb wurde in der Übersichtskarte ein zeitlicher Verlauf integriert. Ebenfalls wurde aus diesem Grund der zeitliche Filter anschließend auf der Zoom-In Ansicht hinzugefügt.

Gleichermaßen haben sich auch die Teams sowohl innerhalb als auch außerhalb der Vorlesung gegenseitig Feedback gegeben. Die gelernten Design Paradigmen haben zu einer ständigen Überarbeitung der Menüführung und der Benutzerinteraktionen geführt. Es wurden mit Familie und Freunden Usability Tests durchgeführt. Hierbei ist das Problem, dass es nur sehr wenige Probanden mit geringen IT Kenntnissen gab.

Fazit

Es konnten bei einzelnen Standorten Korrelationen zwischen Tourismus und Kriminalität entdeckt werden. Außerdem ist es ersichtlich, dass viele weitere Faktoren, wie zum Beispiel die Nähe zu Bus- und Bahnstationen auch eine Rolle spielen können.

Immerhin ist die Vermutung, dass Westminster viele Verbrechen hat richtig. Das Tool kann noch in viele Richtungen erweitert werden. Der London Datastore enthält viele weitere Daten, wie die Bevölkerungsdichte der Stadtteile. Leider war der letzte Zensus 2011. Der nächste Zensus ist 2021. Eine Erweiterung der Übersichtskarte mit diesen Daten würde die Daten normalisieren und den Erkenntnisgewinn verbessern.

Die Zoomin Karte kann ebenfalls mit weiteren Informationen angereichert werden. Momentan entstehen durch die Beobachtung eher weitere Fragen als neue Erkenntnisse. Diese konnten nur mit weiteren Recherchen geklärt werden. Eine Einbindung des U-Bahnnetzes in die bisher erstellte Abbildung ist vorstellbar, kann aber auch zu weniger Übersicht führen. Es wäre eher vorstellbar mehrere Kartenebenen zu erstellen, sodass die Darstellung des Stadtliniennetzen optional eingeblendet werden kann. Solche optionalen Einblendungen können auch für Kamerastandorte von CCTV, lokale Events, Bevölkerungsdichte sowie vieles Weitere erstellt werden.

Der erstellte Prototyp ist in diesem Kontext eher als eine erste Iteration der Verbrechensanalyse zu verstehen. Solche Erkenntnisse wurden erst im späteren Laufe des Projektes erlangt und und die Einbindung dieser wäre im zeitlichen Rahmen der Veranstaltung GDV nicht möglich gewesen. Aus diesem Grund wurde sich mehr auf eine übersichtliche und schlanke Darstellung der Daten konzentriert, welche interaktiv und erkenntnisgewinnend ist.