Transportmittelvergleich in Mannheim
Vergleich des Verkehrs auf zwei Mannheimer Brücken nach Fahrtrichtung und Transportmittel

Alina Akerlund, Tobias Benrath, Talha Butt, Anette Koch & Julius Lehmann

Transportmittelvergleich in Mannheim

Visueller Vergleich des Verkehrsaufkommens im ÖPNV und im motorisierten Individualverkehr an zwei Mannheimer Brücken.

In dieser Untersuchung vergleichen wir die Nutzung des ÖPNV und des Individualverkehrs in Mannheim,. Dabei wurden Daten der MVV Energie AG (MVV) und Stadt Mannheim sowie Daten der Rhein-Neckar-Verkehr GmbH (RNV) betrachtet und verglichen, sodass Beobachtungen zum Nutzverhalten der Bürger Mannheims und Umgebung im Bezug auf die Transportmittel Auto und ÖPNV gemacht werden konnten. Das Hauptaugenmerk lag hierbei auf der Konrad-Adenauer und Kurpfalzbrücke. Durch die Betrachtung verschiedener Merkmale konnte festgestellt werden, dass das Auto im betrachteten Zeitraum Sommer 2021 das beliebtere Transportmittel war.

Dieses Projekt ist im Rahmen des Kurses “Grundlagen der Datenvisualisierung” im Wintersemester 2021/22 an der Hochschule Mannheim unter der Leitung von Prof. Dr. Till Nagel entstanden.

Einführung

Im Rahmen der Vorlesung „Grundlagen der Datenvisualisierung“ (GDV) bei Prof. Dr. Nagel haben wir gelernt, dass Datenvisualisierung eine sehr große Rolle spielt, wenn es darum geht, Erkenntnisse über Daten auf einen Blick und übersichtlich zu erhalten. Um das Gelernte anzuwenden, haben wir das Projektziel bekommen, aus verschiedenen Quellen urbane Daten interaktiv zu visualisieren. Zu diesem Zweck haben wir Zugriff auf Verkehrsdaten der MVV und Stadt Mannheim bekommen, aus denen sich schnell eine gemeinsame Projektvision innerhalb des Teams entwickelt hat.

Konzept

Da wir Daten zur Verfügung stehen hatten, aus denen wir die genaue Anzahl an Autos zu gewissen Zeiten und festgelegten Standpunkten herauslesen konnten, stellten wir uns die Frage: ist das eine große Zahl? Immerhin hängt die Antwort dieser Frage oftmals von der Relation ab. Knapp 14.000 Autos, die am 15. August 2021 die Konrad-Adenauer-Brücke in Mannheim passiert hatten, klingt zwar sehr viel, aber wie sieht es aus, wenn man diese Zahl in einen Vergleich zu anderen Transportmitteln stellt? Außerdem ist Mannheim eine Großstadt, mit der die Meisten Stau und teures Parken verbinden. Nicht selten wird hier anstatt dem Auto die Bahn als Transportmittel gewählt, um unnötig Zeit und Kosten, die für Stadtstau und Parken verschwendet werden, zu sparen. Wir sehen dies zumindest so aus der Sicht des Studenten; aber was ist mit dem Rest der Gesellschaft?

Aus diesem Gedankengang heraus entwickelte sich eine Diskussion innerhalb des Teams, ob wohl Autos oder öffentliche Verkehrsmittel in Mannheim beliebter sind. Da wir uns weder einig waren, noch die Einschätzungen auf Daten basierend beweisen konnten, haben wir diese Frage als Grundidee unseres Konzeptes für unser GDV-Projekt gewählt und daraus folgende Hauptfrage und Hypothese aufgestellt:

  • Nutzen im Alltag mehr Menschen Autos oder öffentliche Verkehrsmittel als Transportmittel?
  • Welche Nutzungsmuster sind zu Stoßzeiten und am Wochenende zu erkennen?

Da wir uns entschieden haben, als zweites Transportmittel öffentliche Verkehrsmittel, also Bahnen und Busse in Mannheim, zu betrachten, haben wir hierfür Kontakt mit der Rhein-Neckar-Verkehr GmbH (im Folgenden RNV) aufgenommen und zu den von MVV und der Stadt Mannheim bereitgestellten Daten vergleichbare Daten erhalten.

Daten & Auswertung

Auswahl MVV-Daten

Um den Vergleich zwischen PKW und öffentlichen Verkehrsmitteln zu prüfen, boten sich die Kameras an den Brücken an, da hier genaue Richtungsangaben angegeben werden konnten. Das bedeutet, dass wir die Kameras an der Konrad – Adenauer, Kurpfalz und Friedrich – Ebert Brücke ausgewählt haben. Die Kameras auf der Friedrich–Ebert Brücke MAVI018 und MAVI019 liefern keine Daten, daher haben wir die Brücke in unseren Beobachtungen nicht berücksichtigt. Für die Konrad–Adenauer Brücke gab es 2 Spuren, die beide auf die Brücke führten, daher nutzten wir beide. Für die MAVI001 auf Kurpfalzbrücke mussten wir uns auf die beiden rechten Spuren beschränken, da die anderen nicht über die Brücke führten.

Aufbereitung und Aggregation MVV-Daten

Damit die Daten der MVV mit den Daten der RNV zeitlich übereinstimmen, haben wir den Zeitraum 01.08.2021 – 30.09.2021 ausgewählt. Wir haben die Daten angefordert und sie mit den Keys der verschiedenen Fahrzeugtypen und Fahrbahnspuren verknüpft. Dann haben wir nach dem Key für die relevante Spur und den Fahrzeugtyp PKW gefiltert. Als Endprodukt erhielt man eine Tabelle für jede Kamera bestehend aus einer Spalte mit Zeitstempeln und einer zweiter Spalte “Values”, die die Anzahl der gezählten PKW in dem Zeitintervall angibt. Dafür wurden die Werte der verschiedenen Spuren aufaddiert.

Um eine ungefähre Einschätzung der Personen im Individualverkehr zu gewinnen, wurden die Anzahl der Autos um den durchschnittlichen Besetzungsgrad von PKWs in Deutschland multipliziert. Dieser beträgt für Baden-Wüttemberg in Durchschnitt 1,4(Quelle: Staatsministerium BW).

Die 10 Minuten–Abstände der Messungen war für die Visualisierung zu feingranular, daher wurden die Daten auf zwei verschiedene Arten aggregiert. Es gibt eine stündliche Aggregation, in der alle Zeitstempel mit dem gleichen Datum und der gleichen Stunde zusammengefasst wurden. Sodass man aus letztlich aus sechs Zeitstempel einen machen konnte. Die zweite Aggregation befasst sich mit kompletten Tagen. Daher wurden hier Zeitstempel mit dem gleichen Datum unabhängig von der Uhrzeit zu einem Tages Zeitstempel zusammengefasst.

Auswahl RNV-Daten

Die RNV-Daten wurden unter dem Aspekt gewählt, welche Bahnen über die relevanten Brücken fahren. Daher haben wir alle Bahnlinien und alle Haltestellen, die die Erste nach der Brücke waren weitergegeben und haben daraufhin ein Datenpaket bekommen.

Aufbereitung und Aggregation RNV-Daten

Die Daten waren aufgeteilt in September und August. Ansonsten befanden sich alle Daten in einer Excel– Datei. Es wurde unterschieden zwischen einer Haltestellen Datei, in der alle Haltestellen einer Fahrt aufgelistet werden und einer Fahrten-Datei, in der alle Gesamtfahrten der Linien aufgelistet wurden. Um die Komplexität und Größe der Datei zu verbessern wurden die Dateien nun nach den jeweiligen Linien und Brücke aufgeteilt und verknüpft, dass alle relevanten Daten beider Dateien in einer Datei auftauchen. Somit hatte man für jede Linie den Tag und die Uhrzeit der Fahrt, eine eindeutige Fahrtnummer, die Haltestellen und eine Belegungszahl für diese Fahrt. Nicht alle Fahrten wurden getrackt, sodass man auch nicht alles rekonstruieren konnte. Also wurde wiederrum in einer separaten Datei nur vollständig getrackte Daten verarbeitet. Fahrten von einer Haltestelle A auf Seite A der Brücke zur Haltestelle B zu Seite B der Brücke, in der auch die Zeiten logisch zusammenhingen. Nach diesem Prozess hatte man eine Datei in der das Datum und die Uhrzeit, die Start und Ziel Haltestelle einer Bahnlinie und die beförderte Personen pro Fahrt waren.

Abbildung 1: Aggregation der gesamten RNV-Daten

Auch die RNV–Daten wurden sowohl stündlich als auch täglich aggregiert. Dies war unter anderem deswegen notwendig, da die Gesamtsicht auf die Daten so feingranular ausgefallen ist, dass man kaum etwas erkennen konnte, wie in Abbildung 1 deutlich wird. Der einzige Unterschied hier war, dass wir die Dateien für jeweils eine Linie durch eine zusätzliche Spalte für die Richtung aufgeteilt haben, sodass wir am Ende jeweils vier aggregierte Dateien hatten. Zwei für beide Richtung der Konrad–Adenauer Brücke und zwei für jede Richtung der Kurpfalzbrücke.

Visualisierungsexperimente und Mockups

Im folgenden werden Auschnitte und Zwischenergebnisse gezeigt, welche unterschiedliche Stationen auf unserem Weg zum finalen Prototypen aufzeigen. Dabei wird zunächst auf die generelle explorative Datenanalye eingegangen, welche nicht nur Erkenntnisse für die Ergebnisse, sondern auch einen generellen Überblick über das Datenmaterial geliefert haben. Anschließend wird anhand von zwei Mockups der Konzeptionsprozess des finalen Prototypen skizziert.

Explorative Datenanalyse

Wir beschäftigten uns zu Beginn mit den MVV-Daten. Diese wurden nach der im Unterkapitel “Daten” beschriebenen Datapreperation in Tableau für die einzelenen Brücken visualisiert. In der Abbildung 2 werden über einen zeitlichen Verlauf die Anzahl der Fahrzeuge pro Fahrzeugtyp, welche die Brücke überquerten angezeigt.

Abbildung 2: Explorative Datenanalyse der MVV-Daten von Konrad-Adenauer Brücke. Die unterschiedlichen Fahrzeugtypen sind zu sehen.

Neben der Erkenntnis, dass offensichtlich nach dem 24.September Daten fehlen, wird in der Beobachtung klar, dass die PKWs(rot in der Abbildung) der zahlenmäßig wirklich relevante Fahrzeugtyp sind. Diese Tatsachen fand sich nicht nur bei der Konrad-Adenauer Brücke, sondern auch bei der Kurpfalzbrücke. Deswegen wurde die Entscheidung getroffen nur die PKWs als relevantesten Fahrzeugtypen zu betrachten.

Abbildung 3: Gegenüberstellung der MVV- und RNV-Daten

Um tiefergehende Erkenntnisse über das Verkehrsgeschehen zu erhalten, wurden weitergehend die MMV- und RNV Daten gegenübergestellt und analysiert. Was aus der Abbildung 3 ersichtlich wird ist, dass es durchaus über die Zeit ein sich wiederholendes Verlaufsmuster der Liniendiagramme gibt. Auch wird ersichtlich, dass sich auf beiden Brücken deutlich mehr Autos im Verkehr befinden, als Personen im ÖPNV.

Mockups

Um die Verkehrsbelastung durch die einzelnen Transportmittel zu verdeutlichen, wurde zunächst einmal ein Mockup mit einer Geovisualisierung mit dem Python-Framework Geoviews erstellt. Der Gedanke dahinter war die Konzentration des Verkehrs zu den Stoßzeiten visuel auf der Karte entweder in Form einer “Heat”-Darstellung oder zu verdeutlichen. Links daneben sollte in einem Liniendiagramm die Verkehrsmittel verglichen werden.

Abbildung 4:Erste Skizzierung einer Lösungsidee, welche als Hauptkomponente eine Geovisualisierung und ein Liniendiagramm hatte.

Das erste Mockup wurde verworfen, da sich aus der resultierenden Visualisierung nicht hätte viel ableiten können. So könnte man zwar die Nutzung von PKWs versus ÖPNV insgesamt sehen, aber es ist dabei nicht viel Differenzierung möglich. So ist es im finalem Mockup möglich den Verkehrs auf den einzelnen Brücken, sowie nach Fahrrichtung zu untersuchen. Dabei wurde das Mockup so skizziert, dass es vier Aspekte abdeckt:

  • die spezifische Brücke
  • das genutzte Verkehrsmittel
  • die zeitliche Dimension
  • Fahrrichtung(farblich)
Abbildung 5:Finales Konzept für die Ausgestaltung des Prototypen

Prototyp / Ergebnisse

Die aus dem Kontext der explorativen Datenanalye gewonnen Informationen und die Ideen aus dem Konzeptionsprozess der Mockups führte zur Erstellung einer funktionsfähigen Webapp, welche vielfältige Untersuchungsmöglichkeiten der Daten ermöglicht. Im folgenden werden die Ergebnisse der Projektarbeit, also die gewonnen Erkenntnisse und die Funktionsweise des Prototypen, sowie die genutzte Implementierungstechnik vorgestellt.

Demo-Video

Erkenntnisse

Die Erkenntnisse, welche sich aus den Ergebnissen der Datenexploration und des Dashboards ableiten lassen, bestätigen die vorab aufgestellte These, dass sich über den zeitlichen Verlauf regelmäßig auftretende Muster zu Stoßzeiten und im Vergleich von Werktagen und Wochenende erkennen lassen.

Abbildung 6: Feierabendverkehr am Morgen und Abend

Wir sehen an der Abbildung 6 einen Tagesverlauf des ÖPNV-Verkehrs auf der Konrad-Adenauer Brücke, wie er sich typisch während eines üblichen Werktages beobachten lässt. Es wird ersichtlich, dass morgens mehr Pendler aus Ludwigshafen nach Mannheim kommen, als von der anderen Richtung. Dabei erreicht der Verkehr seine Hauptstoßzeit zwischen 6:00Uhr und 9:00Uhr. Abends kehren die Pendler logischerweise wieder zurück nach Ludwigshafen, wobei wir die Spitze der Stoßzeiten abends zwischen 16:00Uhr und 18:00Uhr vorfinden. Das gleiche Muster lässt sich genauso bei dem PKW-Verkehr finden, wobei hier anzumerken ist, dass die Anzahl der dadurch beförderten Personen 2-4 mal so hoch ist.

Abbildung 7: Verkehr am Sonntag ist deutlich geringer

In Abbildung 7 lässt sich beobachten, dass sowohl die PKWs als auch Bus/Bahn an Sonntagen weniger genutzt werden, als während der Werktage. Dies gilt wiederrum für beide Brücken und lässt sich dadurch erklären, dass Sonntags die meisten Pendler nicht Arbeiten müssen und auch für Einkaufsaktivitäten sich nicht über die Brücken bewegen.

Bei den öffentlichen Verkehrsmitteln lässt sich im Speziellen beobachten, dass die Schul- und Ferienzeiten einen Einfluss auf die Nutzung der ÖPN-Verkehrsmittel. Da wir beobachten können, wie nach dem Ende der Sommerferien ab dem 16. September ein deutlicher Anstieg an Fahrgästen zu verzeichnen ist (Abbildung 8). Eine Erklärung hierfür könnte sein, dass Schüler die öffentlichen Verkehrsmittel nutzen um an ihre jeweilige Bildungsstätte zu gelangen.

Abbildung 8: Vergleich Ferien(links) und Schulbeginn(rechts)

Eine weitere Erkenntnis, welche wir bei nährer Untersuchung der Visualisierung feststellen ist, dass auf der Konrad-Adenauer Brücke deutlich weniger Bus/Bahn genutzt wird, als auf der Kurpfalzbrücke.

Visualisierungstechniken

Abbildung 9: Finales Dashboard

Zur Visualisierung der Daten wurden vier Liniendiagramm erstellt. Jedes Diagramm zeigt den zeitlichen Verlauf von jeweils einer Brücke und jeweils einem Verkehrsmittel. Die zwei unterschiedlichen Linien in einem Diagramm stehen für die verschieden Richtungen. Dabei sind die Diagramme, die zur selben Brücke gehören miteinander verknüpft. Dies erkennt man auch an dem Slider, der die beiden miteinander verbindet.

Als Interaktionsmöglichkeit, steht die Auswahl eines bestimmten Zeitraums zur Verfügung. Nutzer können bestimmte festgelegte Zeitabstände (z.B. 1 Tag, 1 Woche) über Buttons auswählen und die Diagramme der jeweiligen Brücke passen sich dementsprechend an. Es ist aber auch möglich über den Slider, die Zeitabstände frei zu wählen. Wichtig ist auch der Button oben in der Mitte, der die angezeigte Aggregation der Daten ändert. Man kann wählen zwischen Tage- und Stundenaggregation. Bei einem Wechseln ändern sich auch die Buttons für festgelegte Zeiträume und passen sich besser an die Aggregation an.

Liniendiagramme sind eine gute Visualisierungstechnik, um zeitlich abhängige Daten darzustellen. Da es in diesem Projekt darum ging Zeitliche Muster zu erkennen und diese zwischen Auto und ÖPNV-Verkehr zu vergleichen war das Liniendiagramm für uns die beste Wahl. Alternativ haben wir auch eine Geovisualisierung getestet, in der die Zeit mit Hilfe eines Zeitstrahl angezeigt wurde und sich verschiedene Kreisdiagramme passend zum ausgewählten Zeitpunkt verändert haben. Allerdings konnte man daraus nur schwer Erkenntnisse ziehen, weshalb wir es wieder verworfen haben.

Ursprünglich wollten wir alle Linien einer Brücke in einem Diagramm darstellen und keine Unterscheidung zwischen den verschiedenen Richtungen vornehmen. Nach einem Visualisierungsexperiment, entschieden wir uns dann aber doch dafür die Diagramme zu trennen.

Implementierung

Bei der Implementierung haben wir uns für Python als Programmiersprache entschieden. Mit Python hatte der Großteil unserer Gruppe bereits Erfahrung, was zu unserer Entscheidung beigetragen hat. Zur Aggregation der Daten wurde Pandas verwendet. Diese Bibliothek hat uns hier alle benötigten Funktionen geboten.

Zur Erstellung der Diagramme habe wir die Python-Bibliothek Plotly verwendet. Genauer gesagt ‘Plotly-Graph Objects’. Hiermit konnten wir unsere Daten visualisieren und auch Funktionen wie den Slider oder verschiedene Buttons einfügen. Da wir den gesamten Prototyp gerne auf einer Webseite anzeigen lassen wollten haben wir noch das Framework Dash verwendet. Dash hat eine sehr gute Integration mit Plotly und wir konnten unsere bereits erstellten Diagramme direkt einbinden. Letztendlich konnten wir dann mit Hilfe der in Dash integrierten HTML- und CSS-Funktionen alles auf einem Dashboard vereinen und im Web darstellen.

Fazit und Ausblick

Es ist sehr viel Zeitaufwand für die Datenaufbereitung angefallen, da die RNV Daten nicht in optimaler Form vorlagen bzw. generell erst einmal angefordert werden mussten. Leider fehlten sowohl bei der MVV und RNV viele Daten, meistens ohne Begründung. Trotzdessen lassen sich mit der Hilfe des Dashboards einige interessante Beobachtungen machen. So sehen wir, dass beide Brücken mehr von Autos befahren werden als von Fahrgästen des ÖPNV. Außerdem wird die Hypothese, dass es Stoßzeiten gibt, welche als Muster über den zeitlichen Verlauf erkannt werden können, bestätigt. Das Dashboard bietet dem Nutzer vielfältige Möglichkeiten, die Daten selbst zu erkunden.

Funktionell ergänzen könnte man den Prototypen beispielsweise um mehr Filtermöglichkeiten. So wäre eine Erweiterung um ein Kalendertool sinnvoll, da sich so bequemer Tage und Zeitabschnitte generell auswählen lässen.

Natürlich sind die Erklärungen die man für Beobachtungen gegeben hat immer gewisserweise spekulativer Natur. Wobei eine nähere Untersuchung der Ursachen möglichweise die von dem Projektteam gelieferten Erklärungen ergänzen könnten. So könnte beispielsweise der Anstieg der Fahrgäste der RNV beim Schulbeginn nicht nur mit dem Schulweg der Kinder zusammenhängen, sondern auch damit, dass Eltern von Kindern ebenfalls zeitgleich aus dem Urlaub zurückkehren. Für solche und viele weitere Begründungen könnten nähere Untersuchungen angestellt werden, um das Verständnis für Anomalien in den Daten zu verbessern.