Global Killer Tuberkulose

Patrick Eisenschmidt, Philipp Fruh, David Nadoba, Phuong Thao Michaela Nguyen, Mustafa Yildiz

Global Killer Tuberkulose

Im Rahmen des Projektes wurde eines der 17 Ziele der UN für nachhaltige Entwicklung (SDG = Sustainable Development Goals) untersucht: Gesundheit und Wohlergehen. In Anbetracht dieses Themas beschäftigten wir uns mit der Krankheit Tuberkulose. Tuberkulose (TB oder TBC, früher Schwindelsucht) ist eine bakterielle Infektionskrankheit, die weltweit stark verbreitet ist. Trotz des geringen Aufkommens im europäischen Bereich ist sie in den Top 10 der tödlichsten Krankheiten. Unser Ziel war die Entwicklung einer Applikation, welche es erlaubt Fälle von Tuberkulose global und in Abhängigkeit verschiedener Faktoren zu untersuchen.

Inhalt

  1. Einführung und Konzept
  2. Daten
  3. Visualisierung und Auswertung
  4. Implementierung und Prototyp
  5. Fazit

Einführung und Konzept

Im Jahr 2006 starben weltweit rund 1,6 Mio. Menschen an Tuberkulose. Damit liegt die Krankheit in den Top 15 der weltweiten Todesursachen und ist nach HIV/AIDS die tödlichste Infektionskrankheit. Obwohl die Krankheit in der Statistik weit oben liegt, ist sie eine der wenigen behandelbaren Ursachen und müsste in den meisten Fällen nicht zum Tod führen. Weltweit sind ca. ein Drittel aller Menschen mit Tuberkulose infiziert. Allerdings entwickeln davon nur 5 bis 10 % behandlungsbedürftige Probleme. Rund 95 % aller Todesfälle betreffen Entwicklungsländer.

Tuberkulose ist eine meldepflichtige Infektionskrankheit. Ausgelöst wird Tuberkulose in aller Regel durch das Einatmen von Tuberkulosebakterien (Mycobacterium tuberculosis-Komplex). Primär betrifft Tuberkulose die Lunge, kann während dem Krankheitsverlauf jedoch auch andere Organe befallen. Es gibt zwei Arten von Tuberkulose: die offene und geschlossene Tuberkulose. Die offene Tuberkulose ist am häufigsten vertreten, da hier die Lunge betroffen ist. Bei dieser Art ist die Krankheit durch Husten oder Niesen von Mensch zu Mensch übertragbar. Bei der geschlossenen Tuberkulose sind andere Organe betroffen. In diesem Fall ist die Krankheit nicht ansteckend und somit nicht übertragbar. Die Symptome der Krankheit sind im Frühstadium Fieber, Müdigkeit, Nacht-schweiß und Gewichtsverlust. Im weiteren Verlauf der Krankheit können Atemnot und blutiger Husten hinzukommen.

Im weltweiten Bild kann eine Tuberkulose Behandlung von wenigen hundert Euro bis mehreren hundert Tausend Euro kosten (Quelle: Spiegel Online). Vor allem Multiresistente Erreger sind sehr teuer zu behandeln und kommen immer häufiger vor.

Die Vermeidung von Tuberkulose sollte an erster Stelle stehen.

Unsere Fragen und Hypothesen:

  • Frage: Welche Faktoren haben den größten Einfluss auf Sterbe- und Ansteckungsraten von Tuberkulose?
  • Hypothese: Entwicklungsgrad und Wohlstand der Region.

  • Frage: Finden wir Ausnahmen oder größere Abweichungen der Ergebnisse auf Frage 1 und welche Gründe haben diese?
  • Hypothese: Maßnahmen durch UN, WHO, Spendenaktionen, etc.

  • Frage: Welche Maßnahmen haben in der Vergangenheit am meisten zur Besserung der Situation beitragen?
  • Hypothese: Ausbau medizinischer Einrichtungen, Schulung von Personal und Aufklärung der Bevölkerung.

Daten

Unsere Betrachtungen stützen sich auf folgende Datenquellen:

World Health Organization (WHO)
  • Todesfälle durch Tuberkulose pro 100.000 Einwohner 1
  • Gesundheitsausgaben pro Kopf in USD$ 2
World Bank
  • Durchschnittliches Einkommen pro Kopf gerechnet auf USD 3

Aufbereitung

Die Daten wurden in Tableau Prep aufbereitet und zusammengeführt. Bezugspunkt für die Aufbereitung war hierbei ISO 3166, welche Ländernamen und Kürzel standardisiert und ein einheitliches Format für die weiteren Datenquellen vorgibt. Anhand dieser Vorgaben wurden unsere Datensätze angepasst, hierfür waren unter anderem Arbeiten nötig wie Pivots, Anpassung von Ländernamen und Zahlenformaten. Der finale Datensatz wurde für die Webanwendung als JSON exportiert.

Anfangs hatten wir Schwierigkeiten, da es sehr zeitaufwendig war, Datensätze dieser Art per Hand anzugleichen. Als wir jedoch Tableau Prep fanden, löste dies viele unserer Probleme und lies uns unsere Daten problemlos aufbereiten.

Aufbereitung

Visualisierung und Auswertung

Erste Visualisierungs-Experimente und Ideen

Unsere ersten Arbeiten am Projekt bestanden aus Visualisierungs-Experimenten, bei denen wir feststellen wollten, welche Visualisierungen die besten Überblicke, Detailansichten und Antworten auf unsere Fragen liefern. Hierfür verwendeten wir die Visualisierungs-Software Tableau.

Erste Visualisierungs-Experimente

Nachdem wir uns für das Thema Tuberkulose entschieden hatten, waren wir uns einig, dass wir Choroplethenkarten für den Vergleich auf globaler Ebene einsetzen wollen. Unsere ersten Ideen sahen eine Weltkarte als Haupt-Visualisierung vor, diese sollte die globalen Todesfälle durch Tuberkulose visualisieren. Für einen zeitlichen Vergleich der Daten sollte unter der Weltkarte ein Stacked Area Chart platziert werden, welches die Länder der Erde in Abhängigkeit der Zeit darstellt. Dort sollte auf der Zeitachse ein Datum gewählt werden, welches alle restlichen Daten entsprechen koordiniert. Eine weitere Idee sah Markierungen („Flags“) auf der Zeitachse vor, welche wichtige Ereignisse in Bezug auf das SDG 3 signalisierten.

Probleme und Weiterentwicklung

In unseren Experimenten hat sich gezeigt, dass ein Stacked Area Chart für die Anwendung mit vielen Länder wenig geeignet ist, es wird aufgrund der vielen Länder schnell unübersichtlich und bietet keinen Vergleich zwischen mehreren Datenpunkten. Wir haben uns stattdessen für ein Streudiagramm (Scatterplot) entschieden, hier können wir die Länder aus 2 auswählbaren Datensätzen vergleichen.

Die geplanten “Flags” wurden aufgrund von gestalterischen Gründen (Webseiten Layout) zu einem Textfeld. Dieses zeigt zu jedem ausgewählten Jahr einen kurzen Text an der ein Ereignis dieses Jahres im Zusammenhang mit dem SDG-3 beschreibt.

Sketch

Implementierung und Prototyp

Prototyp

Wir hatten uns gleich zu Anfang entschieden unser Projekt als Webanwendung zu entwickeln, so ist es universell zugänglich und die Auswahl an Frameworks groß.

Frameworks:

Bootstrap:

Bootstrap ist ein freies Frontend-CSS-Framework, welches uns verschiedene HTML, CSS und JavaScript/JQuery basierte Gestaltungselemente zur Verfügung stellt. So konnten wir ein ansprechendes Frontend entwickeln, welches zugleich performant und einfach zu benutzen ist. Genutzt wurden vor allem Elemente wie Navigationsleiste, Grid-System, Schalt- und Eingabeflächen sowie gestalterische Elemente.

D3.js:

D3.js ist eine JavaScript Library, die es ermöglicht umfangreiche und komplexe Visualisierungen umzusetzen. An sich bietet es sehr mächtige Werkzeuge, ist in der Benutzung jedoch relativ kompliziert. Aus diesem Grund gibt es viele Visualisierungs-Frameworks, welche auf D3.js basieren und dessen Benutzung „streamlinen“. Da dabei der Zugriff auf die „low-level“ Anteile von D3.js nicht verloren geht, können auf D3.js basierende Frameworks gut in Kombination für z.B. „Coordinated Views“ (Koordinierte Filter über mehrere Visualisierungen) benutzt werden.

DataMaps:

DataMaps ist ein D3.js Framework zur Darstellung von SVG basierten Karten. In unserer Anwendung benutzen wir es für die Erzeugung der beiden Welt-Choroplethenkarten und die Darstellung der ausgewählten Datensätze.

Anfangs hatten wir einige Schwierigkeiten mit Datamaps, es fiel uns schwer die Skalierung der Karte auf der Webseite richtig und dynamisch zu implementieren. Dies kostete uns viel Zeit und wir zogen in Erwägung das Framework zu wechseln, doch durch viele Tests von verschiedene Arten der Umsetzung hatten wir schlussendlich Erfolg und konnten die Karte richtig implementieren.

DC.js:

DC.js ist ein weiteres D3.js Framework, es bietet viele der klassischen Visualisierungselemente wie Balkendiagramme, Liniendiagramme, Kreisdiagramme und mehr. Für unsere Anwendung benutzen wir es, um das Streudiagramm zu generieren, welches die beiden ausgewählten Datensätze in Abhängigkeit visualisiert.

Coordinated Views:

Coordinated Views

Da alle unsere Visualisierungs-Frameworks auf D3.js basieren, konnten wir dessen Funktionen benutzen um „Coordinated Views“ (Koordinierte Filter über mehrere Visualisierungen) in unserem Projekt umzusetzen. Diese erlauben ein Land in einer der drei Visualisierungen auszuwählen. Dieses Land wird in allen Visualisierungen hervorgehoben und relevante Informationen werden als Text angezeigt. So ist es einfacher, spezielle Zusammenhänge zu untersuchen.

Interaktive Karten

Beide Welt-Choroplethenkarten zeigen genauere Informationen über ein Land, wenn der Benutzer die Maus darüber bewegt.

Darüber hinaus kann der Benutzer auswählen, welcher Datensatz in einer Karte visualisiert wird.

Timeline

Über einen Schieberegler kann der Benutzer das Jahr auswählen, welches von allen Visualisierungen angezeigt wird. Mit dem zusätzlichen Play Button kann man auch automatisch durch alle Jahre wechseln.

Streudiagramm

Unser Streudiagramm dient dazu, einen übersichtlichen Direktvergleich über die zwei ausgewählten Datensätze zu bieten. Hierbei können Ausreißer einfach erkannt und untersucht werden. Auch ist hier wieder die Auswahl einzelner Länder für „Coordinated Views“ möglich. Das Land wird in allen Ansichten hervorgehoben und ein Textfeld im Hintergrund liefert wichtige Informationen.

Coordinated Views

Tastenbefehle
  • K, um den zufälligen Präsentationsmodus zu aktivieren.
  • S, um den zufälligen Präsentationsmodus nach 60 Sekunden Inaktivität automatisch zu aktivieren.
  • L, um zufällig ein Jahr weiterzugehen oder die ausgewählten Datensätze zu wechseln.

Fazit

Als Fazit können wir sagen, dass sich unsere Hypothesen zu großen Teilen bestätigt haben. Durch unsere Visualisierung ließ sich zeigen, dass der Entwicklungsgrad und der Wohlstand einer Region große Auswirkungen auf die Tode durch Tuberkulose haben. Weiterhin hat sich gezeigt, dass die allgemeinen Gesundheitsausgaben aller Ländern, besonders in den letzten Jahren, große Fortschritte gemacht haben und deshalb die Tode durch Tuberkulose stetig fallen. Unter anderem sorgten Hilfs- und Spendenprogramme der UN für eine fortschreitende Weiterentwicklung der medizinischen Versorgung in Entwicklungsländern.

Abschließend hoffen wir, dass wir ein wenig Aufmerksamkeit über dieses Problem geweckt haben, über das sich in Deutschland kaum noch jemand Sorgen macht und doch weltweit jedes Jahr immer noch viele Todesopfer fordert.

Credits

Das Projekt SDG-3 “Global Killer Tuberkulose” wurde entwickelt von:

  • Patrick Eisenschmidt
  • Philipp Fruh
  • David Nadoba
  • Phuong Thao Michaela Nguyen
  • Mustafa Yildiz

Kurs Grundlagen der Informationsvisualisierung, WS 2018/2019 bei Prof. Dr. Till Nagel, Hochschule Mannheim.