Ärztedichte in München
Auszug der Visualisierung

Markus Leketas, Jan Henseler, Artur Miller, Sascha Rauch & Denis Kinzel

Ärztedichte in München

Gibt es einen direkten Zusammenhang zwischen der Ärztedichte in einer Großstadt und dem Durchschnittsalter?

München - Mit 1,71 Millionen Einwohnern ist sie die einwohnerstärkste Stadt des Bundeslandes Bayerns und die drittgrößte Gemeinde Deutschlands. Wo viele Menschen leben, liegt die Vermutung nahe, dass auch eine hohe Anzahl an niedergelassenen Ärzten vorhanden ist. Mit diesem Projekt möchten wir untersuchen, ob ein Zusammenhang zwischen der Ärztedichte in einer Großstadt wie München und dem dortigen zu erwartenden Lebensalter der Bevölkerung besteht.

Einführung

Motivation

Im Rahmen der Veranstaltung “Grundlagen der Datenvisualisierung” hatten die Studierenden die Aufgabe, ein Visualisierungsprojekt durchzuführen, welches das Thema “Urbanität und Smart Cities” behandelt. Dafür sollten urbane Daten aus unterschiedlichen Quellen ausgewählt, aufbereitet und analysiert und anschließend mit Hilfe von angemessenen interaktiven Visualisierungstechniken sichtbar gemacht werden. In dieser Dokumentation soll erläutert werden, was die Grundidee unserer Untersuchung ist und welche Hypothesen von uns aufgestellt wurden. Es wird beschrieben, wie bei der Auswahl der Datenquellen vorgegangen wurde und wie diese für die weitere Bearbeitung des Projektes aufbereitet worden sind. Anschließend wird die Vorgehensweise bei dem Entwurf und der Implementierung des Prototypen vorgestellt. Dabei wird auch auf die gewählten Technologien, sowie die Visualisierungstechniken eingegangen und welche Erkenntnisse wir aus den Visualisierungen gewinnen konnten. Abschließend wird ein Fazit gezogen und die Ergebnisse unserer Untersuchung reflektiert.

Konzept

Niedergelassene Ärzte kümmern sich vor allem um die medizinische Grundversorgung zu der die Prävention und Früherkennung, sowie die Behandlung verschiedener chronischer Krankheiten gehört, die keine klinische Behandlung erfordern. Ausgehend von dieser Tatsache stellt sich die Frage, ob die Ärztedichte einen direkten Zusammenhang mit dem dortigen Lebensalter hat. Werden die Menschen in Stadtteilen wo sich viele Ärzte niedergelassen haben tendenziell älter? Und gibt es in Stadtteilen mit einer hohen absoluten Anzahl an Frauen vergleichsweise mehr Frauenärzte? Ausgehend von diesen Fragestellungen wurden die folgenden zwei Hypothesen aufgestellt, die zum Abschluss dieses Projektes entweder belegt oder widerlegt werden sollen.

  • Hypothese 1: Je höher der Altersdurchschnitt in den jeweiligen Stadtteilen, desto höher ist die Dichte diverser Arztgruppen.
  • Hypothese 2: Je höher die Anzahl weiblicher Einwohner in einem Stadtteil, desto höher ist die Anzahl der Frauenärzte.

Daten / Auswertung

Daten

Die Daten für die Visualisierung entstammen dem Münchener Datenportal Opengov. Hierbei hatten wir Zugriff auf die gesammelten Daten der Altersverteilung und Bevölkerungsdichte, sowie die Frauenanteile. Die Informationen lagen dabei von 2013 bis 2017 vor. Es wurde zwischen den Stadtteilen und dem Ärztetyp unterschieden, sodass man für jeden Stadtteil eine entsprechende Aussage bezüglich der Ärztedichte treffen konnte. Unter der Ärztedichte versteht man bei unserer Visualisierung, wie viele Einwohner auf einen Arzt zukommen, also entsprechend wie hoch die Patientenanzahl pro Arzt ist.

Um die Daten hinsichtlich unserer Hypothesen zu überprüfen, haben wir zunächst mittels verschiedener Diagramme versucht Schlüsse zu ziehen, die diese unterstützen.

Abb.1: Anzahl Frauenärzte

Jedoch war es schwer signifikante Änderungen für so einen begrenzten Zeitraum zu sehen. Die Zusammenhänge zwischen dem Alter und den Ärzten waren auf den ersten Blick relativ schlüssig, wenn man betrachtet, welche Daten wir zur Verfügung hatten. Die Streu- und Balkendiagramme haben jedoch schnell gezeigt, dass wir unsere Hypothesen mit den gegebenen Daten nicht solide stützen konnten.

Prozess

Bevor wir mit der eigentlichen Implementierung des Prototypen begonnen haben, wollten wir zunächst betrachten, inwieweit es zu dem Thema bereits verwandte Arbeiten und Publikationen gibt. Das sollte uns dabei helfen, sich einen ersten allgemeinen Überblick über die Thematik und die möglichen Visualisierungsmöglichkeiten zu verschaffen.

Die erste Veröffentlichung die wir uns dafür genauer anschauten, war ein Paper, welches die regionalen Unterschiede in der Ärztedichte in Bayern behandelt. Die Studie kam zu dem Ergebnis, dass es nur geringe Unterschiede der Ärztedichte von Hausärzten in ländlichen und städtischen Regionen gibt, was unsere erste Annahme, dass es in den zentraler gelegenen Stadtteilen mehr Ärzte gäbe, widerlegt hat. Zudem umfasst der Artikel eine Geomap, die die verschiedenen Stadtteilgrenzen auf Basis der Ärztedichte farblich voneinander abgrenzt. Dies diente auch als erster gedanklicher Impuls für unsere eigene Visualisierung.

Abb.2: Verteilung der Ärztedichte pro Kreis (Quelle: Rüger “Regionale Unterschiede in der Ärztedichte, 2014)

Eine weitere verwandte Arbeit beschäftigt sich mit dem Zusammenhang zwischen der medizinischen Grundversorgung und der Bevölkerungssterblichkeit in den USA. Die Studie wertet die US-Bevölkerungsdaten und individuelle Schadensfalldaten mit der Sterblichkeit von 2005-2015 aus, wobei die Veränderungen in der Grundversorgung und Versorgung von Fachärzten berücksichtigt wurde. Die Autoren kamen zu dem Ergebnis, dass eine größere Versorgung von Hausärzten mit einer geringeren Sterblichkeit verbunden ist und dass alle 10 zusätzlichen Hausärzte pro 100.000 Einwohner mit einem Anstieg der Lebenserwartung um 51 Tage verbunden ist. Hier wurden zwar keine, für uns relevanten Visualisierungen genutzt, dennoch verstärkten die Ergebnisse die Annahme unserer Hypothese, dass die Ärztedichte einen Einfluss auf die Lebenserwartung hat.

Auf der Suche nach weiteren Werken wurden wir auf eine Visualisierung vom Verlag “Zeit Online” aus dem Jahr 2014 aufmerksam, welcher ein ähnliches Projekt auf ihrer Seite veröffentlicht hat. Die JSON Daten wurden zwar veröffentlicht, jedoch wurden die Daten zu den Ärzten sehr speziell für das Projekt aufbereitet, was eine Nutzung für uns nicht möglich gemacht hat. Dennoch konnten wir die Visualisierung als weitere Anregung für unser eigenes Projekt mit einfließen lassen.

Prototyp

Bevor wir mit einer softwarebasierten Visualisierung anfingen, fertigten wir mehrere Papier-Prototypen an, anhand deren wir uns ein erstes Bild verschaffen konnten, wie wir die Visualisierung sinnvoll gestalten konnten. Nach einigen Iterationen hatten wir ein Grundkonzept aufgestellt, das sowohl eine Geomap als auch ein weiteres Diagramm umfasste. Hierbei war zu dem Zeitpunkt jedoch noch nicht klar, für welchen Diagrammtyp wir uns letztlich entscheiden. Daher hatten wir mehrere Papier-Prototypen, die uns als Grundlage dienten, einen mit einem Balken- und einen mit einem Streudiagramm nebst der festgelegten Geomap.

Abb.3: Finale Version des Papier-Prototypen mit Balkendiagramm

In den Papier-Prototypen hatten wir auch Interaktionsmöglichkeiten festgehalten, die wir in unserer Visualisierung umsetzen wollten. Dies umfasste einen Slider zur Auswahl des Jahres und einen Tooltip, der beim Hovern weitere Informationen zu dem ausgewählten Bereich anzeigen sollte.

Im nächsten Schritt setzten wir die Papier-Prototypen in Tableau um. Das Ziel hiervon war es, eine eindeutige Struktur und die Auswahl der Diagrammtypen festzulegen. Hierbei haben wir uns weitestgehend an die Papier-Prototypen gehalten.

Abb.4: Visualisierung der Daten in Tableau gemäß dem Papier-Prototyp

Die Geomap wurde zu einer Choroplethenkarte umgewandelt. Hierdurch war es uns möglich, die Ärztedichten der verschiedenen Stadtteile farblich darzustellen und somit einen Vergleich eben dieser zu ermöglichen. Hierbei fiel die Auswahl bewusst auf eine Choroplethenkarte da wir einen direkten Vergleich von verschiedenen Stadtteilen ermöglichen wollten, was in einer Heatmap, welche sich nicht auf festgelegte Grenzen bezieht sondern eher grenzübergreifende Auswirkungen darstellt, nicht möglich war. Um eine Auswahl der verschiedenen Arztgruppen zu ermöglichen wurde ein weiterer Filter eingefügt, welcher per Radio Button ausgewählt werden kann. Durch die Explorative Datenanalyse, welche in Tableau durchgeführt wurde, konnten wir uns auf die vorher nicht näher definierten Diagrammtypen zur Visualisierung der Altersverteilung festlegen. Hierfür wurde ein Säulendiagramm genutzt, da es die Verteilung der verschiedenen Altersdurchschnitte am anschaulichsten darstellt und einen Vergleich der verschiedenen Daten ermöglicht. Eine andere Idee zur Umsetzung war das Verwenden eines Liniendiagramm. Diese Idee wurde nach ersten anfänglichen Visualisierungen verworfen, da die Altersverteilungen der verschiedenen Stadtteile nur schwer erkennbar wurde und wir eine eindeutige und einfache Sicht ermöglichen wollten. Bei den Frauenärzten hingegen wurde ein Scatterplot zur Visualisierung gewählt, da hier die Anzahl der Frauen in Bezug auf die Anzahl der Frauenärzte der Stadtteile als Datengrundlage dient. Tests mit anderen Visualisierungsarten wie Balken- oder Säulendiagrammen stellten sich schnell als nicht praktikabel heraus. Mit ihnen kann man weder Trends noch Ausreißer oder Verteilungen aussagekräftig darstellen im Gegensatz zu einem Scatterplot.

Visualisierung

Der Prototyp ist in mehrere Bereiche aufgeteilt. In der Kopfzeile ist eine Auswahl der zu visualisierenden Daten möglich.

Abb.5: Interaktion zur Auswahl der Visualisierung mittels Radiobutton

Wie in Abbildung 5 gezeigt, kann man mittels Radiobutton auswählen, ob man sich eine Visualisierung zu Allgemein- oder Frauenärzten in München anzeigen lassen möchte.

Abb.6: Geomap als Choroplethenkarte mit Ärztedichteverteilung als Färbung

Über eine Chorpolethenkarte werden die verschiedenen Ärztedichten der Stadtteile Münchens grafisch dargestellt. Die GeoMap beschränkt sich hierbei ausschließlich auf die Stadt München und Ihren zugehörigen Stadtteilen, da weitere Ebenen für die Untersuchung der Hypothesen nicht Erfolgsbringend sind und vom wesentlichen ablenken können. Über eine Legende werden wird der Farbgebung ein Wert der Ärztedichte zugeordnet. Die Skala erstreckt sich von 0, einem sehr hellen Orange, bis zu 4.000, in rotbraun gekennzeichnet. Durch das Hovern über einen der Stadtteile werden dem Benutzer weitere Informationen mittels Tooltip offenbart wie z.B. die Anzahl der Ärzte, das genaue Durchschnittsalter oder den exakten Wert der Ärztedichte.

Abb.7: Durchschnittsalter der jeweiligen Stadtteilen

Neben der Choroplethenkarte findet sich das Säulendiagramm wieder, welches die verschiedenen Durchschnittsalter den Stadtteilen zuordnet. Auf der X-Achse werden die Stadtteile, auf der Y-Achse das Durchschnittsalter, dargestellt. Um einen allgemeinen Vergleich der verschiedenen Durchschnittsalter zu ermöglichen wurde von allen Datenmengen das arithmetische Mittel errechnet und durch eine rote waagerechte Linie im Diagramm eingezeichnet. Auch hier kann durch hovern mit dem Cursor über einen der Säulen ein Tooltip angezeigt werden. Durch einen Klick auf einen der verschiedenen Säulen wird der zugehörige Stadtteil in der Choroplethenkarte grau markiert. Die restlichen Säulen ändern Ihre Farbe in Grau wodurch man die genaue Auswahl erkennen kann. Durch die Verbindung der beiden Diagramme ist es möglich sich das Durchschnittsalter im Säulendiagramm sowie die Ärztedichte in der Choroplethenkarte gesondert für ein Stadtteil anzeigen zu lassen. Die funktioniert umgekehrt auch durch einen Klick auf ein Stadtteil in der Choroplethenkarte. Bei den Frauenärzten ist anstatt des Säulendiagramms, wie bereits beim Prototyp erwähnt, ein Streudiagramm zu sehen.

Abb.8: Streudiagramm, welches die Anzahl der Frauenärzte zu den Frauenanteilen eines Stadtteils mappt

Dieses bildet auf der X-Achse die Anzahl der Frauen und auf der Y-Achse die Anzahl der Frauenärzte ab. Eine rote Linie innerhalb des Diagramm stellt die Regression zwischen der Anzahl der Frauen und der Anzahl der Frauenärzten dar. Die Interaktionen per Hovern oder Click sind identisch mit denen im Säulendiagramm der Allgemeinärzte. Weiterhin ändert sich die Skala der Choroplethenkarte aufgrund der enorm niedrigen Ärztedichte der Frauenärzte. So bildet der Farbwert “rotbraun” nun eine Arztdichte von über 30.000 ab.

Abb.9: Interaktion zur Auswahl des zu betrachtenden Jahres mittels Slider

Unterhalb der Choroplethenkarte befindet sich ein Filter für die verschiedenen Berichtsjahre. Hier kann durch das verschieben eines Sliders das gewünschte Anzeigejahr ausgewählt werden.

Erkenntnisse

Mittels der Visualisierung wurde deutlich, dass unsere beiden Hypothesen nicht zutreffend sind. Die Ärztedichte steht, im Gegensatz zu unserer Annahme, in keinem Zusammenhang zu der Anzahl der Einwohner eines Stadtteils. Ebenso verhält es sich für die Hypothese, dass bei einer höheren absoluten Anzahl an weiblichen Einwohnern in einem Stadtteil mehr Frauenärzte dort angesiedelt sind, also eine geringere Frauenarztdichte vorherrscht. Auch hier ist kein Zusammenhang zu erkennen.

Ebenso ist uns aufgefallen, dass der Altersdurchschnitt im Säulendiagramm keine Aussagekraft besitzt. Dies liegt daran, dass wir nur einen einzelnen Wert für den Altersdurchschnitt in einem Stadtteil vorliegen hatten. Eine Aufteilung nach Altersgruppen wäre hierfür deutlich hilfreicher und unter Umständen aussagekräftiger gewesen, was uns auch neue Erkenntnisse hätte liefern können.

Wir konnten jedoch die Erkenntnis gewinnen, dass im Stadtzentrum sowohl die Anzahl der Allgemeinärzte als auch der Frauenärzte deutlich höher ist als in den äußeren Bezirken. Aus zeitlichen Gründen haben wir jedoch keine Recherche zur Kausalität dessen durchführen können.

Implementierung

Die Visualisierung wurde als HTML-basierte Webanwendung umgesetzt. Nebst HTML nutzten wir JavaScript, um die Auswahl der Visualisierung mittels Radiobutton hinzuzufügen. Somit ist ein dynamisches Laden der gewünschten Visualisierung möglich und bietet eine bessere Übersichtlichkeit als eine vertikale Anordnung der jeweiligen Visualisierung. Als Datengrundlage für die Stadtteile und somit der Choroplethenkarte dient eine GeoJSON-Datei der Stadtteile Münchens. Diese haben wir mit allen weiteren nötigen Informationen angereichert, sodass nur eine Datei mit allen relevanten Daten in das Visualisierungstool eingebunden werden musste. Als Visualisierungstool wählten wir VegaLite, dwa es sich für uns als das Praktikabelste herausstellte und alle Anforderungen erfüllte. Ebenso war hierfür eine geringe Einarbeitungszeit notwendig verglichen mit mächtigeren Visualisierungstools wie D3.

Zu Beginn wollten wir die Daten in getrennten Dateien in VegaLite einbinden, was jedoch nicht funktionierte, wodurch wir gezwungen waren, alle Daten innerhalb einer Datei zu halten. Ebenso hatten wir Probleme mit der Sortierung der Stadtteile im Säulendiagramm. Es war angedacht, die Stadtteile aufsteigend nach dem Durchschnittsalter zu sortieren, dies war jedoch nicht möglich, was an einem Bug in VegaLite liegt. Ebenso war es schwierig, zwei Diagramme innerhalb einer Visualisierung in VegaLite darzustellen. Hierbei haben uns weder die Dokumentation noch Anwendungsbeispiele zu VegaLite weitergeholfen, da diese sich nur auf spezifische und rudimentäre Probleme bezogen haben. Nach längerer Recherche in Foren sind wir auf den Lösungsansatz gestoßen, die Diagramme mittels verschiedenen Layern umzusetzen und diese mittels concat zusammen zu setzen. Zusätzlich hatten wir bei einigen Funktionen das Problem, dass gewisse Keywords, die in der VegaLite Dokumentation aufgeführt sind, nicht genutzt werden konnten, da das Script dadurch nicht kompilierte. Um das Problem zu lösen behalfen wir uns tiefgründiger Recherche in Foren, wie gewisse Keywords in der Praxis genutzt werden können und änderten unser Skript entsprechend ab.

Fazit

Mithilfe unserer Visualisierungen kamen wir zum Ergebnis, dass sowohl kein Zusammenhang zwischen Ärztedichte und Altersdurchschnitt als auch zwischen Frauenanteil und Frauenarztdichte innerhalb der Stadtteile Münchens von 2012 - 2017 existiert. Das Aufbereiten der Daten war zeitintensiv, da wir gezwungen waren, alle Daten in einer Datei zusammenzufassen.

Deutlich anspruchsvoller war jedoch die Programmierung aufgrund einer klein gehaltenen Dokumentation von Vega Lite und der geringen Anzahl von Beispielen, welchen unseren Erwartungen entsprachen. Fehlerquellen waren deshalb schwer zu entdecken und nachzuvollziehen. Aus diesem Grund nahm die Fehlersuche die meiste Zeit auf sich, was den Druck aufgrund Zeitmangel erhöhte.

Reflektion

Unsere Thesen konnten wir mit unseren Visualisierungen widerlegen, weshalb unser Ziel weitgehend erreicht wurde. Dennoch stellt sich hier die Frage, ob unsere gewählten Datensätze für einen Vergleich sinnvoll sind. Datensätze von Altersdurchschnitt oder dem Frauenanteil unterscheiden sich innerhalb der Stadtteile nur geringfügig. Sinnvoller wäre hierbei die Betrachtung der Altersverteilung in Zusammenhang zur Ärztedichte. Sinnvoll wäre auch ein direkter Vergleich mehrerer Großstädte in Hinblick auf die Ärztedichte, damit unsere Erkenntnisse nicht regionsabhängig sind. Dies war jedoch aufgrund fehlender Daten nicht möglich. Auch diverse Bugs schränkten unsere Visualisierung ein. So war es beispielsweise nicht möglich die Reihenfolge der Stadtteile im Säulendiagramm nach Altersdurchschnitt zu sortieren.

Dennoch wurden unsere Hauptziele erreicht. So besitzt unser Prototyp für die Hypothesen jeweils eine interaktive Choroplethenkarte, einen Slider zum Vergleich der Jahre 2012 - 2017 und einen Tooltip zur Anzeige von zusätzlichen Informationen. Auch die zusätzlichen Visualisierungen, also das Säulendiagramm und der Scatterplot sind anklickbar und zeigen auf das entsprechende Stadtteil in der Choroplethenkarte.

Ausblick

Wie bereits im obigen Abschnitt erwähnt, wäre für die erste Hypothese die Betrachtung der Altersverteilung innerhalb der Stadtteile sinnvoller. So könnte man beispielsweise den Zusammenhang zwischen dem Anteil älterer Bürger (über 60 Jahre) mit der Ärztedichte vergleichen. Erweitern könnte man dies mit der Betrachtung von verschiedenen Arztgruppen (Internist, Orthopäde usw.).

Auch ein Vergleich von verschiedenen Städten statt Stadtteilen wäre zur Untersuchung der These hilfreich, da es häufiger vorkommt, dass Patienten einen Arzt in einem anderen Stadtteil besuchen. So besitzt unser Prototyp noch deutlich Potential zur Weiterentwicklung, was jedoch aufgrund fehlender Daten bisher nicht umzusetzen ist.