Epochen und ihre Kunstobjekte
Zusammengefasste Erkenntnisse in Form eines Posters für die iExpo

Christian Garske, Elbasan Krasniqi, Hendrik Krause, Marko Lasic, Christopher Troy

Epochen und ihre Kunstobjekte

Untersuchung des Zusammenhangs zwischen Epochen und Maßen ausgewählter Kunstobjekte des Cooper Hewitt Museums aus dem Zeitraum von 1497 bis 1929

In diesem Projekt, welches im Zeitraum vom 3. Mai 2018 bis 3. Juni 2018 bearbeitet wurde, werden eine Analyse und mehrere Visualisierungen eines Datensatzes zweidimensionaler Kunstwerke des Cooper Hewitt Smithsonian Design Museums in New York durchgeführt. Dabei liegt der Fokus auf dem Zusammenhang zwischen Epochen und Maßen der Kunstobjekte. Weiterhin wurden die Länder der Veröffentlichung betrachtet, um Erkenntnisse über die Herkunft von Kunstobjekten einzelner Epochen zu gewinnen. Die Epochen wurden sowohl in ihrer Gesamtheit als auch einzeln voneinander abgrenzend betrachtet, sodass Epochen in den Kontext eingeordnet, aber auch Erkenntnisse für eine einzelne Epoche gewonnen werden konnte. Die Daten wurden über ein Git-Repository zur Weiterverarbeitung direkt vom Museum bereitgestellt.

Inhalt

  1. Einführung
  2. Motivation und Konzept
  3. Daten
    3.1 Datenquellen
    3.2 Datenerhebung
    3.3 Datenaufbereitung
  4. Prototyp und Erkenntnisse
    4.1 Gestapeltes Säulendiagramm
    4.2 Scatter Plot
    4.3 Zeitlich geordnetes Balkendiagramm
    4.4 Erkenntnisse
  5. Fazit

Einführung

Im Rahmen der Lehrveranstaltung Grundlagen der Datenvisualisierung (GDV), die von Prof. Dr. Till Nagel an der Hochschule Mannheim gehalten wird, findet in der zweiten Semesterhälfte ein Visualisierungsprojekt statt. In diesem Semester (Sommersemester 2018) wurde das Thema kulturelle Datensammlungen behandelt. Hierbei gab es keine Vorgaben zur Wahl der Datensätze oder zur Umsetzung der Visualisierung. Durch diese enorme Freiheit war es zu Beginn schwierig eine konkrete Projektidee zu entwickeln und eine dazugehörige Datenquelle zu finden. Nach anfänglichen Schwierigkeiten fanden wir das Cooper Hewitt Design Museum und deren ausgestellte Kunstartikel.

Motivation und Konzept

Keines der Gruppenmitglieder konnte vertiefende Kenntnisse zu Kunstwerken vorweisen, weshalb eine erste Auseinandersetzung mit der Thematik die Grundvoraussetzung für dieses Projekt war. Jedoch kann eine solch weitreichende Thematik nicht im vorgegebenen Zeitraum vollständig durchdrungen werden. Demnach stellten wir Kriterien wie die Lizenzierung der Datensätze, die Verfügbarkeit, die Anzahl der verfügbaren Datensätze und den Aufwand zur Aufbereitung der Daten auf. Wir entschieden uns für das Cooper Hewitt Museum, da der Datensatz eine Vielzahl von Attributen besitzt, die sich für eine Auswertung anbietet und möglicherweise interessante Erkenntnisse ermöglicht. Dabei erwiesen sich vor allem die Jahreszahlen, Maße und Veröffentlichungsländer als wichtigste Attribute. Zudem bot der Datensatz des Cooper Hewitt Museums eine große Anzahl an Objekten, welche eine zuverlässige Aussage über die Kunstwerke einer Epoche oder eines Herkunftslands ermöglicht. Durch die große Anzahl aller über die Schnittstelle verfügbaren Objekte entschieden wir uns für Gemälde und Drucke, denn alle anderen Objekte wiesen eine sehr unklare Clusterung auf. Zusätzlich hatte dies den Vorteil der besseren Vergleichbarkeit von Objektmaßen. Eine weitere Rolle, welche eine Motivation für diesen Datensatz war, spielte die angegebenen Farbwerte der Kunstobjekte. Diese Farbwerte wurden allerdings im Laufe der Projekts zugunsten der Realisierbarkeit und einer besseren Übersichtlichkeit verworfen.

Für die Findung sinnvoller und stichhaltiger Hypothesen wurde eine erste explorative Auswertung gemacht, welche einen Einblick in die vorhandenen Datensätze und bestehende Tendenzen offenbaren sollte. Daraus konnten dann folgende Thesen abgeleitet werden, auf denen wir im weiteren Projekt aufsetzten:

  • Kunstrichtungen vor 1800 sind nicht in Amerika zu finden, da die Unabhängigkeit erst Ende des 18. Jahrhunderts erklärt wurde und Kunst somit aus dem europäischen Raum kam.
  • Europäische Stilrichtungen sind nicht in Amerika aufzufinden, da die Kunst nicht in die Kolonien gebracht wurde.
  • In der damaligen Zeit wurden viele Kunstwerke unter dem Aspekt des goldenen Schnitts angefertigt, weswegen es keine quadratischen Kunstwerke gibt.

Die ersten beiden Hypothesen sind eng miteinander verknüpft, jedoch besteht der Unterschied in der räumlichen und zeitlichen Trennung. Es wird immer auf Amerika eingegangen, da es sich um ein amerikanisches Museum handelt, weswegen dieser Bezug relevant ist.

Daten

Datenquellen

Das Cooper Hewitt Smithsonian Design Museum stellt 75% seiner Kunstsammlung auf GitHub für die Öffentlichkeit zur Verfügung (Quelle: https://github.com/cooperhewitt/collection, Stand 18. Juli 2018). Die angebotenen Inhalte werden von der Institution unter der Creative Commons Zero (CC0) Lizenz veröffentlicht, welche besagt, dass man an keine Lizenzbedingungen gebunden ist und die Inhalte somit verwenden, bearbeiten und veröffentlichen darf. Die Inhalte liegen zum einen im JSON Format vor, indem unter anderem jedes Kunstobjekt, jeder Künstler und jede Epoche über eine eigene Datei verfügt. Zum anderen werden die Daten zusätzlich als zusammengefasste CSV Dateien zur Verfügung gestellt. In den CSV Dateien befinden sich unter anderem Auflistungen aller Kunstobjekte, Epochen, Künstler, verwendeter Farben im Kunstobjekt und Verlinkungen zum Bild eines Kunstojektes zur Onlinegallerie. Für unser Vorhaben sind nur die CSV Dateien von Interesse, da in diesen alle wichtigen Daten bereits zusammengefasst vorliegen.

Datenerhebung

Um einen Überblick über die Kunstgegenstände zu gewinnen, nutzten wir zu Beginn die Onlinegallerie, jedoch konnten wir aufgrund der fehlenden Metadaten keine Entscheidungen treffen. Im nächsten Schritt befassten wir uns mit der Untersuchung der CSV Datei zur Auflistung aller Kunstobjekte. Die interessante und zudem ausschlaggebende Erkenntnis bei der Untersuchung dieser Datei war die Entscheidung lediglich zweidimensionale Kunstobjekte in unsere Auswahl aufzunehmen. Der Hintergrund dieser Entscheidung ist auf die vom Cooper Hewitt hinterlegten Angaben zu den Maßen der Kunstobjekte zurückzuführen. Die Angaben haben jedoch keine einheitlichen Formate, wodurch wir eine Datenaufbereitung durchführen mussten. Um die Datenaufbereitung im Projektzeitraum pünktlich und vollständig durchführen zu können, haben wir die dreidimensionalen Kunstobjekte aus dem Datensatz ausgeschlossen.

Datenaufbereitung

Die Datenaufbereitung musste zunächst für die CSV Datei der Kunstobjekte durchgeführt werden. Da die CSV Datensätze nicht sauber in Spalten gegliedert, sondern untereinander in Zeilen getrennt durch Kommas aufgelistet waren, überführten wir die Datensätze in ein übersichtliches Excel Format mit entsprechenden Spalten. Diese Datei mit dem Namen Objects.xlsx, beinhaltet für uns alle relevanten Daten, die wir für unsere Visualisierungen benötigten. Die Datei enthält allerdings auch einige Spalten, die für unsere Auswertung keine Rolle spielen, wie z.B. der Titel der Kunstobjekte oder die verwendeten Mittel zur Erstellung der Kunstobjekte. Relevante Spalten sind folgende: dimensions, date, decade, period_id, woe:country_name und url. Die Maßangaben zu den Kunstobjekten sind unter der Spalte dimension zu finden. Hierbei hält sich das Museum allerdings nicht an ein einheitliches Format, somit kommen verschiedene Maßangaben zustande. Für unser Vorhaben sind unterschiedliche Formate der Maße nicht förderlich. Unter anderem wurden folgende Formate durch das Museum für die Maßangabe verwendet:

  • H x W: 24.4 × 34.3 cm (9 5/8 × 13 1/2 in.)
  • 31.4 x 23.8 cm (12 3/8 x 9 3/8 in.)
  • L x W: 342.9 x 111.8 cm (11 ft. 3 in. x 44 in.)
  • (approx.): 11.5 x 16 cm (4 1/2 x 6 5/16 in.)
  • H x diam.: 40 x 16.5 cm (15 3/4 x 6 1/2 in.)

Um eine einheitliche Formatierung zu erreichen, haben wir die Maßangaben in drei neue Spalten aufgeteilt, die die Höhe, Breite sowie das Format beinhalten. Dabei gibt die Spalte Format Auskunft darüber, ob das jeweilige Kunstobjekt in Hochkant- oder Breitbild-Format vorliegt. Die Spalten date, decade und period_id haben wir für die Datenaufbereitung zu den Epochen genutzt. Das Museum bietet in einer zusammengefassten CSV Datei alle Epochen an, die jeweils mit einer ID versehen sind. Diese taucht in der “Objects.xlsx”-Datei innerhalb der Spalte period_id zu jedem Kunstobjekt auf. Allerdings ist uns bereits frühzeitig aufgefallen, dass die Daten zur period_id sehr lückenhaft sind und viele Kunstobjekte keine derartige ID enthalten und somit keine Zuweisung auf diese Art möglich ist. In aufwendigen Schritten haben wir anhand der Spalten date und decade versucht die Epochen manuell einzupflegen. Allerdings beinhalten auch diese Spalten kein einheitliches Format der darin beinhalteten Daten. Neben den Angaben eines einzelnen Jahres, gab es unter anderem auch folgende Ausführungen:

  • before 1855
  • created before 1870s
  • ca. 1981
  • covers 1876
  • 19th century
  • made between 1400 1532
  • mid-19th century
  • late 17th century
  • 1560 - 1600

Wir haben uns im Internet auf diversen Seiten wie beispielsweise Taschenhirn oder auch Wikipedia mit den einzelnen Epochen vertraut gemacht und uns Grundkenntnisse angeeignet. Für Kunstobjekte, die durch fehlende period_id nicht eindeutig einer Epoche zuweisbar waren, haben wir die Epochen manuell abgeglichen und zugewiesen. Wir erstellten eine neue Spalte, in der wir die Jahreszahlen einheitlich in das JJJJ Format übertragen haben. Bei ungenauen Angaben, wie z.B. „19th century“ oder „before 1855“, haben wir über die Spalte url Zugriff auf den Gallerielink des Kunstobjektes erhalten, wodurch wir anhand des Künstlers, sofern dieser vorhanden war, die Jahreszahl des Kunstobjektes bestimmt haben. Bei nicht vorhandenen Künstlerangaben glichen wir die angegebene Jahreszahl mit der in Frage kommenden Epoche ab. In den meisten Fällen war dieses Prinzip erfolgreich. Bei nur wenigen Fällen konnten wir keine eindeutige Aussage treffen, wodurch wir die Fakten gegenübergestellt haben, um anschließend eine Zuweisung zu ermöglichen. Unsere Kunstobjekte entstanden in folgenden Epochen:

  • 1300 bis 1600 Renaissance
  • 1575 bis 1720 Barock
  • 1720 bis 1780 Rococo
  • 1770 bis 1840 Neoklassizismus
  • mitte 19.Jhd. Realismus
  • mitte 19.Jhd. Hudson River School
  • 1890 bis 1920 Impressionismus
  • 1875 bis 1914 Jugendstil
  • 1905 bis 1923 Expressionismus

Für die iExpo 2018 an der HS Mannheim haben wir eine Präsentation erstellt, die Informationen zu den jeweiligen Epochen für die Besucher aufzeigt.

Prototyp und Erkenntnisse

Der Prototyp und die Visualisierungen sind mithilfe der Programmiersprache R entwickelt worden. Zu Beginn des Projekts hatte jedoch keines der Projektmitglieder mit dieser Sprache gearbeitet, weswegen eine Einarbeitungsphase notwendig war. In dieser Phase wurden erste explorative Visualisierungen mittels des bereits bekannten Tools Tableau erstellt. Dadurch konnten erste Erkenntnisse gewonnen werden, die dem Projekt eine Richtung gaben und unser weiteres Vorgehen bestärkte, rechtfertigte oder zu Änderungen veranlasste. Für die spätere Darstellung wurden die Pakete Shiny und ggplot für R verwendet.

Ausführung des Prototyps als GIF

Vorab kann zu den Visualisierungen gesagt werden, dass eine Unterteilung der Epochen für das Vorhaben enorm wichtig war und diese durch eine farbliche Kodierung gelöst wurden. Da es jedoch keine intuitive Zuordnung von Farben zu einzelnen Epochen gibt, musste eine Kodierung festgelegt werden. Hierfür wurde das Paper „Somewhere Over the Rainbow: An Empirical Assessment of Quantitative Colormaps“ (Liu and Heer 2018) herangezogen, welches eine wissenschaftliche Arbeit zur Problematik der Farbwahl ist. Dabei entschieden wir uns für die Farbpalette Viridis, die optisch ansprechend ist und ein gutes Farbspektrum zur Visualisierung der Epochen bietet.

Gestapeltes Säulendiagramm

Das Säulendiagramm stellt die Anzahl der Kunstwerke in Relation zu deren Herkunftsland dar. Dabei ist das Herkunftsland jenes Land, in welchem das entsprechende Kunstwerk veröffentlicht wurde. Außerdem wird die zugehörige Epoche des Kunstwerkes durch eine Farbkodierung verdeutlicht. Dieses Diagramm sollte in erster Linie eine Übersicht über die Herkunft der verschiedenen Werke schaffen. Weiterhin konnte damit auch bestimmt werden, welche Länder eine Vielzahl an Kunstwerken zu einzelnen Kunstepochen beigetragen haben oder woher besonders viele Werke (einer einzelnen Epoche) stammen.

Anzahl der Kunstwerke pro Epoche (farblich kodiert) für die verschiedenen Herkunftsländer

Scatter Plot

Um die Maße eines Kunstobjekts zu betrachten, wurde ein Scatter Plot genutzt, wobei die Höhe und Breite einer Achse eines zweidimensionalen Graphensystems zugewiesen wurden. Zuerst kam im Projektteam die Idee auf, den Rahmen des Objekts darzustellen, sodass die Größe der Objekte in einen Bezug gestellt werden, allerdings erwies sich dieses Vorhaben bei der bestehenden Menge an Objekten als äußerst schwierig, denn es gab extrem viele Überlappungen. Außerdem konnten mit dieser Darstellung keine Epochen mehr dargestellt werden, da ein solider Rand die anderen Farben mit denselben oder ähnlichen Maßen überdecken, ein transparenter Rand jedoch zur Mischung der Farben geführt hätte. Aufgrund dieser Problematik fiel die Entscheidung auf ein Scatter Plot, welches den Eckpunkt des jeweiligen Kunstobjekts repräsentiert.

Breite und Höhe der Kunstwerke für die verschiedenen Epochen (farblich kodiert)

Zeitlich geordnetes Balkendiagramm

Ursprünglich sollten ein Histogramm oder ein gestapeltes Flächendiagramm für diese Darstellung genutzt werden, jedoch ergaben sich Probleme der Übersichtlichkeit bei der Umsetzung. Dort sollte die Anzahl der Objekte zur jeweiligen Epoche angezeigt werden, doch diese Anzahl war durch die sehr unterschiedlichen Zeiträume und der darin enthaltenen Objekte nicht mehr klar ersichtlich. Für das Histogramm war es schwierig geeignetes Intervall zu finden, das sowohl die langen Epochen Rococo, Barock und Neo-Klassizismus, aber auch die moderneren kurzen Epochen Expressionismus, Impressionismus und Jugendstil aussagekräftig darstellen kann. Gegen das gestapelte Flächendiagramm sprach vor allem die Übersichtlichkeit und die Gewinnung von Erkenntnissen über den Bezug der einzelnen Epochen zueinander. Hierbei sollte die Anzahl der Objekte zur jeweiligen Epoche angezeigt werden, doch diese Anzahl war durch die sehr unterschiedlichen Zeiträume und den damit verbundenen Mengen von Objekten nicht mehr klar ersichtlich.

Somit wurde die gesamte Aussage auf die zeitliche Abfolge der Epochen reduziert. Hierfür bot sich das zeitlich geordnete Balkendiagramm an. Dabei wird die Länge der einzelnen Epochen ersichtlich und wie sie im zeitlichen Verlauf zueinander stehen. Zusätzlich können Überlappungen der Epochen in klarer und übersichtlicher Form dargestellt werden und vermitteln ein besseres Gefühl von Parallelität.

Balkendiagramm aus dem Prototyp

Erkenntnisse

Zusammengefasste Erkenntnisse in Form eines Posters für die iExpo

Die Hypothese, dass bestimmte Kunstepochen vor 1800 nicht in Amerika vertreten waren erwies sich als richtig, denn keines der Kunstwerke aus Amerika ist auf den Zeitraum vor der Zeit des Neoklassizismus (ungefähr ab 1770) datiert. Dafür sind mehr Kunstwerke der moderneren Kunstepochen in Amerika vorhanden, als es in den europäischen Ländern der Fall ist.

Weiterhin hat sich bestätigt, dass Europäische Stilrichtungen (Renaissance, Barock und Rococo) kaum bzw. gar nicht aus Amerika kommen. Dies hängt unter anderem mit dem Fakt zusammen, dass die europäischen Stilrichtungen älter sind und somit aus der Zeit vor der Gründung der Vereinigten Staaten von Amerika stammen. Eine weitere zu untersuchenden Hypothese wurde ebenfalls bestätigt, denn die Bildformate unterteilten sich in Hochkant- und Breitbilder. Durch die weitere Unterteilung der Maße in die einzelnen Epochen konnten zwei weitere Erkenntnisse gewonnen werden. Zum Einen wiesen die Objekte der Renaissance deutlich kleinere Bildformat auf, als es in den anderen Kunstrichtungen der Fall ist und zum Anderen ging aus der Stilrichtung des Expressionismus ein auffallender Cluster von Objekten hervor.

Kleinere Kunstwerke in der Renaissance (links) und Cluster von Postern des Künstlers Batiste Madalena zur Zeit des Expressionismus

Bezüglich den Maßen der Renaissance ist keines der Objekte größer als 50cm x 50cm, wohingegen die anderen Kunstrichtungen breit gestreute Objekte von bis zu einem Meter Breite oder Höhe besitzen. Der Cluster des Expressionismus weist nach weiterer Untersuchung dieselbe Herkunft auf, so erstellte der Künstler Batiste Madalena mehrere Plakate in sehr ähnlichem Stil. Dabei hatten die Plakate ein verhältnismäßig großes hochkant Format.

Eine abschließende Erkenntnis konnte aus einer Frage gewonnen werden, welche erst im Verlauf des Projekts aufkam. Dadurch konnten Kunstwerke der Hudson River School, welche durch Landschaftsmaler aus dem Tal des Fluss Hudson definierten, in Kolumbien, Ecuador und Europa gefunden werden. Diese Objekte hätten der Definition der Stilrichtung nach nicht aus diesen Ländern kommen dürfen. Doch für diese räumliche Ausbreitung konnte nach weiterer Recherche eine einfache Erklärung gefunden werden. Die Künstler, die die Hudson River School prägten waren alle Künstler der ersten Generation, welche ihre Ausbildung oder Inspiration aus Europa entnahmen und dementsprechend dort Kunstwerke anfertigten. In der zweiten Generation breitete sich diese Stilrichtung in den Westen Amerikas, die Seeprovinzen vor der kanadischen Küste, New England und auch Südamerika aus, wodurch Kunstwerke in Südamerika entstanden.

Fazit

Im Gegensatz zu alltäglichen Themen- und Problemfeldern benötigt die Thematik kultureller Objekte eine andere Herangehensweise, denn in den wenigen Fällen besteht ein Grundwissen im Bezug auf solche. Hierbei war es wichtig ein Verständnis für die Charakteristik des Themas zu erlangen, denn sonst werden Auswertungsmöglichkeiten und Kreativität durch fehlendes Wissen stark eingeschränkt. Durch die zunehmende Beschäftigung mit dem Datensatz war es dennoch möglich Erkenntnisse zu gewinnen und eine aussagekräftige Visualisierung zu schaffen. Ein initial bestehendes Problem stellte die Hypothesenfindung dar, denn eine konkrete Formulierung von sinnvollen und stichhaltigen Hypothesen war nur mit bereits genanntem Wissen möglich, weswegen die erste Phase des Projekts vor allem aus explorativen Auswertungen des Datensatzes bestand, um den diesen zu verstehen und zu durchdringen.

Durch die anfänglichen Schwierigkeiten blieb gegen Ende des Projekts weniger Zeit, weshalb eine Priorisierung der Aussagen, der darzustellenden Inhalte und dem Detailgrad der Visualisierungen vorgenommen werden musste. Infolgedessen wurde nicht der wünschenswerte Umfang von Interaktionen mit dem Prototypen eingebunden. Hierbei wäre nicht nur die Auswahl der Epochen sinnvoll gewesen, sondern auch die Auswahl eines bestimmten Zeitfensters indem eine weitere Auswahl der Epochen getroffen werden kann. Zusätzlich hätte für die Herkunftsländer der Objekte eine geographische Karte eingebunden werden müssen, um einen intuitiveren Überblick zu schaffen und mittels der Farbkodierung eine räumliche Unterteilung der Epochen vorzunehmen. Abschließend hätten wir gerne eine direkte Zugriffsmöglichkeit auf die Objekte in den Visualisierungen ermöglicht, sodass zumindest eine Vorschau oder eine Verlinkung der hinter den Datenpunkten liegenden Kunstwerke zu ermöglichen.

Projekt Vorstellung auf der iExpo 2018 an der HS Mannheim (v.l.n.r. Hendrik Krause, Christian Garske, Elbasan Krasniqi, Christopher Troy und Marko Lasic)