Auf den ersten Blick scheint das Erstellen einer Datenvisualisierung nicht besonders schwer zu sein. Beim näheren Hinsehen verbirgt sich dahinter aber ein Handwerk, das auch beherrscht werden sollte. Eine gut gemachte Datenvisualisierung muss gewisse Bedingungen erfüllen, damit sie ihre Botschaft verständlich überbringen kann.

Das Design und Skalierung

Das Design einer Visualisierung soll gut überlegt sein, damit es die dort enthaltenen Informationen schnell und effizient vermittelt.

Eine mangelhafte Datenvisualiserung übermittelt im besten Fall die Informationen fehlerhaft. Im schlimmsten Fall stiftet sie sogar zusätzliche Verwirrug und lenkt von wichtigen Ergebnissen ab, oder verschleiert den eigentlichen Zusammenhang.

Vor einiger Zeit wurde folgende Visualisierung viral auf Twitter.

Hier wird es bereits auf den ersten Blick deutlich, dass etwas mit der Skalierung dieser Grafik nicht stimmt. Sie macht den Unterschied zwischen der Länge der Frauen durch eine falsche Sklierung und grafische Aufarbeitung sehr viel größer. Der in in der Realität geringe Unterschied zwischen den Längen wird hier durch die falsche Dartsellung massiv überzeichnet.

Da wir insgesamt gute Kenntnisse bezüglich der menschlichen Größe haben, ist es hier relativ leicht den Fehler zu erkennen. Bei anderen Themenbereichen kann aber so eine irreführende Skalierung zu einer falschen Wahrnehmung und unrichtigen Schlussfolgerungen führen.

Aus diesem Grund ist es wichtig die Visualisierung kritisch zu überprüfen: Ist die Skalierung korrekt? Werden entsprechende Zahlenintervalle entsprechend dargestellt?

Auch die Farbgestaltung sollte mit Bedacht gewählt werden. Farben können in einer grafischen Darstellung helfen zusätzliche Inhalte zu übermitteln. Allerdings soll darauf geachtet werden, dass die gewählten Farben nicht zu bunt und grell sind und somit vom eigentlichen Inhalt der Grafik ablenken oder auf diese Weise die Aussagekraft der Visualisierung dezimieren.

Datenstruktur: qualitative oder quantitative Daten?

Damit die Grafik entsprechend gestaltet werden kann, müssen auch die Daten entsprechend ihrer Eigenschaften bzw. Struktur dargestellt werden.

Die Grundsatzentscheidung, wie wir unsere Daten darstellen, hängt stark davon ab, ob unsere Daten qualiatitiv oder quantitativ sind.

Qualitative Daten lassen sich nur auf begrenzte Art und Weise darstellen. Quantitativen Daten können hingegen so dargestellt werden, dass man auch ihre mathematische Eigenschaften auf den ersten Blick erkennen kann.

Linienplot, Pie Chart oder etwas anderes?

Ferner müssen wir überlegen, wie wir am besten und effektivsten unsere Daten abbilden können, soll es ein Linien- oder ein Säulendiagramm sein? Oder passt zu den Daten eine andere Darstellungsform besser?

Einfache Datendarstellung: Linienplots und Kuchendiagramme

Liniendiagramme eignen sich am ehesten um Zeitreihen darzustellen. Daten mit einem zeitlichen Faktor wie beispieslweise Trends lassen sich sehr gut mit Linien wie oben dargestellt abbilden.

Daten, die beispielsweise Anteile einer Gesamtheit zeigen, lassen sich besser durch andere Visualisierungsformate abbilden, wie etwa Kuchendiagramme.

Pie Charts / Säulendiagramme

Pie Charts bzw.  Kuchen- oder Kreisdiagramme sind auch eine gute Lösung für Daten, die insgesamt wenig Werte ausweisen. Beispielsweise könen wir gut die Marktanteile einer Firma mit einem Pie Chart ausdrücken.

Grafische Darstellung der quantitativen Daten

Sind unsere Daten quantitativ, können sie auch so aufgearbeitet werden, dass man ihre statistische Beschaffenheit (z.B. Streuung) auf einen Blick erkennen kann.

Box Plot

Die hilfreichste grafische Darstellung ist hier der sogenannte Box Plot.

Mit dem Box Plot lassen sich bereits auf den ersten Blick die wichtigsten statistischen Eigenschaften einer Variable erkennen, wie z.B. der Median (grüne Linie), der Interquartile Range (Interquartilsabstand) und (falls vorhanden) die Ausreißer.

Histogramme und Säulendiagramme

Mit Histogrammen lässt sich sehr gut die statistische Verteilung der Daten abbilden. Sie funktionieren gut für stetige Variablen, deren Werte sich in nacheinander folgenden Größen bewegen.

 

Ein Säulendiagramm (bar chart), obwohl dem Histogramm ähnlich, visualisiert am besten diskrete und qualitative Variablen, die nur wenige Werte aufweisen.

 

Datenvisualisierungstools

Es gibt sehr viele verschiedene kostenpflichtige und kostefreie Anwendungen, die uns helfen eine gute Datenvisualisierung zu erstellen. Zu den kostenpflichtigen Anwendungen gehören die Standardanwendungen wie Excel, aber auch mehr auf Visualisierung fokusierte Tools wie Tableau. Zudem gibt es auch statistische Softwareprodukte wie Stata oder SPSS, die auch gute Visualisierungsmöglichkeiten beinhalten.

Zu den kostenlosen Anwendungen gehören insbesodere Programmiersprachen, die bestimmte Visualisierungsbibliotheken beinhalten wie Python oder R.

Generell können die Angebote nach der Lernkurve unterschieden werden. Bei den Softwareanwendungen wie Excel oder Tableau lassen sich die Visualisierungen relativ schnell erstellen. Die Lernkurve ist also relativ flach. Man arbeitet mit Vorlagen und pflegt die Daten in diese Mustervorlagen ein.

Im Fall der Programmiersprachen wie R oder Python ist die Lernkurve zunächst recht steil, denn man muss die Programmiersprache zumindest in ihren Grundzügen erlernen. Dafür sind die Möglichkeiten, die Programmiersprachen für die grafische Bearbeitung der Daten anbieten, ungleich flexibler als im Fall von Excel oder Tableu. Man ist nicht nur auf starre Vorlagen angewiesen, sondern kann die Visualisierung stark an die Datenbedürfnisse anpassen.

Eine weitere Alternative für eine schöne grafische Bearbeitung von Daten ist auch der Adobe Illustrator. Diese Anwendung ist jedoch rein grafisch und eignet sich nicht zur Berechnung von Tabellen. Mit Adobe Illustrator lassen sich jedoch sehr schöne und einzigartige Tabellen und Grafiken erstellen, die gut für Werbung und Data Storytelling funktioneren. Die obigen Diagramme in diesem Beitrag wurden mit Adobe Illustrator erstellt.

 

 

*Disclaimer: Ich habe für diesen Beitrag kein Geld von den hier genannten Firmen erhalten.