Python oder R für Data Science?

Welche Programmiersprache ist für Data Science wichtiger? Python oder R? Kurze Antwort: es kommt zwar auf das Ziel an, aber Python ist definitiv das Mittel der Wahl für Data Science. Laut dem IEE Spektrum Ranking ist Python die populärste Programmiersprache weiterlesen…

Was sind eigentlich Daten? Daten einfach erklärt

Daten sind Informationseinheiten Unsere Welt besteht aus Daten, denn Daten sind nichts anderes als Informationen oder noch spezifischer, Informationseinheiten. Datenformen Daten können vielfältige Formen annehmen. Beispielsweise können sie als Text vorkommen aber auch als Video, Datenbanken, Tabellen, Zahlen, Audiodaten, Bilder weiterlesen…

Einfache Visualisierung in Python erstellen – Einführung

Im heutigen Beitrag möchte ich eine einfache Anleitung zur Datenvisualisierung in Python erstellen und zeigen, wie der Prozess in seinem gesamten Ablauf ausschauen kann. Um eine Visualisierung zu erstellen, werden wir das Beispiel aus dem vorherigen Artikel zu Straßenverkehrsunfällen in weiterlesen…

Wie sicher sind Kinder im Straßenverkehr? Datenbasiertes Entscheiden

Soll ich mein Kind zu Fuß auf den Weg zur Schule schicken und zwar alleine, oder sind die deutschen Straßen inzwischen so unsicher geworden, dass es zu riskant ist? Laut Focus gehen inzwischen die wenigsten Kinder allein zur Schule: „In weiterlesen…

Fake Follower auf Twitter anhand von Daten erkennen

Wie kann ich erkennen, ob einem Twitterprofil viele Bots / Fake Follower folgen? Dieser Frage werden wir heute mit der Analyse der Twitterfollowerdaten ausgewählter deutscher Politiker beantworten. Bots und Fake Follower auf Twitter und Social Media Jede Person, die auf weiterlesen…

Hadoop, Spark und Big Data – brauchen wir sie wirklich?

Im heutigen Beitrag werde ich einige Entwicklungen im Big Data Ökosystem ansprechen und den Bereich ganzheitlicher als in meinem letzten Artikel beleuchten. Zudem stelle ich eine kontroverse Frage in den Raum: Brauchen wir überhaupt Big Data Analyse? Oder ist es weiterlesen…

Moral Hazard im Machine Learning: falsche Metriken

Der Trend geht hin zur datenbesierten Entscheidungsfindung. Dies birgt allerdings einige Gefahren, die in der Expertenwelt* zunehmend besprochen werden. Eine der drängendsten Fragen ist das Problem der Erfolgsmessung dieser datenbasierten Strategien und angewandten Algorithmen. Anders ausgedrückt: Sind KI Algorithmen wirklich weiterlesen…

Lerne Data Science – Resourcen

Im heutigen Beitrag schlage ich einige Bücher und Kurse vor, die aus meiner Sicht sehr gut verschiedene Themen im Bereich Data Science erklären. Diese Ressourcen erlauben es einem Data Science im Selbststudium zu vertiefen und einen guten Überblick über die weiterlesen…

Datenkultur im Unternehmen – KI Strategie und Personalgewinnung

KI Themen gewinnen in Deutschland an Popularität. Viele Unternehmen (zunehmend auch mittelständische) wollen ihre KI-Strategie verbessern und planen vermehrt Data Scientists und/oder Data Engineers einzustellen um das Unternehmen im KI-Wettbewerb gut zu positionieren. Es ist offenbar vor allem „in“, etwas weiterlesen…

KI-Algorithmen werden die Ärzte nicht ersetzen

Seit einigen Jahren werden zunehmend Artikel publiziert, die das baldige Überholen der Ärzte und insbesondere Radiologen in der Diagnostik durch KI verkünden. So schreibt beispielsweise die Zeit: „Die Fachgesellschaft der US-amerikanischen Radiologen prognostiziert der Radiologie, dass sie sich in den weiterlesen…