Vereinfacht gesagt untersucht die (soziale) Netzwerkanalyse die Beschaffenheit eines Netzwerks. Heutzutage werden Netzwerkanalysen vor allem zur Analyse von Netzwerken in den Sozialen Medien (FACEBOOK, Twitter etc) angewandt. Vom Prinzip aber eignet sich diese Methode, um Netzwerke jeder Art zu analysieren.

Was ist ein Netzwerk?

Ein Netzwerk (auf englisch wird auch der Begriff  „Graph“ verwendet) ist vom Prinzip eine Ansammlung von „Knoten“ (auf Englisch: Nodes), die miteinander verbunden sind. Die Verbindungen in einem Netzwerk heißen auf Englisch Edges.

Dabei kann ein Netzwerk verschiedene Beziehungen abbilden: Freundschaften, Familie oder Kollegen in der Firma. In diesen Fällen entsprechen Knoten und Edges den menschlichen Beziehungen untereinander.

Netzwerkanalyse umfasst sehr viele Methoden und Verfahren, die verschiedene Parameter eines Netwzerks untersuchen. In diesem Beitrag werden wir einige dieser Methoden zusammenfassen. Für mehr Infos sind auch folgende Beiträge empfehlenswert: „Graph Machine Learning with Python Part 1: Basics, Metrics, and Algorithms„, „Graph measurements: length, distance, diameter, eccentricity, radius, center„.

Das populärste Beispiel für Netzwerkanalysen sind derzeit die Analysen von Social Media Usern (FACEBOOK, Twitter usw). Da Menschen in einem Netzwerk oft bestimmte Gemeinsamkeiten haben, lassen sich bestimmte Merkmale und Verhaltensweisen davon ableiten und somit Vorhersagen über das Netzwerk treffen. Beispielsweise werden Menschen, die viele gemeinsame Freunde haben, oft auch Freunde. Menschen, die viele Verbindungen zu einem bestimmten Netzwerk haben, werden mit der Zeit oft auch ein Teil dieses Netzwerks. Auch lässt sich einschätzen, ob und wann ein Netzwerk in kleinere Netzwerke auseinanderbricht, welche Subgruppen es in einem Netzwerk gibt oder beispielsweise, wie sich eine Nachricht über ein Netzwerk ausbreiten wird.

Netzwerke können verschiedene Formen annehmen und die Analyse beschränkt sich nicht nur auf soziale Medien. Auch Flughäfen bilden beispielsweise ein Netzwerk, das über Flüge verbunden ist. Netzwerkanalyse erlaubt uns alle Netzwerke zu analysieren und nicht nur die auf Social Media.

Wie anaysiere ich ein Netzwerk?

Netzwerkanalyse ist keine exakte Wissenschaft, jedoch gibt es einige Anhaltspunkte, die uns Informationen über ein Netzwerk leiefern können.

Distanz

Eines der wichtigstsen ist dabei die Distanz. Wie weit sind die Nodes voneinander entfernt? Es gibt verschiede Möglichkeiten Distanz in einem Netzwerk zu messen.

Die einfachste Methode ist die Messung der Entfernung zwischen den Knoten/Nodes untereinander. Ein Beispiel:

Wie weit ist es von Node A bis zu Node D?

Wir folgen den Verbindungen (Edges) und kommen auf folgende Schritte: A – C – D.

Distanz ist hier der kürzeste Weg zwischen Knoten A und D. Dabei ist der kürzeste Weg der, der die wenigsten Nodes als Zwischenschritte beinhaltet.

Breitensuche

Breitensuche ist ein Verfahren, welches Verbindungen eines Knoten zu allen anderen Knoten nacheinander systematisch aufdeckt.

An unserem Beispiel (siehe Netzwerk oben) erklärt:

Wir gehen vom Knoten A und wollen die Distanz von A zu allen anderen Knoten im Netzwerk aufdecken.

Knotenabstand 0 ist in diesem Fall A.

Knotenabstand 1 ist: C.

Knotenabstand 2: D, B und E.

Die am weitesten entfernte Verbindung ist der Knoten F mit Knotenabstand 3.

Kürzeste Distanz zwischen zwei Knoten

Sie misst die kürzeste Entfernung zwischen zwei Knoten/Nodes gemessen in Edges. In unserem Beispiel beträgt die kürzeste Distanz zwischen A und E: 2 Edges.

Diameter

Diameter zeigt die maximale Distanz zwischen zwei Nodes/Knoten in einem Netzwerk an. In unserem Beipiel ist es die Distanz zwischen A und F: 3.

Länge

Die Länge eines Netzwerks beschreibt die Anzahl der Edges zwischen den einzelnen Knoten. Im obigen Beispiel ist die Länge: A-C, D-C, C-B, C-E, B-E, D-F: 6.

Es gibt weitere Merkmale, die die Distanz in einem Netzwerk erfassen, u.a. die durchschnittliche Distanz, Eccentricity. Hier eine kurze Zusammenfassung davon.

Wie robust ist ein Netzwerk?

Starke Robustheit eines Netzwerks bedeutet, dass ein Netzwerk seine allgemeine Eigenschaften behalten kann, wenn es z.B. angegriffen wird oder manche Verbindungen zusammenbrechen.

Konkret heißt es beispielsweise, dass die Transportlinien aufrechterhalten werden, obwohl ein Flughafen geschlossen wird.

Weitere Messwerte für Netzwerkanalyse

Weitere Messwerte der Netzwerke fokussieren sich insbesondere auf die Wichtigkeit bzw. Relevanz bestimmter Knoten in einem Netzwerk.  Dabei kann die Relevanz anhand von vielen unterschiedlichen Faktoren ausgemacht werden.

Wir könnten beispielsweise sagen, die Knoten mit der höchsten Anzahl an Followern/Freunden sind die wichtigsten oder aber die Knoten, die nah beieinander liegen (Distanz) sind die wichtigsten.

Eine Gruppe von Werten, die es uns erlaubt die Wichtigkeit der Knoten in einem Netzwerk zu bewerten ist die Zentralität.

Zentralität

Es gibt hierzu kein einheitliches Maß. Es werden verschiedene Messwerte benutzt wie zum Beispiel:

Gradzentralität (Degree): Wie viele direkte Nachbarn hat ein Node/Knoten? Zählung der Edges, die von einem Knoten ausgehen.

Ein Knoten hat die Zentralität von 1, wenn er mit jedem Knoten im Netzwerk verbunden ist. Wenn die Zentralität 0 beträgt, ist der Knoten mit keinem Knoten im gegebenen Netzwerk verbunden.

Closeness-Zentralität (Closeness Centrality): Dieser Messwert berechnet die Nähe eines Knotens zu allen anderen Knoten im Netzwerk.

Es gibt weitere Zentralitätsmesswerte, die in dieser Bachelorarbeit (Link zum PDF Dokument) anschaulich erklärt worden sind.

Betweenness-Zentralität: Sie geht davon aus, dass die wichtigsten Knoten die sind, die viele anderen Knoten miteinander verbinden.

Diese Werte sind in ihrer Beschreibung relativ verständlich. Allerdings werden zu ihrer Berechnung oft recht komplexe Methoden angewandt. Aus diesem Grund ist bei jeder Netzwerkanalyse Vorsicht geboten. Sind die Werte für mein Netzwerk wirklich ermittelbar?

Prestige

Weitere Werte, die allerdings nur für bestimmte Art der Netzwerke (gerichtete Netzwerke)  messbar sind, sind die sogenannten Prestigemaße. In dieser Gruppe finden sich weitere recht komplexe Berechnungsformel (Zusammenfassung als PDF). Im Fall von Prestige Messwerten ist die Richtung der Beziehung wichtig.

Software für die Netzwerkanalyse

In der Praxis können wir die oben genannten Messwerte mit verschiedenen Python- (NetworkX) oder R-Bibliotheken berechnen. Auch gibt es weitere Softwareprogramme wie Gephi, die sich auf die Visualisierungen von Netzwerken spezialisieren.

 

Social Media Mining: Twitter (Einführung)