Social Media Monitoring

Fake Follower auf Twitter anhand von Daten erkennen

Wie kann ich erkennen, ob einem Twitterprofil viele Bots / Fake Follower folgen?

Dieser Frage werden wir heute mit der Analyse der Twitterfollowerdaten ausgewählter deutscher Politiker beantworten.

Bots und Fake Follower auf Twitter und Social Media

Jede Person, die auf Twitter einen Account hat, wird schnell bemerken, dass auf Twitter nicht nur echte User aktiv sind. Twitter, wie auch das gesamte Netz, wird in nicht unerheblichem Maße von diversen Bots bewohnt.

Bots sind vom Prinzip kleine Computerprogramme, die verschiedenen Zwecken dienen können. So zum Beispiel gibt es Bots, die Daten abrufen oder scannen, sich als neue Folower tarnen oder Texte veröffentlichen. Die bekanntesten Bots sind beispielsweise Google Crawler, die die Webseiten nach ihrem Inhalt scannen und dann bei der Google Suche indexieren. Dieses Beispiel zeigt auch: Bots haben nicht unbedingt immer unehrliche Zwecke.

Auch auf Twitter können Bots verschiedene Funktionen ausführen. Twitter erlaubt die Erstellung von Bots, wenn sie nicht gerade gegen seine Richtlinien verstoßen. Im Twitteruniversum gibt es beispielsweise unterhaltsame Bots, die Texte zu bestimmten Themen twittern. So zum Beispiel informiert das WeRaBot Nutzer über die Weltraumfahrt, das Magic Realism Bot erzählt wiederum Geschichten.

Problematisch ist allerdings wenn Bots gekauft beziehungsweise erstellt werden, um die Reichweite in Social Media zu steigern. Ähnlich wie im Fall Instagram haben sich einige Firmen darauf spezialisiert Fake Follower – Bots an Influencer auf Twitter zu verkaufen. The New York Times veröffentlichte im Artikel „The Follower Factory“ eine ausgefeilte Analyse dieser Problematik inklusive grafischer Darstellung der Accounts bekannter amerikanischen Persönlichkeiten. Offenbar haben einige amerikanische politische und mediale Prominente Bots im großen Stil gekauft um ihre Reichweite zu steigern. Aus der grafischen Darstellung der Followerdaten kann sehr gut entnommen werden, wer große Mengen an Bots für seinen Twitteraccount vermutlich gekauft hat.

Die Grafiken in der NYTimes habe ich hier aus rechtlichen Gründen nicht abgebildet. Sie kommen im zweiten Teil des oben ziterten Artikel vor. Im zweiten Teil dieses Artikels werde ich diese Grafiken für die Followerdaten von Annegret Kramp-Karrenbauer und Christian Lindner nachahmen.

Bot Follower auf Twitter – Analyse

Den Pythonskript für das Abrufen der Followerdaten entwickelte die amerikanische Bloggerin Ellaine Ou. In ihrem Blogbeitrag „Your Twitter Followers are Probably Bots“ hat sie die Visualisierungen der NYTimes für einige Journalisten nachgemacht. Dies hat mich dazu inspiriert, dies für deutsche Politiker auszuprobieren.

Das Skript „Follower Factory“ ist auf der Github Profil von Elaine abrufbar. Um das Skript zu starten ist allerdings eine Bewerbung für einen Developer Account bei Twitter erforderlich. Zum Glück ist Twitter großzügig und meistens ist es leicht den Zugang zum API zu bekommen, insbesondere, wenn man angibt die Daten nicht zu veröffentlichen. In meinem Fall war aus diesem Grund die Bewerbung etwas komplizierter.

Nachdem man erfolgreich als Twitter Developer anerkannt wurde, erhält man Zugangsschlüssel zum Twitter API. Nun kann man den Skript ausführen. Das Ergebnis ist eine Grafik (ähnlich wie die in der NYTimes und die bei Elaine Ou).

Probleme mit dem Skript

Bei der Ausführung dds Skripts habe ich mit zwei Problemen zu kämpfen. Der Abruf der Followerdaten dauert lange, denn Twitter begrenzt die Geschwindigkeit auf bis zu 12 000 Follower pro Stunde. Auch stoppte bei mir das Skript häufig bei ca 30 000 Followern.

Aus diesem Grund sind die hier erstellten Grafiken mit Vorsicht zu geniessen, denn manche Profile haben deutlich mehr als 30 000 Follower.

Twitter Follower @datenverstehen

Der „Trick“ bei der Entdeckung der Bot Follower ist die aggregierte Followerschaft eines Accounts zu betrachten. Ich habe das Skript zunächst auf meinen eigenen Daten getestet.

Die vertikale Achse „account creation date“ zeigt an, wann das Profil des Followers erstellt worden ist. Die horizontale Achse zeigt meine Followerzahl an. Die Grafik scheint unauffällig: es sind keine Ansammlungen von Punkten zu sehen, weder als Kreise noch als Linien. Ergebnis: keine bzw. nur wenige Bots folgen mir.

Twitter Follower @eiaine

Jetzt schauen wir uns mal ein auffälliges Profil an und zwar das von Elaine Ou selbst. Es ist kein Geheimnis, dass sie für ihren Twitter Account selbst eine Menge Bots erstellt hat. Sie gibt es sebst zu:

„My first thousand followers were all bots. I know this, because I made them myself. For the first several years of my Twitter existence, the only people I interacted with were bots. Didn’t realize the platform could be useful for humans until 2016.“

Hier sieht man eindeutig eine horizontale Linie, die auf Unregelmäßigkeiten hindeutet. Alle Accounts in dieser Linie sind zur gleichen Zeit zwischen 2008 und 2010 entstanden. Hier handelt es sich vermutlich um die von Elaine erstellten Bots.

Twitter Follower @akk

Ale nächstes habe ich das Skript auf das Twitter Profil von Annegret Kramp-Karrrenbauer angewandt. Ich habe mich für sie entschieden, da AKK ca. 80 000 Follower hat. Wie gesagt, konnte ich bei den Profilen nur ca 30 Tausend Follower analysieren. Dies macht die Analyse bei AKKs Profil robuster als bei einem größeren Profil.

Im Twitter Profil von AKK sieht man keine stark auffälligen Unregelmäßigkeiten. Die untere Linie könnte dadurch verursacht werden, dass das Skript nach 30 000 Follower aufgehört hat.

Twitter Follower @c_lindner

Als weiteren Kandidaten habe ich mir das Profil von Christian Lindner angeschaut. Christian Lindner hat allerdings einen sehr großen Account von über 360 000 Followern. Dies bedeutet, dass die grafische Darstellung seiner Follower nicht sehr zuverlässig ist. Mir ist gelungen nur 40 000 Followerdaten abzurufen.

Im Twitterprofil von Christian Lindner sieht man eine schwache Linie zwischen den Jahren 2016 und 2018. Allerdings ist die Linie zu schwach um daraus Schlussfolgerungen zu ziehen. Größere Twitterprofile werden auch automatisch von Bots gefolgt. Generell gilt: je größer ein Profil, desto größer auch die Botfollowerschaft.

Bei einem Boteinkauf bzw. Erstellung wären die Unregelmäßigkeiten vermutlich deutlich stärker.

Die horizontalen Linien sowohl bei Lindner als auch bei AKK im unteren Bereich der grafischen Darstellung könnten davon kommen, dass Twitter mein Skript nach 30-40 Tausend Follower unterbrochen hat. Ich habe es auch aus Zeitgründen nicht weiter probiert, denn die gesamte Abrufprozedur dauert Stunden. Trotzdem ist das Skript von Elaine von Nutzen für alle, die ein Account auf Fake Followerschaft prüfen wollen.

Hier noch ein informativer Artikel, der weitere Tools zur Entdeckung von Fake Accounts auf Twitter präsentiert: „How to find swarms of fake Twitter followers“ (https://conspirator0.substack.com/p/how-to-find-swarms-of-fake-twitter).

Sollte ich weitere Accounts auf Bots untersuchen? Schreiben Sie mir eine Mail oder Nachricht in die Kommentare.

 

 

Bild von Free-Photos auf Pixabay

Aleksandra Klofat

Dr. Aleksandra Klofat, Data Scientist und promovierte Volkswirtin. Ich helfe Unternehmen und Privatpersonen bei Fragestellungen rund um Datenanalyse und Data Science.

View Comments

  • Moin Aleksandra!
    Ich würde mich über eine Untersuchung des Accounts: @Karl_Lauterbach sehr freuen. Dort müsste halt auch die Folowerzahl angepasst werden, da er eine knappe Million hat.
    Vielen dank im Voraus
    Timo

    • Hi Timo, Ok, ich werde es untersuchen. Das kann aber dauern, da Karl Lauterbach recht viele Follower hat. Wenn er tatsächlich welche Fakes gekauft hat, dann würde man es eher am Anfang seiner Twitter Geschichte erkennen. Der Skript zieht die neuesten Daten zuerst. Mal sehen. Ich poste die Ergebnisse auf meinem Twitter Account (a_klofat) und vielleicht auch hier. Das dauert aber einige Tage.

  • Hi Aleksandra, ich glaube, mit deiner Analyse könntest du vielen Menschen helfen, die betrogen werden. Insbesondere in der Krypta-Welt.
    Dort werden immer wieder neue Coins herausgegeben und die Scammer gaukeln mit Twitter-Followern vor, sie hätten Erfolg. Dann bringen sie einen Coin raus, die Leute kaufen und verlieren dieses Geld.
    Aktuell fällt mir beispielsweise der Account @Chain_GPT auf, dessen Anzahl Follower rasant wächst. Könntest du dir den vielleicht anschauen?
    Vielen Dank und beste Grüße
    Alex

    • Hallo, ich werde mir das Profil angucken und poste hier, was ich gefunden habe. Ich brauche aber noch ca. Eine Woche bis ich Zeit dafür finde.

    • Hi Alex, endlich habe ich Zeit gefunden mir das Account anzuschauen und tatsächlich gibt es auf dem Account einige Unregelmäßigkeiten.
      Zwar habe ich aufgrund von Elons neuen API-RIchtlinien meinen privaten API-Zugang zu Twitterdaten verloren. Ich werde mir vermutlich demnächst neues zulegen.

      Trotzdem gibt es weitere Möglichkeiten das Account zu prüfen.
      (1). Social Blade https://socialblade.com/ : Dort sieht man, dass @Chain_GPT an manchen Tagen Tausende Follower gewinnt aber an manchen wieder Tausende (sogar -11.000 Follower) verliert. Dies könnte auf einen Kauf der Follower deuten. Die gekauften Follower haben Tendenz nach einer gewissen Zeit zu verschwinden. Auf dem Account wirken die starken Follower-Schwankungen nicht organisch.

      (2). Punktuelle Überprüfung der Follower, deutet auch auf möglichen Einsatz der Follower-Farmen. Es sind sehr viele Follower mit Handle wie bspw asbitmijob75799,avpiselso161448,@alalphora117362 usw. Diese Follower haben selbst keine Follower, folgen aber meistens Firmenaccounts. So agieren oft gekaufte Follower.

      Online gibt es Firmen, die solche Sockenpuppen Accounts erstellen und dann gegen Geld deinem Account folgen können.

      Was man noch machen könnte ist das Engagement Ratio sich anzuschauen. Das ist das Verhältnis zwischen Views und Likes/Kommentaren. Wenn es viele Views gibt aber keine Likes/Kommentare, könnte es auch auf Fake Follower deuten. Bzw. wenn ein Account viele Follower hat aber wenig Views. Likes und Kommentare können aber auch gekauft werden.

      (3) Chain_GPT hat goldenen Hacken. Das bedeutet, dass sie mind 1000 Dollar/Monat an Werbung an Twitter bezahlen. Deswegen lässt sich das richtige Engagement/Ratio vorerst nicht ermitteln, da sie durch Werbung gepusht wird.

Recent Posts

Conversion Optimierung durch Google Analytics Daten

Eine erfolgreiche Webseite geht auch immer mit einer hohen Conversion Rate (Konversionsrate) einher. Denn schließlich…

4 Wochen ago

Der „The winner takes all“ – Effekt oder wieso du keine YouTuberin werden solltest

"The winner takes it all, The loser has to fall , It's simple and it's…

10 Monaten ago

Large Language Models: Open Source oder nicht?

Generative KI-Chats wie ChatGPT, Bard und ähnliche Systeme erfreuen sich derzeit großer Beliebtheit. Diese sprachbasierten…

11 Monaten ago

Beitrag über Transformer für „Informatik Aktuell“

Für "Informatik Aktuell" habe ich einen Artikel über die Funktionsweise der Transformer verfasst, einschließlich ihrer…

12 Monaten ago

Kobra-Effekt und die versteckten Auswirkungen von Entscheidungen

Menschen haben oft Probleme Folgewirkungen ihrer Entscheidungen in ihrer Komplexität zu erfassen. Sie treffen oft…

1 Jahr ago

Ein Spiegel Online Artikel über Survivorship Bias

Vor Kurzem durfte ich ein wenig Input über Survivorship Bias für den Artikel in Spiegel…

1 Jahr ago