Twitter Analyse der Bundestagswahl – Technik und Motivation

Twitter Analyse der Bundestagswahl

Teil 1:  Technik und Motivation

Inhalt

Wie funktioniert die Bigdata Bundestagswahlanalyse?
Zusammenfassung
Dank

-> Artikel Serie Teil 2: Berichte und Deutung
-> Artikel Serie Teil 3: TV Duell, Fünfkampf, Spitzenkandidaten, Effekte
-> Interview zur Twitter Analyse

Übersicht:

In diesem ersten Artikel geben wir einen Überblick über die Funktionsweise der Bundestagswahl Twitter Analyse. Zuerst wird die Motivation dargelegt. Nachdem danach der Verarbeitungsweg der Twitter Nachrichten beschrieben wurde, erfolgt eine kurze Zusammenfassung mit Ausblick. Zuletzt folgt  noch ein kurzer Dank an Personen oder Accounts, die Feedback gegeben und somit einen Teil dieses Projektes ermöglicht haben.

Hintergrund/Motivation:

Ziel des Projektes war es, unsere Bigdata Plattform in Twitter Szenarien zu testen. Das Projekt wurde durch Lean Startup Methoden entwickelt, um stets die Resonanz von Benutzern zu testen und kontinuierlich Feedback zu erhalten. Konsequent wurde nach dem Pareto Prinzip gearbeitet, um nicht perfekte Visualisierungen zu erschaffen, sondern Visualisierungen, die interessieren. Wir wollten hierbei zwei verschiedene Dinge feststellen:

  • Schaffen wir es innerhalb kürzester Zeit eine automatisierte Twitter Analyse zu erstellen, die von Benutzern angenommen wird?
  • Wie gut schafft es unsere Infrastruktur (Micorservices, Bigdata usw.) und unsere Entwicklungsmethoden (iteratives, agiles lean development) über ein solches Projekt zu skalieren.

Obwohl wir nur diese zwei Ziele hatten, wurde noch zusätzlich eine größere Aufmerksamkeit durch unser Projekt erreicht, als wir vermuteten. Weiterhin war es uns sogar möglich, die analysierten Partei-Accounts mit nahezu allen Parteien abzugleichen, um die Qualität weiter zu steigern.

Aufgrund vieler Rückmeldungen ist es sicherlich auch erwähnenswert, dass wir nicht den Anspruch haben, die Wahl genau vorherzusagen, vielmehr sollen unsere Analysen dazu dienen, Wähler zu motivieren auch zur Wahl zu gehen. Unsere Analysen zeigen die Twitter Aktivität und sie zeigen dabei gleichzeitig, welche Partei, in welcher Art, in diesem Medium performt. Das Mandat der Interpretation unserer aufbereiteten Analysen sehen wir bei den Benutzern.

Wie funktioniert die Bundestagswahlanalyse?

Im folgenden Bild ist die Architektur der Bundestagswahlanalyse zu sehen. Fortlaufend werden nach dem Bild die mit Zahlen versehenen Schritte beschrieben.

Schritt 1

Im ersten Schritt werden Namen von Politiker-, Partei- und Landesparteiaccounts in einer Datenbank hinterlegt. Die Zusammenstellung der einzelnen Accounts wird anhand der Twitter Listen von Partei Accounts durchgeführt. Weiterhin werden noch die HashTags der einzelnen Parteien und deren Kampagnen hinterlegt, um die Chancengleichheit zu erhöhen. Sämtliche Partei Accounts und Hashtags wurden dann einer Partei zugeordnet, um diese in der fortfolgenden Analyse zu nutzen.

Beispiel:

Die CDU hat/hatte eine Liste der Bundestagsabgeordneten in ihrem Twitter Account hinterlegt, und diese Accounts wurden dann verwendet. Aufgrund der unterschiedlichen Qualität der Listen, die in anderen Partei Accounts hinterlegt waren, wurde zusätzlich händisch nachgearbeitet, um möglichst aktive Partei Twitter Accounts in der Datenbank zu hinterlegen. Ziel war es hierbei, möglichst jeder Partei die gleiche Chance einzuräumen.

Genutzte Hashtags

Hashtags die neben den Partei- und Politikeraccounts verwendet werden:
freudichaufsneuland, piraten, neuland, gruene, grüne, afd, traudichdeutschland, linke, dielinke, die_linke, spd, schulzzug, merkel, schulz, csu, fdp, denkenwirneu, cdu, fedidwgugl, ödp, oedp, menschvorprofit, freiewähler, dieanständigealternative, freiewaehler, dieanstaendigealternative, freienwähler, freienwaehler, diepartei, dergraueblock, grauearmeefraktion

Schritt 2

Im nächsten Schritt wird Twitter Aktiv und in Echtzeit nach politischen Tweets durchsucht. Hierbei werden qualifizierte Tweets extrahiert und zur weiteren Verarbeitung vorbereitet. (Konsistenzprüfung)

Schritt 3

Insgesamt werden durch den Tag hinweg ca. 200.000 Tweets ausgewählt, die sich zur weiteren Verarbeitung eigenen.

Schritt 4

Danach wird die Analyse durchgeführt. Partei- Accounts, Hashtags und weitere Symbole werden erkannt und mit der Datenbank aus Schritt 1 abgeglichen. Im Zuge dessen wird berechnet, wenn ein Benutzer ein Partei-Symbol (Hashtag) oder einen Partei-account erwähnt.

Zusätzlich werden verschiedene Kennzahlen berechnet. Beispielsweise werden intelligente Mechanismen eingesetzt um die Inhalte der Tweets in positive, negative und neutrale Tweets einzuteilen. Daneben werden Retweets zuerkannt, Berechnungen werten aus, wie viele verschiedene Benutzer über etwas getweetet haben und ähnliches.

Schritt 5

Die Analyseergebnisse aus Schritt 4 werden genutzt, um die Twitter Ereignisse in Echtzeit auf der Website Bundestagswahlanalyse.de Dort kann ein Benutzer live das geschehen bei Twitter verfolgen. Verschiedene, in Echtzeit aktualisierte, Ansichten geben dabei Aufschluss, was gerade in diesem Moment auf Twitter passiert, und wie dieses in das Gesamtgeschehen von bis zu einer Woche einordnet wurde. Somit kann z.B. die Auswirkung einer TV Sendung direkt verfolgt werden.

Schritt 6

Die Analyseergebnisse werden zudem dazu verwendet, um spezifische Berichte aufgrund von Talkshows zu erzeugen.

Beispiele:

Eine AnneWill Sendung wurde analysiert, in der man Alice Weidel (AfD) und Christian Linder(FDP) als „Social Media/Twitter Gewinner“ erkennen konnte.

Eine Darstellung der semantischen Bewertungen (positive Tweets) zeigt ähnliche Ergebnisse:

Auch die Live TV Show #überzeugtuns wurde damit dargestellt und zeigt Cem Özdemir als „Twitter Gewinner“.

Schritt 7

Zusätzlich zu den spezialisierten Berichten werden in regelmäßigen Abständen Analysen auf Twitter veröffentlicht.

Beispielsweise gibt es um 10:30 Uhr eine tägliche Bigdata Übersicht über alle Parteien. In dieser werden die am besten performenden Politiker und Parteien dargestellt.

Es werden auch über den Tag hinweg Auswertungen veröffentlicht, die zeigen, welche Politiker besonders häufig erwähnt werden.

Plötzliche Aktivitäten, wie der “Aufschrei” bei Eva Hoegl oder auch Karamba Diabys viraler Post werden so automatisch erkannt, da diese Politiker dann oftmals in den Berichten auftauchen und die Spitze erklimmen.

Eva Högels Erwähnungen wurden recht schnell bei den Analysen sichtbar:

Karamba Diaby wurde durch seinen viralen Facebook Post fortfolgend auch recht stark auf Twitter erwähnt und tauchte plötzlich in den Analysen auf:

Schritt 8

Um die Analysequalität weiter zu steigern und jeder Partei die bestmögliche Chance zu geben, sich darzustellen, wurden die verwendeten Partei Accounts mit den einzelnen Parteien abgeglichen. Hierdurch wird sichergestellt, dass die aktivsten Partei Accounts in die Analyse mit einfließen. Danach beginnt der Prozess von Anfang an und arbeitet mit den verbesserten Daten weiter.

Zusammenfassung/Ausblick

In diesem Artikel haben wir die Motivation unserer Bundestagswahlanalyse dargestellt. Dabei sind wir kurz auf den unerwarteten Erfolg der https://Bundestagswahlanalyse.de und des @BTWAnalyse Twitter Accounts eingegangen. Das Feedback und Interesse war hier weitaus höher als von uns erwartet.

Zusätzlich wurde die Grundfunktionsweise der Bundestagswahlanalyse Technik dargelegt. Es wurden dabei die verschiedenen Komponenten dargestellt und deren Funktionsweise erläutert. In Zuge dessen wurde der Datenfluss und die Datenaufbereitung von Twitter, bis hin zu den Berichten und der Echtzeit-Berichtswebsite erläutert. Ferner wurden auf spezielle Beispiele, die Daten in Berichten anzeigen, verwiesen.

In den nächsten Blogposts der Serie wird dann konkret auf die verschiedenen Berichte eingegangen. (-> Artikel Serie Teil 2)

Dank

Verschiedene Personen und Accounts gaben uns Feedback und Anregungen zu unseren Entwicklungen oder haben uns besonders häufig geteilt. Weiterhin konnten wir die Top-Politiker Listen mit Parteien abgleichen. Dies hat uns geholfen und dafür bedanken wir uns bei (nicht sortierte Reihenfolge ohne Präferenz in der Reihenfolge):

@AnjaHirschel, @kubischblog, @PaulStrobel,@Pascal_Hesse, @PhLuebbert @AfD, @DiePartei@Piratenpartei, @JBrandenburg, @Gomander, @FREIEWAEHLER_BV@CarenLay, @FrankB, @CDU, @ÖDP, @FDP, Die Grünen, P. Looft, @osterlohmichael, @EspendillerM und viele Andere…

Update (29th April 2021): Check out our latest project, Fahrbar!

Get in touch with us

If you are interested in Fahrbar or want to find out how we can help you leverage your data

Categories: