Eike Mark Rinke, Cäcilia Zirn, Charlotte Löb, Hartmut Wessler
Big-Data-Forschung als Interaktion zwischen Topic Models und Expertendaten: Ein neuer Ansatz zur Erfassung der thematischen Vernetzung nationaler Onlinedebatten

62nd Annual Conference of the German Communication Association (DGPuK), Heinrich-Heine Universität, Düsseldorf, 30. März bis 01. April 2017

Topic Models sind eine der vielversprechendsten jüngeren Methodeninnovationen in der Kommunikationswissenschaft (Günther & Quandt, 2016). Diese Familie automatisierter Inhaltsanalyseverfahren erlaubt die Strukturierung großer Textdatenmengen (sog. „Big Data“) anhand der Identifikation von latenten, zuvor unbekannten Themen, welche über Muster des gemeinsamen Auftauchens von Wörtern in den analysierten Texten ermittelt werden (Jacobi, van Atteveldt & Welbers, 2016). Damit eignen sich Topic Models besonders zur Erfassung der thematischen Vernetzung und internen Strukturen von Mediendebatten. In diesem Beitrag stellen wir eine allgemeine, praktische Lösung für das grundlegende Problem der Validierung von Topic Models zur Erfassung von Themenstrukturen in Textkorpora aus wenig bekannten Kontexten vor. Speziell entwickeln wir eine valide Methode zur Erfassung der Struktur nationaler Debatten über verschiedene Typen von Internetplattformen und nationale Grenzen hinweg. Der Ansatz greift auf eine Verknüpfung durch Crawler automatisiert generierter Big Data mit qualitativen Expertendaten zurück, die mittels halbstrukturierter Umfragen erzeugt wurden.