Modulare Fragenbogendesigns für sozialwissenschaftliche Umfragen: Der Beitrag statistischer Modellierung mittels Imputationsverfahren

Fragestellung/Ziel: 

Umfragen haben sich zu einer unverzichtbaren Informationsquelle für soziale und politische Sachverhalte in modernen Gesellschaften entwickelt. Quantitative sozialwissenschaftliche Untersuchungen, welche auf Umfragedaten basieren, erfordern immer umfangreichere Datensätze mit immer komplexeren Datenstrukturen. Gemeinsam mit sinkenden Teilnahmeraten und einem steigenden Bedarf an Feldarbeit, als Folge höherer Erwartungen an die Datenqualität, führt dies zu steigenden Kosten. Jedoch kam es in den letzten 20 Jahren im Bereich der statistischen Modellierung in Verbindung mit steigenden Rechnerleistungen zu großen Weiterentwicklungen, die es erlauben, traditionelle Methoden der Datenerhebung zu überdenken. Insbesondere zwei Ansätze scheinen vielversprechend: modulare Fragenbogendesigns und Imputationsmethoden.

Ziel des Projektes ist zu untersuchen, ob diese Ansätze verknüpft und weiterentwickelt werden können, um auf diese Weise aufwendige  Face-to-Face-Erhebungen bei gleichbleibender Abdeckung der Grundgesamtheit und Datenqualität zu ersetzen. Die Aufgabe des Projektes ist somit die Entwicklung und Bewertung statistischer Methoden zur Vervollständigung von Datenstrukturen, welche mittels modularen Fragebogendesigns erhoben worden sind. Das Hauptinteresse liegt darin, die Effizienz der Schätzungen zu bewerten sowie mögliche Verzerrungen zu evaluieren, welche aus der Anwendung der Imputationsmethoden resultieren können. Weitere Untersuchungen widmen sich der Bewertung möglicher Einsparungspotentiale und der Benutzerfreundlichkeit.

Zur Evaluierung der Ansätze und Methoden wird in der ersten Phase des Projektes auf die Daten der verschiedenen Wellen des German Internet Panels zurückgegriffen. In der zweiten Phase des Projektes werden Daten, welche durch modulare Fragenbogendesigns im Rahmen der European Value Survey erhoben wurden, imputiert und analysiert.

Arbeitsstand: 

Im Laufe des Jahres 2020 wurde eine vielseitige Simulationsstudie programmiert, die eine Untersuchung verschiedener Anwendungsszenarien und -strategien für modulare Fragebogendesigns ermöglicht. Zurzeit werden auf dieser Grundlage Analysen mit Hilfe von Hochleistungsrechenkapazitäten des Landes Baden-Württemberg (bwHPC) durchgeführt. In einem ersten Schritt hat das Projektteam die Datenqualität in Designs mit verschiedenen Modularisierungstechniken untersucht. Hierzu wird momentan ein erstes Manuskript zur Veröffentlichung (“Split Questionnaire Designs for Online Surveys: Imputation Quality and the Impact of Module Construction”) vorbereitet und voraussichtlich in Kürze fertiggestellt. Der analytische Fokus des Projekts verschiebt sich nunmehr auf Effekte verschiedener Imputationsstrategien auf die Datenqualität.

Fact sheet

Finanzierung: 
DFG
Laufzeit: 
2017 bis 2022
Status: 
laufend
Datenart: 
German Internet Panel, European Value Survey
Geographischer Raum: 
Europa

Veröffentlichungen