Modulare Fragenbogendesigns für sozialwissenschaftliche Umfragen: Der Beitrag statistischer Modellierung mittels Imputationsverfahren
Umfragen haben sich zu einer unverzichtbaren Informationsquelle für soziale und politische Sachverhalte in modernen Gesellschaften entwickelt. Quantitative sozialwissenschaftliche Untersuchungen, welche auf Umfragedaten basieren, erfordern immer umfangreichere Datensätze mit immer komplexeren Datenstrukturen. Gemeinsam mit sinkenden Teilnahmeraten und einem steigenden Bedarf an Feldarbeit, als Folge höherer Erwartungen an die Datenqualität, führt dies zu steigenden Kosten. Jedoch kam es in den letzten 20 Jahren im Bereich der statistischen Modellierung in Verbindung mit steigenden Rechnerleistungen zu großen Weiterentwicklungen, die es erlauben, traditionelle Methoden der Datenerhebung zu überdenken. Insbesondere zwei Ansätze scheinen vielversprechend: modulare Fragenbogendesigns und Imputationsmethoden.
Ziel des Projektes ist zu untersuchen, ob diese Ansätze verknüpft und weiterentwickelt werden können, um auf diese Weise aufwendige Face-to-Face-Erhebungen bei gleichbleibender Abdeckung der Grundgesamtheit und Datenqualität zu ersetzen. Die Aufgabe des Projektes ist somit die Entwicklung und Bewertung statistischer Methoden zur Vervollständigung von Datenstrukturen, welche mittels modularen Fragebogendesigns erhoben worden sind. Das Hauptinteresse liegt darin, die Effizienz der Schätzungen zu bewerten sowie mögliche Verzerrungen zu evaluieren, welche aus der Anwendung der Imputationsmethoden resultieren können. Weitere Untersuchungen widmen sich der Bewertung möglicher Einsparungspotentiale und der Benutzerfreundlichkeit.
Zur Evaluierung der Ansätze und Methoden wird in der ersten Phase des Projektes auf die Daten der verschiedenen Wellen des German Internet Panels zurückgegriffen. In der zweiten Phase des Projektes werden Daten, welche durch modulare Fragenbogendesigns im Rahmen der European Value Survey erhoben wurden, imputiert und analysiert.
2022 haben wir unsere Studien zur Simulation geplant fehlender Werte aus Modularen Fragebogendesigns um zusätzlich fehlende Werte durch Item Nonresponse seitens der Umfrageteilnehmer erweitert. Ein Paper hierzu befindet sich in der Vorbereitung und soll in im Laufe des nächsten Jahres bei einer Fachzeitschrift eingereicht werden. Darüber hinaus wurden zwei Beiträge zu bisherigen Forschungsergebnissen aus dem Projekt in Fachzeitschriften veröffentlicht, im Journal for Survey Statistics and Methodology und in Statistics Surveys. Zentrale Befunde aus dem Projekt wurden zudem auf der -2022-Jahreskonferenz der Deutschen Arbeitsgemeinschaft Statistik (DAGStat) vorgestellt. Ein weiterer Vortrag fand auf dem Symposium der Initiative „High Performance Computing, Data Intensive Computing and Large Scale Scientific Data Management in Baden-Württemberg“ (bwHPC) statt.