Modulare Fragenbogendesigns für sozialwissenschaftliche Umfragen: Der Beitrag statistischer Modellierung mittels Imputationsverfahren

Fragestellung/Ziel:

Im Mittelpunkt des Projektes stand die Untersuchung der Eignung von Methoden zur Imputation von geplant fehlenden Datenpunkten, welche aus einem sogenannten modularen Fragebogendesign resultieren. Ziel war es, einen vollständigen, zur Analyse geeigneten Datensatz zu produzieren. Die Untersuchung bezog sich insbesondere auf den Einsatz von modularen Fragebogendesigns in sozialwissenschaftlichenausklappen

Zur Erreichung unseres Forschungsziels führten wir Monte-Carlo Simulationen mit den Daten des German Internet Panels (GIP) auf den Hochleistungsrechner des Bundeslandes Baden-Württemberg (bwHPC) durch.

Unsere Ergebnisse zeigen, dass die Allokation mehrerer Items eines Themenblocks zum gleichen Fragebogenmodul mit der Annahme, dass diese Items eine hohe Korrelation aufweisen zu schlechteren imputationsbasierten Schätzungen führen als eine zufällige Allokation von Items zu Modulen oder die Allokation von Items des gleichen Themas zu verschiedenen Modulen. Die Unterschiede zwischen den beiden letzteren Strategien sind jedoch gering aufgrund der hohen Anzahl von geringen Korrelationen in den Daten.

Des Weiteren wurden in unserem Projekt eine Vielzahl von Imputationsmethoden auf ihre Eignung hin untersucht, vollständige Datensätze im Rahmen von modularen Fragenbogendesigns zu produzieren, die Schätzungen mit akzeptabler Qualität erlauben. In unserer Untersuchung konnten wir insbesondere vor dem Hintergrund kleiner Stichprobengrößen und einer hohen Anzahl verwendeter Variablen gute Ergebnisse bei Imputationsmethoden beobachten, die eine Vereinfachung der Imputationsmodelle ermöglichen. Beispiele sind Verfahren, welche die Anzahl der unabhängigen Variablen reduzieren. In einem weiteren Forschungsabschnitt wurde das Vorhandensein von ungeplant fehlenden Datenpunkten durch Auslassen der Befragten (item nonresponse) untersucht, welche zusätzliche zu den geplant fehlenden Datenpunkten durch das modulare Fragebogendesign auftreten. In diesem Zusammenhang konnte gezeigt werden, dass große Probleme entstehen, wenn der Anteil an fehlenden Datenpunkten aus beiden Quellen zusammen zu groß wird oder wenn ungeplant fehlende Datenpunkte auftreten, welche dem Fall „missing not at random“ (MNAR) zugeordnet werden können. Aus diesem Grund empfehlen wir, die Menge an geplant fehlenden Datenpunkten bei solchen Items zu reduzieren, bei denen ein größerer Anteil an „item nonresponse“ erwartet wird.

zuklappen

Fact sheet ausklappen

Veröffentlichungen ausklappen

Beiträge in Zeitschriften

Axenfeld, Julian B., Christian Bruch und Christof Wolf (2022): General-purpose imputation of planned missing data in social surveys: Different strategies and their effect on correlations. Statistics Surveys, 16, S. 182-209. mehr

Axenfeld, Julian B., Annelies G. Blom, Christian Bruch und Christof Wolf (2022): Split Questionnaire Designs for Online Surveys: The Impact of Module Construction on Imputation Quality. Journal of Survey Statistics and Methodology, 10, Heft 5, S. 1236–1262. mehr

Wiśniowski, Arkadiusz, Joseph W. Sakshaug, Diego Andres Perez Ruiz und Annelies G. Blom (2020): Integrating Probability and Nonprobability Samples for Survey Inference. Journal of Survey Statistics and Methodology, 8, Heft 1, S. 120-147. mehr

Bruch, Christian (2019): Applying the rescaling bootstrap under imputation: a simulation study. Journal of Statistical Computation and Simulation, 89, Heft 4, S. 641-659. mehr

Herzing, Jessica M. E., Caroline Vandenplas und Julian B. Axenfeld (2019): A data-driven approach to monitoring data collection in an online panel. Longitudinal and Life Course Studies, 10, Heft 4, S. 433–452. mehr

Konferenzpräsentationen

Axenfeld, Julian B. (2022): Planned Missing Data in Social Surveys: Evaluating Strategies Regarding Their Design and Imputation. [8th bwHPC Symposium, virtual conference, 28. November 2022] mehr

Axenfeld, Julian B., Christian Bruch und Christof Wolf (2022): General-purpose imputation of planned missing data in social surveys: different strategies and their effect on correlations. [DAGStat 2022, Hamburg, 28. März bis 01. April 2022] mehr

Axenfeld, Julian B. (2021): Split Questionnaire Designs for Social Surveys: Evaluating Strategies on Design and Imputation. [GESIS Lecture Series, (virtual conference), 22. April 2021] mehr

Axenfeld, Julian B., Annelies G. Blom, Christian Bruch und Christof Wolf (2021): Split Questionnaire Designs: Imputation Quality and the Impact of Module Construction. [ESRA21, (virtual conference), 16. Juli 2021] mehr

Bruch, Christian (2018): Variance estimation under imputation using the rescaling bootstrap. [Joint Statistical Meetings, Vancouver, 28. Juli bis 02. August 2018] mehr

Fact sheet ausklappen

Veröffentlichungen ausklappen

Beiträge in Zeitschriften

Konferenzpräsentationen

Besuchsadresse

Postanschrift

Aktuelles

Das MZES

Projekte

Publikationen

Personen