Neue Methoden zur Berufsverkodung

Fragestellung/Ziel: 

In vielen Umfragen ist es üblich den Beruf mit offenen Fragen zu erheben. Nach der Befragung müssen diese Texte in eine Klassifikation mit hunderten Kategorien und tausenden Berufen eingeordnet (kodiert) werden. Diese Aufgabe ist nicht nur zeitaufwändig und daher teuer, sondern auch fehleranfällig. Wenn die Berufsbeschreibungen ungenau sind, ist die exakte Kodierung oft unmöglich. Das Projekt untersucht, wie mit zusätzlichen Nachfragen während des Interviews Verbesserungen erreicht werden können. Maschinelles Lernen wird dazu verwendet mögliche Berufe vorzuschlagen und die relevantesten Berufskategorien werden dem Interviewer für weitere Nachfragen bereitgestellt. Die vorgeschlagene Methode wird in einer Telefonumfrage des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) getestet. Die Qualität von traditioneller Kodierung wird mit dem hier vorgeschlagenen Verfahren verglichen, wobei auch administrative Daten einbezogen werden. Dieses Projekt findet statt in Kooperation mit Arne Bethmann (IAB, Universität Mannheim), Manfred Antoni (IAB), Markus Zielonka (LIfBi), Daniel Bela (LIfBi) und Knut Wenzig (DIW).

Arbeitsstand: 

Aufbauend auf den ermutigenden Ergebnissen einer Pilotstudie ließen sich weitere Verbesserungen am Instrument vornehmen. Insbesondere wurde eine tätigkeitsbezogene Hilfsklassifikation für Berufe entwickelt und publiziert. Ein Vergleich verschiedener in Frage kommender Algorithmen wurde auf internationalen Konferenzen vorgestellt und zur Publikation vorbereitet. Auf Basis der Hilfsklassifikation und des Algorithmen-Vergleichs hat das Projektteam einen Prototyp des überarbeiteten Instruments programmiert, den Kodier-Experten von Befragungsinstituten nun auf Stärken und Schwächen überprüfen.

Fact sheet

Finanzierung: 
DFG
Laufzeit: 
2014 bis 2019
Status: 
laufend
Datenart: 
ALWA and NEPS survey data, additional sources
Geographischer Raum: 
Germany

Veröffentlichungen

Bücher

Foster, Ian, Rayid Ghani, Ron S. Jarmin, Frauke Kreuter und Julia Lane (Hrsg.) (2017): Big Data and Social Science: A Practical Guide to Methods and Tools. London: Chapman & Hall / CRC Press. [Chapman & Hall/CRC Statistics in the Social and Behavioral Sciences] mehr