Neue Methoden zur Berufsverkodung

Fragestellung/Ziel: 

In vielen Umfragen ist es üblich den Beruf mit offenen Fragen zu erheben. Nach der Befragung müssen diese Texte in eine Klassifikation mit hunderten Kategorien und tausenden Berufen eingeordnet (kodiert) werden. Diese Aufgabe ist nicht nur zeitaufwändig und daher teuer, sondern auch fehleranfällig. Wenn die Berufsbeschreibungen ungenau sind, ist die exakte Kodierung oft unmöglich. Das Projekt untersucht, wie mit zusätzlichen Nachfragen während des Interviews Verbesserungen erreicht werden können. Maschinelles Lernen wird dazu verwendet mögliche Berufe vorzuschlagen und die relevantesten Berufskategorien werden dem Interviewer für weitere Nachfragen bereitgestellt. Die vorgeschlagene Methode wird in einer Telefonumfrage des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) getestet. Die Qualität von traditioneller Kodierung wird mit dem hier vorgeschlagenen Verfahren verglichen, wobei auch administrative Daten einbezogen werden. Dieses Projekt findet statt in Kooperation mit Arne Bethmann (IAB, Universität Mannheim), Manfred Antoni (IAB), Markus Zielonka (LIfBi), Daniel Bela (LIfBi) und Knut Wenzig (DIW).

Arbeitsstand: 

Die ermutigenden Ergebnisse einer Pilotstudie zur Berufskodierung während der Befragung wurden zur Publikation in einer internationalen Fachzeitschrift angenommen. Die Pilotstudie deckte aber zugleich verschiedene Mängel auf, die eine methodische Weiterentwicklung des Instrumentes erforderlich machten. Beispielsweise wurden Antwortoptionen (geläufige Bezeichnungen und Tätigkeitsbeschreibungen) für mehr als tausend Berufe sorgfältig neu formuliert. Zudem ist ein neuer Algorithmus zur Generierung der Antwortoptionen in der Entwicklungsphase. Das so verbesserte Instrument soll im Laufe des Jahres 2018 erneut getestet werden.

Fact sheet

Finanzierung: 
DFG
Laufzeit: 
2014 bis 2019
Status: 
laufend
Datenart: 
ALWA and NEPS survey data, additional sources
Geographischer Raum: 
Germany

Veröffentlichungen

Bücher

Foster, Ian, Rayid Ghani, Ron S. Jarmin, Frauke Kreuter und Julia Lane (Hrsg.) (2017): Big Data and Social Science: A Practical Guide to Methods and Tools. London: Chapman & Hall / CRC Press. [Chapman & Hall/CRC Statistics in the Social and Behavioral Sciences] mehr