Neue Methoden zur Berufsverkodung

Fragestellung/Ziel: 

In vielen Umfragen ist es üblich den Beruf mit offenen Fragen zu erheben. Nach der Befragung müssen diese Texte in eine Klassifikation mit hunderten Kategorien und tausenden Berufen eingeordnet (kodiert) werden. Diese Aufgabe ist nicht nur zeitaufwändig und daher teuer, sondern auch fehleranfällig. Wenn die Berufsbeschreibungen ungenau sind, ist die exakte Kodierung oft unmöglich. Das Projekt untersucht, wie mit zusätzlichen Nachfragen während des Interviews Verbesserungen erreicht werden können. Maschinelles Lernen wird dazu verwendet mögliche Berufe vorzuschlagen und die relevantesten Berufskategorien werden dem Interviewer für weitere Nachfragen bereitgestellt. Die vorgeschlagene Methode wird in einer Telefonumfrage des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) getestet. Die Qualität von traditioneller Kodierung wird mit dem hier vorgeschlagenen Verfahren verglichen, wobei auch administrative Daten einbezogen werden. Dieses Projekt findet statt in Kooperation mit Arne Bethmann (IAB, Universität Mannheim), Manfred Antoni (IAB), Markus Zielonka (LIfBi), Daniel Bela (LIfBi) und Knut Wenzig (DIW).

Arbeitsstand: 

Ein Instrument zur Erfassung und Kodierung von Berufen während des Interviews wurde entwickelt und erfolgreich in einer computergestützten Telefonbefragung und in einer computergestützten persönlichen Befragung getestet. Die Ergebnisse sind vielversprechend. Über die Hälfte aller Antworten können durch dieses neu entwickelte Instrument kodiert werden und es gibt keine Hinweise darauf, dass die Anwendung dieser Methode von Befragten oder von Interviewern als besonders schwierig wahrgenommen wird. Da ein großer Teil der interview-kodierten Antworten jedoch nicht mit der Kodierung übereinstimmt, die zur Prüfung durch professionelle Kodierer vorgenommen wurde, werden derzeit mögliche Gründe für diese Abweichungen evaluiert.

Fact sheet

Finanzierung: 
DFG
Laufzeit: 
2014 bis 2020
Status: 
laufend
Datenart: 
ALWA and NEPS survey data, additional sources
Geographischer Raum: 
Germany

Veröffentlichungen

Bücher

Foster, Ian, Rayid Ghani, Ron S. Jarmin, Frauke Kreuter und Julia Lane (Hrsg.) (2017): Big Data and Social Science: A Practical Guide to Methods and Tools. London: Chapman & Hall / CRC Press. [Chapman & Hall/CRC Statistics in the Social and Behavioral Sciences] mehr