Neue Methoden zur Berufsverkodung

Fragestellung/Ziel: 

In vielen Umfragen ist es üblich den Beruf mit offenen Fragen zu erheben. Nach der Befragung müssen diese Texte in eine Klassifikation mit hunderten Kategorien und tausenden Berufen eingeordnet (kodiert) werden. Diese Aufgabe ist nicht nur zeitaufwändig und daher teuer, sondern auch fehleranfällig. Wenn die Berufsbeschreibungen ungenau sind, ist die exakte Kodierung oft unmöglich. Das Projekt untersucht, wie mit zusätzlichen Nachfragen während des Interviews Verbesserungen erreicht werden können. Maschinelles Lernen wird dazu verwendet mögliche Berufe vorzuschlagen und die relevantesten Berufskategorien werden dem Interviewer für weitere Nachfragen bereitgestellt. Die vorgeschlagene Methode wird in einer Telefonumfrage des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) getestet. Die Qualität von traditioneller Kodierung wird mit dem hier vorgeschlagenen Verfahren verglichen, wobei auch administrative Daten einbezogen werden. Dieses Projekt findet statt in Kooperation mit Arne Bethmann (IAB, Universität Mannheim), Manfred Antoni (IAB), Markus Zielonka (LIfBi), Daniel Bela (LIfBi) und Knut Wenzig (DIW).

Arbeitsstand: 

Zum Ende der ersten Förderperiode haben wir ein neues Instrument zur Berufskodierung entwickelt, das während des Interviews eingesetzt werden kann. Wir implementierten das Instrument in zwei Umfragen (einer Telefonumfrage und einer persönlichen Umfrage) und sammelten Informationen zur Berufstätigkeit von mehr als 2.000 Befragten. Die Ergebnisse sind vielversprechend: Mehr als fünfzig Prozent der Textantworten können mit dem neu entwickelten Tool codiert werden, und es gibt keine Hinweise darauf, dass die Verwendung dieses Tools eine zusätzliche Belastung für Interviewer und Befragte darstellt. Da jedoch viele interviewintercodierte Antworten nicht mit denen übereinstimmen, die sich bei einer Kodierung durch professionelle Kodierer ergeben haben, werden derzeit mögliche Gründe für diese Abweichungen untersucht. Im Herbst 2020 haben wir zu diesem Zweck bei der Deutschen Forschungsgemeinschaft (DFG) einen Verlängerungsantrag eingereicht.

Fact sheet

Finanzierung: 
DFG
Laufzeit: 
2014 bis 2021
Status: 
laufend
Datenart: 
ALWA and NEPS survey data, additional sources
Geographischer Raum: 
Germany

Veröffentlichungen

Bücher

Foster, Ian, Rayid Ghani, Ron S. Jarmin, Frauke Kreuter und Julia Lane (Hrsg.) (2017): Big Data and Social Science: A Practical Guide to Methods and Tools. London: Chapman & Hall / CRC Press. [Chapman & Hall/CRC Statistics in the Social and Behavioral Sciences] mehr