Malte Schierholz, Miriam Gensicke, Nikolai Tschersich, Frauke Kreuter
Occupation coding during the interview

Journal of the Royal Statistical Society: Series A (Statistics in Society), 2018: 181, issue 2, pp. 379–407
ISSN: 1467-985X (online)

Currently, most surveys ask for occupation with open-ended questions. The verbal responses are coded afterwards, which is error prone and expensive. We present an alternative approach that allows occupation coding during the interview. Our new technique uses a supervised learning algorithm to predict candidate job categories. These suggestions are presented to the respondent, who in turn can choose the most appropriate occupation. 72.4% of the respondents selected an occupation when the new instrument was tested in a telephone survey, entailing potential cost savings. To aid further improvements, we identify some factors for how to increase quality and to reduce interview duration.

Die Erfassung des Berufs geschieht in Umfragen üblicherweise mithilfe offener Fragen. Anschließend ist eine Kodierung der Freitextantworten notwendig, was teuer und fehleranfällig ist. Wir beschreiben einen alternativen Ansatz, bei dem die Kodierung bereits während des Interviews erfolgt. Die neue Methode verwendet Algorithmen des maschinellen Lernens um mögliche Berufskategorien automatisch vorherzusagen. Die so erzeugten Vorschläge werden dem Befragten vorgelegt, der dann sofort die am besten passende Kategorie auswählen kann. 72.4% der Teilnehmer einer Telefonbefragung haben auf diese Weise ihren Beruf direkt während des Interviews kodiert, was mögliche Kosteneinsparungen impliziert. Um weitere Verbesserungen des neuen Instruments zu ermöglichen, identifizieren wir verschiedene Faktoren, wie auch die Qualität der Kodierung erhöht und die Dauer der Interviews verkürzt werden kann.