CV-Parsing

Automatisches einlesen von Lebensläufen

„Parsing“ steht in der IT für die Analyse einer Syntax. Texte können analysiert und dank sehr präziser Algorithmen in strukturierte Informationen beziehungsweise Datensätze umgewandelt werden. Übertragen auf das Recruiting bedeutet CV-Parsing das intelligente Einlesen von Lebensläufen. Diese können mit Hilfe einer bestimmten Software automatisch erfasst und in das Bewerbermanagementsystem übertragen werden. Dabei werden durch die Technologie nicht nur Namen, Adressen und Geburtsdaten als Datensätze eingelesen, auch Abschlüsse, Berufserfahrungen und Qualifikationen werden systematisch für jeden einzelnen Kandidaten erfasst. Technisch funktioniert dies nicht nur mit klassischen PDF- oder Word-Dateien, auch andere Formate wie etwa txt, jpg oder html werden von der Software erkannt. Das hat den Vorteil, dass nicht nur zugesandte Dokumente erfasst werden können, sondern auch Profile in Karriere-Netzwerken.

Für den Kandidaten bedeutet dies, dass er bei einer Bewerbung über die Karriereseite eines Unternehmens lediglich ein CV-Dokument in Form zum Beispiel einer PDF-Datei hochlädt. Dieses wird von der Parsing-Software ausgelesen. In der Regel zeigt die Software die Daten einmal im Überblick an und der Kandidat kann gegebenenfalls noch kleine Änderungen vornehmen. Der hochgeladene Lebenslauf wird dabei von der Software nicht nur automatisch ausgelesen, sondern auch im System abgespeichert. Der Recruiter wiederum kann auf diese Daten direkt im firmeneigenen Bewerbermanagementsystem zugreifen, die Bewerbungen sortieren, bearbeiten und verwalten.

Einsatz in der HR: CV-Parsing-Softwareprogramme

Im Prinzip lässt sich eine solche Software in jedem Unternehmen unabhängig von der Branche oder Größe anwenden, da Bewerbungsunterlagen meist ähnlich aufgebaut sind. Ob sich der Einsatz beziehungsweise Kauf einer solchen Software jedoch lohnt, hängt schließlich doch von der Größe des Unternehmens sowie dem Umfang der eingehenden Bewerbungen, die bearbeitet beziehungsweise gesichtet werden müssen. Wichtig zu wissen: Es gibt verschiedene Technologien des Parsings, die bei Softwareprogrammen angewendet und teilweise auch miteinander kombiniert werden. Je nach Einsatz ist das Ergebnis mehr oder weniger zuverlässig. Grob spricht man von den folgenden drei Technologien:

1) keywordbasiertes Parsing: Technologie erkennt definierte Wörter (Keywords) und einfache Textstücke. Die Fehlinterpretationsrate ist relativ hoch.

2) statistikbasiertes Parsing: Technologie liest Texte mit Hilfe numerischer Modelle aus und erkennt Textzusammenhänge. Die Fehlinterpretationsrate ist relativ niedrig.

3) grammatikbasiertes Parsing: Technologie identifiziert Textzusammenhänge mit Hilfe grammatischer Regeln. Die Fehlinterpretationsrate ist relativ niedrig.

Die Treffgenauigkeit der Software ist mit Sicherheit ein wichtiges Auswahlkriterium. Ist diese hoch beziehungsweise die Fehlinterpretationsrate niedrig, müssen die Daten nicht aufwendig korrigiert werden und fließen korrekt in das Bewerbermanagementsystem ein. Jedes weitere Bearbeiten der Daten kostet Zeit. Wichtig ist auch, welche Daten eine Parsing-Software abdeckt. Neben den Standard-Angaben zum beruflichen Weg, können die Programme zum Teil auch Referenzen, Wunschgehalt oder Sprachkenntnisse aus dem Datensatz eines Lebenslaufs erfassen. Auch die Sprachen, in denen der CV verfasst ist, die analysiert und gelesen werden können, sind ein wichtiger Faktor.

CV-Parsing und die Candidate Experience

Zuallererst wird dem Bewerber der Bewerbungsprozess erheblich erleichtert, denn er muss nicht jeden einzelnen Karriereschritt sowie persönliche Daten einzeln in ein Formular eingeben. Tatsächlich stellt genau dieses Eintragen in die einzelnen Textfelder im Bewerbungsprozess eine Hürde dar, die oft abgebrochen wird. Fällt dies weg, nimmt der Kandidat das Bewerbungsverfahren in der Regel nutzerfreundlicher wahr und die Candidate Experience ist positiv. Die Konversionsrate steigt und zugleich wird die Arbeitgebermarke gestärkt.

 

Hinweis: Aus Gründen der Lesbarkeit verzichten wir in diesem Text auf das Gendern.