Het kan voorkomen dat je CV’s in briefvorm krijgt aangeleverd. Om deze vervolgens in Eazymatch onder te brengen zul je deze eerst moeten digitaliseren. Wanneer dit 1 of 2 CV’s betreft, kun je dit wellicht nog handmatig doen. Maar wanneer je meerdere van dit soort fysieke CV’s hebt, is scannen een snellere en handiger manier.

Echter het probleem van scannen is dat (in de meeste gevallen) van de CV een afbeelding wordt gemaakt. Dit houdt in dat de oorspronkelijke inhoud niet meer als tekst wordt gezien, maar het CV in zijn totaliteit als plaatje wordt opgeslagen. Wanneer je vervolgens zo’n gescande CV in EazyMatch wilt toevoegen dan zijn Eazymatch en Textkernel niet in staat om de tekst van het CV te lezen. Met als gevolg dat Textkernel het CV niet kan extraheren en in EazyMatch de inhoud van het CV niet doorzoekbaar is met behulp van de zoekfunctie.

Door gebruik te maken van OCR kun je dit probleem oplossen. OCR staat voor Optical Character Recognition oftewel optische tekenherkenning. Bij sommige scanners kun je dit al toepassen tijdens het scannen (raadpleeg de handleiding om te controleren of je scanner dit ondersteunt). Maar je kunt OCR ook toepassen na het scannen. Dit doe je door gebruik te maken van OCR-software.

Bekende OCR-software zijn:

  • Adobe Acrobat Professional (Windows, Mac OS)
  • BIT-Alpha (Windows)
  • ExactScan Pro (Mac OS)
  • ABBYY FineReader (Unix, Windows)
  • OCRKit (Mac OS)
  • Readiris (Unix, Windows, Mac OS)
  • Scansoft Omnipage (Windows)

OCR toepassen gescande CV

in de onderstaande uitleg zijn we uitgegaan van een CV dat gescanned is in PDF en maken we gebruik van Adobe Acrobat

  • Scan CV en sla deze in PDF-formaat op
  • Open de gescande PDF in Adobe Acrobat (of ander OCR software)
  • Kies bovenin voor Gereedschappen > Tekst herkennen > In dit bestand
  • Selecteer in het dialoogvenster Tekst herkennen de optie alle pagina’s
  • Klik op Bewerken om het dialoogvenster Tekst herkennen – Algemene instellingen te openen
  • Primaire OCR-taal; Hiermee geef je de taal op die de OCR-engine gebruikt om de tekens te herkennen. (evt. voor buitenlandse CV’s)
  • PDF-uitvoerstijl; Hiermee bepaal je het type PDF dat wordt gemaakt. Voor alle opties is een invoerresolutie vereist van 72 dpi of hoger (aanbevolen). Bij alle indelingen worden de OCR-functie en font- en paginaherkenning toegepast op tekstuele afbeeldingen en converteer je deze naar normale tekst.
    • Doorzoekbare afbeelding; Hiermee zorg je ervoor dat de tekst doorzoekbaar en selecteerbaar is. Met deze optie behoud je de originele afbeelding, hef je eventuele schuintrekking op en plaats je er een onzichtbare tekstlaag overheen.
    • Doorzoekbare afbeelding (exact); Hiermee zorg je ervoor dat de tekst doorzoekbaar en selecteerbaar is. Met deze optie behoud je de originele afbeelding en plaats je er een onzichtbare tekstlaag overheen. Aanbevolen als de gescande afbeelding een zo getrouw mogelijke weergave van het origineel moet zijn.
    • ClearScan; Hiermee genereert je nieuwe Type 3-font dat veel lijkt op het originele font, en behoud je de pagina-achtergrond met behulp van een kopie met lage resolutie.
  • Downsampling naar; Hiermee verklein je het aantal pixels in kleuren-, grijswaarden- en zwart-wit-afbeeldingen nadat de OCR voltooid is. Hoe hoger het aantal dpi, hoe lager het downsampling-niveau. Dit levert PDF’s op met een hogere resolutie.
  • Kies voor OK om OCR uit te voeren
  • Sla na OCR conversie het CV op als PDF
  • Voeg CV toe aan kandidaat via Textkernel of door deze te uploaden in EazyMatch

<< terug