Whitepaper elektronische formulierverwerking

25
IBAN NL14 RABO 0345 8630 03 | K.v.K. Haarlem 34081856 Elektronische formulierverwerking Automatische verwerking van formulieren en data capture systemen DDi Elektronische formulierverwerking Error! Use the Home tab to apply Ondertitel;DDi Sub Titel to the text that you want to appear here. 31 december 2014

description

Bedrijfsmatig gezien is handmatige invoer een kostbare activiteit, waarop snel bespaard kan worden! Het is daarom niet vreemd dat steeds meer organisaties ervoor kiezen hun formulieren geautomatiseerd te verwerken.

Transcript of Whitepaper elektronische formulierverwerking

I B A N N L 1 4 R A B O 0 3 4 5 8 6 3 0 0 3 | K . v . K . H a a r l e m 3 4 0 8 1 8 5 6

Elektronische formulierverwerking

Automatische verwerking van formulieren en data capture systemen

DDi

Elektronische formulierverwerking

Error! Use the Home tab to apply Ondertitel;DDi Sub Titel to the text that you want to appear here.

31 december 2014

2

Alle in dit document beschreven gegevens zijn vertrouwelijk van aard en alleen bestemd voor direct

betrokken medewerkers van geadresseerde en DDi. Geen van de genoemde partijen heeft het recht om

zonder schriftelijke toestemming van DDi bv informatie uit dit document te verschaffen aan derden. Alle

rechten zijn uitdrukkelijk voorbehouden.

3

Inhoudsopgave

1. Inleiding ......................................................................................................................................... 4

2. Automatische formulierverwerking ............................................................................................... 5

2.1. Type formulieren ................................................................................................................................. 5

2.1.1. Gestructureerde formulieren .............................................................................................................. 5

2.1.2. Semi gestructureerde formulieren ...................................................................................................... 6

2.1.3. Ongestructureerde formulieren/documenten .................................................................................... 7

2.2. De invloed van de lay-out op het rendement ...................................................................................... 8

3. De werking van automatische formulierverwerking ...................................................................... 9

3.1. Scannen van formulieren ................................................................................................................... 10

3.2. Herkennen formulieren ..................................................................................................................... 11

3.3. Corrigeren foutief herkende waarden ............................................................................................... 13

3.4. Exporteren verwerkte gegevens ........................................................................................................ 21

4. Conclusies .................................................................................................................................... 22

5. Hoe toepasbaar is automatische formulierverwerking? ............................................................... 23

Over DDi en DDi-ers ..................................................................................................................................... 25

4

1. Inleiding

De handmatige invoer van gegevens vanaf formulieren en documenten is arbeidsintensief, foutgevoelig en

wordt algemeen beschouwd als “vervelend” werk. Bedrijfsmatig gezien is handmatige invoer een kostbare

activiteit, waarop snel bespaard kan worden! Het is daarom niet vreemd dat steeds meer organisaties er voor

kiezen hun formulieren geautomatiseerd te verwerken. Sterker nog, waarom worden er nog steeds gegevens

met de hand ingetypt?

Als specialist in automatische formulierverwerking hebben wij deze white paper zo informatief mogelijk

samengesteld. Het biedt u uiteindelijk een uitgebreide omschrijving van nagenoeg alle mogelijkheden. Deze

white paper is bij uitstek geschikt voor diegenen die een flinke besparing en kwaliteitsslag willen bereiken op

hun dagelijkse invoerwerkzaamheden. Alle (on)mogelijkheden vindt u terug in dit document, opgehangen aan

vele praktijkvoorbeelden.

Om een goed beeld te creëren van de mogelijkheden, zal in dit document eerst een omschrijving volgen van

de typen documenten. Van standaard enquêteformulieren tot complexe schade documenten. We maken

daarbij een onderscheid in gestructureerde, semi gestructureerde en ongestructureerde formulieren.

Daarnaast zal worden ingegaan op de invloed van de lay-out van een formulier. Hoe kan het ontwerp van een

formulier invloed hebben op een succesvolle verwerking?

In het daarop volgende hoofdstuk zullen we dieper ingaan op de verschillende scan- en herken technieken.

Hoe werkt de techniek? Wat te doen als deze niet optimaal kan worden ingezet? Enkelvoudige en

meervoudige documenten scannen en elektronisch verwerken. Hoe goed is bijvoorbeeld nu de herkenning

van handgeschreven karakters, etc.

Tot slot sluiten we deze white paper af met de toepasbaarheid van automatische formulierverwerking. Welke

verschillende oplossingen leveren welke prestatie? Hoe moet u als organisatie een keuze maken, voor welk

systeem? Wat is het rendement waar u op kunt rekenen? Wat zijn de praktijkervaringen met de verschillende

oplossingen en hoe snel en makkelijk hebt u een eigen systeem in huis en kunt u voortaan uw formulieren

automatisch verwerken?

Het laatste hoofdstuk is gereserveerd voor het bedrijfsprofiel van DDi. Hierin wordt beschreven wie DDi is,

waar zij voor staat en met welke vakgebieden zij zich nog meer bezighoudt.

5

2. Automatische formulierverwerking

De term “automatische formulierverwerking” spreekt eigenlijk voor zich. Het is een geautomatiseerde

oplossing om de gegevens die vanaf een formulier in een computer worden ingevoerd te automatiseren.

Voorbeelden te over met als meest bekende formulier: de enquête. Iedereen heeft wel eens een enquête of

vragenlijst ingevuld. Met de hand turven we de antwoorden al lang niet meer. Dat doet de computer voor

ons. We hoeven de vragenlijsten alleen maar even in te voeren.

Maar toch niet handmatig? Dan bent u zeker 4 tot 5 keer zoveel meer tijd kwijt! Door de formulieren te

scannen en deze vervolgens met behulp van herkensoftware te laten lezen, worden alle vragen automatisch

ingevoerd. Tijdwinst tot 80%, aantal typefouten met gemiddeld 50% gereduceerd. Klinkende cijfers, die

moeten overtuigen. Maar waarom wordt er dan nog steeds veelvuldig handmatig ingevoerd?

Heel vaak zijn de mogelijkheden van automatische formulierverwerking onbekend. Tegelijkertijd wordt

gedacht dat bepaalde formulieren zich niet automatisch laten verwerken. Het tegendeel is waar, ieder

formulier dat handmatig wordt ingevoerd kan automatisch worden ingevoerd. Belangrijkste vraag is eigenlijk

alleen maar of het gewenste rendement bereikt wordt. Wij hebben weleens oplossingen gezien waarbij de

automatische invoer meer tijd koste dan handmatige invoer (hierover later meer in hoofdstuk 4,

toepasbaarheid van automatische formulierverwerking.)

Wat een grote invloed heeft op het resultaat is het type formulier en de lay-out van het document dat

verwerkt moet worden.

2.1. Type formulieren

In algemene zin zijn er drie soorten formulieren te onderscheiden;

• gestructureerde formulieren,

• semi gestructureerde formulieren en

• ongestructureerde formulieren

De complexiteit van ongestructureerde formulieren is vele malen groter dan die van gestructureerde

formulieren. In veel gevallen zal het rendement op de automatische verwerking van ongestructureerde

formulieren behoorlijk lager blijken dan bij gestructureerde formulieren. Voordat we verdergaan, leggen we

hieronder eerst eens uit wat de typische kenmerken van de drie soorten formulieren zijn.

2.1.1. Gestructureerde formulieren

Het belangrijkste kenmerk van een gestructureerd formulier is dat ieder kopie van het formulier er precies

hetzelfde uitziet. Op iedere pagina van ieder formulier staan dezelfde gegevens op dezelfde positie. In z’n

algemeenheid laten deze formulieren zich uitstekend automatisch verwerken en is al snel een zeer hoog

rendement te bereiken. Manuele ondersteuning is nagenoeg niet nodig en de huidige herkentechnieken zijn

eigenlijk feilloos.

6

Voorbeelden van gestructureerde formulieren:

• Enquêtes

• Vragenlijst

• Waardebonnen

• Toetsen/examens

• Stembiljetten

• Oproepkaarten

• Bestelformulieren

• Aanvraagformulieren

• Keuze lijsten

• Labaanvragen

• Menukeuze kaarten

• Verzuimformulieren

• Evaluaties

• Inschrijvingen

• Aanmeldingen

• Etc

2.1.2. Semi gestructureerde formulieren

Deze lijken deels op gestructureerde formulieren. Echter het formulier is in verschillende uitvoeringen

uitgebracht. Op ieder formulier staan wel dezelfde gegevens (of grotendeels dezelfde), maar niet op dezelfde

positie. Dit kan bijvoorbeeld doordat er verschillende versies van een formulier in omloop zijn. Een ander

voorbeeld kan zijn dat het formulier naar verschillende doelgroepen is gestuurd en daarop is afgestemd. Een

derde voorbeeld is een bestelbon in tijdschriften. De bon is afgestemd op de eisen van het tijdschrift en het

profiel van de lezers.

Kortom, welke gegevens op het formulier staan is duidelijk, alleen de positie op het formulier is verschillend.

Om deze formulieren geautomatiseerd te kunnen verwerken, zullen aan het verwerkingssysteem

slimmigheidjes toegevoegd moeten worden. Het systeem moet als het ware bij inrichting worden

“uitgelegd”, hoe en vervolgens waar de relevante gegevens op een formulier staan. Dit in tegenstelling tot de

gestructureerde formulieren. Daar hoeft bij de inrichting van het systeem alleen worden aangegeven waar de

gegevens staan.

Voorbeelden van semi gestructureerde formulieren:

• Coupons

• Actiebonnen

• Polis aanvragen

• Prolongaties

• Belastingformulieren

• Declaratie formulieren

• Urenverantwoording

• Werkbonnen

• Verzekeringsformulieren

• Etc.

7

2.1.3. Ongestructureerde formulieren/documenten

Deze groep formulieren (eigenlijk beginnen we hier meer over documenten te spreken) zijn het meest

complex om geautomatiseerd te verwerken. Het betreft hier documenten waarbij de inhoud voldoet aan

bepaalde overeenkomsten. De verscheidenheid aan documenten is voor wat betreft de lay-out en de inhoud

relatief groot. Onbekend is welke gegevens er precies opstaan, waar ze staan en hoe ze op het document

staan. Als de verscheidenheid te groot en te onvoorspelbaar wordt, dan zal het rendement negatief gaan

uitpakken. Op dat moment is zeker de menselijke intelligentie nodig om te begrijpen waar welke gegevens

staan en hoe ze geïnterpreteerd moeten worden.

Voorbeelden van ongestructureerde documenten:

• Facturen

• Schade formulieren

• Inkooporders

• Curriculum Vitae

• Contracten

• Medische recepten

• Doorverwijzingen

• Offertes

• Notariële akten

• Hypothecaire akten

• Etc.

Uit de praktijk blijkt dat het rendement op geautomatiseerde invoer ten opzichte van handmatige invoer bij

ongestructureerde formulieren tussen de 30% en 40% ligt. Bij semi gestructureerde formulieren wordt al snel

een rendement behaald van 50% en bij gestructureerde formulieren zijn de rendementsverbeteringen vaak

op of boven de 80%

8

2.2. De invloed van de lay-out op het rendement

Vooral bij gestructureerde en semi gestructureerde formulieren kan in veel gevallen invloed worden

uitgeoefend op de lay-out van het formulier. De vragenlijsten die u uitdeelt heeft u zelf samengesteld (of

laten samenstellen). Op de lay-out van coupons in tijdschriften kan vaak ook wat invloed worden

uitgeoefend. Belangrijk bij de lay-out van een formulier zijn de volgende zaken:

• Zorg ervoor dat het formulier logisch en ruim is opgezet.

o Indien bijvoorbeeld aankruishokjes bij meerkeuzevragen te dicht bij elkaar staan, dan is het

risico aanwezig dat een respondent onbedoeld twee hokjes aankruist.

o Een e-mailadres bijvoorbeeld is vaak lang. Biedt hiervoor voldoende ruimte.

• “Dwing” respondenten om het formulier netjes in te vullen.

o Geef duidelijk aan op uw formulier hoe bepaalde gegevens ingevuld moeten worden.

Bijvoorbeeld datum dd-mm-yyyy.

o Zorg ervoor dat het voor een respondent logisch is om in blokletters te schrijven.

o Geef op het formulier aan dat deze elektronisch wordt verwerkt en verzoek om een nette

invulling. Biedt in ruil hiervoor een snelle afhandeling.

• Gebruik zoveel mogelijk concrete vragen. Handgeschreven teksten zijn het moeilijkst te lezen.

• Gebruik zo min mogelijk donkere achtergrondkleuren. Door een donkere achtergrond kan informatie

slecht leesbaar of zelfs onleesbaar worden.

Kort samengevat; zorg ervoor dat het voor de “invuller” weinig moeite kost om het formulier netjes en

eenduidig in te vullen. Gebruik daarbij altijd zowel de voor- als achterzijde van het formulier.

9

3. De werking van automatische formulierverwerking

Voordat de formulieren geautomatiseerd verwerkt kunnen worden, zal allereerst de programmatuur

ingericht moeten worden. Later in dit hoofdstuk komen we hierop terug. Allereerst geven we hieronder een

standaard beschrijving over de operationele werking. Eerst in ruwe stappen en vervolgens per stap steeds

meer concreet.

In de regel bestaat de verwerking uit vier deelprocessen. Per deelproces zullen we aangeven welke

handelingen nog manueel zijn.

1. Scannen van de formulieren (manueel)

Een stapel van ca. 100 pagina’s is gemiddeld in 2,5 minuut gescand. Tijdens het scannen bereidt de

gebruiker de volgende stapel (batch) voor. Belangrijk is dat de formulieren in een nette stapel op de

scanner worden gelegd.

Scanners zijn er in allerlei soorten en maten. Een gemiddelde scanner heeft een documentenbak voor 50-100 pagina’s en een

gemiddelde snelheid van 40 pagina’s per minuut (40 ppm).

2. Herkennen (lezen) van de formulieren (100% automatisch)

Nadat alle formulieren zijn gescand worden ze direct door de programmatuur “gelezen”. Hiertoe worden

verschillende herkentechnieken toegepast, zoals OMR voor meerkeuze vragen, OCR voor geprinte

teksten, ICR voor handgeschreven karakters, barcode herkenning, QR en 2D barcode herkenning,

alsmede de herkenning van vormen.

Het lezen (herkennen) is een volautomatisch proces.

3. Corrigeren (manueel)

Tijdens de herkenning heeft de software bijgehouden welke gegevens eventueel niet goed herkend zijn.

Alleen deze gegevens worden aan de gebruiker ter correctie aangeboden.

4. Exporteren (100% automatisch)

Nu alle gegevens zijn herkend en de fouten zijn gecorrigeerd, kan de data geëxporteerd worden naar de

desbetreffende databronnen. Mogelijkheden te over. Rechtstreeks naar analyse systemen (Excel, SPSS),

als XML, als platte CSV bestanden, via ODBC naar databases, etc.

Al deze activiteiten kunnen uitgevoerd worden op één desktop PC, maar ook verdeeld worden over een

veelvoud aan stations en/of (web)servers. Hoe een uiteindelijke configuratie eruit komt te zien is afhankelijk

van twee factoren, namelijk:

• aantal te verwerken formulieren per uur, dag, week, maand, jaar etc.

• aantal verschillende locaties waar de formulieren verwerkt worden (outsourcen).

In de volgende paragrafen wordt verder ingezoomd op de verschillende deelprocessen.

10

3.1. Scannen van formulieren

Scanners bestaan er in vele uitvoeringen. Vaak wordt de vraag gesteld of ook de Multifunctionele copier

(MFC) gebruikt kan worden om te scannen. Technisch geen enkel probleem, alleen functioneel zijn deze

apparaten niet goed uitgerust en met hoge snelheid en betrouwbare kwaliteit grotere hoeveelheden

documenten te scannen.

Meestal wordt gekozen voor een zogenaamde documentscanner, die zijn onverdeeld in drie categorieën:

• Low volume scanners

Tot 30 ppm, een sheetfeeder van ca. 50 vel, max. A4 formaat

Prijsniveau tot € 1.500,00

• Mid volume scanners

Van 40 ppm tot 90 ppm, sheetfeeder van 100 vel tot 250 vel, tot max. A3 formaat

Prijsniveau tot € 6.500,00

• High volume scanners

Van 90 ppm tot 170 ppm, sheetfeeder van 250 vel tot 800 vel, tot max. A3 formaat

Prijsniveau tot € 40.000,00

Het aantal fabrikanten van documentscanners is beperkt. De meest bekende merken zijn Canon,

Kodak, Panasonic en Fujitsu.

De keuze in scanner is relatief eenvoudig en gebaseerd op onderstaande criteria:

• Robuustheid van de scanner

De low volume scanners zijn vaak fragiel, maar bieden toch een prima alternatief voor 250 tot 300

scans per dag. Tot 5.000 scans per dag kunt u met een mid volume scanner goed uit de voeten.

Daarboven moet u echter overwegen te kiezen voor een high volume scanner.

• Piekvolume op een bepaald moment

• Formaat van de formulieren

A3 formaat formulieren dwingt u tot een A3 scanner

• Beschikbaar budget

Indien het budget het toelaat, kunnen extra selectiecriteria worden gehanteerd die voornamelijk op het

kwalitatieve vlak liggen. Welke scanner produceert kwalitatief de mooiste scans (minste pixel ruis), heeft

kwalitatief de beste invoertechniek (automatische scheefstand correctie, double feed detectie, etc.) en de

beste doorvoertechniek (korte transportbaan met veel rollers over breedte, zorgen voor minder vastlopers

van het papier).

In deze white paper spreken wij geen voorkeur uit. Tegelijkertijd merken we graag op dat alle fabrikanten

gemiddeld goede tot uitstekende machines leveren. Tot slot maken we er melding van dat alle scanners in

een enkele scangang beide zijden van de documenten scant. Instelbaar kunt u in de software kiezen voor

enkelzijdig of dubbelzijdig scannen.

11

Nu de keuze voor de juiste scanner gemaakt kan worden, kan deze worden aangeschaft en in gebruik worden

genomen. Het scanproces zelf is op zich een eenvoudige handeling, die indien niet goed uitgevoerd grote

gevolgen kan hebben (garbage in, garbage out). Enige aandacht bij de gebruiker is dan ook een vereiste:

• Zorg ervoor dat de formulieren in nette stapels (boven en onder, links en rechts goed recht leggen)

klaar worden gemaakt.

• Controleren of er geen formulieren tussen zitten die verkeerd liggen (op de kop), gevouwen zijn, aan

elkaar geplakt/geniet, Post-it stickers hebben, o.i.d..

• Vervolgens deze stapels (batch) netjes recht in de scanner leggen (om scheef scannen te

voorkomen).

• Plus de scanner goed schoon houden. Papier geeft veel stof af. Gebruikte Tipp-Ex kan resten

achterlaten. Soms glipt er toch een nietje of paperclip door. Dit is allemaal rommel die het

scanproces negatief kan beïnvloeden.

Rekening houdend met bovenstaande garandeert een uitstekend scanresultaat.

3.2. Herkennen formulieren

Zoals eerder aangegeven is dit een volautomatisch proces. Direct nadat een batch formulieren is gescand, zal

de programmatuur tot verwerking overgaan. Bij het scannen is van ieder formulier een bitmap image (een

digitaal beeld gemaakt. De algoritmes van de software berekenen als het ware de waarde van alle pixels. Dit

gaat razendsnel. Per A4 pagina leest de programmatuur alle hokjes (zowel de niet als wel ingevulde), alle

geprinte teksten, alle handgeschreven karakters en barcodes (1D, 2D en Quick Response (QR) codes).

Gemiddeld in twee seconde wordt een pagina volledig gelezen (herkend of nog beter gezegd: berekend).

Welke herkentechnieken en hoe goed zijn deze kwalitatief:

• Herkennen van meerkeuzevragen (OMR)

De herkenning van hokjes wordt uitgevoerd door het OMR algoritme (Optical Mark Reading). Bij de

inrichting van het systeem is de software uitgelegd waar de hokjes op het formulier staan en hoe ze

eruit zien. Aan de hand van deze karakteristieken wordt voor ieder hokje berekend of deze wel of

niet is ingevuld. Aan de hand van ingestelde drempelwaarde is een hokje wel of niet aangekruist.

Een feilloos mechanisme!

Een feilloos mechanisme, met de nadruk op mechanisch.

Iemand maakt een tekening op het formulier en tekent door het hokje. Een respondent heeft

aangekruist dat hij zowel een man als vrouw is. Wij als mens begrijpen dat dit niet klopt. Dit zijn

voorbeelden van hokjes die mechanisch gezien juist zijn gelezen, maar intellectueel gezien niet

correct zijn. Typisch hokjes die ter correctie moeten worden aangeboden (zie paragraaf 3.1.3.)

• Herkenning van geprinte teksten (OCR)

Geprinte teksten kunnen alweer drie decennia goed herkend worden. De herkenning is daarbij

steeds een stuk verbeterd. Inmiddels claimen de OCR fabrikanten een accuratesse van 99,8% goed

herkende karakters. Nagenoeg feilloos, maar niet foutloos. Feitelijk moet niet meer de vraag gesteld

worden hoe goed de OCR kan lezen, maar hoe goed deze is in het herkennen van fouten. Deze

fouten moeten immers ter correctie worden aangeboden. Of gewoon negeren. Een mens maakt

immers bij overtypen ongeveer 0,6% typefouten.

12

Door bij de inrichting van het systeem rekening te houden met herkenfouten, zijn deze met groot

succes te isoleren en ter correctie aan te bieden. Toch nog iets met de hand intypen zult u nu

zeggen. Klopt, maar gemiddeld 99,8% is al voor u gedaan!

• Herkenning van handgeschreven karakters (ICR)

Weer even terug naar het doel van automatische formulierverwerking, namelijk besparing op arbeid

en verbetering van kwaliteit (minder invoerfouten). Handschrift herkenning, of beter gezegd de

herkenning van handgeschreven karakters (blokletters), is alleen onder voorwaarden goed

toepasbaar. De accuratesse van handgeschreven karakters is namelijk veel lager dan bij OCR (ca.

80% tegen 99,8%). Ondanks een gemiddeld foutpercentage van deze 20% kan deze techniek toch

bijdrage aan een redelijke rendementsverbetering.

In de eerste plaats door bij het ontwerp van het formulier respondenten te dwingen om in

blokletters te schrijven (gebruik hiervoor voorbedrukte kaders). Daarnaast helpt het om de

numerieke en de alpha karakters van elkaar te scheiden (herken een postcode als twee velden (één

voor de vier cijfers en twee voor letters). Maak gebruik van validatie tabellen (door de herkenning

van postcode en huisnummer, kan automatisch een compleet adres gevuld worden). Gebruik

automatische correctie tabellen (herkende waarde “lijkt het meest op”).

Men kan nog een stap verder gaan door gebruik te maken van een voting algoritme. De

handgeschreven karakters worden met meerdere neurale netwerken gelezen waarbij de herkende

waarden tussen de netwerken met elkaar worden vergeleken. Vervolgens wordt het juiste karakter

volgens berekenmodellen gelezen. Er bestaan verder nog een aantal intelligente technieken waarbij

de kwaliteit van herkenning behoorlijk verbetert. Om uiteindelijk weer op de gewenste doelstelling

uit te komen; kwaliteitsverbetering en tijdwinst!

• Herkenning van barcodes, 1D, PDF147 en 2D barcodes

Dit is de meest zekere vorm van herkenning, vandaar de populariteit van barcodes. Barcodes worden

vrijwel altijd correct gelezen. Gemiddeld één op de miljoen barcodes wordt verkeerd gelezen.

Nadeel van barcodes is de relatie tussen het aantal karakters en de benodigde ruimte. Met de komst

van de PDF147 barcode en de 2D barcode is dit sterk verbeterd. In een 2D barcode kunnen tot 4.000

karakters worden opgenomen in een ruimte niet groter dan een postzegel. Een PDF147 barcode kan

tot 929 karakters coderen.

2D barcode PDF147 barcode 1D barcode

13

De toepassingen van 2D barcodes komen we steeds vaker tegen als zogenaamde QR-code (Quick

Response). Vooral voor online marketing campagnes (lees de QR met je smartphone en ontvang

direct via internet alle benodigde informatie, inclusief GPS coördinaten naar de winkel). Ook bij

formulierverwerking is de 2D barcode aan een opmars bezig. Bij aangifteformulieren, toetsen,

opdrachtbevestigingen, waardebonnen, etc. Het belangrijkste bij verwerking is dat de barcodes altijd

foutloos worden gelezen.

• Herkenning van patronen (vormen)

Door logo’s van leveranciers vast te leggen, kunnen bijvoorbeeld facturen automatisch herkend

(geïdentificeerd) worden aan de vorm van het logo.

3.3. Corrigeren foutief herkende waarden

Dit wordt wellicht de langste paragraaf uit dit document. Omdat juist hierover het meest te doen is en het

verreweg de grootste invloed heeft op de winst in tijd en kwaliteit. Fouten corrigeren kosten namelijk tijd.

Ten minste, dit wordt vaak gedacht. In dit deel van het document vindt u antwoorden op de vragen, “Wat zijn

(herken)fouten?”, “Hoe ernstig zijn ze?” en “Wat doen we met deze fouten?”.

Om te beginnen, herkentechnieken zijn niet feilloos! We zullen in deze paragraaf uitleggen waardoor de

herkenning zal falen. Ten tweede kunnen zich in het document of formulier dat wordt verwerkt fouten

voordoen. Bij het invullen van bijvoorbeeld een vragenlijst heeft een respondent een vraag niet of onjuist

ingevuld. De software herkent ook deze fouten (en terecht). Maar wat nu te doen met deze fouten?

In de basis heeft u drie keuzes:

1. Negeren

Het maakt niet uit dat er af en toe iets fout wordt herkend. Handmatige invoer brengt immers ook

fouten met zich mee. Zolang het aantal fouten maar onder de x% blijft. Voordeel, er hoeft niets meer

handmatig gecontroleerd te worden.

2. Automatisch laten corrigeren

Indien bij herkenning fouten worden gemaakt kunt u deze via o.a. scripting, matchtabellen en/of voting

algoritmen automatisch laten corrigeren.

3. Verifiëren en handmatig corrigeren

De foutief herkende waarden worden aan een operator aangeboden. Deze bepaalt handmatig wat de

juiste waarde is.

Voordat we verder gaan met corrigeren, allereerst nog een stuk uitleg over het ontstaan van herkenfouten.

Daar is wat extra uitleg over het herkennen van gegevens voor nodig.

Herken engines hebben allen hetzelfde uitgangspunt, namelijk het uitvoeren van berekeningen over een

gegroepeerde set pixels. Ieder element (karakter, cijfer, hokje, patroon of barcode) bestaat uit een groepje

pixels die tezamen een geheel vormen (zie voorbeeld hieronder).

14

Herkenning is dus eigenlijk berekenen. Stel, bij de verwerking van een document hoeven alleen maar de

geprinte karakters gelezen te worden (OCR). Na scanning wordt door software geanalyseerd welke pixels

gegroepeerd zijn en daarmee een karakter uitbeelden. Vervolgens berekent de programmatuur voor elke

groep pixels het juiste karakter. Per karakter zijn er drie mogelijke uitkomsten, namelijk:

• Berekening geslaagd, karakter juist herkend.

• Berekening niet geslaagd, karakter kan niet herkend worden.

• Berekening twijfelachtig, karakter kan mogelijk verkeerd herkend zijn.

Zoals eerder opgemerkt, is de gemiddelde accuratesse bij OCR herkenning 99,8%. Hierbij wordt

vanzelfsprekend uitgegaan van een gemiddelde kwaliteit. Voorbeelden zoals hieronder zullen de accuratesse

verminderen (achtereenvolgens: beschadigde karakters, karakters die tegen een achtergrond geprint zijn,

karakters waar doorheen is gekliederd of karakters die te dicht bij elkaar staan).

Ook priegelige lettertypes (bijvoorbeeld ALGERIA, Broadway of harlow) zullen een negatieve invloed

hebben op de herkenkwaliteit.

Maar bij een gemiddelde kwaliteit zal de accuratesse dus zeer hoog zijn. Per 1.000 karakters, gemiddeld twee

fouten. Wat OCR nu juist zo krachtig maakt, is dat ook de fouten worden herkend (immers, de berekening is

niet geslaagd of de uitkomst is twijfelachtig). Bovendien weet de programmatuur ook precies welke karakters

het betreft. OCR berekent iedere groep pixels apart en legt naast de uitkomst ook de coördinaten van de

15

groep pixels vast. Met behulp van deze informatie worden ten behoeve van het corrigeren alleen de

karakters aangeboden die niet berekend kunnen worden of waarvan de uitkomst twijfelachtig is.

Nu weer terug naar de factuur. Omdat we niets willen inrichten (de software is alleen verteld dat we graag

facturen willen inboeken), worden van iedere factuur alle karakters herkend. Voor het vastleggen van de

factuur in ons ERP systeem, hebben we alleen de crediteur nodig plus het factuurnummer, de factuurdatum,

totaal bedragen inclusief en exclusief btw, btw bedragen en ordernummer. Verder staat er nog veel meer

informatie op de factuur (alle factuurregels, betalingsvoorwaarden, etc.). Alles bij elkaar ca. 1.100 karakters

(m.a.w. gemiddeld 2-3 karakters niet of verkeerd berekend). De software heeft precies bijgehouden welke

karakters dit zijn. De software is echter ook verteld, dat we alleen bepaalde informatie van de factuur willen

overtypen. Zolang de fouten zich hier niet voordoen, zal niets van de factuur ter correctie worden

aangeboden. Stel dat de fout is waargenomen in het bedrag (in plaats van € 8.719,23 = € 3.719,23 herkend),

dan zal de software alleen de foutieve 3 (gezamenlijk met het gescande beeld) ter correctie aanbieden. De

operator corrigeert vervolgens de 3 naar een 8 en de volledige factuur is feitelijk met één toetsaanslag

ingevoerd.

In vergelijking tot bijvoorbeeld een factuur (document) staan op een formulier vaak meer verschillende

soorten gegevens (zie voorbeeld op de volgende pagina).

Handschriftherkenning

ICR

Herkenning aankruishokjes

OMR

16

Om het formulier op juiste wijze in te voeren, wordt bij de inrichting van de programmatuur vastgelegd wat

welke zone betekent.

• Bij het veld “achternaam” wordt ingesteld dat hier een handgeschreven achternaam staat

(alfabetische karakters).

• Bij “geboortedatum”, zal hetzelfde zijn ingesteld als bij achternaam, met het verschil dat er

numerieke karakters staan en dat het een geldige datum moet zijn.

• Bij “geboorteplaats” staat dezelfde instelling als bij achternaam, plus een controle dat de herkende

waarde een geldige plaatsnaam moet zijn, waarbij automatische correctie wordt geactiveerd (stel

dat herkenning in plaats van “Amsterdam” “Anstendam” oplevert, dan is de software in staat om de

herkende waarde via matchtabellen automatisch te corrigeren naar “Amsterdam”).

• Bij het veld “OOI AANGEVRAAGD DOOR” (de vier hokjes) zal zijn vastgelegd dat deze gelezen moeten

worden m.b.v. OMR en slechts één van de vier hokjes aangekruist moet/mag zijn.

Bij herkenning vindt nu weer hetzelfde principe plaats. Alleen weet de programmatuur nu dat de

gegroepeerde pixels in een bepaalde zone niet met OCR techniek maar met ICR of OMR techniek berekend

moeten worden. Ook nu zijn de uitkomsten weer “goed”, “fout” of met twijfel berekend.

Met behulp van OMR technieken (Optical Mark Reading) wordt berekend welke pixels bij meerkeuzevragen

een leeg hokje of een ingevuld hokje zijn. Bij geprinte teksten wordt van iedere groep pixels een karakter

berekend (Optical Character Recognition – OCR herkenning). Bij handgeschreven karakters werkt de

herkenning volgens een neuraal netwerk (een zelf lerend algoritme, ICR ofwel Intelligent Character Reading

genoemd).

Tegelijkertijd wordt de herkende waarde van ieder veld gecontroleerd tegen een aantal standaard validaties

en/of speciaal via scripting samengestelde validatie routines. Enerzijds om de herkende waarde op juistheid

in te schatten, anderzijds om te bepalen wat te doen als de uitkomst van de routine negatief is.

17

Voorbeelden:

• Het veld “OOI AANGEVRAAGD DOOR” op de vorige pagina.

o Standaard is de validatie routine zo ingesteld dat een hokje pas is aangekruist als minimaal

10% van het hokje met pixels is gevuld. 10% met een kleine marge. Minder dan 8% pixels

gevuld = niet aangekruist en > 12% = 100% zeker aangekruist. Indien uit de herkenning blijkt

dat de waarde tussen 8% en 12% ligt, dan “twijfelt” de programmatuur

o Tevens is standaard vastgelegd dat slechts één van de 4 hokjes aangekruist moet zijn. Met

andere woorden: niets ingevuld is fout en meer dan één aangekruist is ook fout.

Wat dan te doen in de volgende gevallen?

o De herkende waarde van één van de hokjes is bijvoorbeeld 9% (er staat dus iets in). De

validatie routine geeft aan dat de herkende waarde (niet aangekruist) discutabel is. De

keuze is nu aan u. Gaat u uit van uw instellingen (> 10% is aangekruist, < 10% = niet

aangekruist), dan wordt automatisch de herkende waarde hierop ingesteld. U kunt er ook

voor kiezen de disputen (waarden tussen 8% en 12%) voor verificatie aan een gebruiker aan

te bieden. Deze bepaalt dan of het hokje van 9% inderdaad niet is aangekruist.

Wat blijkt uit de praktijk is dat in ruim 95% van de zogenaamde twijfelgevallen toch correct

zijn herkend door de software. Bij goede instellingen is OMR herkenning nagenoeg foutloos.

Zeker vergelijking met handmatige invoer maakt OMR herkenning substantieel minder

fouten.

o Er is geen enkel hokje aangekruist.

Het heeft geen zin om een operator te laten bepalen wat de waarde moet zijn indien geen

hokje is aangekruist. Deze zal maar wat gokken (of denken te zien wat de respondent

bedoelt). Het is beter een script(je) te maken waarin wordt vastgelegd wat te doen met

deze vraag indien niet beantwoord (negeren, standaard waarde bepalen of random een

keuze laten maken).

o Er is er meer dan één aangekruist.

Deze fout ligt meer voor de hand. Een respondent heeft zich in eerste instantie vergist. Hij

corrigeert zichzelf door nog een ander hokje aan te kruisen en er een pijl bij te zetten (om

aan te geven dat dit echt het hokje is wat hij bedoelt). Of hij krast het vorige hokje nog eens

extra door (groot kruis erdoor). Misschien is de vraag niet goed gelezen en denkt de invuller

dat hij meer dan één hokje mag aankruisen. Kortom, een respondent kan allerlei keuzes

maken.

Voor de OMR software is het duidelijk:

- Twee hokjes aangekruist (beiden ruim meer dan 10% ingevuld)

- Twee hokjes niet aangekruist (beiden ruim minder dan 10% ingevuld)

Ook hier is de uitkomst van OMR herkenning juist. In het script heeft u nu vastgelegd dat

een operator dan maar handmatig moet bepalen wat het juiste hokje is. De hokjes worden

dus ter verificatie aangeboden.

18

In het script had u ook andere keuzes kunnen maken en de software automatisch laten

bepalen wat de juiste waarde is. Bijvoorbeeld door aan te geven dat het hokje met de

meeste pixels de juiste is. Of het hokje met juist het minste aantal pixels. U kunt ook weer

een standaard waarde kiezen. Of toch beide waarden goedkeuren. Wat u ook instelt, de

keuze blijft arbitrair. Echter, ook bij handmatige verificatie zal de keuze die een operator

maakt discutabel zijn. In veel gevallen zal ook voor de gebruiker niet duidelijk zijn welk

hokje een respondent nu daadwerkelijk bedoelt.

Wat nu te doen? Automatisch laten bepalen door de software of toch handmatig nakijken

en daar waar nodig corrigeren? Ook hier heeft de praktijk ons weer geleerd wat de beste

keuze is. Uitgedrukt in (data) kwaliteit blijkt er weinig verschil te zitten tussen handmatige

of automatische correctie.

19

• Het veld “achternaam”

Op het voorbeeldformulier staan naast een aantal meerkeuzevragen ook een aantal open vragen.

Handmatig schrijft de respondent in zijn eigen handschrift het antwoord. De antwoorden zullen

voorspelbaar zijn. De vraag “achternaam” bijvoorbeeld laat niets aan duidelijkheid te wensen over.

De leesbaarheid helaas vaak wel. Dat geldt voor ons mensen, maar zeer zeker voor de herken

engines (in dit geval dus de ICR engines). In de voorgaande paragraaf hadden we het al over de

voorwaarden van handschriftherkenning.

Wat zijn de voorwaarden bij herkenning van het veld “achternaam”?

o De vragenlijst is toegestuurd aan een gecontroleerde groep respondenten. Hierdoor is het

voorspelbaar welke achternamen allemaal voor kunnen komen op de formulieren. Door al

deze achternamen op te nemen in een tabel, kan de herkende waarde gecontroleerd

worden met de namen in de tabel. Zelfs als een aantal karakters onjuist zijn berekend, kan

toch vaak nog de juiste naam worden gevonden. In plaats van “pietersen” werd “bietevsen”

herkend. In de tabel gaat de software zoeken in de namen met negen karakters en vindt

vervolgens “Pietersen” als meest overeenkomend. “bietevsen” wordt nu automatisch

gecorrigeerd naar “Pietersen”.

� Combinatie velden

Naast de achternaam hebben we in de tabel ook de voornaam, geboortedatum,

postcode etc. van de respondent. Door de velden met de desbetreffende gegevens

met elkaar te combineren (bijvoorbeeld geboortedatum en achternaam), kunnen

meerdere velden automatisch gecorrigeerd en gecontroleerd worden. Vervolgens

kan deze matchingregel weer verder worden doorgevoerd op de overige NAW

gegevens.

o Mogelijke respondenten zijn onbekend.

Het wordt nu al een stuk lastiger om de juiste achternaam te herkennen. We hebben ook

geen enkele tabel met mogelijke achternamen beschikbaar. Kortom we zijn nu echt alleen

afhankelijk van de kwaliteit van de herken engine(s).

� Werken met betrouwbaarheid

Zoals eerder gezegd, wordt ieder karakter apart berekend door de ICR engine. Bij

ieder karakter zal naast de berekende uitkomst ook de betrouwbaarheid van de

berekening bekend zijn. De “b” bij “bietevsen” was bijvoorbeeld berekend met een

betrouwbaarheid van 10%. De overige karakters hadden de volgende score: i =

70%, e = 80%, t = 30%, e = 100%, v = 40%, s = 90%, e = 90%, n = 100%.

Om de kwaliteit te borgen hebben we in de programmatuur ingesteld dat alleen

karakters met een betrouwbaarheid van meer dan 70% automatisch worden

goedgekeurd. In context willen we karakters die lager scoren door een operator

laten controleren/corrigeren. In ons voorbeeld krijgt de operator dan het volgende

aangeboden: b i e t e v s e n.

Tegelijkertijd ziet hij op zijn scherm wat de respondent heeft geschreven, namelijk

P i e t e r s e n.

Met deze gegevens kan de operator vrij eenvoudig en snel zien welke karakters

twijfelachtig zijn en welke gecorrigeerd moeten worden.

20

Indien een te groot aantal van de karakters in één woord twijfelachtig zijn (in de

praktijk meer dan 30%), dan is het verstandiger (werkt domweg sneller) om de

herkende waarde helemaal niet te tonen. Het gehele woord wordt afgekeurd en

de operator krijgt op zijn scherm alleen het oorspronkelijk geschreven woord P i e

t e r s e n te zien, met daaronder het invoerveld, waar hij dan “Pietersen” intypt.

Praktijkervaring in dit geval:

Circa 70% van de velden wordt ter correctie aangeboden. Bij gemiddeld 40% is het

aantal twijfelachtige karakters in één woord groter dan 30%. Kort samengevat:

Hier moet toch nog wat werk worden verzet.

� Werken met meer dan één ICR engine en een voting algoritme

Dit is wel een kostbare oplossing, maar loont zich zeker bij hoge oplagen. Door

gebruik te maken van bij voorkeur de verschillende ICR engines (ICR engines zijn

allemaal net iets anders getraind), kan automatisch per karakter de verschillende

uitkomsten van de engines met elkaar vergeleken worden. We gebruiken ons

voorbeeld P i e t e r s e n en plaatsen deze voor het overzicht in een matrixtabel

hieronder.

Veldwaarde ICR Engine 1 ICR engine 2 ICR Engine 3 Berekende waarde

P P b P P

70% 10% 60%

i i i i i

90% 70% 50%

e e e e e

70% 80% 100%

t t t t t

90% 30% 80%

e e e s e

100% 100% 20%

r r v v ..

40% 40% 20%

s s s s s

95% 90% 70%

e e e e e

70% 90% 80%

n n n 4 n

70% 100% 10%

Bij de uitkomsten per karakter per engine hebben we ingesteld dat alleen de

herkende karakters worden gebruikt met een betrouwbaarheidswaarde boven de

50%. Indien van drie engines vervolgens minimaal twee engines dezelfde waarde

hebben berekend, dan is die waarde correct. Is deze formule niet toe te passen,

dan is de waarde fout en wordt er geen karakter getoond. De operator hoeft nu

alleen nog maar de ontbrekende karakters te corrigeren (de rest van de karakters

is namelijk correct berekend).

21

3.4. Exporteren verwerkte gegevens

Nadat alle documenten/formulieren zijn gescand en herkend en de foutieve waarde al dan niet automatisch

zijn gecorrigeerd, kan de data geëxporteerd worden naar zijn bestemming. In geval van onder een onderzoek

kan dat zijn een database, een statistische applicatie als SPSS of een spreadsheet (Excel). Betreft het

bijvoorbeeld een inkooporder of een factuur, dan is export naar een ERP systeem (SAP, Exact, Navision, AFAS,

o.i.d.) nodig.

De meest voorkomende dataformaten waarin geëxporteerd moet worden zijn de bekende standaarden zoals

CSV en XML. Specifieke formaten zoals Excel, SPSS zijn alleen nodig in enkele gevallen. Tot slot is ook het

direct wegschrijven in een database een optie.

Met betrekking tot het exporteren kunnen drie verschillende scenario’s gehanteerd worden:

• Batchgewijs (per gescande stapel documenten/formulieren)

• Stuksgewijs (per gescand document/formulier)

• Tijdsgebonden (op ingestelde tijdstippen)

De formulierverwerkingssoftware is hier eigenlijk altijd flexibel en laat zich aanpassen naar de wensen van de

bestemmingsprogrammatuur.

22

4. Conclusies

Zoals de hoeveelheid tekst alleen al uitwijst, draait het bij automatische document- en formulierverwerking

om het correctieproces. De correcties van foutief herkende waarden. Logisch, omdat juist hierin de meeste

kostbare tijd verloren kan gaan.

Dat maakt aan de andere kant juist de voorgaande handelingen zo belangrijk. Alles heeft namelijk invloed op

het mogelijke aantal correcties. In de eerste plaats het formulierontwerp. Dwing in het ontwerp af dat

respondenten duidelijk in blokletters schrijven (en dat kan echt heel goed. Kijk maar eens naar de papieren

belastingformulieren, deze worden allemaal automatisch verwerkt). Zet aankruishokjes niet te dicht op

elkaar. Zorg voor een duidelijke vraagstelling en een logische opbouw van een vragenlijst/formulier. Gebruik

bij response formulieren indicatiecodes. Werk – indien mogelijk – met matchtabellen, etc.

In de tweede plaats het scannen zelf. Zorg ervoor dat alle documenten netjes worden gescand. Minimaal in

een resolutie van 300 x 300 dpi of hoger. Hoe hoger de densiteit, hoe beter de herkenning zal worden. Met

andere woorden, investeer in een goede scanner. Deze verdient zich direct weer terug. Zorg ervoor dat de

scanner schoon blijft (stof e.d. regelmatig verwijderen). Bij een goede scanner kost u dit maximaal 5 minuten

per dag.

Tot slot de inrichting van de programmatuur. Denk goed na welke data absoluut 100% goed moet zijn. Welke

herkenfouten zijn toelaatbaar? Welke kunnen automatisch gecorrigeerd worden? Waar kan gewerkt worden

met matchtabellen? Ook externe matchtabellen kunnen vaak gebruikt worden. Denk bijvoorbeeld in de

gezondheidszorg aan het BSN nummer. Het BSN nummer is eenvoudig en goed te herkennen (alle karakters

zijn numeriek). Het kan tijdens herkenning direct gecontroleerd worden aan de hand van een elfproef en

vervolgens kunnen alle relevante gegevens uit de centrale BSN database (beheerd door Vecozo) worden

opgehaald.

Als u al deze zaken goed in ogenschouw neemt, dan zal automatische formulierverwerking u substantieel veel

tijd schelen ten opzichte van handmatige invoer. Bovendien zal ook de kwaliteit duidelijk verbeteren. Maar

verwacht geen tovermiddel wat alles foutloos en goed voor u regelt. De technieken bij formulierverwerking

zijn “slechts” een krachtig hulpmiddel om tijd te besparen!

23

5. Hoe toepasbaar is automatische formulierverwerking?

Kunnen nu alle documenten en formulieren automatisch worden verwerkt? Technisch gezien kan alles wat

met de hand wordt ingevoerd, geautomatiseerd worden. De vraag is echter of het in alle gevallen voldoende

tijdwinst oplevert. Er zijn voorbeelden dat de kwaliteit van de te verwerken documenten niet voldoende is.

Ditzelfde geldt voor het volume. Een kleine oplage is vaak niet rendabel te krijgen waarom wij adviseren

gewoon handmatig te blijven invoeren.

Er zijn enkele specifieke elementen die van invloed zijn op de kwaliteit en daardoor op het rendement.

• Uniformiteit

Diversiteit in formulieren kan een grote invloed hebben op de kwaliteit. Als er in verschillende

documenten maar een beperkt aantal overeenkomsten is, dan zal het technisch moeilijk blijken om

de juiste data in een document te vinden. Bijvoorbeeld declaraties. Wat met betrekking tot een

declaratie moet worden vastgelegd is helder. Iedere declaratie (kassabon of nota) ziet er alleen

compleet anders uit. Om hier toch voldoende rendement te kunnen behalen, moet u bereidt zijn

wijzigingen door te voeren in het declaratieproces.

• Formulierontwerp

Onduidelijk en slordig ontworpen formulieren worden onduidelijk en slordig ingevuld. Dit is een

wetmatigheid en heeft direct invloed op de response. Zorg ervoor dat respondenten uw formulieren

goed kunnen invullen. Via het ontwerp kunt u bijvoorbeeld afdwingen dat in blokletters wordt

geschreven.

• Eenduidige data

Indien het vooraf niet voorspelbaar is welke data op een document kan voorkomen, is het moeilijk

vast te stellen welke gegevens ingevoerd moeten worden. Bijvoorbeeld: In totaal moeten 40 velden

worden vastgelegd. Per document is niet voorspelbaar welke van deze 40 waarden op een document

staan. Waar en hoe ze op de document staan is tevens niet duidelijk. Om nu toch precies de juiste

gegevens van ieder document te halen vereist een zeer uitgebreid script. Alleen bij hoge oplages kan

in deze gevallen voldoende rendement worden behaald.

• Verschillend ingevuld

Een goed voorbeeld zijn de zogenaamde NAW-gegevens. De wijze waarop deze gegevens zijn gevuld,

zijn nogal verschillend. Soms handgeschreven, soms direct op het formulier geprint, soms een sticker

met NAW’s op het formulier geplakt. In dat laatste geval, vaak onvolledig. Ook hier kan

automatische invoer een uitkomst bieden, maar voor voldoende rendement is weer een hoge oplage

nodig.

• Slordig ingevuld of slordig ingeleverd

Dit is sterk afhankelijk van de doelgroep en de mogelijkheden die u biedt. Zoals eerder opgemerkt,

kunt u met het formulierontwerp invloed uitoefenen op slordig ingevulde formulieren. Dit is zeker

niet in alle gevallen mogelijk. Formulieren die worden ingevuld op bijvoorbeeld bouwplaatsen, zullen

er vaak niet fraai uitzien. Ook gekopieerde formulieren of met de fax teruggezonden formulieren

zullen bij verwerking meer kopzorgen met zich meebrengen dan originele formulieren. Probeer

kopieën en faxen zoveel mogelijk te voorkomen.

24

Bovenstaande punten vertonen overigens veel parallellen met de type formulieren die benoemd zijn in

hoofdstuk 2. De gestructureerde, semi gestructureerde en ongestructureerde documenten en formulieren.

Vaak is de mate van invloed op het ontwerp en daardoor de uniformiteit, eenduidigheid en de wijze waarop

een document wordt ingevoerd bij een gestructureerd formulier het grootst. Bij ongestructureerde

formulieren is dit veel minder het geval. Juist door hier op in te spelen met uw bedrijfsprocessen, kan ook

hier een behoorlijk rendement worden behaald.

In de regel geldt dat het automatiseren van uw gegevensinvoer snel mogelijk blijkt. Zeker indien uw

organisatie bereidt is het ontwerp en procedures af te stemmen op de technische mogelijkheden.

25

Over DDi en DDi-ers

In deze 24-uurs economie is het aantal mogelijkheden en momenten om als klant te communiceren fors

toegenomen. Veel van deze communicatie vindt nog steeds schriftelijk plaats. Via de e-mail, social media,

web portalen, traditionele post, et cetera. Nagenoeg ieder bericht van je klant is een opdracht aan je

organisatie om wat te doen. Door de verscheidenheid komen deze ‘berichten’ op verschillende plekken en in

verschillende vorm je organisatie binnen. Waar en hoe ze binnenkomen is niet direct voorspelbaar. Waar het

over gaat is niet direct duidelijk. Wie er wat mee moet vaak al helemaal niet. Voordat het bericht bij de juiste

behandelaar(s) ligt is deze al door vele handen gegaan en misschien wel geprint, gekopieerd en/of opnieuw

gescand. Met als gevolg te veel mensen met het ‘document’ bezig zijn i.p.v. de inhoud. Status onderhanden

werk is niet duidelijk. Afdelingen/mensen roepen dat ze het te druk hebben. De klant moet te lang wachten

op reactie (klant gaat misschien klagen dus nog meer werk). Tegelijkertijd leven we in een tijd dat marges

slinken en het aantal documentuitwisselingen groeit. Laatst zei een directeur van een bedrijf tegen mij: “Als ik

mijn informatie processen niet aanpak dan besta ik over twee jaar niet meer”.

Ongetwijfeld herkent niet ieder dienstverlenende organisatie zich in bovenstaande situatie. Gelukkig niet.

Tegelijkertijd komen wij – DDi-ers – dikwijls in contact met organisaties die hier wel mee worstelen en van

deze worstelingen af willen, of zelfs moeten. Dan zijn ze bij DDi Information Automation Engineers aan het

juiste adres. De veelzijdigheid van de DDi software biedt reeds voor vele organisaties een passende oplossing

voor bijvoorbeeld het bovengenoemde vraagstuk. Bovendien (en vanzelfsprekend) beheersen alle DDi-ers de

magie van het data capture en document management vak.

Thom Menssink

Directeur DDi Information Automation Engineers

DDi BV

Binnenweg 18

2132 CT Hoofddorp

The Netherlands

Phone +31 88 567 2000

www.ddi.nl

info@ ddi.nl

KvK Haarlem 34081856

IBAN NL14 RABO 0345 8630 03