Risico geclassificeerd werken naar een data gedreven organisatie voor meer business value.
-
Upload
sogeti-nederland-bv -
Category
Data & Analytics
-
view
710 -
download
1
description
Transcript of Risico geclassificeerd werken naar een data gedreven organisatie voor meer business value.
Elke burger en bedrijf krijgt de aandacht die
hij/zij verdient
Ontwikkeling van een risicoclassificatiemodel, op weg
naar meer businessvalue
24 november 2014 Martijn Scheele B/CA - BICC Paul van Egmond B/CA - AFB
2
3 3
Overige volumes
• We betalen uit:
> BTW € 22 mld
> Teruggaven IH € 12 mld
> Toeslagen € 11 mld
• Aantal burgers met een aangifte IH 7,8 mio
• Aantal burgers met Toeslagen 7,1 mio
• Aantal ondernemers 1,6 mio
• Aantal bezoeken Internetsites 44 mio
• Aantal telefoongesprekken 17 mio
• Aantal medewerkers 30.000
Elke burger en bedrijf krijgt de aandacht die hij/zij verdient
Elke burger en bedrijf krijgt de aandacht die hij/zij verdient
6
Opdracht
X
8
Data driven organisatie, kijk vanuit analytics
•
van standaard analyse naar ‘wat vertelt en voorspelt de data jou’
Greenlane
USER ROLES & THE ANALYTICS LIFECYCLE
•IDENTIFY /
•FORMULATE
•PROBLEM
•DATA
•PREPARATION
•DATA
•EXPLORATION
•TRANSFORM
•& SELECT
•BUILD
•MODEL
•VALIDATE
•MODEL
•DEPLOY
•MODEL
•EVALUATE /
•MONITOR
•RESULTS
•Domain Expert
•Makes Decisions
•Evaluates Processes and ROI
•BUSINESS
•MANAGER
•Model Validation
•Model Deployment
•Data Preparation
•IT SYSTEMS /
•MANAGEMENT
•Data Exploration
•Data Visualization
•Report Creation
•BUSINESS
ANALYST
•Exploratory Analysis
•Descriptive Segmentation
•Predictive Modeling
•ANALYST
•DATA
SCIENTIST
10
Statistisch model / machinaal leren.
• Supervised learning
• Gedrag uit het verleden bij IH en TSL is basis: > Trainingsset met foute en goede gevallen IH en TSL (totaal
52.000 stuks)
• Databronnen ontsluiten
• Data vertalen naar indicatoren
• Indicatoren programmeren
• Beslisbomen modelleren
• Model draaien op totale populatie (scoring)
• Steekproef validatie door toezichtsmedewerkers
• Resultaten validatie terugbrengen in het model
Indicatoren model
Antifraudebox 11
BRP
Geo-gegevens
Auto
Inkomen
Logistiek
Woning
CBS
Schulden/ betalings- gedrag
Werk-gevers
Aangifte-gedrag
12
Uitkomsten
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
1-10% 10-20% 20-30% 30-40% 40-50% 50-60% 60-70% 70-80% 80-90% 90-100%
Freq
uen
tie
Voorspelde kans op non-compliance
# BSN
nummers
Antifraudebox 13
Minder dossiers behandelen zonder
opbrengst
Omvang inzet (tijdelijke) medewerkers ▼ Tevredenheid ▲
Eerlijkheid/rechtsgelijkheid ▲
Samen met classificatie op de inhoud van een aangifte: hit-
rate van 25% naar 80% (voorbeeld)
Staatskas ▲ Enthousiasme ▲ Efficiëntie ▲ Proactief ▲
Goed nagedacht over privacy en security
Gevolgen voor de medewerkers
14
Business Value
• Gegevens centraal – aanpassing architectuur
• Data driven mindset
• Massaal proces: eerste indicatie aanbrengen aan de poort = beter kiezen !