Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

24
Big Data™: Wat ruist er door uw data-zee ? ISACA NL Roundtable Breukelen, 3 juni 2013

description

Wat er mis is met 'big'data maar wel lukt met smart data (niet de data, maar de analist moet (extreem) smart zijn...)

Transcript of Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Page 1: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Big Data™:

Wat ruist erdoor uw data-zee ?

ISACA NL RoundtableBreukelen, 3 juni 2013

Page 2: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Introductie

Page 3: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Agenda

• Big Data™ is ideaal• Echter• Vroeger was alles beter• En recent• Smart data

Page 4: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Agenda

• Big Data™ is ideaal• Echter• Vroeger was alles beter• En recent• Smart data

Page 5: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03
Page 6: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Moto Moto

“I like ‘em Big … I like ‘em chunky! ”

Page 7: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Kohonen et al.

• Al sinds de 80ies• Nog geen “Big” data• PoC: Credit cards

(… nog steeds!)

• Nu echter wel Big ..?(Yottabytes aan socmed-data)

Page 8: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

• Hadoop, HBase, HDFS, Hive clusters; Cascading,• MongoDB, NoSQL, Cassandra CQL, Redis, Riak, CouchDB, Neo4j

• Continuuity, Google Prediction API, BigQuery, Wukong, Kontagent• Mortar Data, Placed Analytics, Precog (Labcoat, Quirrel), R• Spring for (Apache) Hadoop, Statsmix, Rush Analytics by Pervasive• Scribe, ElasticSearch,

• Pentaho• Jaspersoft BI Suite• Karmasphere Studio / Analyst on Eclipse• Talend Open Studio• Skytree Server• Tableau• Splunk

Page 9: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Agenda

• Big Data™ is ideaal• Echter• Vroeger was alles beter• En recent• Smart data

Page 10: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Echter

• Bijna niemand gebruikt Twitter• En dan nog zeer gevarieerd

• Ja, bedoeling: data chaos → hidden signals• Ja er zijn ‘succesjes’ (Tesco)

• Maar incidenteel (of…?)

Page 11: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Voornaamste bezwaar

Page 12: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Tevens

• Ruis in data• ‘Spurious’ resultaten

(Statistisch zeker dat die eruit komen)• ‘Biased’ data

• Systematisch• Incomplete data (nog steeds)

• Correlatie … causatie !?

Page 13: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Agenda

• Big Data™ is ideaal• Echter• Vroeger was alles beter• En recent• Smart data

Page 14: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Deductie (?)

• Oorzaak / gevolg• Reden / actie

DoelDoel

Page 15: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Agenda

• Big Data™ is ideaal• Echter• Vroeger was alles beter• En recent• Smart data

Page 16: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Al geprobeerd; refresher• MIS → (‘MIS is a mirage’)

• Data Warehousing(Hypercubes et al.) → …?

• Business Intelligence → …?

• Janee... Maar nú …• Predictive Analytics (sic);

volume, variety, velocity

Page 17: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Agenda

• Big Data™ is ideaal• Echter• Vroeger was alles beter• En recent• Smart data

Page 18: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Get Real• Tesco et al.

→ ‘Big Data’ met héél veel analisten erachter→ Kennis-intensief; diepe kennis

• Statistiek; ruis; verdeling→ Inzicht

• Smart Data• Accountancy: Process Mining• ‘Intelligent analysis’ = Back to the 80’s• Social CRM• Zie tools: Hoop ‘klassiek’ handwerk

Page 19: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Agenda

• Big Data™ is ideaal• Echter• Vroeger was alles beter• En recent• Smart data

Page 20: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Conclusie: Karel Appel

“Ik rotzooi maar wat an”

Page 21: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Dus:

• Niks nieuws (? Nu wel massieve data)• Big Data inderdaad hype• Smart Data (klassiek) werkt

• Overschatting k.t.• Onderschatting l.t.

• … → Machine learning / Watson, Google Glass, Internet of Things, …• … → Singularity, …

Page 22: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03
Page 23: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

Dank u

Page 24: Wat ruist er door uw data-zee ISACA NL roundtable 2013 06 03

• Jurgen = Ir.drs. J. van der Vlugt RE CISA CRISC• Maverisk Consultancy, IS Audit and Advisory servicesTemporarily for courses, etc., only

• ERM/ORM, (IS) Audit, (Info)Security, Futuring

• Member, ISACA (NL), ISSA (NL), PvIB, NOREA• President, member Ethics Committee, ISSA NL• Subject Matter Expert Operational Risk and Cyber/IT Risk Advisory Groups, PRMIA

[email protected]• LinkedIn http://nl.linkedin.com/in/jurgenvandervlugt/• Twitter @jvdvlugt• (G+, tumblr, etc.etc.)

“I hate quotations”(Ralph Waldo Emerson 1849, quoted by among others Rem Koolhaas in S, M, L, XL, 1995)