Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

14
17.02.2017 1 Avalik loeng Jaanus Kroon 12.01.2017 Andmed kui kapital statistika mõjuvõimust 21. sajandil Teemad Statistikast… …ja selle rollist Eesti Pangas Statistikaprotsess kui „kvaliteedimärk“ Statistiliste andmete kui kapitali väärtus on ajas muutuv Mis määravad statistikanõudluse ja pakkumise? Kokkuvõtteks: peamised väljakutsed 17.02.2017 2

Transcript of Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

Page 1: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

1

Avalik loeng

Jaanus Kroon

12.01.2017

Andmed kui kapital

statistika mõjuvõimust 21. sajandil

Teemad

• Statistikast…

• …ja selle rollist Eesti Pangas

– Statistikaprotsess kui „kvaliteedimärk“

• Statistiliste andmete kui kapitali väärtus on ajas muutuv

– Mis määravad statistikanõudluse ja pakkumise?

• Kokkuvõtteks: peamised väljakutsed

17.02.2017 2

Page 2: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

2

Statistikast…

• Statistika on üks inimkonna vanemaid teadusi. Sellest ajast peale, kui inimene õppis loendama, hakkas ta tegema ka algelist statistikat – võrdlema küttide jahisaaki, püütud kalade arvukust kalastamiskohtades jne.

• Kapital on väärtus või omand, mida saab kasutada lisaväärtuste loomiseks. Kapitaliks võib olla raha, kinnisvara, oskusteave, seadmed, informatsioon jne.

• Andmed on informatsioonikapital!

ühtegi pädevat järeldust majanduse hetkeseisu ja suundumuste kohta ei saa teha ilma statistikata - statistika on aluseks analüüsiprotsessis, poliitikate kujundamisel ja prognooside koostamisel

17.02.2017 3

Statistikast…

• Tõenduspõhine poliitikakujundamine

– poliitika, mis tugineb rangelt objektiivsetele tõenditele

– vähendab “emotsiooni- ja õhinapõhiseid” otsuseid ja viib parema tulemuseni

– asetab (debattides) kesksele kohale statistilised andmed, mida tuleb osata õigesti kasutada

• Alternatiivid

– Huvi- ja survegruppide lobby, poliitilised lubadused, omavoli, korruptsioon …

17.02.2017 4

Kvaliteetsed andmed…

… ja nende hea kasutamine

Kehvad andmed…

… ja nende ebaõige kasutamine

Page 3: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

3

Statistikast…

• Statistika on oluline igas poliitikatsüklis etapis

17.02.2017 5

STATISTIKA Jälgimine, hindamine, järeldused

Poliitikavariantide arendamine ja

otsused

Probleemid, ideed ja

eesmärgid

Millised andmed

?

Statistikast…

17.02.2017 6

• “Andmed on kui uus nafta…”

http://www.rss.org.uk/RSS/Influencing_Change/Data_manifesto/RSS/Influencing_Change/Data_democracy_sub/Data_manifesto.aspx?hkey=5dd70207-82e7-4166-93fd-bcf9a2a1e496

Page 4: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

4

Statistikast…

• Me elame ajastul, mil meid ümbritseb pretsedenditult palju andmeid ning meil on neile ligipääs

– Maailmas tekib iga kahe päevaga sama palju andmeid kui tsivilisatsiooni koidiku ja 2003. aasta vahel

– Andmemaht maailmas kahekordistub iga 18-kuuga

• Avaandmed (open data) on [masinloetavas formaadis] andmed, mis on antud kõigile vabalt ja avalikult kasutamiseks.

– Riiklikud registrid…

• Andmetest statistikani on pikk tee

– Kuidas tagada andmete võrreldavus?

• Rahvusvaheliste organisatsioonide rolliks on standardiseerimine ja harmoniseerimine

• ÜRO, IMF, Euroopa Keskpank, Eurostat, OECD, Rahvusvaheliste arvelduste Pank (BIS), Maailmapank jne

17.02.2017 7

Statistika rollist Eesti Pangas

• Riiklik statistika on avalik teave, mis

– vastab kindlatele põhimõtetele

– arvestab kokkulepitud kvaliteedistandardeid

– on demokraatliku ühiskonna infrastruktuuri osa.

• IMF-i andmelevi standard SDDS (EE 1998)

– Majandus ja rahandusstatistika andmelevi standardi algatuse eestvedaja (sidunud üle 90% maailma riikidest)

„Kui sind ei ole siin, siis ei ole sind olemas“ - riigi peegeldamine läbi statistika

• Statistikategevust loetakse üheks Euroopa Keskpankade Süsteemi üheks põhifunktsiooniks

– Eesti Pank on riikliku statistika tegija Eestis

17.02.2017 8

Page 5: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

5

17.02.2017 9

Statistika rollist Eesti Pangas statistikaprotsess

1.

Vajadus

2.

Metoodi-ka

arendus ja disain

3. Tehnilised

ette-valmis-tused

4. Andmete

kogu-mine ja kontroll

5. Andmete

töötle-mine

6.

Väljundite koosta-mine ja

valideeri-mine

7. Statistika

levita-mine

8.

Analüüs

Väljund

Tarbija

Institutsiooniline

keskkond

•Asjakohasus •Täpsus •Ajakohasus •Õigeaegsus •Kättesaadavus •Selgus •Võrreldavus •Sidusus

•Ametialane sõltumatus •Erapooletus, •Objektiivsus •Usaldusväärsus •Statistiline konfidentsiaalsus •Kulutasuvus

Kvaliteedikriteeriumid

Põhimõtted

Statistika rollist Eesti Pangas kvaliteedistandardid ja hea tava

17.02.2017 Teema 10

Page 6: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

6

Statistika rollist Eesti Pangas statistikavaldkonnad

• Raha- ja finantssektori statistika

• Krediidiasutuste bilansistatistika

• Krediidiasutuste intressistatistika

• Makse- ja arveldussüsteemide statistika

• Hoiu- laenuühistute statistika

• „Varipangandusstatistika“ (liising, tarbijakrediit* jne)

• Välissektori statistikavaldatav statistika

• Maksebilanss

• Välisvarade ja –kohustuste investeerimispositsioon

• Välisvõlastatistika

• Rahvusvaheliste reservide statistika

• Piiriületusstatistika*

• Vahetuskursiindeksite (NEER, REER) statistika

• Finantskontode statistika

• Kodumajapidamiste tarbimisharjumiste uuring (HFCS)

17.02.2017 11

Statistika kui kapitali väärtus on ajas muutuv

• Vajadused (nõudlus) vs võimalused (pakkumine)

– Statistika on „avalik kaup (teenus)“

• Nõudlus statistika järele pidevalt kasvab (kiirus vs kvaliteet)

Iga majanduskriis on toonud kaasa uued statistikaalgatused:

• 1930-ndate majanduskriis: rahvamajanduse arvestus, maksebilanss

• 1990-ndad: Mehhiko kriis: välisinvesteeringute ja -võlaarvestus

• 2008 finantskriis

17.02.2017 12 Pildipank: https://www.dreamstime.com/

Page 7: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

7

13

Järellainetus – Mai 2010 Riikide võlakriisid ja panganduskriis

Investeerimispank Lehman Brothers pankrott ja järgnev sündmusteahel – Sept 2008 Pankade päästmine, riigigarantiid

2008 2009 2010 2011 2012 2013 2014 2015 2016

IMF SDDS+

G-20 andmelünkade

algatus

Statistika kui kapitali väärtus on ajas muutuv

• Andmenõudluse kujunemine viimasel kümnendil

Statistika kui kapitali väärtus on ajas muutuv

• G-20 andmelünkade algatus

Vajadus tuvastada paremini finantssektori riske

Vajadus majanduslikud piiriüleste seoste paremaks tuvastamiseks (globaliseerumine)

Enam tähelepanu siseriiklikele probleemidele (seosed)

Parem statistikaalane kommunikatsioon

• Mõju statistikanõudlusele

Vajadus rohkemate ja detailsemate andmete järele

(granularity)

Vajadus andmeid omavahel seostada: ühtne ID?

Vajadus rohkemate ja paremini hoomatavamate andmete järele: näidikulauad (dashboards, scoreboards)

17.02.2017 14

Page 8: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

8

NÄIDE: Legal Entity Identifier (LEI) ja osapoolte seotus

• Kildandmed (granular data) – üksikandmed kirjeldatava nähtuse kõige detailsemal tasemel

• Kildandmete seostamine (LEI, ISIN, …)

- Kes on kellega finantsiliselt seotud?

- Kus asuvad riskid?

- Milline kaart „kaardimaja“ ohustab

- Kuidas ja kuhu „kaardimaja“ kokkuvarisemise ahel ja nakkused levivad? Doominoefekt?

17.02.2017 15 Pildipank: https://www.dreamstime.com/

17.02.2017 16

NÄIDE: Legal Entity Identifier (LEI) ja osapoolte seotus

1 2 75% Kes keda omab?

Andmemudel

LEI 1 LEI 2

Aktsia ISIN kood

45%

Sisu

LEI 1 hoiab 75%

LEI 2 aktsiatest

Page 9: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

9

17.02.2017 17

NÄIDE: Legal Entity Identifier (LEI) ja osapoolte seotus

17.02.2017 18

Peakorter

NÄIDE: Legal Entity Identifier (LEI) ja osapoolte seotus

Page 10: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

10

Euroopa Keskpanga

väärtpaberite andmebaas

- Kes mida emiteerib?

Väärtpaberiportfelli hoidjate

andmebaas

- Kes mida hoiab?

Emitent A emiteerib väärtpaberi B mida hoiab Investor C väärtuses X EUR

Emitendi

tunnused

ID

Nimi

Majandussektor

Riik

Instrumendi

tunnused

ID (ISIN)

Väärtpaberi liik

Emissooni jääk

Hind

Investori

tunnused

Sektor

Riik

Andmed

väärtpaberi kohta

Hoitav arv

Summa/väärtus

Reiting

ID (ISIN)

19

NÄIDE: ISIN ja osapoolte seotus

NÄIDE: Riikide ja sektoritevahelised seosed

• EKPS-i uued algatused

– Väärtpaberihoidjate statistika ja väärtpaberite keskandmebaas

– EKP krediidiregister

– …

• Eesti uued algatused

– € 1000.- arved EMTA-sse

– Tööregister

– Aruandlus 3.0

– …

17.02.2017 20

Page 11: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

11

Näide: näidikulauad (dashboard’id ja scoreboard’id)

17.02.2017 21

• Andmete üleküllus ja vajadus kiirelt reageerida

– Euroopa Komisjoni Macroeconomic Imbalances Scoreboard (MIP)

– ESRB Risk Dashboard

– …

Statistika kui kapitali väärtus on ajas muutuv

• Uued andmeallikad ja tehnoloogiad pakkumise poolel - BIG DATA

– Sotsiaalmeedia

• Twitter, Facebook, GOOGLE

– Äriinfosüsteemid

• Kaupluste kassasüsteemid

• Arveldusandmed

– Masintekkelised andmed

• Mobiilpositsioneerimine

• Kaardimaksekeskused

• Kiiruskaamerad ja maanteeloendurid

– IT areng

• Andmemahud ei ole probleem

• Automatiseeritus

• E-andmevahetus

17.02.2017 22

Pilt: Cisco

Page 12: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

12

1.

Vajadus

2.

Metoodi-ka

arendus ja disain

3. Tehnilised ettevalmis-

tused

4. Andmete

kogu-mine ja kontroll

5. Andmete

töötle-mine

6.

Väljundite koosta-mine ja

valideeri-mine

7. Statistika

levita-mine

8.

Analüüs

Statistika kui kapitali väärtus on ajas muutuv

• BIG DATA - SUURANDMED

– “Peapeale pööratud” statistikaprotsess

• Mida ja kuidas täpselt teha, sõltub andmetest

– Andmed struktureerimata, „reaalajas“ ja „kohe olemas“

• Eesti Pank: mobiilpositsioneerimine piiriületusstatistika tegemisel (koostöös TÜ OÜ-ga Positium LBS)

• Statistikaamet: energiatarbimisandmete ladu

17.02.2017 23

Statistiliste andmete väärtust kujundab ka „statistiline kirjaoskus“

• Statistika väärkasutus tuleneb tavaliselt andmete ebapiisavast analüüsist ja vähesest huvist tausta vastu

17.02.2017 24

https://xkcd.com/605/

Page 13: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

13

Kokkuvõtteks: peamised väljakutsed

• Digitaalne jalajälg ja info üleküllus

• Statistiline “kirjaoskus” ja andmeesitajate teadlikkus

• Uued tehnoloogilised võimalused, nt avaandmed (open data), suurandmed (big data), masinloetavad andmed, andmete hoidmine pilves, nutiseadmed jms

• Andmeesitus- ja andmeedastusstandardite (SDMX, XML, XBRL jt) areng

• Statistikastandardite areng: statistika sisu ja tähendus on muutumas

– Kildandmed vs näidikulauad

• Konkurents: riiklik statistika vs erapakkujad ja -andmestikud

• Läbipaistvus ja informatiivsus vs privaatsus ja andmekaitse

• Andmete kvaliteet:

– Kildandmed vähendavad asümmeetriaid

– Suurandmete kvaliteet on väljakutse

• Andmetöötlusvõimekuse kasv vs –oskuste proovilepanek

– Data science

17.02.2017 25

Data, data everywhere

Feb 25th 2010 | From The Economist print edition

Chief information officers (CIOs) have become somewhat more prominent in the executive suite, and a new kind of professional has emerged, the data scientist, who combines the skills of software programmer, statistician and storyteller/artist to extract the nuggets of gold hidden under mountains of data. Hal Varian, Google’s chief economist, predicts that the job of statistician will become the “sexiest” around.

Page 14: Andmed kui kapital. Statistika mõjuvõimust 21. sajandil

17.02.2017

14

Tänan! [email protected]

17.02.2017 27