Andmed kui kapital. Statistika mõjuvõimust 21. sajandil
-
Upload
eesti-pank -
Category
Economy & Finance
-
view
22 -
download
2
Transcript of Andmed kui kapital. Statistika mõjuvõimust 21. sajandil
17.02.2017
1
Avalik loeng
Jaanus Kroon
12.01.2017
Andmed kui kapital
statistika mõjuvõimust 21. sajandil
Teemad
• Statistikast…
• …ja selle rollist Eesti Pangas
– Statistikaprotsess kui „kvaliteedimärk“
• Statistiliste andmete kui kapitali väärtus on ajas muutuv
– Mis määravad statistikanõudluse ja pakkumise?
• Kokkuvõtteks: peamised väljakutsed
17.02.2017 2
17.02.2017
2
Statistikast…
• Statistika on üks inimkonna vanemaid teadusi. Sellest ajast peale, kui inimene õppis loendama, hakkas ta tegema ka algelist statistikat – võrdlema küttide jahisaaki, püütud kalade arvukust kalastamiskohtades jne.
• Kapital on väärtus või omand, mida saab kasutada lisaväärtuste loomiseks. Kapitaliks võib olla raha, kinnisvara, oskusteave, seadmed, informatsioon jne.
• Andmed on informatsioonikapital!
ühtegi pädevat järeldust majanduse hetkeseisu ja suundumuste kohta ei saa teha ilma statistikata - statistika on aluseks analüüsiprotsessis, poliitikate kujundamisel ja prognooside koostamisel
17.02.2017 3
Statistikast…
• Tõenduspõhine poliitikakujundamine
– poliitika, mis tugineb rangelt objektiivsetele tõenditele
– vähendab “emotsiooni- ja õhinapõhiseid” otsuseid ja viib parema tulemuseni
– asetab (debattides) kesksele kohale statistilised andmed, mida tuleb osata õigesti kasutada
• Alternatiivid
– Huvi- ja survegruppide lobby, poliitilised lubadused, omavoli, korruptsioon …
17.02.2017 4
Kvaliteetsed andmed…
… ja nende hea kasutamine
Kehvad andmed…
… ja nende ebaõige kasutamine
17.02.2017
3
Statistikast…
• Statistika on oluline igas poliitikatsüklis etapis
17.02.2017 5
STATISTIKA Jälgimine, hindamine, järeldused
Poliitikavariantide arendamine ja
otsused
Probleemid, ideed ja
eesmärgid
Millised andmed
?
Statistikast…
17.02.2017 6
• “Andmed on kui uus nafta…”
http://www.rss.org.uk/RSS/Influencing_Change/Data_manifesto/RSS/Influencing_Change/Data_democracy_sub/Data_manifesto.aspx?hkey=5dd70207-82e7-4166-93fd-bcf9a2a1e496
17.02.2017
4
Statistikast…
• Me elame ajastul, mil meid ümbritseb pretsedenditult palju andmeid ning meil on neile ligipääs
– Maailmas tekib iga kahe päevaga sama palju andmeid kui tsivilisatsiooni koidiku ja 2003. aasta vahel
– Andmemaht maailmas kahekordistub iga 18-kuuga
• Avaandmed (open data) on [masinloetavas formaadis] andmed, mis on antud kõigile vabalt ja avalikult kasutamiseks.
– Riiklikud registrid…
• Andmetest statistikani on pikk tee
– Kuidas tagada andmete võrreldavus?
• Rahvusvaheliste organisatsioonide rolliks on standardiseerimine ja harmoniseerimine
• ÜRO, IMF, Euroopa Keskpank, Eurostat, OECD, Rahvusvaheliste arvelduste Pank (BIS), Maailmapank jne
17.02.2017 7
Statistika rollist Eesti Pangas
• Riiklik statistika on avalik teave, mis
– vastab kindlatele põhimõtetele
– arvestab kokkulepitud kvaliteedistandardeid
– on demokraatliku ühiskonna infrastruktuuri osa.
• IMF-i andmelevi standard SDDS (EE 1998)
– Majandus ja rahandusstatistika andmelevi standardi algatuse eestvedaja (sidunud üle 90% maailma riikidest)
„Kui sind ei ole siin, siis ei ole sind olemas“ - riigi peegeldamine läbi statistika
• Statistikategevust loetakse üheks Euroopa Keskpankade Süsteemi üheks põhifunktsiooniks
– Eesti Pank on riikliku statistika tegija Eestis
17.02.2017 8
17.02.2017
5
17.02.2017 9
Statistika rollist Eesti Pangas statistikaprotsess
1.
Vajadus
2.
Metoodi-ka
arendus ja disain
3. Tehnilised
ette-valmis-tused
4. Andmete
kogu-mine ja kontroll
5. Andmete
töötle-mine
6.
Väljundite koosta-mine ja
valideeri-mine
7. Statistika
levita-mine
8.
Analüüs
Väljund
Tarbija
Institutsiooniline
keskkond
•Asjakohasus •Täpsus •Ajakohasus •Õigeaegsus •Kättesaadavus •Selgus •Võrreldavus •Sidusus
•Ametialane sõltumatus •Erapooletus, •Objektiivsus •Usaldusväärsus •Statistiline konfidentsiaalsus •Kulutasuvus
Kvaliteedikriteeriumid
Põhimõtted
Statistika rollist Eesti Pangas kvaliteedistandardid ja hea tava
17.02.2017 Teema 10
17.02.2017
6
Statistika rollist Eesti Pangas statistikavaldkonnad
• Raha- ja finantssektori statistika
• Krediidiasutuste bilansistatistika
• Krediidiasutuste intressistatistika
• Makse- ja arveldussüsteemide statistika
• Hoiu- laenuühistute statistika
• „Varipangandusstatistika“ (liising, tarbijakrediit* jne)
• Välissektori statistikavaldatav statistika
• Maksebilanss
• Välisvarade ja –kohustuste investeerimispositsioon
• Välisvõlastatistika
• Rahvusvaheliste reservide statistika
• Piiriületusstatistika*
• Vahetuskursiindeksite (NEER, REER) statistika
• Finantskontode statistika
• Kodumajapidamiste tarbimisharjumiste uuring (HFCS)
17.02.2017 11
Statistika kui kapitali väärtus on ajas muutuv
• Vajadused (nõudlus) vs võimalused (pakkumine)
– Statistika on „avalik kaup (teenus)“
• Nõudlus statistika järele pidevalt kasvab (kiirus vs kvaliteet)
Iga majanduskriis on toonud kaasa uued statistikaalgatused:
• 1930-ndate majanduskriis: rahvamajanduse arvestus, maksebilanss
• 1990-ndad: Mehhiko kriis: välisinvesteeringute ja -võlaarvestus
• 2008 finantskriis
17.02.2017 12 Pildipank: https://www.dreamstime.com/
17.02.2017
7
13
Järellainetus – Mai 2010 Riikide võlakriisid ja panganduskriis
Investeerimispank Lehman Brothers pankrott ja järgnev sündmusteahel – Sept 2008 Pankade päästmine, riigigarantiid
2008 2009 2010 2011 2012 2013 2014 2015 2016
IMF SDDS+
G-20 andmelünkade
algatus
Statistika kui kapitali väärtus on ajas muutuv
• Andmenõudluse kujunemine viimasel kümnendil
Statistika kui kapitali väärtus on ajas muutuv
• G-20 andmelünkade algatus
Vajadus tuvastada paremini finantssektori riske
Vajadus majanduslikud piiriüleste seoste paremaks tuvastamiseks (globaliseerumine)
Enam tähelepanu siseriiklikele probleemidele (seosed)
Parem statistikaalane kommunikatsioon
• Mõju statistikanõudlusele
Vajadus rohkemate ja detailsemate andmete järele
(granularity)
Vajadus andmeid omavahel seostada: ühtne ID?
Vajadus rohkemate ja paremini hoomatavamate andmete järele: näidikulauad (dashboards, scoreboards)
17.02.2017 14
17.02.2017
8
NÄIDE: Legal Entity Identifier (LEI) ja osapoolte seotus
• Kildandmed (granular data) – üksikandmed kirjeldatava nähtuse kõige detailsemal tasemel
• Kildandmete seostamine (LEI, ISIN, …)
- Kes on kellega finantsiliselt seotud?
- Kus asuvad riskid?
- Milline kaart „kaardimaja“ ohustab
- Kuidas ja kuhu „kaardimaja“ kokkuvarisemise ahel ja nakkused levivad? Doominoefekt?
17.02.2017 15 Pildipank: https://www.dreamstime.com/
17.02.2017 16
NÄIDE: Legal Entity Identifier (LEI) ja osapoolte seotus
1 2 75% Kes keda omab?
Andmemudel
LEI 1 LEI 2
Aktsia ISIN kood
45%
Sisu
LEI 1 hoiab 75%
LEI 2 aktsiatest
17.02.2017
9
17.02.2017 17
NÄIDE: Legal Entity Identifier (LEI) ja osapoolte seotus
17.02.2017 18
Peakorter
NÄIDE: Legal Entity Identifier (LEI) ja osapoolte seotus
17.02.2017
10
Euroopa Keskpanga
väärtpaberite andmebaas
- Kes mida emiteerib?
Väärtpaberiportfelli hoidjate
andmebaas
- Kes mida hoiab?
Emitent A emiteerib väärtpaberi B mida hoiab Investor C väärtuses X EUR
Emitendi
tunnused
ID
Nimi
Majandussektor
Riik
…
Instrumendi
tunnused
ID (ISIN)
Väärtpaberi liik
Emissooni jääk
Hind
…
Investori
tunnused
Sektor
Riik
…
…
…
Andmed
väärtpaberi kohta
Hoitav arv
Summa/väärtus
Reiting
ID (ISIN)
…
19
NÄIDE: ISIN ja osapoolte seotus
NÄIDE: Riikide ja sektoritevahelised seosed
• EKPS-i uued algatused
– Väärtpaberihoidjate statistika ja väärtpaberite keskandmebaas
– EKP krediidiregister
– …
• Eesti uued algatused
– € 1000.- arved EMTA-sse
– Tööregister
– Aruandlus 3.0
– …
17.02.2017 20
17.02.2017
11
Näide: näidikulauad (dashboard’id ja scoreboard’id)
17.02.2017 21
• Andmete üleküllus ja vajadus kiirelt reageerida
– Euroopa Komisjoni Macroeconomic Imbalances Scoreboard (MIP)
– ESRB Risk Dashboard
– …
Statistika kui kapitali väärtus on ajas muutuv
• Uued andmeallikad ja tehnoloogiad pakkumise poolel - BIG DATA
– Sotsiaalmeedia
• Twitter, Facebook, GOOGLE
– Äriinfosüsteemid
• Kaupluste kassasüsteemid
• Arveldusandmed
– Masintekkelised andmed
• Mobiilpositsioneerimine
• Kaardimaksekeskused
• Kiiruskaamerad ja maanteeloendurid
– IT areng
• Andmemahud ei ole probleem
• Automatiseeritus
• E-andmevahetus
17.02.2017 22
Pilt: Cisco
17.02.2017
12
1.
Vajadus
2.
Metoodi-ka
arendus ja disain
3. Tehnilised ettevalmis-
tused
4. Andmete
kogu-mine ja kontroll
5. Andmete
töötle-mine
6.
Väljundite koosta-mine ja
valideeri-mine
7. Statistika
levita-mine
8.
Analüüs
Statistika kui kapitali väärtus on ajas muutuv
• BIG DATA - SUURANDMED
– “Peapeale pööratud” statistikaprotsess
• Mida ja kuidas täpselt teha, sõltub andmetest
– Andmed struktureerimata, „reaalajas“ ja „kohe olemas“
• Eesti Pank: mobiilpositsioneerimine piiriületusstatistika tegemisel (koostöös TÜ OÜ-ga Positium LBS)
• Statistikaamet: energiatarbimisandmete ladu
17.02.2017 23
Statistiliste andmete väärtust kujundab ka „statistiline kirjaoskus“
• Statistika väärkasutus tuleneb tavaliselt andmete ebapiisavast analüüsist ja vähesest huvist tausta vastu
17.02.2017 24
https://xkcd.com/605/
17.02.2017
13
Kokkuvõtteks: peamised väljakutsed
• Digitaalne jalajälg ja info üleküllus
• Statistiline “kirjaoskus” ja andmeesitajate teadlikkus
• Uued tehnoloogilised võimalused, nt avaandmed (open data), suurandmed (big data), masinloetavad andmed, andmete hoidmine pilves, nutiseadmed jms
• Andmeesitus- ja andmeedastusstandardite (SDMX, XML, XBRL jt) areng
• Statistikastandardite areng: statistika sisu ja tähendus on muutumas
– Kildandmed vs näidikulauad
• Konkurents: riiklik statistika vs erapakkujad ja -andmestikud
• Läbipaistvus ja informatiivsus vs privaatsus ja andmekaitse
• Andmete kvaliteet:
– Kildandmed vähendavad asümmeetriaid
– Suurandmete kvaliteet on väljakutse
• Andmetöötlusvõimekuse kasv vs –oskuste proovilepanek
– Data science
17.02.2017 25
Data, data everywhere
Feb 25th 2010 | From The Economist print edition
Chief information officers (CIOs) have become somewhat more prominent in the executive suite, and a new kind of professional has emerged, the data scientist, who combines the skills of software programmer, statistician and storyteller/artist to extract the nuggets of gold hidden under mountains of data. Hal Varian, Google’s chief economist, predicts that the job of statistician will become the “sexiest” around.