Post on 24-Jan-2017
10.11.2016 1
DIGITAALISTEN TIETOAINEISTOJENkansallinen kuvausjärjestelmä
THL, Tilastokeskus, Tietoarkisto, Sitra
10.11.2016 2
SITRAN ISAACUS-
ESITUOTANTOHANKKEITA 2016–2017
TIETOAINEISTOJEN KUVAUKSET JA METADATA
– Digitaalisten tietoaineistojen kansallinen kuvausjärjestelmä.
– THL, Tilastokeskus ja Tietoarkisto (CSC, HUS, VSSHP).
SÄHKÖINEN KÄYTTÖLUPAHAKEMUS- SEKÄINFORMAATIO- JA TUKIPALVELU
– Rekisteritutkimuksille ja eettisille lausunnoille.
– Kansallisarkisto.
ETÄKÄYTTÖJÄRJESTELMÄ
– Tilastokeskus ja THL.
TIETOALTAAT
– HUS, VSSHP, Istekki Oy.
BIOPANKIT
– BBMRI.fi.
Laki sosiaali- ja terveysalan
tutkimus- ja
kehittämiskeskuksen (Stakes)
tilastotoimesta
Muita muuttuvia lakeja:
Henkilötietolaki, Julkisuuslaki, Biopankkilaki, Tartuntatautilaki,
Laki sosiaalihuollon asiakkaan asemasta ja oikeuksista,
Laki kuolemansyyn selvittämisestä,
Laki sähköisestä lääkemääräyksestä
Laki terveydenhuollon
valtakunnallisista
henkilörekistereistä
Laki sosiaali- ja terveystietojen
tietoturvallisesta
hyödyntämisestä
Laki Terveyden ja hyvinvoinnin
laitoksesta annetun lain
muuttamisesta
Tietosuoja-asetusLaki sosiaali- ja terveydenhuollon
asiakastietojen sähköisestä
käsittelystä
Sosiaali- ja
terveydenhuollon
järjestämislaki
Kumottavat lait: Uudet/uudistetut lait:
Säädösympäristön muutoksia:
SOTE-TIETOJEN TOISSIJAISEN KÄYTÖN
LAKITYÖRYHMÄ 1.4.2015–31.12.2016
Kliinisiä lääketutkimuksia koskeva
asetus
EU:
10.11.2016 4
10.11.2016 5
METADATAHANKE
1.7.2016 – 15.12.2017
Aineistojen kuvailu ja kuvailutietojen julkaisu.
Yhtenäisten kuvaustapojen kehittäminen.
Rakennetaan kuvausvälineet, joita voidaan käyttää aineistojen keruuorganisaatioissa.
Roadmap: Metadata tietotuotannon elinkaarta tukemassa.
Tehdään olemassa olevien aineistojen löytäminen ja hyödyntämisen suunnittelu helpoksi tutkijoille ja kehittäjille kuvailutietojen ja hakutermien avulla.
15.11.2016
Tehdään olemassa olevien aineistojen löytäminen ja hyödyntämisen suunnittelu helpoksi tutkijoille ja kehittäjille kuvailutietojen ja hakutermien avulla.
15.11.2016
Rakennetaan yhtenäiset kuvaustavat ja -välineet, joita voidaan käyttää aineistojen keruuorganisaatioissa
15.11.2016 8
ROADMAP: Uusien aineistojen osalta metatietoja aletaan tuottaa aineiston elinkaaren aikana lähtien aineiston suunnitteluvaiheesta
15.11.2016 9
HANKKEEN TÄRKEIMMÄT TUOTOKSET
1. Tietomalli, käsitemalli, arkkitehtuurikuvaus ja keskeistentietokenttien määrittely digitaalisten tietoaineistojenmuuttujatasoisen kuvailun, ylläpidon ja julkaisun tueksi.
2. Hankitaan tai kehitetään muuttujatasoisten aineistojenkuvaus- ja ylläpitotyökalu (kuvauskanta ja metadataeditori).
3. Kehitetään kuvaus- ja ylläpito-ohjeistus rekisterinpitäjillesisältäen tiekartan ohjaavan metadatan(prosessimetadatan) generoinnille ja hyödyntämiselle.
4. Kuvataan valitut pilottiaineistot.
5. Julkaistaan kuvatut aineistot aineistokatalogissa.
6. Siirretään järjestelmä tekniselle ylläpitäjälle.
10.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 10
AIKATAULU
Q4/2016: Julkaistaan 100 THL:n AJR-aineistoa. (Q4/2016.)
Q4/2016: Selvitys metadatatietomalleista ja kansallinentietomalli ja arkkitehtuuri. (iteraatio 2017.)
Q2/2017: Hankitaan/kehitetään IT-työväline metadatankuvailuun.
Q2/2017: Kuvaillaan valitut pilottiaineistot.
Q3/2017: Julkaistaan pilottiaineistot olemassa olevassa tai uudessa metadatakatalogissa.
Q3/2017: Siirretään palvelujen tekninen ylläpito CSC:lle.
2017: Yhteinen kansallinen pilotti etä- ja lupahankkeidenkanssa.
10.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 11
KUVATTAVAT PILOTTIAINEISTOT
AJR-aineistot (THL, 12/2016 – suppeat tiedot)
Terveydenhuollon hoitoilmoitusrekisteri (THL)
Aikuisten terveys-, hyvinvointi- ja palvelututkimus (THL)
Finriski/Finterveys (1992?–) (THL)
Ortopedisten endoproteesien rekisteri (THL+HUS+VSSHP)
Selkäkirurgian rekisteri (HUS+VSSHP)
Kuolemansyytilaston tutkimusaineisto (Tilastokeskus)
Perus-, perhe-, tutkinto-, työssäkäynti- ja tulotietojenvalmismoduulit (Tilastokeskus)
Kelan aineisto: Erityiskorvausoikeuksien tietokanta?
10.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 12
VÄLITUOTOKSET 10.11.2016
1. Nykytilakartoitus ja alustavien testien tulokset 0.5;
2. Metadata-arkkitehtuurikuvaus 0.5;
3. Käsitemalli 0.5;
4. Tietomallin implementointisuunnitelma 0.5;
5. Vaatimusmäärittely 0.5;
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 13
NYKYTILAKARTOITUS 0.5: METATIETOTARPEITA Kansallinen aineistoluettelo-, haku- ja latauspalvelu tietojen
toissijaisille käyttäjille.
Sähköinen käyttölupajärjestelmä/käyttölupakäsittely.
Aineistonhallintasuunnitelma rahoittajalle.
Rekisteriseloste ja tieteellisen tutkimuksen rekisteriseloste.
Muuttuja- ja kysymystietopankki.
Kyselylomakkeiden rakentaminen ja suunnittelu.
Tietopoimintojen määrittely tiedonantajille (esim. Hilmo-tiedonkeruu.)
Tietokantojen metadatakuvaukset.
Eurostatin edellyttämät metadatakuvaukset.
Saatavuustiedot ja suorat jakaumat tietojen käyttäjille.
Tietojen analyysi ja raportointi.
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 14
KYTKENNÄT
Indikaattorimetadata
Julkaisujen metadata
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 15
GSIMHelsinki ModelGSBPMEARPIJHS Rekisteritiedon metatiedotCommon Structure of Statistical Information CoSSIDDI Codebook DDI-CDDI Lifecycle DDI-LMinimum Information About BIobank data Sharing MIABISTTA-minimimetatietomalliATT-metatietomalliMetaformTHL:n AJR-metadataDublin Core Metadata Initiative DCMIData Catalog Vocabulary DCAT
Single Integrated Metadata Structure SIMSStatistical Data and Metadata eXchange SDMXFINTOTEROMESHFinMESHTK:n luokituksetDDI CVsMIABIS-sanastotSKOSXKOSFOAFADMSDDI DiscoORG
Tietoarkisto | www.fsd.uta.fi
16
Mallien arviointi ja valitseminen: yleisiä kriteereitä
sisältää tarvittavat tietoelementit resurssin kuvailuun
sisältää mahdollisuuden kontrolloida/rajoittaa tietoelementtien sisältöä
pitää tukea sanastojen/sovittujen koodien käyttöä
pitää tukea metadatan ja kuvailtavien objektien versiointia
pitää tukea PIDien käyttöä
pitää olla käyttäjäyhteisö
pitää olla dokumentoitu, saatavilla ohjeistusta ja esimerkkejä
standardilla pitää olla kehittäjä/ylläpitäjäyhteisö
avoin, ei-kaupallinen
Tietoarkisto | www.fsd.uta.fi
17
NYKYTILAKARTOITUS 0.5
Termieditori (THL)
TopBraid-sanastoeditori (kaupallinen)
Muuttujaeditoridemo (Tilastokeskus)
Colectica (kaupallinen)
Luokituseditori (Tilastokeskus)
Metka (Tietoarkisto)
DDI Disco -editoriproto (THL)
Lomakepalvelu (THL)
Metaform (THL)
AJR (THL)
RUT/Metadataverktyg (Vetenskapsrådet, Ruotsi)
15.11.2016 18
JÄRJESTELMÄN ARKKITEHTUURI JA KANSALLINEN VIITEKEHYS 0.5
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 19
VAATIMUSMÄÄRITTELY 0.5
Aineistokuvausten kansallinen kuvauskanta
Aineisto- ja muuttujatason metatietoeditori
Kansallinen aineistokatalogi
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 20
KÄSITEMALLI 0.5
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 21
TIETOMALLIN IMPLEMENTOINTISUUNNITELMA 0.5
10.11.2016 22
AINEISTOTYYPPI KUVAUS
Valtakunnalliset keskusrekisterit THL, Kela, Tilastokeskus, Väestörekisterikeskus,
jne.
Kanta Valtakunnallinen potilastiedon arkisto ja
sähköinen resepti
Kliiniset potilasaineistot Tietoaltaista tai lähdejärjestelmistä
Kliiniset laaturekisterit Rakenteiset kliiniset sairaus- ja
toimenpidekohtaiset rekisterit
Väestötutkimukset FinTerveys/Finriski, Aikuisten terveys-,
hyvinvointi- ja palvelututkimus ATH, jne.
Muut tutkimus- ja näyteaineistot Yksittäiset poikkileikkaus- ja
pitkittäistutkimusaineistot
MyData OmaKannan/PHR:n ja appsien tiedot
Biopankkeihin siirretyt näytteet
ja tiedot
Biopankkilain mukaisesti biopankkien
(palveluoperaattorin?) kautta
SEURAAVAT ASKELEET
• 9.11.–16.11. Välituotosten kommenttikierros.• 30.11. Nykytilaselvitys 1.0 valmis.• 13.12 Kansallisen kuvauskannan, editorin ja katalogin vaatimusmäärittely, v. 1.0. valmis.
• 13.12 Metadata-arkkitehtuurikuvaus, v. 1.0 valmis. • 13.12 Tietomallin implementointisuunnitelma, v. 1.0 valmis.
• 13.12. 100 AJR-aineistoa julkaistaan THL.fi:ssä.• Marras-joulukuu: IT-työn tilauksen valmistelu.• 31.1.2017. Käsitemalli, v. 1.0 valmis.
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 23
KOMMENTTIKIERROS (1/5)
1) Metadata-arkkitehtuuri 0.5. Arkkitehtuuridokumenttiluonnoksessa ehdotetaan, että rakennetaan kansallinen aineistokuvausten kuvauskanta. Kuvauskantaan voidaan tuoda rajapinnan kautta valmiita metadatakuvauksia organisaatioiden omista kuvauskannoista tai kehitettävällä metadataeditorilla. Keskeisimmillä tietoja hallinnoivilla organisaatioilla, kuten Tilastokeskuksella ja THL:llä, olisi omat versionsa metadataeditorista. Kansallisia kuvauksia julkaistaisiin kansallisessa aineistokatalogissa ja niitä voitaisiin hyödyntää myös muihin käyttötarkoituksiin. Mitä mieltä olet arkkitehtuurimallin toimivuudesta?
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 24
KOMMENTTIKIERROS (2/5)
2) Mitä mieltä olet suunniteltujen välineiden (kuvauskanta, metadataeditori, kansallinen metadatakatalogi) tarpeellisuudesta ja niille esitetyistä vaatimuksista?
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 25
KOMMENTTIKIERROS (3/5)
3) Käsitemalli 0.5. Tuotettu käsitemalliluonnos on rakennettu lähtien liikkeelle jo olemassa olevista aineistokatalogeista, eikä olemassa olevista standardeista. Katalogeihin perustuvaa mallia on työstetty eteenpäin ja täydennetty eräillä GSIM-mallin piirteillä.Toinen tapa olisi ollut lähteä liikkeelle jostakin valmiista standardista, ja määritellä käsitemalli siitä lähtien. Kummallakin lähestymistavalla on vahvuutensa ja heikkoutensa. Onko valittu tapa oikea? Miksi? Jos käsitemallin pohjana tulee olla jokin standardi, mikä ja mistä syystä?
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 26
KOMMENTTIKIERROS (4/5)
4) Ehdotettu arkkitehtuuri- ja käsitemalli edellyttävät nykyiset organisaatiorajat ylittävää hallintamallia. Kansallisesti ylläpidettävä metadatakokonaisuus vaatisi eri organisaatioiden yhteistoimintaa. Lähdetäänkö organisaatiorajat ylittävän hallintamallin tielle, vai onko tämä liian kunnianhimoinen tavoite? Pystyvätkö suomalaiset julkishallinnon organisaatiot yhdessä pitämään yllä kansallista tietoaineistojen metadataa? Mikä voisi olla vaihtoehtoinen malli?
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 27
KOMMENTTIKIERROS (5/5)
5) Onko dokumenteissa asioita, joita ei ole vielä osattu ottaa lainkaan huomioon? Mitä?
15.11.2016 THL, Tilastokeskus, Tietoarkisto, Sitra 28
10.11.2016 29
KIITOS!
10.11.2016 30
Yhteydenotot:
Arto.Vuori@thl.fi thl.fi