Talent Base - Tiedon standardisoinnin merkitys MDM hankkeelle
-
Upload
talent-base-oy -
Category
Documents
-
view
354 -
download
1
description
Transcript of Talent Base - Tiedon standardisoinnin merkitys MDM hankkeelle
Tiedon standardisoinnin merkitys MDM
hankkeelle
Heimo Hänninen
Senior Consultant, Data modeling
Talent Base Oy, Finland
http://www.talentbase.fi
Sisältö
• AIHE: Standardointi pohjana älykkäälle päätöksenteolle
• MOTIVOINTI: Datan standardoinnin merkitys
• MITEN semantiikka liittyy datan standardointiin?
• CASET: Huonot ja Hyvät
• MITÄ on datan standardointi (MDM kontekstissa)?
• MITEN yhteinen kieli otetaan käyttöön
• YHTEENVETO
30% of people’s time is spent searching for relevant information
40% of IT budgets may be spent on integration
IBM (2005)
Eckerson, (2002)
Huonosta tiedon
laadusta aiheutuu USA:n yrityksille 600 miljardin
kulut vuodessa.
Dama Finland (2012)
Suomessa kulut tiedon
huonosta laadusta arvioidaan olevan yli
10 miljardia vuodessa.
• Myyjä halusi myydä 1 osakkeen 600,000 jenillä
• Myi 600,000 osaketta 1 jenillä • $347 miljoonan tappio
Mizuho Securities (2005)
Mistä huono data tulee?
• Lähde: TDWI.
Mitä huono data on yleisesti?
• Lähde: TDWI.
Opiskele lisää: Dama Finland raportti: http://tinyurl.com/data-rapsa
Datan standardoinnin merkitys
Home Depot NSN Operaattori portaali PDM datan automatisoitu käyttö: • Tuoterakenteen
mukainen navigointi • Monipuoliset filtterit
hauille • Tuotekonteksti
dokumenteille • Automatisoitu sisällön
päivitys Lähdejärjestelmien standardoitu integrointi: • PDM, CMS
Kuinka tehdään laadukasta dataa
• Virhetarkastus syötettäessä
• Syöte suoraan tietotokantaan – ei excel suhmurointia
• Tiedon luokitus käyttöön, joka määrittää:
– Validoinnin ja luotettavuustason
– Arvo/kustannus –indeksin
– Semanttisen jaottelun (mistä data kertoo, relevanssi)
• Käyttäjille suora kanava antaa palautetta:
– Hyödyllisyys
– Virheiden korjaus
• “Siivouspalvelu” osaksi prosesseja (hyödytön, vähän käytetty
sivummalle ja huono data pois)
Miten arvioida tiedon laatu?
Laadun mittaaminen ja arviointi perustuu aina sovittuun tietostandardiin
• Ajantasaisuus - Onko tieto ajan tasalla ja saatavissa oikeaan aikaan?
• Tietueiden yksilöllisyys- Kuinka monta tarpeetonta esiintymää
samasta tietueesta on?
• Täyttöaste - Kuinka suuri osa halutuista tiedoista on olemassa?
• Paikkansapitävyys - Kuinka oikeaa tietosisältö on? Kuinka hyvin se
vastaa todellisuutta?
• Muodon oikeellisuus - Onko tieto oikeassa muodossa?
• Yhdenmukaisuus - Onko tieto yhdenmukaista eri järjestelmissä
• Eheys - Ovatko viittaukset tietojen välillä oikein kaikissa
järjestelmissä?
• Kattavuus - Kuinka hyvin olemassa oleva tieto kattaa valitun alueen?
Informaationhallinta haastaa sinut
30% of people’s time is spent searching for
relevant information
Only one-third of CFOs believe that the information is
easy to use, tailored, cost-effective or integrated
17% of IT budgets for storage hardware and storage management software and people
More than 60% of CEOs believe their business needs to access and understand information faster to make swift decisions
30–50% of design time is copy management
85% of information is unstructured
Documents
Transactions
Customers
Partners
Employees
Organizations
Financials
Products
E-mails
Databases
Media
Web content
Reports
37% growth of disk storage in 2005
40% of IT budgets may be spent on integration
Source: IBM
Faktapohjainen päätöksenteko
Konseptuaalinen
Looginen
Konkreettinen
Tietoarkkitehtuurin
tasot
Päätöksenteko
Tietämys
Opiskele lisää TalentBase.fi Blogi: Binding Information Layers to Strategy
Data
Olio - Data - Informaatio - Tietämys • Todellinen olio/asia
– Fyysinen tai abstrakti olio, olemassa vaikka siitä kertova data tuhotaan
– Oliolla on ominaisuuksia (faktat, piirteet)
• Data
– Tallennetut faktat maailmasta
– On olemassa, vaikka siitä tehty informaatio tuhotaan
• Informaatio
– Tallennettua ja usein prosessoitua Dataa
– Tehty datan välittämiseksi jossakin kontekstissa johonkin tarpeeseen
• Tietämys
– Kaikki mitä me tiedämme, tulkinta maailmasta kaikilla aisteilla
– Muodostuu datan, Informaation ja vanhan tietämyksen pohjalta
– Jonka avulla teemme päätöksiä
– Aina henkilökohtaista (kokemukset, odotukset, pelot, uskomusjärjestelmä, tilanne)
Älykäs organisaatio – tiedon tasot Ihminen Organisaatio
140 cm
Olen Pekka
Ostan sopivat varusteet Pekalle
Päätökset • Tietämys, oppiminen
• Bisnes konteksti
Kommunikointi-
kyvykkyys • Konseptit
• Entiteetti, relaatio, attr.
Informaatio • Kooste tarpeeseen
• Yhteiset termit, data
Tosimaailma • Aidot oliot
• Faktat
Teot
FC Honka:
Pekka: 140 cm
40kg, puolustaja
Kenkä: 39
Pelaajat
Isoin alennus parhaimmalle
asiakkaalle
T&K kanava
tuote tuotanto
myynti asiakas
materiaalit
tarve
sijainti
ERP CRM
ERP
CMS
intra PDM
Data-integraatio
Tietämys-integraatio
pelaaja
varuste sää
peli
kenttä
Standardoinnin tasot
• Liiketoiminnan ontologia • Domain-malli • Objekti-malli • IA & bisnes entiteetit
• MDM avaintiedot • Tietomallit (rakenne) • Taksonomiat • Referenssisanastot
• Tietotyyppi (formaatti) • Tallennusmuoto,-paikka
Abstraktiotaso &
Semantiikan määrä
Ymmärrämme käyttötarkoituksen. Miksi tämä data?
Ymmärrämme sisällön ja hallinnan.
Mitä , kuka jne.?
Määritämme sisällön tarkasti.
Missä,miten jne.?
Datan määrä
Maailma – maailmankuva - tietomalli
Aito olio
-kaikki piirteet
-kaikki ominaisuudet
-ympäristössä
Konseptuaalinen
kuvaus
-olennaiset piirteet
-valitut ominaisuudet
-rajattu konteksti
Ihminen @nimi
@rooli
@pituus
@paino
@sukupuoli
@pelinumero Datamalli (looginen)
-luokka
-keskeiset attribuutit
-tietotyypit
Pelaaja
Miten data standardoidaan
@Pituus
Henkilön pituus
• Yksikkö: cm (SI)
• Formaatti: INT [000]
• Omistajuus: kouluterveydenhoitaja
• Sääntö: – Mitataan vuosittain kantapäästä
päälakeen, siten että seistään seinää vasten kasvot/katse sunnattuna suoraa eteenpäin (horisontaalisesti)
X 140 cm
Ihminen
Haasteita – konseptien (termien)
tulkinta eri kontekstissa
• Heimo sanoi Eerolle: “osta kahvi ja viineri”
Diagrammi: Conceptual Spaces: The Geometry of Thought by Peter Gärdenfors
•...Mitä Kalev olisi ostanut?
• Pitäisi vastata kohteesta:
– Mitä ovat tarkoitukset (ontologiset kysymykset)
– Mikä on kielellisten ilmaisujen ja niiden tarkoitusten suhde
(semantiikan kysymykset)
– Kuinka em. suhteiden kytkennät voi oppia (oppimisen kysymykset)
– Kuinka kommunikoimme tarkoituksia (kommunikoinnin kysymykset)
• Konseptuaalinen (alias kognitiivinen) lähestymistapa:
– Kielellisten ilmaisujen tarkoitukset ovat mielikuva entiteettejä –
kognitiivisia rakenteita kielen käyttäjän päässä.
– Kieli itsessään on osa kognitiivista rakennetta – ei irrallinen tai
riippumaton itse maailman kuvausta
• Kieli edustaa konseptia, ei maailmaa!
Lähde: Conceptual Spaces: The Geometry of
Thought by Peter Gärdenfors
Mitä on semantiikka?
Informaation standardointi
organisaatiossa?
Eteneminen
T&K kanava
tuote
tuotanto
myynti asiakas
materiaalit
tarve
sijainti
huolto
asiakas
Yhteinen kieli organisaatiolle
ASIAKAS
(B2B tai B2C)
Talous-hallinto
Myynti / Asiakas-palvelu
Markki-nointi
Logistiikka
Huolto
Tuotanto
Muistilista 1/2:
Kuinka päästä liikkeelle standardoinnissa 1. Valitse aihealue (esim. asiakastieto) jonka datan
standardointi tuottaa eniten arvoa tai on houkuttelevin (ei
välttämättä monimutkaisin)
2. Identifioi avainhenkilöt eri prosessialueilta, sitouta ja myy
idea standardoinnin tärkeydestä. Perusta hallintafoorumi
(tehtävä on luoda standardi!)
3. Käy lävitse per prosessialue (myös avain IT järjestelmät) 1. mitkä ovat tärkeimmät informaatiot,
2. mikä on datan nykytila (ui datassa!)
4. Vedä yhteen tulokset, muodosta yhteinen käsitys mitä
esim. tuote tarkoittaa yritykselle (ontologia, looginen malli &
yhteinen kieli) ja mitkä ovat sen avaintiedot (attribuutit)
Muistilista 2/2:
Kuinka päästä liikkeelle standardoinnissa
5. Määrittele tarkemman tason metatiedot per attribuutti
– (esim. yhteinen nimi, merkitys, mittayksiköt, omistajuudet,
lähteet, luottamuksellisuusasteikko jne.) ja
– dokumentoi riittävällä tarkkuudella.
– Hyödynnä parhaat käytännöt ja olemassa olevat standardit
(esim. toimialakohtaiset, ulkoiset lähteet)
6. Hyväksytä hallintafoorumissa ja aloita jalkautus
(Kommunikaatio! Mandaatti!)
7. Ylläpidä standardia tarvittessa & laadi mittaristot laadun
mittaamiseksi
Datan standardointi
• Liiketoimintalähtöistä (termit, synonyymit, tarpeet)
• Tietotyypit ihmisille ymmärrettäviä ja yksikäsitteisiä
• Tasot: Konseptuaalinen Looginen Konkreettinen
• Huomioi liiketoiminnan ja datan elinkaari
• Hallinta:
– luotaessa, jalkautettaessa, muutostilanteissa
– Vaatii tiedon omistajuutta organisaatiossa