Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
-
Upload
martin-kaltenboeck -
Category
Technology
-
view
400 -
download
4
description
Transcript of Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Linked Open Data (LOD)Basis, Principles, Benefits; Best Practise: LOD PILOT Austria/
Martin Kaltenböck
CFO, Semantic Web Company
www.semantic-web.at
www.poolparty.biz
@semwebcompany
Digital Humanities Tage, 3.12.2014, Wien
Introduction
Semantic Web Company (SWC)
About Semantic Web Company
Company was founded 2001 in Vienna, Austria
>20 experts in linked data technologies
Product: PoolParty Suite (launched 2009)
Serving global 500 companies
EU- & US-based consulting services
Customers we serve
Customers● Credit Suisse● Daimler● Roche● Wolters Kluwer● Tieto● Canadian Broadcasting
Corporation (CBC)● World Bank Group● The Pokémon Company● Healthdirect Australia● Ministry of Finance (A)● Wood Mackenzie● Red Bull Media House● Council of the E.U.● TC Media● American Physical Society● Education Services Australia● Pearson● Techtarget● Norwegian Directorate of
Immigration● REEEP● European Commission● Bank of America
Finance / Automotive / Publisher / Health Care / Public Administration /
Energy / Education
Partners● Cognizant● EBCONT● EPAM Systems● iQuest● PwC● DTI AG● Tenforce● OpenLink Software● Ontotext● MarkLogic● Gravity Zero● Altotech● Wolters Kluwer● Term Management● Taxonomy Strategies● Search explained● WAND● Digirati● Cognistreamer● Linked Data Factory● Taxonic● semweb
2 Main Areas of Work
PoolParty Semantic Suite
http://www.poolparty.biz
Data-, Information- and Knowledge Portals
and Data Tools, http://bit.ly/1DWtp1a
www.buildingsdata.eu
www.gbpn.org
www.eip-water.eu
www.reegle.info
Solutions…
Thesaurus Publishing Business Intelligence Content Recommendation Semantic Expert Finder
Web Mining Semantic Search Semantic Tagging in
SharePoint
Symptom Checker
… About me
Background: Communication Science, Psychology & Marketing
Work: Requirements Engineering & PM of nat. & internat. Industry & Research Projects
Co-Founder, CFO & Managing Partner SWC, www.semantic-web.at
Advisory Board Member Open Knowledge UK, www.okfn.org
Executive Board Member OKF Austria, www.okfn.at
Founding Member of Cooperation OGD Austria
Invited Expert in W3C and ISA Working Groups on Data Management Issues
Steering Group Member, European Data Forum (EDF), www.data-forum.eu
Open (Government) Data
9
Hier wird eine moderne Zusammenarbeit von Politik, Verwaltung, Zivilgesellschaft und Wirtschaft postuliert, mit den Zielen:
• Transparenz zu fördern• Partizipation und • Kollaboration zu ermöglichen
Teilbereich von Open Government = Open Government Data
Was ist Open Government?Was ist Open Government
OKFO – Open Knowledge Forum ÖsterreichOpen Government Data is a worldwide movement to open data(& information/content) of the government / public administration* - that isNOT personal (individual related) – in human- AND maschine-readableopen (non proprietary) formats for re-use (by civil society, economy, media,academia AND politics & public administration itsself)!
•….. data and information produced or commissioned by government or government controlled entities
Lucke & Geiger (Zeppelin Universität, DE)Offene Verwaltungsdaten sind jene Datenbestände des öffentlichen Sektors, die von Staat und Verwaltung im Interesse der Allgemeinheit ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden.
Was ist Open Government Data?O
KFO
–h
ttp
://w
ww
.okf
n.a
t
Pro
f. D
r. J
örn
vo
n L
uck
e C
hri
stia
n P
. Ge
ige
r, M
.Ah
ttp
://w
ww
.zep
pel
in-u
niv
ersi
ty.d
e/d
euts
ch/
OKF-AT: http://www.okfn.at ; @OKFNat
Was ist Open (Government) Data?
11
1. VollständigkeitAlle öffentlichen Daten werden verfügbar gemacht. Als Öffentliche Daten werden hierbei Daten verstanden, die nicht berechtigten Datenschutz-, Sicherheits- oder Zugangsbeschränkungen unterliegen.
2. PrimärquelleDie Daten werden an ihrem Ursprung gesammelt. Dies geschieht mit dem höchstmöglichen Feinheitsgrad, nicht in aggregierten oder sonst wie modifizierten Formaten.
3. ZeitnahDaten werden so zügig, wie zur Werterhaltung, notwendig zur Verfügung gestellt.
4. Leichter ZugangDer Zugang zu Daten soll so leicht wie möglich sein (z.B.: Angebot von Formaten, APIs etc).
5. MaschinenlesbarDaten werden zur automatisierten Verarbeitung strukturiert zur Verfügung gestellt.
6. Nicht diskriminierendDaten sind für ALLE verfügbar, ohne dass z.B. eine Registrierung notwendig ist.
7. Nicht proprietärDaten werden in standardisierten Formaten bereit gestellt, über die keine juristische Person die alleinige Kontrolle hat.
8. LizenzfreiDaten unterliegen keinem Urheberrecht, Patenten, Markenzeichen oder Geschäftsgeheimnissen. Sinnvolle Datenschutz-, Sicherheits- und Zugangsbeschränkungen sind zulässig.
Die Einhaltung dieser Prinzipien ist überprüfbar.
PLUS: Sunlight Foudation, August 2010: 9) Dauerhaftigkeit / Stetigkeit & 10) Nutzungskosten
8 Prinzipien von Open Government Datah
ttp
://w
ww
.op
en
go
vd
ata
.org
/hom
e/8
princip
les
htt
p:/
/su
nlig
htf
ound
ation.c
om
/po
licy/d
ocum
ents
/ten
-ope
n-d
ata
-prin
cip
les/
8 Prinzipien von Open Government Data
12
Open Data …
Verstärkt werden Daten auch durch Nichtregierungen geöffnet undzur Wiederverwendung bereitgestellt…
ODPOpen Data Portal Österreichwww.opendataportal.atEine Kooperation vonOKF-AT, Wikimedia AT undCooperation OGD Österreich
Single Point of Access für Daten aus:• Wirtschaft• Wissenschaft• GLAM• NPO & NGO• Gesellschaft / Privatpersonen
13
Open Data in Europe
Bis zu 100 Mio Euro durch Projekte, H2020 Research et al
• EU Data Incubator• 2015 Launch Pan EU Data Portal• H2020: Open & Big Data Uptake• EC Open Data Portal• LOD as objective for publishing• EU28 National Open Data Activities• Austria: UN Public Award & EDI Award
14
Open Data in use…
Was ist wichtig, wenn man über Open Data in Use nachdenkt?
• Interoperabilität um breite & einfache Nutzung zu ermöglichen• Menschen- UND Maschinen- Lesbarkeit von Daten & Metadaten• In möglichst offenen Formaten• Für eine rasche und kosteneffiziente Datenintegration• Um auf mehreren Ebenen Effekte & Nutzen generieren zu können:
Lokal - Regional - National - EU-weit & Weltweit
Für verschiedene Nutzergruppen mit verschiedenen Interessen
• Öffentliche Verwaltung (auch für interne Nutzung!)• Politiker und Entscheidungsträger• Bürger & Zivilgesellschaft (Citizen Analysts)• Wirtschaft & Industrie (Datenintegration, -anreicherung, APPs, …)• (Daten) Journalismus, Medien & Publisher• Lehre & Wissenschaft
Putting the L in front
Von Open Data zu Linked Open Data (LOD)
16
Interoperabilität
Henry Maudslay (1771 – 1831)
He also developed the first industrially practicalscrew-cutting lathe in 1800, allowingstandardisation of screw thread sizes for the firsttime. This allowed the concept ofinterchangeability (a idea that was already takinghold) to be practically applied to nuts and bolts.Before this, all nuts and bolts had to be made asmatching pairs only. This meant that whenmachines were disassembled, careful account hadto be kept of the matching nuts and bolts ready forwhen reassembly took place.http://en.wikipedia.org/wiki/Henry_Maudslay
John Sheridan, OGD2011 Conference, Vienna, Austria: http://www.slideshare.net/semwebcompany/linking-uk-government-data-john-sheridan/
17
5 Stars for Open Data by Tim Berners Lee
18
Do
cum
en
tso
n t
he
We
b
We
b o
f D
ocu
me
nts
AK
A H
ype
rtex
t
Dat
a o
n t
he
We
b
AK
A O
pe
n D
ata
We
b o
f D
ata
AK
A H
ype
rdat
a
The Evolution of the Internet
Tim Berners-Lee outlined four principles of linked data in his Design Issues: Linked Data
• Use URIs to denote things.• Use HTTP URIs so that these things can be referred to and
looked up (“dereferenced”) by people and user agents.• Provide useful information about the thing when its URI is de-
referenced, leveraging standards such as RDF, SPARQL.• Include links to other related things (using their URIs) when
publishing data on the Web.
Further Reading:• Wikipedia• W3C Wiki
Linked Data Design Principles
19
• Give things an URI!
• Use RDF for Publishing!
• Link your Data to other Data
(as well as the data models)!
• Provide a Standard-API on top
•Provide an API!
•Organise Data!
•License Data!
•Raw Data now!
20
Publish Data!
Use Web-Technologies
Use Linked Data!• The web is an Ecosystem
• Networked Data creates
Network Effects
• Lowers Costs of Data
Integration
Von Open Data zu Linked Open DataVon Open Data zu Linked Open Data
21
Data Integration on User Level and Application Level
Die Idee von HyperdataDie Idee von Hyperdata
22
Integration on Data Level
Application and/or API
Die Idee von HyperdataDie Idee von Hyperdata
CC-BY-SA von campuspartybrasil (flickr)
“Linked Data realizes the vision ofevolving the Web into a global datacommons, allowing applications tooperate on top of an unbounded set ofdata sources, via standardisedaccess mechanisms.
I expect that Linked Data will enable a significant evolutionary step in leadingthe Web to ist full potential.“
The Vision of the new Internet
23
Linked Open Data
in a Nutshell
1. Uses RDF Data Model
LOD WS
Vienna
03.12. 2014
SWCpresents at
starts
takesPlaceIn
2. Is serialised in triples:SWC presents at LOD WS .
LOD WS starts “20141203”^^xsd:date .
LOD WS takesPlaceAt Vienna .
3. Uses Content-negotiation
Subject Predicate Object
Linked Data in a Nutshell
25
1. Identify & analyse your data
2. Clean the data
3. Model your data (URI schema, vocabularies)
4. Select & specify license(s)
5. Convert data to RDF
6. Link your data to other data
7. Publish and promote your Linked Open Data
Quick Guide: Publish LOD
26
1. Specify concrete use cases
2. Evaluate relevant data sources & data sets
3. License clearing: check respective licenses
4. Create data consumption patterns
5. Manage alignment, caching & update mechanisms
6. Create mash-ups, GUIs, services & applications on top
7. Establish sustainable new partnerships
Quick Guide: Consume LOD
27
LOD Pilot
Österreich
Establishing a digital LOD based Data Infrastructure for Austriahttp://www.linkeddata.gv.at (coming soon)
• Wiederverwendung erleichtern durch Standard Formate
• Effiziente Datenintegration ermöglichen (z.B. durch APIs)
• Daten vernetzen um die echten Potentiale zu heben (LOD)
• Die wichtigsten Basisdaten zentral bereitstellen
• Den ‚digitalen Standort Österreich‘ attraktiv gestalten
• Internationalen Trends & Standards folgen
• Bereitstellung von vertrauenswürdigen Datenquellen welche von Verwaltung, Wirtschaft, F&E und Gesellschaft verwendet werdet können
Anforderungen an Open Data in AT
29
Relevante & wichtigste ~30-50 Basisdaten evaluieren Postleitzahlen (PLZ)Politische BezirkePoints of InterestDemographische BasisdatenSchultypenIndustriesektoren
Daten mit (trusted) URIs (Uniform Resource Identifier) versehenDatensätze nach RDF (Resource Description Framework) konvertierenDaten untereinander und extern (Dbpedia, Eurovoc, ..) verlinkenBasisdaten via HTTP frei verfügbar machen (unter: data.gv.at)
Die LOD Infrastruktur zur breiten Verwendung bewerben
Add on: LOD basierte Use Cases realisieren
Anforderungen an Open Data in AT
30
Anforderungen an Open Data in AT
31
Projekt Set Up Identifizieren & Ansprache von relevanten Stakeholdern
Aufbau von Kooperationen
Projekt Setup: Team, Umfeld, …
Spezifikation- & Data Analyse Phase Workshops mit relevanten Stakeholdern
Core Datensätze spezifizieren, URI Konzept, Lizenz, Rechtl. Fragen
Spezifikation der Infrastruktur, Architektur und Tools
Implementierungs Phase Technische Implementierung (Infrastruktur, Tools, et al)
LOD Publishing / Datenpublikation
Promotion, Events & Trainings, Support
Maintenance & Operation Phase Laufende Maintenance
Support für zukünftige Publikation und Verwendung
11-12/2013
01 - 04/2014
05- 10/2013
from 11/2014
LOD Pilot: Datenanalyse
32
In zwei Workshops, mit gesamt 20 TeilnehmerInnen, wurden mit Expertenunterschiedlicher Einrichtungen Basisdatensätze ermittelt, wobei entlang derKategorisierung von help.gv.at (sprich: Lebenslagen) vorgegangen wurde.
• 2 Stakeholder Workshops: 10.12. 2013 & 14.2.2014
• Evaluierung & Analyse data.gv.at ( & opendataportal.at)
• Empfehlung EC zu Open Data (Link)
• G8 Open Data Charter (Link) & EC Implementierung (Link)
• Konzept Basic Data Dänemark (Link)
LOD Pilot: Tools & Architektur
33
• PoolParty Server für LOD Publishing: Conversion – Creation- Linking –Publikation von Taxonomien, Code Lists et al: http://www.poolparty.biz/
• Virtuoso Triple Store für Datenspeicherung & SPARQL Endpoint: http://virtuoso.openlinksw.com/
• ETL & andere LOD Jobs: UnifiedViewshttp://www.semantic-web.at/linked-open-data-management-suite-lodms/
• SILK für Linking: http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/
• Weitere RDF Converter wie Triplify oder D2R etal: http://d2rq.org/d2r-server
• Aufbau & Etablierung einer Basis LOD Infrastruktur für AT
• Angebot eines zentralen Repositories für semantische Assets in Österreich (nach ISA Ansatz, beschrieben in ADMS)
• Angebot & Etablierung von offiziellen & vertrauenswürdigen referenzierbaren Entitäten
• Angebot von Basisdaten, um Impact zu generieren (Bspl. DK)
• Umsetzung von LOD Use Cases um Potentiale aufzuzeigen
• Data Literacy vorantreiben durch LOD Trainings
• Alle relevanten Stakeholder zusammenbringen
• Die (Linked) Open Data Community einbinden (WU, TU, …)
Anforderungen an Open Data in AT
34
Contact
These slides are published under :
Copyright SWC 2014
Martin KaltenböckCFO, Semantic Web Company
+43 1 4021235
www.semantic-web.at
www.poolparty.biz
Gruppenarbeit
36
• Frage 1: welche Basis Datensätze sehen Sie in Ihrer
Organisation (Orte, Branchen, Organisationen, …)
• Frage 2: Welche Datensätze würden (intern /
extern) verlinkt Ihrer Ansicht nach Mehrwert
generieren?
Organisation 1
Organisation 2
Organisation 3
Dataset 1
Dataset 2
Dataset 3
Dataset 1
Dataset 2
Dataset 3
Dataset 1
Dataset 2
Dataset 3
• Less replication (offering same datasets in different places)
• Encouragement to re-use existing datasets (open standards, open formats, reduce semantic & syntactic heterogeneity)
• Clear which datasets are providing similar / same information
• More innovation and creation of new knowledge by contextualisation
• Creating network effects by linking
• Enable scale out of the growing amounts of data
The Benefits of Linked Open Data
37
What are the costs and benefits of★ web data?
As a consumer ...✔ You can look at it.✔ You can print it.✔ You can store it locally (on your hard drive or on an USB stick).✔ You can enter the data into any other system.✔ You can change the data as you wish.✔ You can share the data with anyone you like.
As a publisher ...✔ It's simple to publish.✔ You do not have explain repeatedly to others that they can use your data.
5 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
From Open Data 2 Linked Open Data
38
What are the costs and benefits of★★web data?
As a consumer …you can do all what you can do with ★Web data and additionally:
✔ You can directly process it with proprietary software to aggregate it, perform calculations, visualise it, etc.
✔ You can export it into another (structured) format.
As a publisher ...✔ It's still simple to publish.
395 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
From Open Data 2 Linked Open Data
What are the costs and benefits of★★★web data?
As a consumer …you can do all what you can do with ★★Web data and additionally:
✔ You can manipulate the data in any way you like, without being confined by the capabilities of any particular software.
As a publisher ...✔ It's still rather simple to publish.! You might need converters or plug-ins to export the data from
the proprietary format.
405 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
From Open Data 2 Linked Open Data
What are the costs and benefits of★★★★web data?
As a consumer …you can do all what you can do with ★★★Web data and additionally:✔ You can link to it from any other place (on the Web or locally).✔ You can bookmark it.✔ You can reuse parts of the data.✔ You may be able to reuse existing tools and libraries, even if they only understand
parts of the pattern the publisher used.✔ You can combine the data safely with other data.
As a publisher ...✔ You have fine-granular control over the data items and can optimise their access
(load balancing, caching, etc.)✔ Other data publishers can now link into your data, promoting it to 5 star!! You typically invest some time slicing and dicing your data.! You'll need to assign URIs to data items and think about how to represent the data.! You need to either find existing patterns to reuse or create your own.
5 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/ 41
From Open Data 2 Linked Open Data
What are the costs and benefits of★★★★★web data?
As a consumer …you can do all what you can do with ★★★★Web data and additionally:
✔ You can discover more (related) data while consuming the data.✔ You can directly learn about the data schema.! You now have to deal with broken data links, just like 404 errors in web pages.! Presenting data from an arbitrary link as fact is as risky as letting people include
content from any website in your pages. Caution, trust and common sense are all still necessary.
As a publisher ...✔ You make your data discoverable.✔ You increase the value of your data.✔ You own organisation will gain the same benefits from the links as the consumers.! You'll need to invest resources to link your data to other data on the Web.! You may need to repair broken or incorrect links.
425 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
From Open Data 2 Linked Open Data
Example: Clean Energy Data Portal
Clean Energy Open Data Portal fully based on LOD…
http://data.reegle.info
Example: LOD Pilot Austria
Linked Open Data Pilot Austria… open data as LOD of Austrian national government, City of Vienna and OpenDataPortal Austria (ODP)
http://lodpilot.at
Example: Labour Law Thesaurus
http://vocabulary.wolterskluwer.de/arbeitsrecht/10913
• EuroVoc• Thesaurus
Sozial-Wissenschaften• DBPedia• Standard-Thesaurus
Wirtschaft
50 Billions
Facts