도서관과 링크드데이터[TQK]

90
20101014전략팀 추윤미 숙명여자대학교 문헌정보학과 교수 김성혁

description

 

Transcript of 도서관과 링크드데이터[TQK]

Page 1: 도서관과 링크드데이터[TQK]

2010년 10월 14일

전략팀 추윤미

숙명여자대학교 문헌정보학과 교수 김성혁

Page 2: 도서관과 링크드데이터[TQK]

2

1. 도서관과 웹 생태계

2. 시맨틱 웹과 링크드 데이터

3. Linked Data의 도서관 적용

4. Linked Library Data 주요 사례

5. Linked Library Data 기대 효과

6. Linked Data 구현 기술

7. TQK 소개

목차

Page 3: 도서관과 링크드데이터[TQK]

도서관과 웹 생태계

Page 4: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 4

도서관

메타데이터

식별자

Cataloging - 정보를 가공(메타데이터 기술) 하여 이용가능 하도록 제공(식별자 부여)

Page 5: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 5

OPAC

메타데이터 MARC: Machine-readable cataloging

온라인 장서 목록 검색과 기계가독형 데이터 교환 포맷

[국회도서관 온라인 검색]

Page 6: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 6

도서관 - the Walled Garden

높은 품질의 메타 데이터

정보 관리 기술

도서관 데이터를 위한 표준 포맷/프로토콜

Page 7: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 7

현재의 도서관

Silos인 데이터베이스

웹 기반의 OPAC – 서지 검색 중심

도서관 간의 네트워크

DB

DB

DBZ39.50

Page 8: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 8

도서관 표준, 프로토콜...

MARCXML

Page 9: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 9

도서관 데이터 - Silos

도서관 표준

도서관 네트워크

웹 표준이 아님!

Page 10: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 10

웹의 특성

Social(사회성)

• 웹을 통한 집단 지식 구축

• 가상 커뮤니티(virtual community)를 통한 정보전달 및 커뮤니케이션,

사회적 명성 쌓기

Link(연계성)

• 정보가 서로 링크를 통해 연결된 네트워크(web)를 이루고 있음

• 링크를 통해 유용한 정보 획득이 더욱 쉬워짐

Open(개방성)

• 누구나 참여하여 정보를 생산, 유통, 소비할 수 있음

• 쉽게 정보를 웹으로 발행할 수 있는 기반기술로 인해 웹이 급속히 확산

Page 11: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 11

웹 생태계

웹을 중심으로 디지털 데이터의 생태계 조성

정보의 생산, 배포, 소비가 웹을 통해 이루어짐

정보 생산자, 소비자의 구분이 모호해짐

다른 사람의 데이터를 이용, 융복합을 통한 재생산

웹 중심의 정보 환경

정보를 획득하는 1차 수단이 웹이 됨

누구나 자신이 가진 정보를 웹으로 공개, 공유하며, 무엇에대해서든지 말할 수 있고, 웹을 통해 서로 커뮤니케이션 하며, 물건을 사고 팔기도 함

Page 12: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 12

웹의 발전방향

Page 13: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 13

웹 3.0의 생태계

Page 14: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 14

웹 생태계와 도서관

Page 15: 도서관과 링크드데이터[TQK]

Linked Data

개방해야 하는 이유

웹 생태계로 들어가면

외부 데이터와 연계를 통해

도서관 데이터의 활용성이 높아지고

데이터가 많이 사용될수록 데이터 가치는 증대 – network effect

2010-10-12 15

웹이라는 더욱 크고 다양한 환경의 이용자들이 공유할 수있도록 표준 기반의 지식 네트워크를 구축할 수 있는 기회

Page 16: 도서관과 링크드데이터[TQK]

시맨틱 웹과 링크드 데이터

Page 17: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 17

Current Information – Current Web• 정보의 홍수 시대, 어떤 정보가 올바른 정보인가? 어떤 정보가 내게 필요한 정보인가?

– 지식 관리 및 정보접근성 향상 방안 필요

• 어떤 정보가 좋은 정보인지 일일이 열어서 확인해 보는 것은 너무나 많은 시간과 노력을 필요로함

– 지능형 정보 분석 방법 필요

• 정보들간의 의미적인 관계 및 메타 정보의 부족으로 관련 정보나 상이한 정보를 기계가 판단하지 못함. Silo System, Stove-pipe System

– 의미 기반 상호 운용성 확보 및 데이터 통합 필요

• 문자 중심의 정보는 지능화된 서비스 및 자동화 기능에 취약하며, 재활용이 난해하다.– 형식 문법을 사용한 의미 기반의 정보 구조화가 필요함

• 문자 중심의 데이터와 이에 기반한 정보 시스템은 유지 관리가 어렵고, 비용이 많이 든다– 프로그래밍 대신 모델링이 필요

Page 18: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 18

• 업무 수행을 위해 주당 평균 10시간 이상을 정보 검색에 소비

• 매년 생산되는 정보의 양이 수백만 개의 미국 국회도서관에 저장된 정보의 양과 비슷함

• 새로운 정보를 생산하고 소비하는 것보다 원하는 정보를 빠른 시간 내에 검색할 수 있는 것이더 중요해짐

• 인류 문명 이후 가장 거대한 지식 저장소인 웹은 이제 더 이상 인간 스스로의 힘으로 관리가 어려움

• 그 속에 무엇이 있는지 알 수 없는 상황

정보를 잘 찾고, 잘 활용할 수 있는 웹

Current Information – Current Web

Page 19: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 19

Current Web – Document Web

인간이 이해할 수 있는(human-readable) 웹

? ? ? ?

Beijing

Page 20: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 20

Current Web

Web Browsers

Search Engines

참고 : Chris Bizer / The Emerging Web of Linked Data

Page 21: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 21

Mashup

참고 : Chris Bizer / The Emerging Web of Linked Data

OpenAPI

OpenAPI

OpenAPIX X

X X

Mashup - OpenAPI

Page 22: 도서관과 링크드데이터[TQK]

Linked Data

The Web of Document(문서 웹)

문서로 이루어진 글로벌 네트워크

2010-10-12 22

HTML 문서가 기본 단위

인간가독형(human-readable)

문서간 연계는 단순 링크(untyped link)

Page 23: 도서관과 링크드데이터[TQK]

Linked Data

The Web of Data(데이터 웹)

데이터로 이루어진 글로벌 네트워크

2010-10-12 23

RDF 데이터가 기본 단위

기계가독형(machine-readable)

데이터와 데이터 간의 의미 있는 링크

Page 24: 도서관과 링크드데이터[TQK]

Linked Data

시맨틱웹

2010-10-12 24

“The Semantic Web is a vision: the idea of having data on the Web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.[W3C 2001] ”

HTML 기반의 웹 1.0

RDF 기반의 시맨틱

Page 25: 도서관과 링크드데이터[TQK]

Linked Data

2010-10-12 25

시맨틱 웹 – Linked Data

Many common things are represented in multiple data sets

Linking identifiers connects these data sets

Linked data opens the doors of the silos

Data Silos on the Web

Image: Bob Jagensdorf, http://flickr.com/photos/darwinbell/, CC-BY

Page 26: 도서관과 링크드데이터[TQK]

Linked Data

2010-10-12 26

Page 27: 도서관과 링크드데이터[TQK]

Linked Data

데이터 표현 - 모델

2010-10-12 27

지식의 공유엘리너 오스트롬create

subject predicate object

RDF(Resource Description Framework)

트리플(Triple)

Page 28: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 28

Data is Relationship!

지식의공유

타임북스엘리너 오스

트롬

교보문고

published by

createsold by

hold by

국회도서관

located in

서울

edit샬럿 헤스

서평

홍길동

contains

create

review

The more things you have to connect together, the more powerful it is.Tim Berners-Lee, The next Web of open, linked data. Video of Tim's talk at TED 2009.

링크드 데이터(Linked Data)

Page 29: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 29

Linked Data

1. Use URIs as names for things

2. Use HTTP URIs so that people can look up those names

3. When someone looks up a URI, provide useful RDF Information

4. Include RDF statements that link to other URIs so that they can discover related things

Tim Berners-Lee, “Linked Data- Design Issues(2006)”, http://www.w3.org/DesignIssues/LinkedData.html

Linked data는 웹 상의 데이터들에 URI를 이용해 이름을 붙이고, RDF로 데이터를 기술할 뿐만 아니라 데이터 간의 관계를 부여하여 HTTP를통해 웹으로 발행함으로써 데이터가 인간 뿐만 아니라 기계에 의해 사용되고

이해될 수 있도록 하는 방법

Page 30: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 30

Linked Data

URI RDF

데이터의 네이밍(identification)

데이터의 의미표현링크를 통한 공유

HTTP

데이터 교섭(negotiation)

Page 31: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 31

W3C – Linking Open Data Project

W3C SWEO Community (Semantic Web Education & Outreach Interest Group) 다양한 공개 데이터 셋을 RDF형태로 웹에 퍼블리싱하여, 다양한 데이터 소스 간의 RDF 링크

를 설정함으로써, 공유 데이터(data common)를 통해 웹을 확장하고자 하는 목적

Over 500 million RDF triples Around 120,000 RDF links between data sources

Page 32: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 32

LOD Cloud – 2008. 2

Page 33: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 33

July 2009

LOD Cloud – 2009. 7

Page 34: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 34

LOD Cloud – 2010. 9

Page 35: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 35

결론 - 정보 유통의 패러다임 변화

Paradigm Shift

• 인간 중심의 정보 처리

• 비구조적 문서 중심

• 문자중심의 데이터 처리

• 단방향의 정보 생산과 소비

• 제한적인 인간 중심형 정보

• 기계 중심의 정보 처리

• 구조적 지식 중심

• 의미 기반의 데이터 처리

• 기계와 기계,기계와 인간의 협업

• 대용량 지식형 구조화된 정보

Page 36: 도서관과 링크드데이터[TQK]

Linked Data

36

Why Linked Data?

- (Aren’t we sharing our data already?)

인용 : A Gentle Introduction to Linked Data, Ralph LeVan, OCLC Research Webinar, 2010.5.27

Linked Data는 도서관 간의 데이터 교환이 중심이 아닌 웹 표준 데이터 공유 포맷(non-library-centered exchange format)이기 때문이제까지, 도서관에서는 데이터 공유를 위해MARC(웹 커뮤니티에서는 별로 환영하지 않는)이나Dublin Core(그다지 의미표현이 풍부하지 못한)을 사용해 왔음RDF로 데이터를 기술하는 Linked Data는 웹에 친숙한 방법(in a Web-friendly way)으로 의미적으로 풍부한 데이터를 공유할 수 있는 프레임워크를 제공함(이것이 바로 Semantic Web)

2010-10-12

Page 37: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 37

“We don’t have time to talk about new approaches, we have a battle to fight here.”

Copyright by: http://www.sinclairdesign.com/index.php

Page 38: 도서관과 링크드데이터[TQK]

Linked Data의 도서관 적용

Page 39: 도서관과 링크드데이터[TQK]

Linked Data

도서관 데이터의 구성

2010-10-12 39

서지 레코드전거 레코드

소장 정보

통제어휘

시소러스

분류코드(DDC, LCC,

KDC...) 주제전거파일

지식조직체계(KOS:Knowledge

Organization System)

Page 40: 도서관과 링크드데이터[TQK]

Linked Data

MARC 레코드

2010-10-12 40

Machine Readable Format

in MARC

Page 41: 도서관과 링크드데이터[TQK]

Linked Data

타임북스엘리너오스트롬

교보문고

publisherauthor

sold by

국회도서관 located in

서울

샬럿 헤스

서평

홍길동

create

review

thing(real world entity) information resource

http://ex.library.org/resource/bib/1234

ISBN

http://ex.library.org/resource/bib/1234

title

지식의공유

dp:Cities_in_Korea

10,421,782dp:population

skos:subjectdbpedia:Seoul

editor

http://ex.kyobobooks.com/book/.../a20003

ISBN

hold by

2010-10-12 41

Page 42: 도서관과 링크드데이터[TQK]

Linked Data 42

thing(real world entity)

A 기관

http://ex.library.org/resource/bib/1234

지식의 공유

타임북스

엘리너 오스트롬

Bibliographic Record

샬럿 헤스

001

Machine Readable Formatin RDF

B 기관

createhold

Holding Information

제1문헌실controlNo

HB-0001

checkedOut?

Yes

isLocated in

ISBN

2010-10-12

Page 43: 도서관과 링크드데이터[TQK]

Linked Data 43

A 기관

B 기관

access via HTTP

publish via HTTP http://ex.library.org/re

source/bib/1234

지식의 공유

타임북스

엘리너 오스트롬

Bibliographic Record

샬럿 헤스

001

access via HTTP

access via HTTP

C 기관

D 기관

2010-10-12

Page 44: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data 구현

지식어휘체계(Knowledge Organization System)의 Linked Data화

분류체계, 시소러스, 전거 데이터 등W3C 시맨틱웹 표준인 SKOS를 이용SKOS(Simple Knowledge Organization System)

지식어휘체계를 표현하기 위한 RDF 용어집(vocabulary)

서지 데이터의 Linked Data화서지 온톨로지(the Bibliographic Ontology)

http://bibliontology.com/

RDA, FRBR의 RDF vocabularyExpression of Core FRBR(Functional requirements for bibliographic records) Concepts in RDF - http://vocab.org/frbr/core.htmlRDA(Resource Description and Access) - http://metadataregistry.org/

2010-10-12 44

Page 45: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data 구현 - 지식어휘체계

2010-10-12 45

SKOS(Simple Knowledge Organization System)

World Wide Web 에 대한 SKOS 표현

Page 46: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data 구현 - 지식어휘체계

SKOS를 이용한 지식어휘체계의 Linked Data 사례LCSH - 미의회도서관의 주제명 전거 데이터

http://lcsubjects.org

OCLC의 DDC Linked Datahttp://dewey.info/

OCLC의 VIAF(Virtual International Authority File) Linked Datahttp://www.oclc.org/nextspace/013/research.htm

독일 국립도서관의 인물, 기관명, 주제명 전거데이터https://wiki.d-nb.de/display/LDS

프랑스 국립도서관REMEAU 프로젝트 - http://www.cs.vu.nl/STITCH/rameau/

NY Times의 인명, 기관명, 지명, 주제명 전거 데이터data.nytimes.com

2010-10-12 46

Page 47: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data 구현 - 서지 데이터

서지 레코드의 기술을 위해 Doublin Core 및 Bibliontology을이용

스웨덴 LIBRISOpen Library

http://openlibrary.org/

서지 기술을 위한 관련 표준을 RDF vocabulary 로 매핑/정의하려는 노력

MARC21 코드의 Linked Data 발행http://purl.org/NET/marccodes/

FRBR 및 RDAISBD(International Standard Bibliographic Description) elements

http://metadataregistry.org/schema/show/id/25.html

RDA/ONIX Framework의 Vocabulary Mapping Framework(VMF)

2010-10-12 47

참고: http://www.w3.org/2005/Incubator/lld/wiki/Library_standards_and_linked_data

Page 48: 도서관과 링크드데이터[TQK]

Linked Data

도서관 표준

2010-10-12 48

출처: http://www.w3.org/2005/Incubator/lld/wiki/File:LayeredModelV3.pdf

Page 49: 도서관과 링크드데이터[TQK]

Linked Data

2010-10-12

2010-10-12 49

Page 50: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data – LOD, 2010. mid

2010-10-12 50

국가별 Linked Data 프로젝트

독일 국립도서관https://wiki.d-nb.de/

헝가리 국립도서관http://nektar.oszk.hu/

그 외 체코, 핀란드, 영국 등에서 국립도서관의 Linked Data 적용 움직임

Page 51: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data 동향

2010-10-12 51

도서관 관련 기관 동향IFLA

FRBR Review Group• 시맨틱웹 표준(RDF, RDFS, SKOS, OWL)을 이용한 FRAD와 FRBR entity

relationship 모델의 시맨틱 모델 개발 중ISBD/XML Task Group

• ISBD의 RDF화 추진

DCMI RDA Task Group과 joint steering committee for RDARDA의 RDF화 및 CRM(Conceptual Reference Model)과 RDA, RFBR, FRBR 등과의매핑(alignment) 추진

OCLC의 DDC linked data 실험 서비스

W3C의 Library Linked Data 인큐베이터 그룹(2010. 5)http://www.w3.org/2005/Incubator/lld/목적

Linked Data의 기술을 이용하여 시맨틱웹 환경에서 도서관 데이터의 상호운용성(interoperability)을 증진

관련 표준화작업, 해결해야 할 이슈 정리UseCase 수집을 통한 Best Practice 전파

Page 52: 도서관과 링크드데이터[TQK]

Linked Library Data 구현사례

Page 53: 도서관과 링크드데이터[TQK]

Linked Data

LCSH(Library Congress Subject Headings)

도서관 자료의 주제목록(subject cataloging)을 위한 Subject Headings를 Linked Data로 발행

MARC21(MARCXML)포맷으로 되어있는 전거 데이터(authority record)를RDF 포맷의 SKOS vocabulary를 이용하여 변환

전거 레코드의 각 항목(entry)을skos:Concept의 인스턴스로 대응하고LCCN(Library Congress Control Number)를 이용하여 URI 부여

http://lcsh.info/lccn#concepthttp://id.loc.gov/authorities/

2010-10-12 53

Page 54: 도서관과 링크드데이터[TQK]

Linked Data

LCSH(Library Congress Subject Headings)

전거 레코드에 대한 MARC21(MARCXML)포맷과SKOS vocabulary 매핑

2010-10-12 54

Page 55: 도서관과 링크드데이터[TQK]

Linked Data

LCSH(Library Congress Subject Headings)

2010-10-12 55

Page 56: 도서관과 링크드데이터[TQK]

Linked Data

LCSH(Library Congress Subject Headings)LCSH/SKOS 개념 간의 의미관계를 표현한 RDF 그래프

2010-10-12 56

Page 57: 도서관과 링크드데이터[TQK]

Linked Data

LCSH(Library Congress Subject Headings)

SKOS를 LCSH의 필요에 따라 확장하여 사용

skos:Concept

lcsh:TopicalConcept

lcsh:GeographicConcept

lcsh:GenreConcept

lcsh:ChronologicalConce

pt

2010-10-12 57

Page 58: 도서관과 링크드데이터[TQK]

Linked Data

LCSH(Library Congress Subject Headings)

LOD의 외부 데이터 셋과의 연계

Geographical Headings와의 연계

GeoNames(http://geonames.org), CIA World Fact Book(http://www4.wiwiss.fu-berlin.de/factbook/)

LCSH Concept이 제시된 자료와 연계

RDF BookMashup(http://www4.wiwiss.fu-berlin.de/bizer/bookmashup)

일반적인 정보연계

Dbpedia(http://dbpedia.org)

LCSH와 REMEAU(프랑스 국립도서관)Subject Headings와 상호연계

2010-10-12 58

Page 59: 도서관과 링크드데이터[TQK]

Linked Data

LCSH와 REMEAU 프로젝트와의 상호 연계

2010-10-12 59

Page 60: 도서관과 링크드데이터[TQK]

Linked Data

VIAF – Virtual International Authority File

목적전거 데이터의 공유 증진목록 비용 절감국제적인 전거 통제

주요 기관OCLC – hostLibrary of Congress(LC)Deutsche Nationalbibliothek (DNB)Bibliothèque nationale de France (BnF)

http://www.viaf.org

16개 국의 참여1300만 개의 name records1000만 개의 인명

2010-10-12 60

Page 61: 도서관과 링크드데이터[TQK]

Linked Data

VIAF as Linked Data

항목마다 URI를 부여하여 linked data로 이용가능UNIMARC과 MARC21 지원

http://viaf.org/viaf/24602065/

2010-10-12 61

Page 62: 도서관과 링크드데이터[TQK]

Linked Data

VIAF as Linked Data

2010-10-12 62

Page 63: 도서관과 링크드데이터[TQK]

Linked Data

VIAF as Linked Data

이후 계획Linked Data 추진 - WorldCat, Wikipedia 등과 연계도서관 외부의 출판사, 박물관, 아카이브 및 Rights Managements Agengies 등의 참여, 연계

2010-10-12 63

Page 64: 도서관과 링크드데이터[TQK]

Linked Data

LIBRIS

개요

스웨덴 국립도서관목록

도서관 전체 데이터를 Linked Data로 구축한 최초의 종합목록(2008년)

170 여개 도서관 기관이 이용하는 종합목록 시스템(대학도서관및 연구도서관, 박물관, 아카이브, 공공도서관)

6백만 개의 서지 데이터 및 2천만 개의 도서관 장서목록, 2십만 개의 전거 데이터로 구성

도서관 인프라스트럭처목록작업, 데이터 자동 임포트/익스포트, Open API 제공

도서관 디렉토리2000여 개 도서관의 디렉토리로 ILL 정보, 운영정보, 기술 정보 및 위치정보 보유

http://libris.kb.se/

2010-10-12 64

Page 65: 도서관과 링크드데이터[TQK]

Linked Data

LIBRIS

인명 전거

주제명 전거

도서관 별 소장정보

리소스 타입

2010-10-12 65

Page 66: 도서관과 링크드데이터[TQK]

Linked Data

LIBRIS

소장정보

2010-10-12 66

Page 67: 도서관과 링크드데이터[TQK]

Linked Data

LIBRIS – 서지 데이터

MARC21의 RDF 매핑전거파일

인명 -> foaf:Person기관 -> foaf:Organization

MARC과 온톨로지(FOAF, DBPedia) 매핑

MARC21의 RDF 매핑서지 레코드의 기술을 위해 Doublin Core와 Bibliontology 사용

2010-10-12 67

Page 68: 도서관과 링크드데이터[TQK]

Linked Data

LIBRIS

2010-10-12 68

Page 69: 도서관과 링크드데이터[TQK]

Linked Data

LIBRIS – Linked Data

2010-10-12 69

Page 70: 도서관과 링크드데이터[TQK]

Linked Data

LIBRIS의 Linked Data 전략

도서관 외부 커뮤니티와의 데이터 공유DublinCore, SKOS, FOAF, Bibliontology 같은 범용적인온톨로지 사용

LOD의 다른 데이터셋으로의 링크를 통해 LIBRIS외부의 데이터와 연계

LCSH.infodbpedia.orgMusicBrainzVIAFid.loc.gov

2010-10-12 70

Page 71: 도서관과 링크드데이터[TQK]

Linked Library Data의 기대효과

Page 72: 도서관과 링크드데이터[TQK]

Linked Data

RDF Link를 이용한 데이터 연계

2010-10-12 72

링크드 데이터 클라우드

DB DBDB

DB

통합된 데이터 뷰(view)를 통한 질의

Data Integration

Page 73: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 73

데이터 연계를 이용한 매쉬업

Page 74: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 74PREFIX dgp353: <http://data-gov.tw.rpi.edu/vocab/p/353/> prefix foaf: <http://xmlns.com/foaf/0.1/> PREFIX dgtwc: http://data-gov.tw.rpi.edu/2009/data-gov-twc.rdf#SELECT ?state_name ?state_population SUM(?number_of_books) as ?total_books WHERE GRAPH http://data-gov.tw.rpi.edu/vocab/Dataset_353 ?entry dgp353:phys_st ?state_code. ?entry dgp353:bkservol ?number_of_books. ?entry dgp353:popu_st ?state_population

GRAPH http://data-gov.tw.rpi.edu/wikidata/United_States_and_Territories ?s3 foaf:name ?state_name . ?s3 dgtwc:abbreviation ?state_code

GROUP BY ?state_name ?state_population

?state_name

?state_population

?entry

?state_code

dgp353:bkservol

?number_of_books

dgp353:popu_st

?s3

foaf:name

dgpwc:abbreviation

GRAPH http://data-gov.tw.rpi.edu/vocab/Dataset_353

GRAPH http://data-gov.tw.rpi.edu/wikidata/United_States_and_Territories

SPARQL 질의

Page 75: 도서관과 링크드데이터[TQK]

Linked Data

데이터가 어떻게 사용될지에 대해 제한을두지 않으므로

Data Open – Expose on the Web

Open API 방식데이터 공급자가 데이터의 범위와 방식을 결정

2010-10-12 75

Linked Data데이터 공급자가 데이터를 웹에 공개하기만 하면 이용자가 원하는 데이터를 가져가서 사용

API 및 어플리케이션 개발 비용과 부담을 경감

다양하고 창의적인 데이터의 활용 가능

Page 76: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 76

신간 소개 어플리케이션 예

신문의 신간소개기사블로그 서평

같은 주제에 속한관련 도서정보

국립중앙도서관 서지및 소장사항

과천시정보과학도서관 서지 및 소장사항

과천시정보과학도서관위치정보

Page 77: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data의 기대효과

2010-10-12 77

LOD 클라우드에 고품질의 데이터 제공

전거 데이터, 분류체계, 시소러스, 메타데이터

개별 목록에서 이를 이용하여 데이터의 품질 관리

웹 데이터의 품질 관리

데이터의 상호운용성 지원

시맨틱 웹 기술 기반의 의미적 상호운용성

웹 데이터의 품질 향상

Page 78: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data의 기대효과

2010-10-12 78

도서관 데이터의 활용 증가

도서관 데이터 공개(expose)와 연계(link)

global information space of structured data

seamlessly browsing

library data using in another context

innovative user service

Page 79: 도서관과 링크드데이터[TQK]

Linked Data

Linked Library Data의 기대효과

2010-10-12 79

Linked Data 기술을 이용한 데이터 expose

도서관 간의 상호 협력 증진

상호 협력을 위한 기술적 부담이 낮음

웹 프로토콜을 이용한 데이터 교환이 용이

애플리케이션 개발 비용이 낮음

외부 커뮤니티와의 협력 증진

도서관 종속적인(library-specific) 프로토콜과 포맷을모르더라도 손쉽게 도서관 데이터를 사용할 수 있음

사회의 지식 자원인 도서관 데이터를 공유 자원화

도서관의 협력 증진 및 지식자원 공유 확대

Page 80: 도서관과 링크드데이터[TQK]

Linked Data 2010-10-12 81

A 기관

B 기관

C 기관 D 기관

DB

DB DB

DB

Union Catalog

Union Catalog as Linked Data

Page 81: 도서관과 링크드데이터[TQK]

Linked Data 구현 기술

Page 82: 도서관과 링크드데이터[TQK]

Linked Data

Linked Data Service

83

Linked Data를 위한통합 패키지:

•생성- TopBraid Composer - Semantic Mapping Designer-OntoTrans2.0

•관리-OntoBase2.0-OntoBase2.0 Reasoner

•발행-OntoBase2.0 LOD Builder

•협업- SPARQLMotion in TopBraid Composer Maestro Edition

- OntoBase2.0 LOD BuilderERP DW CRM

2. Linked Data 변환 매핑 설계Semantic Mapping Designer

1. Linked Data 설계TopBraid Composer

Linked Data변환 규칙

Linked Data모델

3. Linked Data 변환OntoTrans2.0

OntoBase2.0

4. Linked Data 협업 설계 및 발행SPARQLMotion & LOD Builder

Linked DataMashup

Linked DataBrowsing

Linked DataSearch

관리OntoBase2.0Reasoner

Page 83: 도서관과 링크드데이터[TQK]

Linked Data

온톨로지 설계도구

2010-10-12 84

http://www.topquadrant.com

Page 84: 도서관과 링크드데이터[TQK]

Linked Data

트리플(Linked Data) 저장소

2010-10-12 85

• W3C 시맨틱웹 표준 기반 트리플 저장소-RDF, RDFS, OWL, SPARQL 지원

• 외부 추론 엔진 연동 지원–Pellet, RacerPro, Jess 등등

• 레거시 정보를 Linked Data 변환기로 변환하기 위한Triple Converter 연동 지원

• 사용자 기반의 웹 환경 관리도구 지원

• 세계 최고 수준의 SPARQL 처리 능력

• 세계 최고 수준의 트리플 저장/관리 능력

• 세계 최고 수준의 트리플 로딩능력

http://ontobase.topquadrant.co.kr

Page 85: 도서관과 링크드데이터[TQK]

Linked Data

트리플 변환기

2010-10-12 86

•기존의 레거시 데이터를 온톨로지 모델과 연계하여 매핑하고, 이를 기반으로 온톨로지 변환 규칙, 레거시 데이

터 수집 규칙을 작성한 후, 이를 이용해 트리플 변환을 수행하는 시맨틱웹 기술 응용 엔진

•최종 변환된 트리플은 트리플 저장소에 빌드(로딩)

•트리플 변환을 수행하기 위해

-온톨로지 모델링 도구(TopBraid Composer)를 이용해

온톨로지 개념 모델 구축 -- 1

-시맨틱 매핑 디자이너를 이용해 GUI 방식으로 매핑을 수행하여

변환 규칙 (수집 규칙 포함) 도출 -- 2

-1,2를 이용해 트리플 변환 수행

Page 86: 도서관과 링크드데이터[TQK]

Linked Data

트리플 변환기

2010-10-12 87

온톨로지 모델 관리자스케줄링 관리자 시맨틱 매핑 관리자

시맨틱 매핑디자이너

온톨로지설계 도구

서버 매니저

매핑 규칙수집 규칙 개념 모델

SchedulerSemantic Collector

레거시 데이터

Semantic Mapper

Triple Generator

ResourceValidator

OutputManager

Plug-In

Page 87: 도서관과 링크드데이터[TQK]

Linked Data

SPARQL Endpoints

88

HTTP

External SystemConnecter

RDF Triple

SPARQL Endpoints

트리플(Linked Data) 저장소

어플리케이션 웹 브라우저

HTML, RDF, XML(Json), Spreadsheet,… SPARQL HTML, RDF, XML(Json), Spreadsheet,…

Web Server / Servlet Container

SPARQL

Page 88: 도서관과 링크드데이터[TQK]

Linked Data

TQK 소개

Page 89: 도서관과 링크드데이터[TQK]

Linked Data

902010-10-12

TopQuadrant USA & Korea

Business Reference Model (BRM)• Lines of Business• Agencies, Customers, Partners

Service Component Reference Model (SRM)• Service Layers, Service Types• Components, Access and Delivery Channels

Technical Reference Model (TRM)• Service Component Interfaces, Interoperability• Technologies, Recommendations

Data Reference Model (DRM)• Business-focused data standardization • Cross-Agency Information exchanges

Performance Reference Model (PRM)• Government-wide Performance Measures & Outcomes• Line of Business-Specific Performance Measures & Outcomes

Business-Driven A

ppro

ach(C

itizen-Centered

Focus)

Com

ponent-Based

Architectures

Companyis a

offering

has resource

has contactInfo

Consulting

Resource

ContactInfo

for

offering

maintained at

Semantic Technology

Tool

Library

TopQuadrant (Korea)

대용량 온톨로지 기반

저장소 및 변환기 보유

세계 최초의 시맨틱웹서버 프레임웍 보유

세계 최고수준의

온톨로지 모델링 툴 보유

다양한 컨설팅 및

시맨틱웹 기술 보급

시맨틱웹 기술

전문 그룹

Federal Enterprise Architecture (FEA)

휴스턴 대학 SARA

온톨로지 저장소/변환기

TopBraid Live

TopBraid Ensemble

TopBraid Composer

Page 90: 도서관과 링크드데이터[TQK]

Linked Data

912010-10-12

TopQuadrant USA & Korea

• 기술 제휴• 시맨틱웹 기반 기술• OntoBase2.0 + TopBraid Composer Plug-in 형태• OntoTrans2.0 + TopBraid Composer Plug-in 형태• TopBraid Suite, Onto Suite

• 마케팅 제휴• TopBraid Suite + Onto Suite 미국 및 세계 시장에서 TQ USA• TopBraid Suite + Onto Suite 한국 및 아시아 시장에서 TQ Korea

• 독점 판매권• Korea : 아시아 전역 (중국 제외)• USA : 세계 전역 (아시아 제외)