مقدمه ای بر داده های پيوندی

Post on 21-Nov-2014

2.980 views 12 download

description

مروری بر کارهای انجام شده در داده های پيوندی

Transcript of مقدمه ای بر داده های پيوندی

1389/2/261

دانشگاه اصفهاندانشکده فني و مهندسي

گروه کامپيوتر

3بررسی ساختار و چالشهای وب وب مبتنی بر داده های پيوندی

استاد راهنما:دکتر محمدعلی نعمت بخش

ارائه دهنده:هادي خسروي فارسانی

1389ارديبهشت

2

فهرست مطالب

بررسی وب سنتی و معرفی مشکالت آن•

Linkedمعرفی مفاهيم، اصول و خصوصيات کليدی داده های پيوندی )•Data)

بررسی روش انتشار داده در ساختار جديد•

معرفی تعدادی از ابزارهای مورد استفاده در اين تکنولوژی•

آينده داده های پيوندي•

سوال و پاسخ•

1389/2/26

3

(The Web of Documentوب سنتی )

مشابه •توزيع شدهسيستم فايل يک •

اشياء اوليه•اسناد•

لينک ها مابين • )به عنوان رابطه بخشی از(اسناد•

درجه ساختار در اشياء•بسيار پايين•

معناي محتوا و لينک ها•ضمنیبه صورت •

طراحی شده برای •انسانمصرف •

1389/2/26

4

وب سنتی ) وب مبتنی بر اسناد لينک داده شده(

1389/2/26

5

سيلوهای داده ای در وب•

1389/2/26

6

1389/2/26

سيلوهای داده ای در وب

7

چالشهای وب سنتی

سادگی•داده های با ساختار بسيار پايين، لينک های بدون نوع ، داده های جدا از •هم

يکپارچگی•تمام مقاالت چاپ شده از اساتيد دانشگاه اصفهان در کنفرانس داده کاوی •

را نشان بده

پرس و جوی وب•نام مقاله ای را که من با استادی از دانشگاه تهران چاپ کرده ام•

1389/2/26

8

وب مبتنی بر داده های پيوندی

نه تنها لينک مابين اسناد وجود دارد بلکه مابين موجوديت ها نيز لينک وجود دارد•

1389/2/26

9

وب مبتنی بر داده های پيوندی

مشابه•پايگاه داده توزيع شده يک •

طراحی شده •انسان در ابتدا و سپس برای ماشينبرای •

اشياء اوليه•و يا توصيفی از موجوديت هاموجوديت ها •

لينک مابين •موجوديت ها•

ميزان ساختار در موجوديت ها•بسيار باال•

معنای محتوا و لينک ها•مشخص است.صورت واضح به •

1389/2/26

10

تکنولوژی های مورد استفاده برای داده های پيوندی

URI

RDF

HTTP

(RDFS/OWL)

(FAOF, SKOS, etcتعدادی از انتولوژی های استاندارد )

SPARQL

1389/2/26

11

URI

روشی ساده برای شناسايي منابع در وب •

شماهای مختلفی می تواند استفاده شود••FTP،HTTP ، mailto :

ها از موجوديت هاي واقعی URIتعدادی •

•http://tomheath.com/id/me•http://eng.ui.ac.ir/~khosravi/hadi•http://dbpedia.org/resource/Talis_Group

1389/2/26

12

RDF (Resource Description Framework)

فرمت داده ای برای توصيف موجوديت ها و روابط مابين آنها•

•subject → predicate → object

•Hadi → LivesIn → Isfahan•hadi → WorksFor → ShaikhBahayi

•<uri> → <uri> → <uri> or "literal"

1389/2/26

13

Talis is Based Near Birmingham

<http://dbpedia.org/resource/Talis_Group><http://xmlns.com/foaf/0.1/based_near>

<http://sws.geonames.org/3333125/>

1389/2/26

14

RDF

Prefixesrc: <http://richard.cyganiak.de/foaf.rdf#>rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>foaf: <http://xmlns.com/foaf/0.1/>dbpedia: <http://dbpedia.org/resource/>dp: <http://dbpedia.org/property/>skos: <http://www.w3.org/2004/02/skos/core#>

1389/2/26

15

RDF

1389/2/26

16

SPARQL

استRDF زبان استانداردي براي پرس و جو بر روي آنتولوژي • استاندارد شده و بسيار انعطاف پذير و قدرتمند استw3cاين زبان توسط •

مثال: تمام کالسهايي که از کالس دوربين ديجيتال مشتق مي شوند را •. نشان دهيد

PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT ?name WHERE { ?person foaf:name ?name . }

SELECT ?p ?o { <http://nasa.dataincubator.org/spacecraft/1968-089A> ?p ?o }

1389/2/26

17

SPARQL

PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT * WHERE { ?person foaf:name ?name . ?person foaf:mbox ?email . }

PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?craft ?homepage { ?craft foaf:name "Apollo 7" . ?craft foaf:homepage ?homepage }

1389/2/26

18

SPARQL

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX type: <http://dbpedia.org/class/yago/> PREFIX prop: <http://dbpedia.org/property/>

SELECT ?country_name ?population WHERE { ?country a type:LandlockedCountries ; rdfs:label ?country_name ; prop:populationEstimate ?population . FILTER (?population > 15000000) . }

1389/2/26

19

FOAF: Friend of A Friend

برای توصيف افراد: RDF Vocabluary يک •نام، نام خانوادگی، و بقيه اطالعات درباره شخص•عالقه های آنها•دوستان شخص•شبکه های اجتماعی••FOAF Ontology

1389/2/26

20

SKOS: Simple Knowledge Organization System

RDF Vocabluary يک •

برای مدل کردن و به اشتراک گذاری سيستمهای اطالعاتی•

SKOS:relatedSKOS:BroaderSKOS:Collecion…

مشاهده استاندارد•

1389/2/26

21

تکنولوژی های مورد استفاده در داده های پيوندی

1389/2/26

22

(Linked Data Principlesاصول داده های پيوندی )

1389/2/26

23

The Web of Data

The Linking Open Data ProjectLOD Project

1389/2/26

24

LOD project

انجام شد W3Cپروژه ای است که با پشتيبانی •

شروع شد.2007در سال •

تبديل RDFمجموعه داده های موجود در وب را گرفته و آنها را به فرمت •کردند.

داده ها را با داده های ديگر لينک دادند•

1389/2/26

25

مشارکت کنندگان

• Massachusetts Institute ofTechnology (US)• University of Southampton (UK)• Freie Universitat Berlin (DE)• DERI (IE)• KMi, Open University (UK)• University of London (UK)• Universitat Hannover (DE)• University of Pennsylvania (US)• Universitat Leipzig (DE)• Universitat Karlsruhe (DE)• Joanneum (AT)• University of Toronto (CA)

1389/2/26

• BBC (UK)• Talis (UK)• Garlik (UK)• OpenLink (UK)• Thomson Reuters (US)• Zitgist (US)• Mondeca (FR)• Cyc Foundation (US)

26

1389/2/26

27

DBPediaفرايند ساخت

1389/2/26

مثال ديگر: شهر برلين•

28

DBPediaفرايند ساخت

1389/2/26

29

DBPediaفرايند دسترسی به

1389/2/26

Semantic Web browsers Disco Tabulator OpenLink Data Web Browser

Semantic Web crawlers SWSE Swoogle

Semantic Web query Semantic Web Client Library SemWeb client

30

Geonames

1389/2/26

31

May 2007در ماه

1389/2/26

32

July 2007در

1389/2/26

33

August 2007در

1389/2/26

34

November 2007در

1389/2/26

35

Feb 2008در

1389/2/26

36

Sep 2008در

1389/2/26

37

2009در سال

1389/2/26

38

LOD DataSet

1389/2/26

39

Linked Set in LOD

1389/2/26

40

مرحله اساسی برای انتشار داده های پيوندی5

(Linked Data Principles فهم اصول انتشار داده ها )1.

شناخت داده هايي که می بايست انتشار يابند2.

برای موجوديت ها در داده هاURI انتخاب 3.

ايجاد زيرساختار 4.

پيوند )لينک( با ديگر داده ها 5.

1389/2/26

41

1 .Linked Data Principles

Use URIs as names for things anything, not just documents you are not your homepage information resources and non-information resources

Use HTTP URIs globally unique names, distributed ownership allows people to look up those names

Provide useful information in RDF when someone looks up a URI

Include RDF links to other URIs to enable discovery of related information

1389/2/26

42

. فهم داده ها2

موجوديت های اساسي در داده ها را شناسايي کنيد•

افراد•مکانها•عکس ها•فيلم ها•کتابها•مفاهيم•نظرات•مرورها•موسيقی ••....

1389/2/26

43

. فهم داده ها2

از چه واژه نامه ای برای توصيف اين داده ها استفاده شود•اصل•

تا حد ممکن استفاده مجدد شود، در صورت نياز مجدد تعريف شود.•

آنتولوژي های ممکن که می توانند مورد استفاده قرار گيرند••Geo•FOAF•GoodRelations•Review•SIOC•SKOS•Dbpedia•RDFS•

1389/2/26

44

برای موجوديت های شناسايي URI. انتخاب 3

• http://dbpedia.org/resource/New_York_City ← Thing• http://dbpedia.org/data/New_York_City ← RDF data• http://dbpedia.org/page/New_York_City ← HTML page

• http://kmi.open.ac.uk/people/tom/ ← Thing• http://kmi.open.ac.uk/people/tom/rdf ← RDF data• http://kmi.open.ac.uk/people/tom/html ← HTML page

1389/2/26

45

. لينک به ديگر داده ها4 تعدادی ازpredicateهای معروف برای لينک دادن

owl:sameAs

foaf:homepage

foaf:topic

foaf:based_near

foaf:maker/foaf:made

foaf:depiction

foaf:primaryTopic

rdfs:seeAlso

1389/2/26

46

. لينک دادن به مجموعه داده های ديگر4

الگوريتم های لينک دهی•(String Matchingتطابق رشته ای )•

تطابق مبتنی بر کليد مشترک• UNSPSC و ISBNمثال •

تطابق مبتنی بر خصوصيات•اگر دو موجوديت دارای برچسب يکسان، نوع يکسان و ... يکسان •

باشند

1389/2/26

47

چرا داده های پيوندی انتشار يابند؟

سادگی يافتن•

سادگی مصرف•اشتراک داده به صورت استاندارد•

کاهش تکرار•

ارزش افزوده•

1389/2/26

48

مزايای داده های پيوندی

(Publishing Dataروش برای انتشار داده ها بر روی وب )•

استفاده مجدد را باال می برد•

تکرار را کاهش می دهد.•

سادگي مصرف، اشتراک داده به صورت استاندارد•

اتصاالت داخلی را افزايش می دهد.•

باعث افزايش ارزش برای داده ها می شود.•

1389/2/26

49 1389/2/26

Linked Data Applications

50

تعدادی از برنامه های که از داده های پيوندی استفاده می کنند

1389/2/26

51

تعدادی از ابزارهای توسعه يافته شده

مرورگرها••Marbles & DBPedia Mobile

جستجو•Falconsبا استفاده از •

•Mashup• Revyu ، BBC Music

1389/2/26

52

SPARQL و RDFa،GRDDLاليه اول :

•RDFa

1389/2/26

53

RDFaتوصيف يک مقاله با استفاده از

1389/2/26

54

RDFaبا استفاده از توصيف يک عکس

1389/2/26

55

RDFaتوصيف يک شخص در سند با استفاده از

1389/2/26

56

آينده داده های پيوندی

همه گير شدن استفاده از تکنولوژی نياز به زمان و شرايط محيطی دارد.•

داده های پيوندی در حوزه های دولتی و سازمانی اعمال خواهد 2010در سال •شد

ابزارها و کتابخانه های داده های پيوندی همه گير خواهد شد. 2011 در سال • در برنامه هايشان همچون يک پايگاه داده محلی استفاده LODبرنامه نويسان از

می کنند.

به وجود خواهد آمد. و مسايل LOD هزاران مجموعه داده 2012در سال • و مجموعه داده های پويا حل خواهد شد. Provananceمربوط به

•Special Issue of Web Semantic Journal Sep 2010

راه حلهای مبتنی بر داده های پيوندی به عنوان راه حلهايي 2013در سال •SOA.سازمانها خواهد شد

داده های پيوندی همچون يک درس ابتدايي خواهد شد. 2014در سال •بازی تمام شده است•1389/2/26معما چو حل گشت آسان شود.•

57

؟

1389/2/26

58/

با تشکر از حoسن توجه شما

1389/2/26

59

رتبه بندی در داده های پيوندی موتورهای جستجو در وب سنتی دارای بخشي برای رتبه بندی هستند

،هدف اصلي رتبه بندی اسناد است در وب ستنی

.در وب جديد، هدف اصلی رتبه بندی موجوديت ها است

هر چقدر لينک به يک موجوديت بيشتر شود احتماال آن موجوديت در بين موجوديت های مشابه خودش دارای اعتبار بيشتری است.

عالوه بر تعداد لينک به يک داده در اين ساختار، معيارهای ديگری نيز الزم است اين که يک داده چقدر اعتبار دارد، چفدر به روز است، منشا آن مدنظر قرار گيرند.

تواند در رتبه کجاست و مفاهيم ديگری که همگی مرتبط با کيفيت داده است میبندی مفاهيم مدنظر باشد.

1389/2/26

60 1389/2/26

موتور جستجوی مبتنی بر داده های پيوندی