Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

119
Impact of Open Data and Linked Open Data Venezuela Maria-Esther Vidal Universidad Simón Bolívar 1 [email protected] h1p://www.ldc.usb.ve/~mvidal Twi1er @Maria11576561 Skype: mevs2006

description

El impacto de open data en el mundo y en Venezuela. Profesora Maria Esther Vidal. Universidad Simón Bolivar. Presentacion realizada durante el boot camp sobre periodismo de datos-Venezuela.

Transcript of Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Page 1: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Impact of Open Data and Linked Open Data

Venezuela

Maria-Esther Vidal

Universidad Simón Bolívar

1  

[email protected]  h1p://www.ldc.usb.ve/~mvidal  Twi1er  @Maria11576561  Skype:  mevs2006  

Page 2: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Lights  around  the  London's  2012  Olympic  stadium  describe  Sir  Tim  Berners-­‐Lee's  invenKon,  the    World  Wide  Web.  The  Open  Data  InsKtute,  which  he  co-­‐founded,  declares  a  mandate  of    'Knowledge  for  Everyone'.  

Page 3: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Sir  Tim  Berners-­‐Lee  (right)  and  Sir  Nigel  Shadbolt  (leT)  

“The  ODI  announced  new  13  nodes:  US,  Canada,  France,  Dubai,  Italy,  Russia,  Sweden  and  ArgenKna.”  Oct  29    2103  

Page 4: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Agenda

Ø Open Data Ø Linked Open Data

ü Linked Open Data in Journalism Ø Linked Open Data Applications

ü Linked Open Data at USB Ø Conclusions and Future Directions

Page 5: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

OPEN  DATA  

Page 6: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open Data

6  

Definition http://opendefinition.org/: “A piece of data or content is open if anyone is

free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and/or share-alike.”

Availability and access Reuse and Distribution Universal Participation

7/1/13 9:33 PMOpen_Data_stickers.jpg 1,024×768 pixels

Page 1 of 1http://ec.europa.eu/digital-agenda/sites/digital-agenda/files/Open_Data_stickers.jpg

Page 7: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open Data

7  

 Availability and Access: Data should be available as a whole, preferably downloading via the Internet.

Data should be available in a convenient format.

Should be free or at most at a reproduction cost.

Page 8: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open Data  

8  

Reuse and Distribution: Data should be offered in a way that it can be reused, distributed and be interrelated with other datasets.

Page 9: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open Data  

9  

Universal Participation: Any person should be able to use, reuse and distribute.

NO discrimination: Commercial vs. NOT commercial Educational vs. NOT educational

Profit vs. No Profit

Page 10: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Type of Open Data

Page 11: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

11  

Interoperability   Transparency  

Page 12: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

12  

Avoid  CorrupKon  

Wealth  Only  in  Europe  over  140  billion  of  euros  per  year  h1p://www.economist.com/news/business/21578084-­‐making-­‐official-­‐data-­‐public-­‐could-­‐spur-­‐lots-­‐innovaKon-­‐new-­‐goldmine  

Page 13: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

13  

Quality  of  Life  Research  and  Development  

Page 14: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

14  

Data  Quality  Improve  Public  AdministraKon  

Page 15: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

15  

Citizens can express themselves and unite so that their voices can be heard.

h1p://www.ted.com/talks/sanjay_pradhan_how_open_data_is_changing_internaKonal_aid.html  

Page 16: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open  Licenses  

Open  Source  

Open  Standards  

Open  ParKcipaKon  

Open  Data  

Page 17: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

What is and what is not Open Data Open  Data.  

“A piece of content or data is open if you are free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and share-alike.”

Difference between open data and data that is publicly available lies in the use of formats that may be read, used and redistributed by any citizen. Examples of public data that is not open data: data in spreadsheets, pdf, etc. Usually open data are csv. h1p://opensource.com/government/10/12/what-­‐“open-­‐data”-­‐means-­‐–-­‐and-­‐what-­‐it-­‐doesn’t  

Page 18: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Opening Up Data Rules

Ø Keep it simple Ø  Engage early and

engage often Ø Address common fears

and misunderstandings

Four Steps

Ø Choose your Dataset(s) Ø Apply an Open License Ø Make the data available Ø Make it discoverable

Page 19: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open Data Conditions

Data Providers Requirements Ø Attribution: data

providers may require to receive credit.

Ø  Integrity: data providers may require that users indicate if data change.

Ø  Share-alike: data providers may impose that any dataset created using their data are also open.

Distributing Open Data Ø Data is machine-readable Ø Data is available in bulk

more than using an API.

h1p://opendatahandbook.org/en/  

Page 20: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

OPEN  DATA  APPLICATIONS  

Page 21: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

OPEN  DATA  AND  GOVERNMENT  

Page 22: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Some Open Data Applications

22  

Al  menos  77  países  cumplen  nivel  >  2  

h1p://wheredoesmymoneygo.org/  

Page 23: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

Citizens may unite so that

their voices can be heard

Page 24: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

h1p://www.ted.com/talks/sanjay_pradhan_how_open_data_is_changing_internaKonal_aid.html  

Monrovia  África  

Page 25: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

Tanzanía  

h1p://www.ted.com/talks/sanjay_pradhan_how_open_data_is_changing_internaKonal_aid.html  

Page 26: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

Tanzanía  

h1p://www.ted.com/talks/sanjay_pradhan_how_open_data_is_changing_internaKonal_aid.html  

Page 27: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

Tanzanía  

h1p://www.ted.com/talks/sanjay_pradhan_how_open_data_is_changing_internaKonal_aid.html  

Page 28: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://www.tableausoTware.com/public/gallery/london-­‐deprivaKon  

Page 29: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

OPEN  DATA  AND  PUBLIC  HEALTH  

Page 30: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Vaccines and Immunisation in Australia

h1p://www.theguardian.com/society/datablog/interacKve/2013/oct/16/children-­‐vaccinaKon-­‐australia-­‐map  

Page 31: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://www.cfr.org/interacKves/GH_Vaccine_Map/index.html#map  

Page 32: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Applications of Open Data  h1p://pinterest.com/socrata/open-­‐data-­‐applicaKons/  

Kenia  

Page 33: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

OPEN  DATA  AND  SOCIETY    

Page 34: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

ApplicaKons  of  Open  Data  h1p://www.crimemapping.com/  

Page 35: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://www.tableausoTware.com/public/gallery/tcc13friends  

Page 36: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

OPEN  DATA  AND  FINANCES  

Page 37: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://opencorporates.com/viz/financial/index.html#bankofamerica/ch/934  

Who Owns Who

Page 38: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://opencorporates.com/viz/financial/index.html#goldman/ch/2213  

Who Owns Who

Page 39: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

OPEN  DATA  AND  ENVIRONMENT  

Page 40: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Why Open Data?

40  

Improve  Public  Services  

Mejorar  la  Administración  Pública  

Smart  CiKes  

Page 41: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://visualizaKon.geblogs.com/visualizaKon/co2/  

Page 42: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://www.visualizing.org/full-­‐screen/27036  

Page 43: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://www.visualizing.org/full-­‐screen/27036  

Page 44: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Applications of Open Data  h1p://opendatachallenge.org/  

 

Page 45: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

LINKED  OPEN  DATA  

h1p://www.ted.com/talks/lang/en/Km_berners_lee_the_year_open_data_went_worldwide.html  

Page 46: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

What to do with Open Data?

46  

Page 47: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

What to do with Open Data?

47  

At  least  77  countries  comply  level  >  2  h1p://www.slideshare.net/mgarrigap/opendata-­‐en-­‐el-­‐ararteko  

Page 48: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

What to do with Open Data?

48  

At least 11 countries comply level > 4 h1p://www.slideshare.net/mgarrigap/opendata-­‐en-­‐el-­‐ararteko  

Page 49: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

What to do with Open Data?  

h1p://www.theguardian.com/news/datablog/2013/oct/28/uk-­‐top-­‐open-­‐data-­‐index-­‐how-­‐countries-­‐compare#!  

Page 50: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://www.theguardian.com/news/datablog/2013/oct/28/uk-­‐top-­‐open-­‐data-­‐index-­‐how-­‐countries-­‐compare#!  

Page 51: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Bottom 10 by Open Data Index Score  

h1p://www.theguardian.com/news/datablog/2013/oct/28/uk-­‐top-­‐open-­‐data-­‐index-­‐how-­‐countries-­‐compare  

Page 52: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 53: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 54: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Local  Governments  must  use  Open  Data  to  stay  connected  

with  the  ciKzens!  

Page 55: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

IRMLs  2010-­‐ESWC  2010  

MoKvaKon  SemanKc  Web  EvoluKon  

80’s 00’s

90’s Now

Arpanet: four servers connected Files were transferred Tools: ftp, telnet, e-mail

Hyperlink-based systems. Protocols: http, uri, html Documents and data were published

Published Data are enhanced with semantics! Standards to annotate and describe data: XML, RDF, RDFS, OWL. Standards to query data: SPARQL. Ontologies representing almost any domain.

The Linked Open Data cloud, using the Web to connect related data that was not previously linked!

Page 56: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

The Linked Open Data Cloud    • Explosion in the number of:

– Linking Open Data resources and databases – Different quality parameters. – Controlled vocabularies:

– MeSH, GO, PO… – Highly interconnected data sources:

Different Sizes Many links • Different in- and out-degrees, etc

• Biological Web: large datasets of linking data.

• Genes, Diseases, Clinical Drugs, Proteins, and so on.

Molecular databases 1170, 95 more than 2008 and 110 more than the year before ! Services and tools published by these databases follow a similar progression! In October 2007, Cloud of Linked Data datasets consisted of over two billion RDF triples, which were interlinked by over two million RDF links. By May 2009 this had grown to 4.2 billion RDF triples, interlinked by around 142 billions RDF links! Today the Linked Open Data cloud has at least 295 datasets, 31,634,213,770  triples, and 503,998,829  links.

Page 57: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 58: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 59: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 60: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

StaKsKcs  

Page 61: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

LINKED  DATA  IN  JOURNALISM  

Page 62: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open Data in Journalism  Ø It may be trendy but not new. Ø Open Data implies Open Data Journalism. Ø Data is not necessarily curated. Ø Bigger Datasets and Small Things. Ø Data Journalism is 80% perspiration, 10% great

ideas, 10% output. Ø Long and short-form. Ø Anyone can do it. Ø Visualization is important. Ø Data publishers do not have to be programmers. Ø It is all about stories.

h1p://www.theguardian.com/news/datablog/2011/jul/28/data-­‐journalism  

Page 63: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open Data in Journalism

Shared  Data  

Running  Events  

Breaking  News  

Open  Data  

Page 64: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Open Data in Journalism

• Data Cleansing • Conflict Resolution

Data  IntegraKon  

• Meta-Data Annotation

• Vocabularies

SemanKficaKon   • Visualization • Publishing the Story

PublicaKon  

Shared  Data  

Running  Events  

Breaking  News  

Open  Data  

Page 65: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Meta-Data BBC News  

h1p://www.bbc.co.uk/blogs/internet/posts/News-­‐Linked-­‐Data-­‐Ontology  

This will help users to find news content about the stories they want to know about and ultimately help to open up references to the data contained in those stories.

Page 66: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Data Management Tools- BBC News  

h1p://www.bbc.co.uk/blogs/internet/posts/Linked-­‐Data-­‐ConnecKng-­‐together-­‐the-­‐BBCs-­‐Online-­‐Content  

Page 67: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 68: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://www.slideshare.net/moustaki/linked-­‐data-­‐on-­‐the-­‐bbc-­‐2638734  

Page 69: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 70: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

More  Ontologies  to  represent  Meta-­‐Data  

Page 71: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 72: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 73: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

VISUALIZING  LINKED  OPEN  DATA  

Page 74: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Challenges  for                                                                    Linked  Data  Visualization  

EUCLID  –  InteracKon  with  Linked  Data   74  

•  Enabling  user  interacKon  –  Users  must  be  able  to  navigate  through  the  data  by  exploiKng  the  

connecKons  between  Linked  Data  resources  –  The  user  might  edit  the  underlying  data  to  enrich  it  by:    

•  CreaKng  addiKonal  metadata  •  HighlighKng  or  correcKng  errors  •  ValidaKng  data  

•  SupporKng  data  reusability  –  The  output  (the  plo1ed  data  or  the  visualizaKon  itself)  might  be  

encoded  using  standard  ontologies  and  vocabularies      

•  Scalability  –  Linked  Data  visualizaKon  techniques  should  support  the  display  of  

large  amount  of  data  in  an  efficient  way  

Page 75: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Challenges  for                                                                    Linked  Open  Data  Visualization  

EUCLID  –  InteracKon  with  Linked  Data   75  

•  ExtracKng  data  from  different  repositories  –  A  Linked  Data  set  might  be  parKKoned  into  several  repositories    –  The  region  of  interest  (ROI)  might  include  data  from  different  data  

sets,  requiring  the  access  to  distributed  repositories  

•  Handling  heterogeneous  data  –  The  same  data  (concepts)  might  be  modeled  differently,  for  example,  

using  different  vocabularies  –  Certain  values  might  have  different  formats,  for  example,  dates  

represented  as  DD-­‐MM-­‐YYYY,  MM-­‐DD-­‐YYYY  or  just  YYYY  

•  Dealing  with  missing  values  –  Due  to  the  semi-­‐structuredness  of  Linked  Data,  some  instances  might  

have  missing  values  for  certain  properKes  

Page 76: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Linked  Open  Data  VisualizaKon  Techniques    

EUCLID  –  InteracKon  with  Linked  Data   76  

View  

Page 77: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Bar/column  chart    Allows  the  comparison  of  values  of  different  categories.      

Pie  chart  Useful  for  performing  comparison  of  percentages  or  proporKons.      

Comparison  of                                                                                                      A1ributes  /  Values  

77  EUCLID  –  InteracKon  with  Linked  Data  

Line  chart  Allows  visualizing  data  as  a  series  of  data  points,  where  the  measurement  points  (x-­‐axis)  are  ordered.      

 

Histogram  Graphical  representaKon  of  the  distribuKon  of  the  data.  

Image  source:  h1p://mbostock.github.io/protovis/      Image  source:  h1p://musicbrainz.fluidops.net  

Image  source:  h1p://mbostock.github.io/protovis/      Image  source:  h1p://musicbrainz.fluidops.net  

Page 78: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Arc  diagram  The  nodes  are  displayed  in  one  dimension,  and  the  arcs  represent  the  connecKons.      

Analysis  of                                          RelaKonships  and  Hierarchies    Graph    The  data  entries  are  represented  as  nodes  and  the  links  as  edges.        

78  EUCLID  –  InteracKon  with  Linked  Data  

Adjacency  Matrix  diagram  The  nodes  are  displayed  as  rows  and  columns,  and  the  links  between  the  nodes  are  entries  in  the  matrix.  

 

Node-­‐link  visualizaKons  The  data  is  organized  in  hierarchies.  

Source  of  images:  h1p://mbostock.github.io/protovis/      

Page 79: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Icicles  and  sunburst  Hierarchies  are  represented  by  adjacencies.    

Analysis  of                                          RelaKonships  and  Hierarchies  (2)    Treemaps  Subdivide  area  into  rectangles.  

79  EUCLID  –  InteracKon  with  Linked  Data  

Circle-­‐packing      Containment  is  used  to  represent  the  hierarchies.  

Rose  diagrams  Areas  are  equal  angles  and  the  data  is  represented  by                                                            the  extension  of                                                                                      the  area.  

Source  of  images:  h1p://mbostock.github.io/protovis/      

Space-­‐filling  techniqu

es  

Page 80: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Analysis  of    Temporal  or  Geographical  Events    

Timeline  

 

80  EUCLID  –  InteracKon  with  Linked  Data  

Maps  

 

Source:  h1p://mbostock.github.io/protovis/      

Choropleth  maps  Aggregate  data  by  geographical  area  

LocaKon  maps  Display  geo-­‐points  on  a  map  

Dorling  cartograms  Aggregate  data  and  replace  each  area  with  a  circle  

Discrete  data  points  in  Kme   ConKnuous  data  in  Kme  

Source:  h1p://www.ko1ke.org/08/08/2008-­‐movie-­‐box-­‐office-­‐chart  Source:  h1p//musicbrainz.fluidops.net  

Source:  Google  Map  API   Source:  h1p//musicbrainz.fluidops.net  

Page 81: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Libraries    

h1ps://github.com/mbostock/d3/wiki/Gallery  

Page 82: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

APPLICATIONS  

Page 83: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

83  

SPARQL endpoints have been developed to access data from the LOD cloud.

Tasks  to  be  Solved  …  

Traverse and Consume Linked Data from the LOD cloud or locally.

Page 84: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

SPARQL  ENDPOINTS    

Page 85: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

select  disKnct  *  where  {<h1p://dbpedia.org/resource/Venezuela>  ?p  ?o}    

Page 86: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://dbpedia.org/sparql  

All  the  informaKon  related  to  Venezuela  

SPARQL  Query  

Page 87: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 88: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://worldbank.270a.info/about.html  

Page 89: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

SPARQL  Endpoint    URL  

SPARQL  Query  

Page 90: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 91: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

SPARQL  Query  

Page 92: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

dbpedia:  The_Beatles  foaf:made  

<h1p://  musicbrainz.org/

record/...>  

<h1p://  musicbrainz.org/

record/...>  

foaf:made  Data:  

"Help!"   "Let  It  Be"  

dc:Ktle   dc:Ktle  

<h1p://  musicbrainz.org/

record/...>  

"Abbey  Road"  

dc:Ktle  

foaf:made  

Page 93: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

SELECT  ?x  ?name  ?mbox  ?country  ?reviewer  ?product  ?title  WHERE  {    <http://www4.wiwiss.fu-­‐berlin.de/bizer/bsbm/v01/instances/dataFromRatingSite293/Review2883011>  rev:reviewer  ?x  .        ?x  <http://www.w3.org/1999/02/22-­‐rdf-­‐syntax-­‐ns#type>  <http://xmlns.com/foaf/0.1/Person>  .      ?x  <http://xmlns.com/foaf/0.1/name>  ?name  .      ?x  <http://xmlns.com/foaf/0.1/mbox_sha1sum>  ?mbox  .      ?x  <http://www4.wiwiss.fu-­‐berlin.de/bizer/bsbm/v01/vocabulary/country>  ?country  .      ?reviewer  <http://purl.org/stuff/rev#reviewer>  ?x  .      ?reviewer  <http://www4.wiwiss.fu-­‐berlin.de/bizer/bsbm/v01/vocabulary/reviewFor>  ?product  .      ?reviewer  <http://purl.org/dc/elements/1.1/title>  ?title  }  

Page 94: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Graph  Databases  

Page 95: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

APPLICATIONS  DEVELOPED  AT  USB  FEDERATED  QUERIES  

Page 96: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

ANAPSID  

SPARQL-DQP  

Federations of Endpoints

Page 97: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

97  

SELECT  DISTINCT  ?D1?TGD  ?GN1  ?GN2  WHERE  {  

 ?CT1  <http://data.linkedct.org/resource/linkedct/condition>  ?C1  .    ?CT1<http://data.linkedct.org/resource/linkedct/intervention>  ?I  .      ?CT1<http://data.linkedct.org/resource/linkedct/intervention>  ?I  .    ?I<http://data.linkedct.org/resource/linkedct/intervention_type>  "Drug"  .    ?C1  <http://www.w3.org/2000/01/rdf-­‐schema\#seeAlso>  ?D1  .    ?I  <http://www.w3.org/2000/01/rdf-­‐schema\#seeAlso>  ?I1  .    ?C  <http://data.linkedct.org/resource/linkedct/condition_name>  "Breast  Cancer"  .    ?CT  <http://data.linkedct.org/resource/linkedct/intervention>  ?I  .    ?CT  <http://data.linkedct.org/resource/linkedct/condition>  ?A4  .    ?II  <http://www4.wiwiss.fu-­‐berlin.de/drugbank/resource/drugbank/target>  ?TGD  .    ?TGD  <http://www4.wiwiss.fu-­‐berlin.de/drugbank/resource/drugbank/genbankIdGene>  ?GN1  .    ?D1  <http://www4.wiwiss.fu-­‐berlin.de/diseasome/resource/diseasome/associatedGene>  ?GN2  .  

}  

“Genes and diseases that have been studied for drugs tested in clinical trials where Breast Cancer was studied”

Life Sciences Query:

Federated Queries ANAPSID  

h1ps://github.com/anapsid/anapsid  

Page 98: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

98  

SELECT  DISTINCT  ?D1  ?TGD  ?GN1  ?GN2  WHERE  {            {  SERVICE  <http://virtuoso.bd.cesma.usb.ve/sparql>  {                    ?C1  <http://data.linkedct.org/resource/linkedct/condition_name>  "Breast  Cancer"  .                    ?C1  <http://www.w3.org/2000/01/rdf-­‐schema#seeAlso>  ?D1  .                    ?C3  <http://www.w3.org/2000/01/rdf-­‐schema#seeAlso>  ?D1  .                    ?CT3  <http://data.linkedct.org/resource/linkedct/condition>  ?C3  }}  .              {  SERVICE  <http://virtuoso.bd.cesma.usb.ve/sparql>  {                    ?C1  <http://data.linkedct.org/resource/linkedct/condition_name>  "Breast  Cancer"  .                    ?I  <http://data.linkedct.org/resource/linkedct/intervention_type>  "Drug"  .                    ?CT1  <http://data.linkedct.org/resource/linkedct/condition>  ?C1  .                    ?CT1  <http://data.linkedct.org/resource/linkedct/intervention>  ?I  }}  .              {  SERVICE  <http://www4.wiwiss.fu-­‐berlin.de/drugbank/>  {                    ?I1  <http://www4.wiwiss.fu-­‐berlin.de/drugbank/resource/drugbank/target>  ?TGD  .                    ?TGD  <http://www4.wiwiss.fu-­‐berlin.de/drugbank/resource/drugbank/genbankIdGene>  ?GN1  }}  .              {  SERVICE  <http://virtuoso.bd.cesma.usb.ve/sparql>  {                    ?I  <http://data.linkedct.org/resource/linkedct/intervention_type>  "Drug"  .                    ?I  <http://www.w3.org/2000/01/rdf-­‐schema#seeAlso>  ?I1  .                    ?CT3  <http://data.linkedct.org/resource/linkedct/intervention>  ?I  .                    ?CT3  <http://data.linkedct.org/resource/linkedct/condition>  ?C3  }}  .    }    

S1:  

S2:  

S3:  

S4:  

Federated Queries ANAPSID  

h1ps://github.com/anapsid/anapsid  

Page 99: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

S4  

S1  

S2  

S3  

99  

Federated Queries ANAPSID  

h1ps://github.com/anapsid/anapsid  

Page 100: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

ANAPSID  

ANAPSID  ANAPSID  

h1p://silurian.thalassa.cbm.usb.ve/  

Page 101: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

101  

“Drugs that possibly target Leukemia”

SELECT  DISTINCT  ?drug1        WHERE  {  ?drug1  drugbank:possibleDiseaseTarget  diseasome:673  .        ?drug1  drugbank:target  ?o.          ?o  drugbank:genbankIdGene  ?g.          ?o  drugbank:locus  ?l.          ?o  drugbank:molecularWeight  ?mw.          ?o  drugbank:hprdId  ?hp.          ?o  drugbank:swissprotName  ?sn.          ?o  drugbank:proteinSequence  ?ps.        ?o  drugbank:generalReference  ?gr.          ?drug  drugbank:target?o.          ?drug  drugbank:synonym?o1  .      OPTIONAL  {          ?drug  owl:sameAs  ?drug5  .                        ?drug5  rdf:type  dbcategory:Drug  .                        ?drug  drugbank:keggCompoundId  ?cpd  .                          ?enzyme  kegg:xSubstrate  ?cpd  .                          ?enzyme  rdf:type  kegg:Enzyme  .                          ?reaction  kegg:xEnzyme  ?enzyme  .                        ?reaction  kegg:equation  ?equation  .      }  }  

h1p://silurian.thalassa.cbm.usb.ve/  

Page 102: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

102  

“Drugs that possibly target Leukemia”

SELECT  DISTINCT  ?drug1        WHERE  {  ?drug1  drugbank:possibleDiseaseTarget  diseasome:673  .        ?drug1  drugbank:target  ?o.          ?o  drugbank:genbankIdGene  ?g.          ?o  drugbank:locus  ?l.          ?o  drugbank:molecularWeight  ?mw.          ?o  drugbank:hprdId  ?hp.          ?o  drugbank:swissprotName  ?sn.          ?o  drugbank:proteinSequence  ?ps.        ?o  drugbank:generalReference  ?gr.          ?drug  drugbank:target?o.          ?drug  drugbank:synonym?o1  .      OPTIONAL  {          ?drug  owl:sameAs  ?drug5  .                        ?drug5  rdf:type  dbcategory:Drug  .                        ?drug  drugbank:keggCompoundId  ?cpd  .                          ?enzyme  kegg:xSubstrate  ?cpd  .                          ?enzyme  rdf:type  kegg:Enzyme  .                          ?reaction  kegg:xEnzyme  ?enzyme  .                        ?reaction  kegg:equation  ?equation  .      }  }  

h1p://silurian.thalassa.cbm.usb.ve/  

Page 103: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

103  

“Drugs that possibly target Leukemia”

SELECT  DISTINCT  ?drug1        WHERE  {  ?drug1  drugbank:possibleDiseaseTarget  diseasome:673  .        ?drug1  drugbank:target  ?o.          ?o  drugbank:genbankIdGene  ?g.          ?o  drugbank:locus  ?l.          ?o  drugbank:molecularWeight  ?mw.          ?o  drugbank:hprdId  ?hp.          ?o  drugbank:swissprotName  ?sn.          ?o  drugbank:proteinSequence  ?ps.        ?o  drugbank:generalReference  ?gr.          ?drug  drugbank:target?o.          ?drug  drugbank:synonym?o1  .      OPTIONAL  {          ?drug  owl:sameAs  ?drug5  .                        ?drug5  rdf:type  dbcategory:Drug  .                        ?drug  drugbank:keggCompoundId  ?cpd  .                          ?enzyme  kegg:xSubstrate  ?cpd  .                          ?enzyme  rdf:type  kegg:Enzyme  .                          ?reaction  kegg:xEnzyme  ?enzyme  .                        ?reaction  kegg:equation  ?equation  .      }  }  

h1p://silurian.thalassa.cbm.usb.ve/  

Page 104: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

APPLICATIONS-­‐  LINK  PREDICTION  AND  PATTERN  DISCOVERY    

Page 105: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

105  

��������

������

���������

��� �����

����������

�������� ���

� ���������

� ��� ����

� ��� ����

� ��� ����

� ��� ����

���������� ��������

!��"���# $�%%��#

� ���������

� ���������

� ��������&

� ���������

A significant increase of graph data in the form of social & biological information.

Tasks  to  be  Solved  …(2)  

Patterns of connections between people to understand functioning of society.

Topological properties of graphs can be used to identify patterns that reveal phenomena, anomalies and potentially lead to a discovery.

Page 106: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 107: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Annotation Graph

107  

Page 108: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Pa1erns  or  Signatures  Brentuzumab_vedoKn  And  Catumaxomab    

108  

Page 109: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Chloroplast  

AtVHA-­‐C5  AtVHA-­‐C  

Vacuole  

Vacuolar  Membrane  

Vacuole  

Golgi    apparatus  

Plant-­‐type  vacuole  

Chloroplast  

Gene  Gene  

GO  Paths  

Vacuole    proton-­‐  TransporKng    V-­‐type    ATPase  ,  V1    domain    

GO  Terms  

GO  Terms  

Vacuolar  Membrane  

Annotation Similarity between two genes based on shared GO annotations

109  

Page 110: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

 Pa1erns  or  Signatures  between  genes  AtVHA-­‐C5  and  AtVHA-­‐C  

   

110  

Page 111: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 112: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Drug-Target Interaction Network    

112  

Pa1erns  Between  InteracKons    

PotenKal  new  interacKon  

Page 113: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

113  

Patterns of connections between people to understand functioning of society.

Page 114: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013
Page 115: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

h1p://www.visualizing.org/full-­‐screen/27036  

Page 116: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Conclusions Ø  Open Data:

ü  Transparency ü  Interoperability ü  Avoid Corruption ü  Impulse research and development ü Data Quality

116  

Ø  Linked Open Data: ü  RDF data ü  Linked to existing datasets ü  Endpoints can be used to access data

Page 117: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Conclusions Ø Open Data Applications:

ü Citizens can developed applications to take control of their lives.

Ø (Linked) Open Data can be used: Ø Link Prediction Ø Discover Complex Patterns.

117  

Page 118: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

Future Directions

Page 119: Presentación Prof. Maria Esther Vida. DataBootCampVE/31 octubre 2013

THANKS! QUESTIONS

Maria-Esther Vidal

Universidad Simón Bolívar

119  

[email protected]  h1p://www.ldc.usb.ve/~mvidal  Twi1er  @Maria11576561  Skype:  mevs2006