Csdh sbg clariah_intr01

7
Clariah Structured Data Hub Sounding Board Group mee8ng IISH, Amsterdam Feb 16, 2015

Transcript of Csdh sbg clariah_intr01

Page 1: Csdh sbg clariah_intr01

Clariah  Structured  Data  Hub    

Sounding  Board  Group  mee8ng    

IISH,  Amsterdam  Feb  16,  2015  

Page 2: Csdh sbg clariah_intr01

Clariah:  who,  what,  why?  

“CLARIAH  aims  to  offer  humani5es  scholars  a   ︎︎︎︎︎︎︎   ︎︎︎︎  ‘Common  Lab’  that  provides  them  access  to  large  collec5ons  of  digital  resources  and  

innova5ve  user-­‐friendly  processing  tools,  thus  enabling  them  to  carry  out  ground-­‐breaking  research  to  discover  the  nature  of  human  

culture.“    

Heerma  van  Voss  et  al.,  2013  

Page 3: Csdh sbg clariah_intr01

Clariah:  three  pillars  

•  Language  studies    –  textual  data  and  tools  

•  Media  studies    – audio-­‐visual  data  and  tools  

•  Socio-­‐economic  history  – structured  data  and  tools    

Page 4: Csdh sbg clariah_intr01

Structured  Data  Hub  

Curate  and  link  datasets    For  example:  –  Isolate  datasets  on  laptops  – Data  in  repositories  – Data  on  different  levels:  

•  Micro  (individual)  •  Meso  (organiza8onal,  e.g.  firms,  guilds)  •  Macro  (regional,  country)  

Page 5: Csdh sbg clariah_intr01

Structured  Data  Hub  

Create  tools  to  facilitate  the  research  process  For  example:  – Evaluate  and  clean  data  – Link  data  – Perform  basic  analyses  – Visualize  data  

Page 6: Csdh sbg clariah_intr01

Planning  (months)  •  Design  phase  (1-­‐7)  –  two  pilot  studies  

•  Prepara8on  phase  (7-­‐13)  –  proto-­‐type  of  research  infrastructure  

•  Execu8on  phase,  part  1  (14-­‐26)  –  first  version  of  infrastructure  (first  tools  and  data)  

•  Execu8on  phase,  part  2  (27-­‐48)  –  Polishing  and  extending  first  version  of  infrastructure  

•  Project  close  phase  –  Securing  tools  and  data  at  dedicated  partners,  e.g.  IISH,  DANS  

Page 7: Csdh sbg clariah_intr01

Pilots  Aim:    to  inventories  and  evaluate  issues  in  the  workflow  

from  ‘raw  data’  to  ‘open  linked  data’      Characteris8cs:  •  Two  pilots  •  Six  months  •  On  human  capital  and  social  stra8fica8on  –  Linking  non-­‐linked  data  through  RDF  – Adding  data  from  the  seman8c  web