CATCHPlus diensten-10jun2011

92
CATCHPlus gemeenschappelijke diensten Hennie Brugman Technisch coordinator 1 CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

description

Gemeenschappelijke Diensten voor Erfgoedinstellingen: Vocabulairebank, User Profile Repository, Persistent Identifiers, Standardisation, Checkers, Workspaces, Annotation Repository ....

Transcript of CATCHPlus diensten-10jun2011

Page 1: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

1

CATCHPlus gemeenschappelijke diensten

Hennie BrugmanTechnisch coordinator

Page 2: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

2

Overzicht

1. Introductie en algemeen overzicht (20+10 minuten)

2. Inzoomen op individuele diensten (5 x 10 min)

3. Beschikbaarheid, duurzame exploitatie, hosting (5 min)

4. Discussie (maximaal 30 min)

Page 3: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

3

CATCHPlus opzet

WP 1: Gemeenschappelijke diensten WP 2: Deel-projecten

WP 3: Framework en interoperabiliteit

MuseumplusCheckersStitchPlusChoralplusScratch4allWitchcraftplusMultiplyChip API

Projectbureau

Projectbureau

Erfgoed-instellingen

Page 4: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

4

De uitdaging van CATCHPlus• Samenhang tussen heel verschillende tools

en diensten realiseren• Toepasbaarheid over grenzen van collecties

en instellingen bevorderen• Resultaten gedistribueerd en online op het

web beschikbaar maken• Samen ontwikkelen waar dat kan• Bijdragen aan infrastructuur voor het

Nederlands digitaal erfgoed• Duurzame exploitatie en hosting

Page 5: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

5

Benadering• Uniform omgaan met 4 soorten data

– Terminologie (vocabulaires)– Annotaties– Catalogi (metadata)– Digitale objecten

• Duurzame verwijzingen (persistent identifiers)• Breed inzetbare componenten opwaarderen tot

gemeenschappelijke diensten

Page 6: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

6

• Uniform omgaan met 4 soorten data– Terminologie (vocabulaires)– Annotaties– Catalogi (metadata)– Digitale objecten

• Duurzame verwijzingen (persistent identifiers)• Breed inzetbare componenten opwaarderen tot

gemeenschappelijke diensten

Vocabulaire en AlignmentRepository

“Uniform representeren, publicerenen doorzoekbaar maken van thesauri door middel van web services”

Page 7: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

7

• Uniform omgaan met 4 soorten data– Terminologie (vocabulaires)– Annotaties– Catalogi (metadata)– Digitale objecten

• Duurzame verwijzingen (persistent identifiers)• Breed inzetbare componenten opwaarderen tot

gemeenschappelijke diensten

Annotation & Recommendation

“Uniform representeren, opslaan,doorzoekbaar en uitwisselbaar maken vanuiteenlopende annotaties van (delen van) bronnen op het web”

Page 8: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

8

• Uniform omgaan met 4 soorten data– Terminologie (vocabulaires)– Annotaties– Catalogi (metadata)– Digitale objecten

• Duurzame verwijzingen (persistent identifiers)• Breed inzetbare componenten opwaarderen tot

gemeenschappelijke diensten

Standaard toegang dmvOAI data providers

“Ondersteuning van depublicatie van metadata mbv OAI-PMHbij deelnemende erfgoedinstellingen”

Page 9: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

9

• Uniform omgaan met 4 soorten data– Terminologie (vocabulaires)– Annotaties– Catalogi (metadata)– Digitale objecten

• Duurzame verwijzingen (persistent identifiers)• Breed inzetbare componenten opwaarderen tot

gemeenschappelijke diensten

Diensten voor gebruik enbeheer van persistente identifiers

“ontkoppelen van object-namen enobject-locaties ter ondersteuning van duurzame verwijzingen”

Page 10: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

10

• Uniform omgaan met 4 soorten data– Terminologie (vocabulaires)– Annotaties– Catalogi (metadata)– Digitale objecten

• Duurzame verwijzingen (persistent identifiers)• Breed inzetbare componenten opwaarderen tot

gemeenschappelijke diensten

• Workspaces• User Profile Repository

“Persoonlijke, tijdelijke opslag van data sets. Tijdelijk verlenen van toegangsrechten tot die data sets”

“Verzamelen van profiel-informatie door en over gebruikers. Tijdelijk verlenen van toegang tot die informatie aan webdiensten”

Page 11: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

11

WP 1: gemeenschappelijke diensten

Vocabulaire en Alignment Service

Annotation Repository

Workspaces

User Profile Repository

WP 3: framework en interoperabiliteit

Metadata harvesting met OAI-PMH

Persistente Identifiers

Page 12: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

12

Het “landschap”

Page 13: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

13

Uitgangspunten

• Open set van samenwerkende bouwstenen (versus monolyten)– componenten ook bestaansrecht op zichzelf of in andere context

• Samenwerking met anderen– hergebruik waar mogelijk bestaande oplossingen– Sluit aan/draag bij aan gerelateerde initiatieven

• Standaardisatie en uniformering• RESTful web services• Liever wat beperkter in scope dan geen draagvlak

– eerst interne en externe belanghebbenden op één lijn– draagvlak belangrijk voor duurzame exploitatie

Page 14: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

14

Verbindingen door gemeenschappelijke diensten: voorbeelden

– Intern: tussen individuele deelprojecten– Extern: bijdragen aan infrastructuur digitaal

cultureel erfgoed, diensten zijn in potentie breed inzetbaar

Page 15: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

15

Workspace toepassingen

• Primair toegepast tbv Scratch4All (images)• In tweede instantie voor één of meer CATCHPlus

cases (spraak, sets van zoekresultaten)– verbindend tussen CATCHPlus deelprojecten– leidt tot uniforme web services

• Model voor persoonlijke, tijdelijke hosting, met name tbv toegang door web services

• potentieel onderdeel van veel (erfgoed-)web applicaties

Page 16: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

16

OAI en PIDs

• BenG: metadata publicatie met OAI-PMH– Neveneffect: toekenning en publicatie van persistente

identifiers– “Landingspagina’s” PIDs en OAI vallen samen

• Bijdrage aan Nederlands Erfgoed: Digitaal!, daarna aan NL Aggregator

• CATCHPlus diensten op metadata eenvoudig te generaliseren (bv zoeken ihkv MuseumPlus)

• bijdrage aan digitale infrastructuur nederlands cultureel erfgoed en Europeana

Page 17: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

17

Multiply/DSS

Search for

Afghanistan

Search results: Annotations:

1 2

Immix title1

Immix title2

Immix title3

Immix results

AT14nov06-text

AT14nov06-website

Context document 3

Context results

Primary language Archiving date

Creation dateDocument type

Context document metadata

Text

11/14/2006

09/23/2006

Dutch

Context documents

Immix metadata

Recommendations

Add context document…

Show all

Show all

Edit

Options…

Show graph…

Show annotations… militairenregeringenkrijgsgevangenenministers-presidentenministersambtenarengevangenissendemocratiseringkampenstemmenmissieakkoorden

Advanced search…Search for

Afghanistan

Search results: Annotations:

1 2

Immix title1

Immix title2

Immix title3

Immix results

AT14nov06-text

AT14nov06-website

Context document 3

Context results

Primary language Archiving date

Creation dateDocument type

Context document metadata

Text

11/14/2006

09/23/2006

Dutch

Context documents

Immix metadata

Recommendations

Add context document…

Show all

Show all

Edit

Options…

Show graph…

Show annotations… militairenregeringenkrijgsgevangenenministers-presidentenministersambtenarengevangenissendemocratiseringkampenstemmenmissieakkoorden

Advanced search…

MetadataOAI-PMH

VocabulaireRepository

TextRepository

AnnotatieRepository

VideoRepository

RecommendationRanking services

AnnotatieServices

Page 18: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

18

Stand van zaken

• Een aantal al gerealiseerde diensten is toenemend succesvol– Breed gedragen wensen tav tweede versies

• Vertragingen hebben wel geleid tot– Duidelijke plannen en specificaties– Meer draagvlak onder mogelijke stakeholders

• Frequente contacten en afstemming met gerelateerde projecten

• Nu is de tijd van implementatie

Page 19: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

19

stakeholders

Vocabulairebank

GM OAI-PMH

RMA /AM

CHECKERS

WORKSPACES

Standaardisatie OAI

Persistent Identifiers

Annotation Repository

User Profile Repository

STITCH+MUSEUM+

CHIP+

MULTIPLY

WITCHCRAFT+

CHORAL+

SCRATCH4ALL

RCENaturalis

CLARINSURF

NA Scratch4allGAR ChoralplusBenG MultiplyMI Witchcraft+GM Museumplus

SARABIGGRIDTARGET

TrezorixUni. Tilburg

KB OCLC

Radio RijnlandUni. Twente

GAR NAX-MI BenG

Clarin/ClavasEuropeanaKBGARBenGNAFotomuseum

Werkgroep ErfgoedthesauriRKDDENOCLC RCE

AdlibPicturaTrezorix

DeventitTMS

MIClarin-NLNED!NL AggregatorsEuropeana

Seecr

TargetRUG

NA Gelders archief Groninger archieven Stadsarchief Leuven

TINMCN

MI UU

BenG DENRCE KennisnetNA MI Surf

SARA EPIC CLARIN Europeana

BenG NA

RDE

GridLineZieOok

RMAAM BenGRCE

ZieOok

Open Annotation Consortium

Scratch4allChoral+Multiply

Page 20: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

20

Vragen en discussie

• Onze vragen– Deugen ambities, aanpak en benaderingswijze?– Ontbreken er diensten, of zijn er overbodige?– Zijn er (betere) bestaande oplossingen?– Zijn er nieuwe toepassingen denkbaar?

Page 21: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

21

Page 22: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

22

WP 1: gemeenschappelijke diensten

Vocabulaire en Alignment Service

Annotation Repository

Workspaces

User Profile Repository

WP 3: framework en interoperabiliteit

Metadata harvesting met OAI-PMH

Persistente Identifiers

Page 23: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

23

Vocabulary and Alignment Service(“VocabulaireBank”)

Page 24: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

24

Visie

• CATCHPlus– Tools en diensten bouwen met één uniforme, externe

dienst voor terminologie-gebruik– Eenvoudig gebruik van elkaars thesauri

• Breder– “Linked Data++”– Laagdrempelig (her)publiceren van thesauri– (her)gebruiken van thesauri zonder tussenkomst van

toolbouwers– Eenvoudig gebruik van gepubliceerde thesauri vanuit tools

en diensten

Page 25: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

25

VAS doelen• Standaard formaat en access methoden

– SKOS, SKOS gebaseerde REST API• Web publicatie van vocabulaires

– Als Linked Open Data– Als doorzoekbare en browse-bare dataset REST API– Te gebruiken voor duurzame referenties naar concepten

persistente identifiers– Te harvesten door middel van OAI-PMH

• Bevorderen semantische interoperabiliteit door het ondersteunen van ‘alignments’

• Stimuleren van Open licenties

Page 26: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

26

SKOS

Term: Economic cooperation Used For: Economic co-operation Broader terms: Economic policy Narrower terms: Economic integration, European economic cooperation, European industrial cooperation, Industrial cooperation Related terms: Interdependence Scope Note: Includes cooperative measures in banking, trade, industry etc., between and among countries.

Page 27: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

27

VAS doelen• Standaard formaat en access methoden

– SKOS, SKOS gebaseerde REST API• Web publicatie van vocabulaires

– Als Linked Open Data– Als doorzoekbare en browse-bare dataset REST API– Te gebruiken voor duurzame referenties naar concepten

persistente identifiers– Te harvesten door middel van OAI-PMH

• Bevorderen semantische interoperabiliteit door het ondersteunen van ‘alignments’

• Stimuleren van Open licenties

Page 28: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

28

Linked Open Data

• Een methode om data te tonen, delen en verbinden via ‘dereferencable URIs’ op het Web.

Page 29: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

29

VAS doelen• Standaard formaat en access methoden

– SKOS, SKOS gebaseerde REST API• Web publicatie van vocabulaires

– Als Linked Open Data– Als doorzoekbare en browse-bare dataset REST API– Te gebruiken voor duurzame referenties naar concepten

persistente identifiers– Te harvesten door middel van OAI-PMH

• Bevorderen semantische interoperabiliteit door het ondersteunen van ‘alignments’

• Stimuleren van Open licenties

Page 30: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

30

Use cases (t.a.v. REST API)

• Use cases uit CATCHPlus en Cultureel Erfgoed– Publiceer je thesaurus: importeer een SKOS vocabulaire,

dan krijg je er REST toegang, tool support en Linked Data gratis bij

– Selecteer het juiste concept om een object te beschrijven• autocompletion

– Gebruik voor browsen en zoeken (naar terminologie en/of collectie-data)

• VAS repository als een “topic map” voor erfgoed-collecties

– Thesaurus-onderhouds-taken door online gemeenschappen

– Vertalen, verfijnen, generaliseren van zoekvragen

Page 31: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

31

Wat is inmiddels gebouwd?• Repository voor SKOS data (inclusief alignment

data)– RDF store (Virtuoso)

• REST API (search, autocomplete, upload, download), gebaseerd op het SKOS data model

• De repository bevat 12 verschillende thesauri (niet vrij toegankelijk, niet meer up-to-date m.u.v. GTAA)

Page 32: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

32

Client tools en diensten

• CATCHPlus cases (semantische annotatie, ranking, art recommender, …)

• CLARIN(-NL) CLAVAS project• Pictura gebruikt de API voor toegang tot de

Beeld en Geluid GTAA thesaurus (Memorix)• Generieke browse- en zoek- web applicatie

(gebruikt REST API) – Q42

Page 33: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

33

Page 34: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

34

VAS, versie 2

• Gedurende half jaar intensief overlegd door CATCHPlus, RCE, Adlib, Pictura, Trezorix– Op initiatief van RCE– Mede naar aanleiding van VAS, versie 1

• Doel: tools en omgevingen op elkaar aansluiten mbt vocabulaires/kennisstructuren

• VAS versie 2 conform de uitkomsten van dit overleg

- performance, schaalbaarheid- gedistribueerd- nieuwe functies- mooier RESTful- authenticatie en authorisatie- betere manieren om content te beheren

Page 35: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

35

Gezamenlijke visie

Page 36: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

36

REST specificatie

• Concept resolve API– URI, bv http://id.loc.gov/authorities/sh95000541

• Find API – /find/concepts– /find/conceptschemecollections– /find/conceptschemes– /map/concept– /map/object– /concept

Page 37: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

37

Toekomst• Online zetten en promoten gezamenlijke API specs• Implementatie Repository service, versie 2

– Nieuwe API– Harvesting dmv OAI-PMH– Upload van SKOS bestanden

• Linken met nieuwe “DEN inventarisatie van erfgoedthesauri”

• Actualiseren en uitbreiden van de inhoud• Stimuleren van open licenties (ODbL)• Duurzame hosting op één of meer plaatsen

Page 38: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

38

stakeholders

Vocabulairebank

Clarin/ClavasEuropeanaKBGARBenGNAFotomuseum

Werkgroep ErfgoedthesauriRKDDEN RCE

AdlibPicturaTrezorix

DeventitTMS

Page 39: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

39

Page 40: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

40

Workspaces

Page 41: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

41

Visie

• CATCHPlus– Gebruikspatroon {inloggen, documenten

uploaden/verzamelen en organiseren, tool daarop laten werken} maar één keer bouwen

• Spaart werk• Biedt gedeelde oplossing voor inloggen, ….

– Legt vast hoe tools en diensten verbonden kunnen worden• Breder

– Nieuw model voor flexibele hosting– Virtuele collecties– Bouwsteen binnen web service gebaseerde infrastructuren

Page 42: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

42

Potentieel

• Legt vast hoe web services veilig op data kunnen werken – tijdelijk delegeren van toegangsrechten

• Goede plek om ‘Single Sign On’ mee te verbinden• Goede ‘home base’ voor geïntegreerde applicatie-omgevingen

(b.v. Virtual Research Environments)• Cloud hosting aspect: tijdelijke, persoonlijke, veilige opslag op

het web, met flexibele toegankelijkheid• voorportaal voor digitale archiving

– data curatie– toekenning persistente identifiers

• Ontwikkeld door partijen, die over veel opslagcapaciteit en bandbreedte beschikken

Page 43: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

43

Deliverables

• Workspace repository (Target Holding)

• RESTful API (Target Holding)

• Webapps voor workspace beheer en workspace repository beheer (Target Holding)

• Authenticatie en Autorisatie oplossing (BigGrid?)

• 2-4 toepassingen binnen CATCHPlus

Page 44: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

44

Implementatie ikhv Scratch4All

Page 45: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

45

Status

• Implementatie Workspaces en aansluiting op Scratch4All is gestart– Afronding: december 2011

• Gesprekken over Authenticatie en Autorisatie module zijn gaande

• Waarschijnlijk ook toegepast ihkv CLARIN, ten behoeve van data uitwisseling tussen web services

Page 46: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

46

stakeholders

WORKSPACESCLARIN

NA Scratch4allGAR ChoralplusBenG MultiplyMI Witchcraft+GM Museumplus

SARABIGGRIDTARGET

Page 47: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

47

Page 48: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

48

Metadata harvesting

Page 49: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

49

Wat?

– Publiceren van metadata volgens standaard formaten (Dublin Core, qualified Dublin Core, bredere standaard formaten, proprietaire formaten)

– Publiceren op standaard manier (OAI-PMH)

Page 50: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

50

Status

• Implementatie bij B en G afgerond• Een aantal deelnemers heeft inmiddels zelf

OAI-PMH• NED!, NL Aggregators en Europeana• Beheer van persistente identifiers kan worden

gekoppeld aan publicatie van metadata

Page 51: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

51

stakeholders

Standaardisatie OAI

MIClarin-NLNED!NL AggregatorsEuropeana

CQ2

Page 52: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

52

Annotation Repository

Page 53: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

53

Visie

• CATCHPlus– Uitwisselen en doorzoekbaar maken van

uiteenlopende annotaties van (delen van) bronnen op het web

– Stap voor stap verrijken van data• Breder

– Annotatie repository als collectie- en instelling-overstijgende index

Page 54: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

54

Requirements

• Annotatie van onderdelen van teksten, xml/xhtml, pdf, audio, video, melodie, images (komen allemaal in CATCHPlus projecten voor)

• Annotatie van annotaties en waarden van annotaties (“gelaagde annotatie”)

• Semantische waarden• Web gebaseerd en uitbreidbaar data model• Opslaan en doorzoeken in repository met

REST API

Page 55: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

55

Voorbeeld: gelaagde annotaties

Voorbeeld workflow:

Document scan[automatische line strip detectie service]Lege annotatie[repository]annotatie[document transcriptie tool] transcriptie[entity recognition service]entity annotatie[repository]

Page 56: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

56

Deliverables

• Annotatie uitwissel-formaat• Annotatie Repository• REST API voor opslaan en doorzoeken

Page 57: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

57

Open Annotation model/formaat

• Generiek model uit CATCH: AMM (Annotation Meta Model)• Grote overlap in requirements en uitwerking met Open

Annotations (www.openannotion.org)• Voorstel: pas OAC model toe (en draag daar eventueel aan bij)

•Annotation is web document met URI•Body annoteert een Target•Verschillende auteurs/eigenaren•Body en Target kan alles zijn•Iedere resource kan target van andere annotatie zijn•Voorzieningen voor onderdelen van documenten

Page 58: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

58

Status

• “Annotation model en formaat” aanbeveling binnenkort beschikbaar, inclusief toets aan CATCHPlus cases

• Implementatie-proces moet nog beginnen• Toepassing in eerste instantie waarschijnlijk

gekoppeld aan workspaces

Page 59: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

59

stakeholders

Annotation Repository

Open Annotation Consortium

ZieOok

Page 60: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

60

Page 61: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

61

User Profile Repository

Page 62: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

62

Visie

• CATCHPlus– Verzamelen van profiel-informatie door en over

gebruikers. Tijdelijk verlenen van toegang tot die informatie aan webdiensten

– Primair ten dienste van Art Recommender. Apart ontwikkeld met oog op bredere toepasbaarheid

• Breder– Gebruikers ‘single-sign-on’ bieden, en baas maken van

hun eigen profieldata– Collectie aanbieders beschikken over brede profiel-

informatie, zonder dat zelf bij te hoeven houden

Page 63: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

63

Wat is het?

• Profielen bevatten personalia, voorkeursobjecten en –concepten, ratings, gebruiks-statistieken e.d.

• Repository met RESTful API voor– Beheer van profielen– Tijdelijke toegang voor toevoegen objecten en gebruiks-

statistieken– Opvragen van profiel informatie door collectie-aanbieders

• Web applicatie voor profielbeheer• Widgets voor website-bouwers

– Login– Rating

Page 64: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

64

Toepassing

• CHIP API deelproject– Bestond oorspronkelijk uit een recommendation engine

(Art Recommender), een Rating tool en een User Profile Repository

– UPR is gepromoveerd tot gemeenschappelijke dienst– Art Recommender wordt gerealiseerd op basis van de

ZieOok recommendation engine• Amsterdam Museum sinds kort de

uitvoerder/collectie-aanbieder• Toepassen op andere collecties is relatief eenvoudig

Page 65: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

65

Relatie met ZieOok

• ZieOok– Is een generieke recommendation engine voor erfgoedcollecties– Gebouwd door Beeld en Geluid– Werkt op basis van statistiek– Collecties te importeren mbv OAI-PMH– Heeft (nog) geen generieke oplossing om met gebruikers- en

gebruiksinformatie om te gaan• Art Recommender is voor ZieOok een extra toepassing,

UPR een generieke bouwsteen• ZieOok biedt zicht op brede toepassing van CATCHPlus UPR

Page 66: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

66

webappwebapp

ZieOok/Art

Recommender

REST API

Dashboard

User Profile Repository

ED!T collectionRMA Collection

OAI

Collection

OAI

Collection

Profile Editor

“harvest”

“collection info”

REST API

“recommend”

“harvest”

“collection info”

“store profile” “store profile”

webapp

“profile info” “store profile”

login widget

rating widget

Recommender widget

UsersUser profilesFavorite objects & conceptsRatingsUsage statistics

“modify profile”

“store statistics”

“grant access”

Page 67: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

67

Status

• Begin juli kickoff• Streven: implementatie eind 2011 afgerond• Implementator (o.v.): Gridline

Page 68: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

68

Stakeholders

User Profile Repository

GridLineZieOok

RMAAMRCE

User Profile Repository

Page 69: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

69

Page 70: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

70

Persistente Identifiers

Page 71: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

71

Visie

• Oorspronkelijke opdracht OCW: biedt een zo breed mogelijke oplossing voor persistente identifiers aan.

• Vertaald naar de volgende taken:– Kies robuuste, duurzame technologie– Laagdrempelig toekennen en beheren van PIDs– Duurzaam, betaalbaar en betrouwbaar model

voor hosting en exploitatie

Page 72: CATCHPlus diensten-10jun2011

Probleem en basisoplossing

• Steeds meer digitale objecten, met steeds meer identifiers– In web context: identifier = URL

• Steeds vaker extern aangeboden (web)• Steeds meer verwijzingen naar objecten

– Contextualisering– Samenwerkingsverbanden– Virtuele collecties en tentoonstellingen

• Identifiers zijn vaak niet uniek• Identifiers zijn vaak niet persistent• Verwijzingen worden gemakkelijk ongeldig (broken links)

Page 73: CATCHPlus diensten-10jun2011

Probleem

object_1

new_object_1

http://.../object_1

Page 74: CATCHPlus diensten-10jun2011

Basisoplossing • Ontkoppel naam/identifier en locatie(s)• Registreer combinaties van identifiers met locaties

in een tabel• Externe referenties gebruiken de identifier

Page 75: CATCHPlus diensten-10jun2011

Basisoplossing

object_1

new_object_1

id1

id1 http://.../object_1

Page 76: CATCHPlus diensten-10jun2011

Basisoplossing (resolver)

new_object_1

id1

id1 http://.../new_object_1

Page 77: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

77

Requirements (1)Software support

Goede resolving service beschikbaar Bewezen technologie, stabiel en100% betrouwbaar Schaalbaar Globaal werkende oplossing• gedistribueerde hosting en dienstverlening mogelijk• Identificatie van onderdelen van objecten Mogelijkheid om metadata met een identifier te associëren “Actionable”: identifiers kunnen worden ge-resolved met

behulp van een http URI

Page 78: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

78

CATCHPlus keuze: Handles als basis• Handle technologie

• Voldoet (verreweg) het best aan onze eisen• http://handle.net/

• Eén Local Handle System en Handle prefix per deelnemende ‘Naming Authority’

• Hosting van Local Handle Systems door SARA, ge-mirrored door internationale partners (EPIC)

Page 79: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

79

Page 80: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

80

Requirements (2)Identifier beheer

Identifier beheer moet onafhankelijk zijn van– System management– Web server management– Hosting van resolution services

• Moet kunnen worden gedaan vanuit de context van een collectie-beheer-systeem– Typisch door de verantwoordelijke collectie beheerder

Is efficient, krachtig en eenvoudig Is veilig

Page 81: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

81

CATCHPlus oplossing: identifier beheerREST web service• Voor zoeken, creëren en beheren van Handles

(behorend bij je eigen Naming Authority) over internet

• ook ondersteuning voor batch operaties (“verplaats collectie”)

• SARA heeft eerste versie voor CATCHPlus gebouwd

• Wordt in de praktijk door een aantal instellingen gebruikt

Page 82: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

82

Methoden voor identifier beheer

• Neveneffect van collectie beheer• Actie in collectie-beheer-systeem triggert een PID

beheer REST call• Neveneffect van collectie publicatie

• Update van je gepubliceerde data set (bv OAI data provider’s interne database) triggert een PID beheer REST call

Page 83: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

83

Requirements (3)Organisatie en beleid

• Welke keuzen zijn gemaakt door je partner instituten? (hoe minder smaken, hoe beter)

• Betrouwbaarheid en duurzaamheid van de service providers

• Quality of Service: redundantie, 24/7 beschikbaarheid, performantie, vermogen op te schalen

• Beperkte en beheersbare kosten• Vrijheid om te wisselen van service provider• Invloed van gebruikersgemeenschap

Page 84: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

84

CATCHPlus oplossing: organisatie• EPIC (European Persistent Identifier Consortium)

• SARA (Nederland), CSC (Finland), GWDG (MPG, Duitsland)

• Redundante en betrouwbare PID services voor eScience en eCulture in Europa

• Contracten mbt Europese mirror van Global Handle Repository

• Directe samenwerking met CNRI• Stakeholders overleg met erfgoedpartijen en SARA

• Samen met DEN• Business cases, business model en contractvormen

Page 85: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

85

Toekomstperspectief

• EPIC brede REST API– Verbeteringen en toevoegingen aan huidige API– Uitbreidbaar, policies afdwingbaar– Specificatie is klaar– Implementatie (o.v.) door SARA, met bijdrage

GWDG• Introductie-trajecten bij erfgoedinstellingen• Businessmodel en contracten

Page 86: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

86

stakeholders

Persistent Identifiers

BenG DENRCE KennisnetNA SurfMI

SARA EPIC CLARIN Europeana

Page 87: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

87

Page 88: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

88

Beschikbaarheid, exploitatie en hosting:enkele opmerkingen

Page 89: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

89

Beschikbaarheid

• Broncode komt onder Open source licentie en online beschikbaar (GitHub)

• We promoten Open Database licenties en Creative Commons

• We promoten vrij gebruik van services, of tegen kostprijs

Page 90: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

90

Hosting en exploitatie

• Regelen duurzame hosting, onderhoud en doorontwikkeling valt binnen scope van CATCHPlus

• Business modellen middagprogramma• Ook techniek kan misschien

kostenbesparend werken– Workspaces– Dynamisch deployment van web services

Page 91: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

91

Vragen, opmerkingen, kritiek, suggesties?

Page 92: CATCHPlus diensten-10jun2011

CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut

92

Vragen van onze kant

• Ontbreekt er iets in het CATCHPlus dienstenpakket?• Nut en noodzaak van de gemeenschappelijke diensten?• Zijn er op- of aanmerkingen in technologische zin?

– B.v., we zijn begonnen met REST (+mash ups). Is er een reden SOAP (+ service bus) te ondersteunen?

• Visie op onderhoud en doorontwikkeling van tools, diensten en data op langere termijn?

• Inschatting kansen op overleven na CATCHPlus?• Wie zouden de aanbieders van die diensten uiteindelijk moeten

zijn?• Ondersteunen deze diensten de CATCHPlus deelprojecten

voldoende?• Realistisch of te ambitieus?• …