Semantic Technologies in the Scholarly Edition of Medieval and Early Modern Accounts

22
Über die Rolle von Technologien des Semantic Web bei der Edition von Rechnungen und Amtsbüchern Georg Vogeler <georg.vogeler@uni- graz.at> ut für Dokumentologie und Editorik e.V. Konzeptionelle Überlegungen zur Edition von Rechnungen und Amtsbüchern des späten Mittelalters, Hamburg 2.-3.2.2015

Transcript of Semantic Technologies in the Scholarly Edition of Medieval and Early Modern Accounts

Über die Rolle von Technologien des Semantic Web bei der Edition

von Rechnungen und Amtsbüchern

Georg Vogeler<[email protected]>

Institut für Dokumentologie und Editorik e.V.

Konzeptionelle Überlegungen zur Edition von Rechnungen und Amtsbüchern des späten Mittelalters, Hamburg 2.-3.2.2015

EditionText als Sprache

Text als InhaltText als Bild

Dokument

Handelt vonGelesen als

Gelesen als

Handelt von

Sieht aus Handelt von

EditionText als Sprache

Text als InhaltText als Bild

Dokument

Diplomatische Transkription Tabellarische

Darstellung

Textkritische Edition mit Variantenapparat

Traditionelle Editionskonzepte für Rechnungen

Digitale Edition: Technologien

• Text als Bild– Digitalphotographie– archivfähige Bilddatenformate wie z.B. TIFF, JPG2000– Bildbetrachter, wie z.B. DFG Viewer, jQuery-Plugins,

IIIF• Text als Sprache– XML/TEI, mit Modifizierung (ODD)– XMLEditoren wie xmlcopy, Oxygen-XML Editor z.B.

mit Ediarium-Plugin, handgeschriebene Online-Editoren z.B. EditMOM

Technologien für Inhalte?

• „Datenbanken“• Tabellenkalkulation (OO Calc, MS Excel ...)• Buchführungssoftware

• Datenformate?– CSV (Zeichen-/Kommaseparierte Werte)– DDI (Data Documentation Initiative) für

Metadaten incl. Datenkategorien

Technologien für Inhalte: Das Semantic Web des W3C

• RDF (Resource Description Framework)– Generelles Konzept zur Abbildung von „Aussagen“

über die Welt in Computercode• SPARQL (SPARQL Protocol and RDF Query

Language)– Abfragesprache für in RDF kodierten Aussagen

• OWL (Web Ontology Language) / RDFs (RDF Schema)– Definitionen der in RDF verwendeten Codes und

Regelwerk zur Beschreibung ihrer Beziehungen

RDF für Rechnungen, z.B.

Digitale Edition der Basler Jahrrechnungen 1535-1611, unter der Leitung von Susanna Burghartz, im Erscheinen, hier Vorabansicht zur Jahrrechnung 1547 <http://gams.uni-graz.at/archive/objects/o:srbas.1547/datastreams/RDF/content>

oder auch ...

@prefix gams.srbas.1547: <http://gams.uni-graz.at/archive/get/o:srbas.1547/sdef:TEI/get#> .

@prefix bk:<http://gams.uni-graz.at/rem/bookkeeping/> .@prefix xsd:<http://www.w3.org/2001/XMLSchema#> .

gams.srbas.1547:d2e13392_calc a bk:#bk_total_calc ; a bk:#bk_balance<http://gams.uni-graz.at/onto/#partOf>

<http://gams.uni-graz.at/o:srbas.1547> ;bk:amount gams.srbas.1547:toplevel_calc .

gams.srbas.1547:toplevel_calc bk:num "-3233262"^^xsd:decimal ;bk:unit bk:#d ;bk:as bk:#bk_d ; N3/turtle-Syntax

Semantic Web bei der Digitalen Edition der Jahrrechnungen der Stadt Basel

• Als Format für die Veröffentlichung der Texte als „Daten“

• Als internes Datenbankformat für Darstellungen wie die Kontenübersicht

Kontenübersicht

Semantic Web bei der Digitalen Edition der Jahrrechnungen der Stadt Basel

• Als Format für die Veröffentlichung der Texte als „Daten“

• Als internes Datenbankformat für Darstellungen wie die Kontenübersicht

• Als interne Datenbank für die Suche

Ist das „Semantic Web“?

• Nein, denn die Anwendung verwendet Datenbankoperationen, die auch mit relationalen Datenbanken möglich sind

• Jein, denn es sind Datenbankoperationen mit erhöhtem Komplexitätsgrad (z.B. Kontenhierarchien)

• Ja, denn die Anwendung verwendet RDF, SPARQL und einen SPARQL-Endpoint

„SPARQL-Endpoints“= Öffentliche Schnittstellen, um SPARQL-Anfragen an RDF-Ressourcen auf unterschiedlichen Servern zu machen:SELECT DISTINCT ?jahr ?von ?entry ?betrag ?text ?o ?signofamount ?konto WHERE { SERVICE <http://rem.gams.uni-graz.at/sesame/sparqlendpoint> { ?entry bk:inhalt ?text; g2o:partOf ?o ; bk:amount ?a .

?a bk:num ?betrag ; bk:as ?signofamount . ?o dc:date ?jahr ; srbas:from ?von ; g2o:sameAs ?mo . { ?text bds:search „umb" ; bds:matchAllTerms "true" . }

} SERVICE <http://gams.uni-graz.at/mulgara/sparqlendpoint> { ?mo <fedora-rels-ext:isMemberOf> <fedora:context:srbas> . }}ORDER BY ?jahr ?von ?o ?pfad ?entry

Welche Informationen könnte man aus verteilten Resourcen ziehen?

Vergleichbarkeit von Angaben:• Umrechnungslisten für Maße

• Taxonomien für Güter, Dienstleistungen, Berufe etc.

• Preise/Löhne für Waren/Dienstleistungsgruppen

Umrechnungslistez.B. 1 Saum Wein:

<rdf:Description rdf:about="http://gams.uni-graz.at/srbas/units/#saum"> <skos:label>soum</skos:label> <skos:prefLabel>Saum</skos:prefLabel> <r:caculates> <rdf:Description> <r:date>1838</r:date> <r:measure>150</r:measure> <r:unit rdf:resource="http://gams.uni-graz.at/srbas/units/#Liter"/> </rdf:Description> </r:caculates> <r:baseMeasure>96</r:baseMeasure> <r:baseUnit rdf:resource="http://gams.uni-graz.at/srbas/units/#ohm"/></rdf:Description>

http://gams.uni-graz.at/o:srbas.3153:

Taxonomien für Güter

• http://www.schuredo.uni-hamburg.de/browse/groceries/0011/0023/0023.A:

• Lebensmittel• Weinsorten

Suche z.B. nach Weinpreisen

in den Basler Jahres-rechnun-genmit Hilfe eines SPAQRL-Inferface für jeder-mann möglich: http://linkeddata.uriburner.com/sparql

ein paar Ergebnisse aus Baseldate menge preis in lb text

1535 24 0.95 "Für xxiiij soum win, von armen luten an ir schuld empangen, uff den schuld thät xix ß ist aller her in in keller komen xxij lb xvj ß "

1535 24 0.95 "Item uszgeben umb xxiiij soum win, so die armen lüt an ir schuld der reben herin in keller gewert haben xxij lb xvj ß "

1535 2 1.35"Item geben umb ij soum win, dem schaffner desz capittels gütern zu Siszach, der den werklüten am wiger zu Artistorff worden ist ij lb xiiij ß

1536 13.5 1.8 "Fur xiiij` soum win von armen lüten an den kouff der reben empfangen, thut nach dem schlag in gelt xxiiij lbvj ß"

1539 8 0.91875 "An die schuld der alten extanzen empfangen viij soum win, sind mit gellt verrechnet vij lb vij ß "

1543 1 4 "Item iiij lb dem predicanten zallt fur ein soum win"

1543 2 4 "Item viij lb dem predicanten fur zwen soum win geben"

Suche z.B. nach Weinpreisen

• in den Basler Jahresrechnungen– mit Hilfe eines SPAQRL-Inferface wie z.B.

http://linkeddata.uriburner.com/sparql für jedermann möglich

• ... und in den Rechnungen des Deutschen Ordens?

• auch, wenn die Daten als RDF veröffentlicht werden.

Umrechungen, Taxonomien und Preise

• ... sind Inhalte von Rechnungsdokumenten.• ... können in anderen Kontexten weiterverwendet

werden.• ... sollten also digital mit Methoden ediert

werden, welche ihre direkte Nutzung als Datenquelle in anderen Anwendungen erleichtert:

• nämlich:Technologien des Semantic Web

Welche Rolle könnten die Technologien des Semantic Web haben?

1. Beschreibung des Datenmodells2. Speicherung und Abfrage der Inhalte von

Rechnungen und wirtschaftlichen Amtsbüchern

3. Speicherung von gemeinsamen Ressourcen, die in die Verarbeitung der Daten eingebunden werden sollten.

Digitale Editionen von Rechnungen unter Verwendung von Technologien

des Semantic Web schaffen eine solide Basis für Ökonometrie ...

hofftGeorg Vogeler

<[email protected]>

Institut für Dokumentologie und Editorik e.V.