Semantic Technologies in the Scholarly Edition of Medieval and Early Modern Accounts
-
Upload
georg-vogeler -
Category
Science
-
view
36 -
download
4
Transcript of Semantic Technologies in the Scholarly Edition of Medieval and Early Modern Accounts
Über die Rolle von Technologien des Semantic Web bei der Edition
von Rechnungen und Amtsbüchern
Georg Vogeler<[email protected]>
Institut für Dokumentologie und Editorik e.V.
Konzeptionelle Überlegungen zur Edition von Rechnungen und Amtsbüchern des späten Mittelalters, Hamburg 2.-3.2.2015
EditionText als Sprache
Text als InhaltText als Bild
Dokument
Handelt vonGelesen als
Gelesen als
Handelt von
Sieht aus Handelt von
EditionText als Sprache
Text als InhaltText als Bild
Dokument
Diplomatische Transkription Tabellarische
Darstellung
Textkritische Edition mit Variantenapparat
Traditionelle Editionskonzepte für Rechnungen
Digitale Edition: Technologien
• Text als Bild– Digitalphotographie– archivfähige Bilddatenformate wie z.B. TIFF, JPG2000– Bildbetrachter, wie z.B. DFG Viewer, jQuery-Plugins,
IIIF• Text als Sprache– XML/TEI, mit Modifizierung (ODD)– XMLEditoren wie xmlcopy, Oxygen-XML Editor z.B.
mit Ediarium-Plugin, handgeschriebene Online-Editoren z.B. EditMOM
Technologien für Inhalte?
• „Datenbanken“• Tabellenkalkulation (OO Calc, MS Excel ...)• Buchführungssoftware
• Datenformate?– CSV (Zeichen-/Kommaseparierte Werte)– DDI (Data Documentation Initiative) für
Metadaten incl. Datenkategorien
Technologien für Inhalte: Das Semantic Web des W3C
• RDF (Resource Description Framework)– Generelles Konzept zur Abbildung von „Aussagen“
über die Welt in Computercode• SPARQL (SPARQL Protocol and RDF Query
Language)– Abfragesprache für in RDF kodierten Aussagen
• OWL (Web Ontology Language) / RDFs (RDF Schema)– Definitionen der in RDF verwendeten Codes und
Regelwerk zur Beschreibung ihrer Beziehungen
RDF für Rechnungen, z.B.
Digitale Edition der Basler Jahrrechnungen 1535-1611, unter der Leitung von Susanna Burghartz, im Erscheinen, hier Vorabansicht zur Jahrrechnung 1547 <http://gams.uni-graz.at/archive/objects/o:srbas.1547/datastreams/RDF/content>
oder auch ...
@prefix gams.srbas.1547: <http://gams.uni-graz.at/archive/get/o:srbas.1547/sdef:TEI/get#> .
@prefix bk:<http://gams.uni-graz.at/rem/bookkeeping/> .@prefix xsd:<http://www.w3.org/2001/XMLSchema#> .
gams.srbas.1547:d2e13392_calc a bk:#bk_total_calc ; a bk:#bk_balance<http://gams.uni-graz.at/onto/#partOf>
<http://gams.uni-graz.at/o:srbas.1547> ;bk:amount gams.srbas.1547:toplevel_calc .
gams.srbas.1547:toplevel_calc bk:num "-3233262"^^xsd:decimal ;bk:unit bk:#d ;bk:as bk:#bk_d ; N3/turtle-Syntax
Semantic Web bei der Digitalen Edition der Jahrrechnungen der Stadt Basel
• Als Format für die Veröffentlichung der Texte als „Daten“
• Als internes Datenbankformat für Darstellungen wie die Kontenübersicht
Semantic Web bei der Digitalen Edition der Jahrrechnungen der Stadt Basel
• Als Format für die Veröffentlichung der Texte als „Daten“
• Als internes Datenbankformat für Darstellungen wie die Kontenübersicht
• Als interne Datenbank für die Suche
Ist das „Semantic Web“?
• Nein, denn die Anwendung verwendet Datenbankoperationen, die auch mit relationalen Datenbanken möglich sind
• Jein, denn es sind Datenbankoperationen mit erhöhtem Komplexitätsgrad (z.B. Kontenhierarchien)
• Ja, denn die Anwendung verwendet RDF, SPARQL und einen SPARQL-Endpoint
„SPARQL-Endpoints“= Öffentliche Schnittstellen, um SPARQL-Anfragen an RDF-Ressourcen auf unterschiedlichen Servern zu machen:SELECT DISTINCT ?jahr ?von ?entry ?betrag ?text ?o ?signofamount ?konto WHERE { SERVICE <http://rem.gams.uni-graz.at/sesame/sparqlendpoint> { ?entry bk:inhalt ?text; g2o:partOf ?o ; bk:amount ?a .
?a bk:num ?betrag ; bk:as ?signofamount . ?o dc:date ?jahr ; srbas:from ?von ; g2o:sameAs ?mo . { ?text bds:search „umb" ; bds:matchAllTerms "true" . }
} SERVICE <http://gams.uni-graz.at/mulgara/sparqlendpoint> { ?mo <fedora-rels-ext:isMemberOf> <fedora:context:srbas> . }}ORDER BY ?jahr ?von ?o ?pfad ?entry
Welche Informationen könnte man aus verteilten Resourcen ziehen?
Vergleichbarkeit von Angaben:• Umrechnungslisten für Maße
• Taxonomien für Güter, Dienstleistungen, Berufe etc.
• Preise/Löhne für Waren/Dienstleistungsgruppen
Umrechnungslistez.B. 1 Saum Wein:
<rdf:Description rdf:about="http://gams.uni-graz.at/srbas/units/#saum"> <skos:label>soum</skos:label> <skos:prefLabel>Saum</skos:prefLabel> <r:caculates> <rdf:Description> <r:date>1838</r:date> <r:measure>150</r:measure> <r:unit rdf:resource="http://gams.uni-graz.at/srbas/units/#Liter"/> </rdf:Description> </r:caculates> <r:baseMeasure>96</r:baseMeasure> <r:baseUnit rdf:resource="http://gams.uni-graz.at/srbas/units/#ohm"/></rdf:Description>
http://gams.uni-graz.at/o:srbas.3153:
Taxonomien für Güter
• http://www.schuredo.uni-hamburg.de/browse/groceries/0011/0023/0023.A:
• Lebensmittel• Weinsorten
Suche z.B. nach Weinpreisen
in den Basler Jahres-rechnun-genmit Hilfe eines SPAQRL-Inferface für jeder-mann möglich: http://linkeddata.uriburner.com/sparql
ein paar Ergebnisse aus Baseldate menge preis in lb text
1535 24 0.95 "Für xxiiij soum win, von armen luten an ir schuld empangen, uff den schuld thät xix ß ist aller her in in keller komen xxij lb xvj ß "
1535 24 0.95 "Item uszgeben umb xxiiij soum win, so die armen lüt an ir schuld der reben herin in keller gewert haben xxij lb xvj ß "
1535 2 1.35"Item geben umb ij soum win, dem schaffner desz capittels gütern zu Siszach, der den werklüten am wiger zu Artistorff worden ist ij lb xiiij ß
1536 13.5 1.8 "Fur xiiij` soum win von armen lüten an den kouff der reben empfangen, thut nach dem schlag in gelt xxiiij lbvj ß"
1539 8 0.91875 "An die schuld der alten extanzen empfangen viij soum win, sind mit gellt verrechnet vij lb vij ß "
1543 1 4 "Item iiij lb dem predicanten zallt fur ein soum win"
1543 2 4 "Item viij lb dem predicanten fur zwen soum win geben"
Suche z.B. nach Weinpreisen
• in den Basler Jahresrechnungen– mit Hilfe eines SPAQRL-Inferface wie z.B.
http://linkeddata.uriburner.com/sparql für jedermann möglich
• ... und in den Rechnungen des Deutschen Ordens?
• auch, wenn die Daten als RDF veröffentlicht werden.
Umrechungen, Taxonomien und Preise
• ... sind Inhalte von Rechnungsdokumenten.• ... können in anderen Kontexten weiterverwendet
werden.• ... sollten also digital mit Methoden ediert
werden, welche ihre direkte Nutzung als Datenquelle in anderen Anwendungen erleichtert:
• nämlich:Technologien des Semantic Web
Welche Rolle könnten die Technologien des Semantic Web haben?
1. Beschreibung des Datenmodells2. Speicherung und Abfrage der Inhalte von
Rechnungen und wirtschaftlichen Amtsbüchern
3. Speicherung von gemeinsamen Ressourcen, die in die Verarbeitung der Daten eingebunden werden sollten.
Digitale Editionen von Rechnungen unter Verwendung von Technologien
des Semantic Web schaffen eine solide Basis für Ökonometrie ...
hofftGeorg Vogeler
Institut für Dokumentologie und Editorik e.V.