Usability of Visual Data Profiling in Data Cleaning and Transformation
Public Data Usability
-
Upload
arm-brahaj -
Category
Documents
-
view
224 -
download
1
description
Transcript of Public Data Usability
Perpunimi dhe publikimi
e të dhënave në format të RFD
• Pershkrim semantik i te dhenave me ontologjite
• Komponentët e një ontologjie:
1. Veçorite
2. Klasat
3. Objekte
Metodologji përpunimi dhe publikimi i të dhënave në format të hapur Open Data
• Veçori ODA:
Property: oda:topic
Domain: oda: Indicator
Range: oda:Topic
• Veçori ODA nga fjalore ekzistues
Property: sdmx-measure:obsValue
Property: dc:title, dc:publisher, dc:creator, dc:date
Ontologjia: Dublin Core Metadata Element Set12
• Instance ODA
• Platforme open-source me mjete për ndërtimin e aplikimeve që bazohen
në një ontologji për modelimin e të dhënave
• Mundeson krijim, vizualizim, modifikim ontologjish
• RDF
• Metodat e serializimit RDF
- format XML <rdf:Description
rdf:about="http://open.data.al/energyloss#dataset">
<dc:date>Thu Aug 11 16:03:07 CEST 2011</dc:date>
<dc:publisher>INSTAT, ERE</dc:publisher>
<dc:creator>Open Data Albania (ODA)</dc:creator>
<dc:title>Humbjet totale te energjise ne Shqiperi
(GWh)</dc:title>
<rdf:type
rdf:resource="http://open.data.al/oda2.owl#Dataset"/>
</rdf:Description>
- Notation 3 (ose N3)
• Per konvertim te datasetit te nje .xls ne triple RDF ne nje.xml
dhe .N3
• Implementim java, i zgjeruar me mapping
• Struktura e mapping
• Struktura e nje template
1. Flete pune (xl:sheetName )
2. xl:templateGraph
3. Veprime transformimi (xl:RowShift, xl:ColShift, xl:SheetShift)
• Nderfaqja në java për konvertim në RDF
• Gjenerim i 2 skedareve:
1. .xml
2. .n3
QUERY & VIZUALIZIMI
I TË DHENAVE SEMANTIKE
-SPARQL
-Google Visualisation
-Spark
• SPARQL përdoret:
- për të pyetur direkt databazen RDF (skedare RDF te ruajtur ne server
ne direktorine http://open.data.al/semanticfiles/xml/)
- Per vizualizim grafik te dhenash
• Query e ekzekutuar ne piken SPARQL Qcrumb
• Përdorimi i SPARQL query në vizualizim të dhënash me ane te
eksploruesit ODA
• Eksploruesi ODA(faceted browser )
- Perdoruesi pyet databazen ODA
- Pyjetjet (kerkimi) me ane te nderfaqes GUI (elemente select)
- Pergjigjet ne trajte grafike
- Elemente GUI popullohen me ane te pyjetjeve SPARQL mbi db RDF dhe
ontologjine ODA, ne Qcrumb
• 2 API vizuale open source ne ODA:
- Google Visualization API
- Spark
• Google Visualization API
- Me nje bashkesi mjetesh (Google Chart Tools) per paraqtitje grafike te te
dhenave
- Komponente t e nje grafiku:
1. Libraria e grafikeve (klase js)
2. Datatable (ne ODA popullohen me programin me rezultatet tabelare te nje SPARQL query)
- Motion Chart e gjeneruar me Google Visualisation API nepermjet nje SPARQL query
Metodologji përpunimi dhe publikimi i të dhënave
në format të hapur Open Data