First Studies on Self-Preserving Digital Objects
-
Upload
jose-antonio-olvera -
Category
Education
-
view
35 -
download
1
Transcript of First Studies on Self-Preserving Digital Objects
First Studies on Self-Preserving Digital Objects
Josep Lluis DE LA ROSA and José Antonio OLVERA
TECNIO – Centre EASYUniversitat de Girona
2
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
3
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
4
Introducció• La Preservació Digital (PD) és la gestió activa dels
continguts digitals al llarg del temps per garantir l’accés permanent
• És cada vegada més important per a les empreses, els organismes del sector públic, científics i ciutadans
• La informació digital generada en totes les àrees de la nostra societat creix a un ritme exponencial:▫ En 2011 s’han superat els 1,8 zettabytes
(1,8 billons de gygabytes) [1]▫ Creix per 9 cada 5 anys
[1] Gantz, J. and Reisel, D. (2011). Extracting Value from Chaos. Available at http://idcdocserv.com/1142
5
Introducció• Fins avui només les institucions públiques afronten aquest
problema, a través dels arxius nacional o les biblioteques• Aquests requereixen un canvi dels sistemes digitals d'arxiu
a gran escala cap als objectes intel·ligents en entorns amb capacitat d'aprenentatge
CCIA 2012
6
Introducció• La missió d’aquesta Recerca és:
▫ Distribuir els esforços de Preservació Digital▫ Fer la Preservació Digital prou fàcil per les persones,
companyies i institucions en general▫ Ajudar a reduir el cost i incrementar la capacitat de les
institucions per preservar la informació digital a llarg termini
CCIA 2012
7
Introducció•Aquest estudi és un primer intent d'establir les bases
d'un nou paradigma en PD centrat en l’objecte ▫ Es caracteritzen per tenir “pressupost digital” crèdit per desplaçar-se, fer
còpies i que es podrà recarregar▫ Els OD competiran entre ells per preservar-se▫ Com més interès en un OD, més pressupost rebrà i més probabilitat de ser
preservat
CCIA 2012
8
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
9
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
10
Estat de l’art•Buckets: Van ser dissenyats per dotar als objectes
amb certes responsabilitats com:▫La visualització▫Disseminació▫Protecció▫Manteniment
•Com faran els SPDOCCIA 2012
[8] Nelson M. 2001, Buckets: Smart Objects for Digital Libraries, PhD thesis, Old Dominion Univ.
11
Estat de l’art•Abans del 2000, va haver una sèrie de projectes
similars als SPDO i als buckets, com:▫Els contenidors Warwick Framework▫Flexible and Extensible Digital Object Repository
Architecture (FEDORA)
CCIA 2012
12
Estat de l’art•El paradigma SPDO es únic degut a que l’objecte és
intel·ligent, proporcionant intel·ligència de màquina a màquina (o intel·ligència de SPDO a SPDO i de SPDO a Serveis Web)
CCIA 2012
13
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
14
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
15
Model de comportament dels SPDO• Les solucions de PD es classifiquen en dos estratègies
principals: ▫La preservació de l’entorn tecnològic (emulació)▫I superar la obsolescència dels formats dels fitxers
(migració)•Nosaltres ens centrem en el segon enfocament per
superar les migracions de formats mitjançant la tècnica d'Intel·ligència d’Eixam
CCIA 2012
16
Model de comportament dels SPDO• L’analogia emprada és la següent:▫Objectes digitals (vídeo o imatge) ≡ formigues▫Usuaris xarxa (servei de preservació)≡ aliment▫Ordinadors xarxa ≡ hàbitats
CCIA 2012
17
Model de comportament dels SPDO
format={ }
CATÀSTROFEFormat vídeo: 3 4Format imatge: 1 2
1 2 3 4 5
1
2
3
4
5
Agents usuari
Objectes Digitals i els seus possibles formats
Usuaris afectatsper catàstrofe
CCIA 2012
18
Model de comportament dels SPDO•Catàstrofes: consisteixen en un canvi sobtat de ¼,
1/3 o ½ dels usuaris de la xarxa, degut a una actualització del seu programari
•Mesura de la “resiliència”:▫ Entropia de Shannon: per saber quan hi ha prou diversitat de formats que
proporcionen la suficient resiliència per recuperar de nou l’estat anterior després de cada catàstrofe.
CCIA 2012
n
iii ppxH
12log)(
n
i jjiji ppxH
1
5
1,2, log)(
5
1,
,,
kki
jiji
f
fp
Adaptat als models simulats
On:• n és el total d'objectes digitals originals• j són els diferents formats que hi ha, que
són 5• pi,j és el percentatge que suposen les
còpies de format j respecte el total de còpies que té un objecte digital original i
• k són els diferents formats que hi ha
20
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
21
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
22
Experimentació• Emulacions de durada de 20 anys cada 5 anys catàstrofe• Topologia de xarxa 1: small world
CCIA 2012
• Després de la primera catàstrofe el sistema mostra el major percentatge de recuperació d’entropia
• En el 10% d’adopció es recupera totalment; al 33% i 50% va disminuint després de cada catàstrofe
23
Experimentació•Topologia de xarxa 1: mesh
CCIA 2012
• La recuperació en cada onada és menor que la topologia anterior
• També s’observen menors percentatges de recuperació si comparem l’entropia al final de la simulació respecte el primer pic, abans de la primera catàstrofe
24
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
25
Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions
CCIA 2012
26
Conclusions• Hem proposat un nou mètode de PD emprant objectes digitals auto-
preservables, creant objectes dissenyats per lluitar per la seva pròpia preservació
• Hem demostrat l’efectivitat d’aquesta estratègia a través de l’experimentació amb un prototipus d’obsolescència digital resultant de diverses (3) onades d’adopció de software.
• Coma a treball futur, els resultats experimentals seran comparats amb aproximacions similars com les presentades per Cartledge i Nelson [18, 19, 20]
• Aquest estudi és el primer treball experimental en aquest camp que il·lustra com els objectes digitals auto-preservables amb comportaments simples poden proporcionar la capacitat de conservar la seva informació digital
CCIA 2012
27
Conclusions•Diverses preguntes queden pendents: ▫De quina altra manera s’hauria d’assignar i recarregar
el pressupost digital?▫Com es podria dissenyar la topologia de la xarxa social
(d’usuaris) per ajudar a preservar el contingut digital?▫Com podríem promoure aquestes topologies?▫Quins altres comportaments dels SPDO
incrementarien la resiliència?▫Hi ha altres maneres rellevants per mesurar la
resiliència? CCIA 2012