First Studies on Self-Preserving Digital Objects

28
First Studies on Self- Preserving Digital Objects Josep Lluis DE LA ROSA and José Antonio OLVERA TECNIO – Centre EASY Universitat de Girona

Transcript of First Studies on Self-Preserving Digital Objects

First Studies on Self-Preserving Digital Objects

 

Josep Lluis DE LA ROSA and José Antonio OLVERA

TECNIO – Centre EASYUniversitat de Girona

2

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

3

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

4

Introducció• La Preservació Digital (PD) és la gestió activa dels

continguts digitals al llarg del temps per garantir l’accés permanent

• És cada vegada més important per a les empreses, els organismes del sector públic, científics i ciutadans

• La informació digital generada en totes les àrees de la nostra societat creix a un ritme exponencial:▫ En 2011 s’han superat els 1,8 zettabytes

(1,8 billons de gygabytes) [1]▫ Creix per 9 cada 5 anys

[1] Gantz, J. and Reisel, D. (2011). Extracting Value from Chaos. Available at http://idcdocserv.com/1142

5

Introducció• Fins avui només les institucions públiques afronten aquest

problema, a través dels arxius nacional o les biblioteques• Aquests requereixen un canvi dels sistemes digitals d'arxiu

a gran escala cap als objectes intel·ligents en entorns amb capacitat d'aprenentatge

CCIA 2012

6

Introducció• La missió d’aquesta Recerca és:

▫ Distribuir els esforços de Preservació Digital▫ Fer la Preservació Digital prou  fàcil  per  les  persones,

companyies i institucions en general▫ Ajudar a reduir  el  cost  i  incrementar  la  capacitat  de les

institucions per preservar la informació digital a llarg termini

CCIA 2012

7

Introducció•Aquest estudi és un primer intent d'establir les bases

d'un nou paradigma en PD centrat en l’objecte ▫ Es caracteritzen per tenir “pressupost digital” crèdit per desplaçar-se, fer

còpies i que es podrà recarregar▫ Els OD competiran entre ells per preservar-se▫ Com més interès en un OD, més pressupost rebrà i més probabilitat de ser

preservat

CCIA 2012

8

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

9

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

10

Estat de l’art•Buckets: Van ser dissenyats per dotar als objectes

amb certes responsabilitats com:▫La visualització▫Disseminació▫Protecció▫Manteniment

•Com faran els SPDOCCIA 2012

[8] Nelson M. 2001, Buckets: Smart Objects for Digital Libraries, PhD thesis, Old Dominion Univ.

11

Estat de l’art•Abans del 2000, va haver una sèrie de projectes

similars als SPDO i als buckets, com:▫Els contenidors Warwick Framework▫Flexible and Extensible Digital Object Repository

Architecture (FEDORA)

CCIA 2012

12

Estat de l’art•El paradigma SPDO es únic degut a que l’objecte és

intel·ligent, proporcionant intel·ligència de màquina a màquina (o intel·ligència de SPDO a SPDO i de SPDO a Serveis Web)

CCIA 2012

13

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

14

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

15

Model de comportament dels SPDO• Les solucions de PD es classifiquen en dos estratègies

principals: ▫La preservació de l’entorn tecnològic (emulació)▫I superar la obsolescència dels formats dels fitxers

(migració)•Nosaltres ens centrem en el segon enfocament per

superar les migracions de formats mitjançant la tècnica d'Intel·ligència d’Eixam

CCIA 2012

16

Model de comportament dels SPDO• L’analogia emprada és la següent:▫Objectes digitals (vídeo o imatge) ≡ formigues▫Usuaris xarxa (servei de preservació)≡ aliment▫Ordinadors xarxa ≡ hàbitats

CCIA 2012

17

Model de comportament dels SPDO

format={                               }

CATÀSTROFEFormat vídeo: 3 4Format imatge: 1 2

1 2 3 4 5

1

2

3

4

5

Agents usuari

Objectes Digitals i els seus possibles formats

Usuaris afectatsper catàstrofe

CCIA 2012

18

Model de comportament dels SPDO•Catàstrofes: consisteixen en un canvi sobtat de ¼,

1/3 o ½ dels usuaris de la xarxa, degut a una actualització del seu programari

•Mesura de la “resiliència”:▫ Entropia de Shannon: per saber quan hi ha prou diversitat de formats que

proporcionen la suficient resiliència per recuperar de nou l’estat anterior després de cada catàstrofe.

CCIA 2012

n

iii ppxH

12log)(

n

i jjiji ppxH

1

5

1,2, log)(

5

1,

,,

kki

jiji

f

fp

Adaptat als models simulats

On:• n és el total d'objectes digitals originals• j són els diferents formats que hi ha, que

són 5• pi,j és el percentatge que suposen les

còpies de format j respecte el total de còpies que té un objecte digital original i

• k són els diferents formats que hi ha

19

Model de comportament dels SPDO•Paràmetres emprats en la simulació:

CCIA 2012

Small world Mesh

20

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

21

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

22

Experimentació• Emulacions de durada de 20 anys cada 5 anys catàstrofe• Topologia de xarxa 1: small world

CCIA 2012

• Després de la primera catàstrofe el sistema mostra el major percentatge de recuperació d’entropia

• En el 10% d’adopció es recupera totalment; al 33% i 50% va disminuint després de cada catàstrofe

23

Experimentació•Topologia de xarxa 1: mesh

CCIA 2012

• La recuperació en cada onada és menor que la topologia anterior

• També s’observen menors percentatges de recuperació si comparem l’entropia al final de la simulació respecte el primer pic, abans de la primera catàstrofe

24

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

25

Estructura• Introducció•Estat de l’art•Model de comportament dels SPDO•Experimentació•Conclusions

CCIA 2012

26

Conclusions• Hem proposat un nou mètode de PD emprant objectes digitals auto-

preservables, creant objectes dissenyats per lluitar per la seva pròpia preservació

• Hem demostrat l’efectivitat d’aquesta estratègia a través de l’experimentació amb un prototipus d’obsolescència digital resultant de diverses (3) onades d’adopció de software.

• Coma a treball futur, els resultats experimentals seran comparats amb aproximacions similars com les presentades per Cartledge i Nelson [18, 19, 20]

• Aquest estudi és el primer treball experimental en aquest camp que il·lustra com els objectes digitals auto-preservables amb comportaments simples poden proporcionar la capacitat de conservar la seva informació digital

CCIA 2012

27

Conclusions•Diverses preguntes queden pendents: ▫De quina altra manera s’hauria d’assignar i recarregar

el pressupost digital?▫Com es podria dissenyar la topologia de la xarxa social

(d’usuaris) per ajudar a preservar el contingut digital?▫Com podríem promoure aquestes topologies?▫Quins altres comportaments dels SPDO

incrementarien la resiliència?▫Hi ha altres maneres rellevants per mesurar la

resiliència? CCIA 2012

First Studies on Self-Preserving Digital Objects

Josep Lluis DE LA ROSA and José Antonio OLVERA

 

TECNIO – Centre EASYUniversitat de Girona