Michal Růžička - Napojení systému Archivematica na úložiště CESNET

13
Napojení systému Archivematica na úložiště CESNET Michal Růžička ÚVT MU Projekt LTP PILOT Masarykova univerzita V Praze dne 1. 12. 2015

Transcript of Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Page 1: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Napojení systému

Archivematica na

úložiště CESNET

Michal Růžička ÚVT MU

Projekt LTP PILOT

Masarykova univerzita

V Praze dne 1. 12. 2015

Page 2: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Osnova

• Strategie bit-level ochrany dat.

• Infrastruktura úložišť CESNET.

• Architektura ukládání dat v Archivematica.

• Kontrola integrity.

Page 3: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Dlouhodobá bitová ochrana dat

• Data ochraňuje před ztrátou a

• nekontrolovanou změnou

• z důvodu chyby (lidské, software, hardware, …)

• nebo cílené zlovolné manipulace.

Page 4: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Strategie bit-level ochrany dat

• Bil-level ochrana dat replikací na

• technologicky,

• logicky a

• geograficky oddělené lokality.

• Kontrola konzistence dat

• v rámci jedné lokality a

• mezi lokalitami.

Page 5: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Infrastruktura úložišť CESNET

Geograficky oddělená nezávislá datová centra.

Page 6: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Infrastruktura úložišť CESNET

HSM – Hierarchical Storage Management.

Z hlediska uživatele je přístup k datům

transparentní.

Page 7: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Architektura systému Archivematica

z hlediska ukládání dat

• Systém Archivematica není monolitický

softwarový celek.

• Archivematica Dashboard.

• Archivematica MCP.

• Archivematica Storage Service.

• Gearman Job Server.

• …

Page 8: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Architektura systému Archivematica

z hlediska ukládání dat

• Archivematica Storage Service se stará

o ukládání dat.

• Může běžet na jiném serveru než Archivematica MCP.

• Může obsluhovat více Archivematica instancí,

• se kterými komunikuje síťovým protokolem.

• Samotná Archivematica neprovádí replikaci

dat a bitovou ochranu ponechává v režii

použitého úložiště.

Page 9: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Technologické řešení:

Schéma napojení na CESNET

Page 10: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Technologické řešení napojení

• Archivematica Storage Service ukládá data na

svazek propojený protokolem NFSv4 na CESNET

úložiště.

• Silná a škálovatelná autentizace přes Kerberos.

• Kryptografické zajištění důvěrnosti a integrity dat při přenosu.

• Dobré výkonností parametry.

• Nutné menší změny v kódu, zdroje dostupné na GitHub.

• Storage Service ukládá data na jedinou

(primární) DU CESNET lokalitu.

• Replikace na ostatní lokality v režii DU CESNET.

• Možnosti replikace rozšířeny v rámci projektu LTP Pilot.

Page 11: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Kontrola konzistence dat

• Archivematica API pro ověření konzistence AIP.

• Pracuje jen s ASS známou jedinou kopií dat.

• V rámci LTP Pilot implementován nástroj

FSTreeIntegrityWatch.

• Ukládání integritní informace v rozšířených atributech souborů v

souborovém systému nebo v integritní bázi vJSON formátu.

• Podpora formátu BagIt.

• Podpora mnoha různých algoritmů kontrolních

součtů s možností snadného rozšíření o další.

• K dispozici na GitHub.

Page 12: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Děkuji za pozornost!

Michal Růžička

[email protected] Národní archiv

V Praze dne 1. 12. 2015

DOTAZY?

Page 13: Michal Růžička - Napojení systému Archivematica na úložiště CESNET

Odkazy, použité zdroje

https://www.archivematica.org/en/docs/archivematica-1.4/

https://wiki.archivematica.org/Main_Page

https://du.cesnet.cz/cs/infrastruktura_ulozist/start

https://github.com/michal-ruzicka/archivematica

https://github.com/michal-ruzicka/FSTreeIntegrityWatch