Přeskočit na obsah

Digitální archiv Nového Zélandu

  • JF 
Shares
Národní archiv Nového Zélandu (Archives New Zealand) patří mezi vedoucí pracoviště v oblasti digitální archivace na světě. Jeho pracovník Mgr. Jan Hutař, Ph.D., v minulosti jeden z aktérů přípravy české Národní digitální knihovny, seznámil zaplněnou posluchárnu Filozofické fakulty na své přednášce 27. května 2015, organizované Ústavem výpočetní techniky Univerzity Karlovy, s úspěchy a problémy svého nynějšího pracoviště (prezentace).

Národní archiv Nového Zélandu se řídí archivním zákonem (Public Record Act) z roku 2005 a je spolu s Národní knihovnou podřízen Ministerstvu vnitra (sekce Information and Knowledge Services). Podle zákona musí původci všechny dokumenty starší 25 let nabídnout archivu. Definice archiválie pracuje nikoli s pojmem dokument, ale „informace“, její součástí je také důraz na „nenáročnost na náklady a údržbu“. Informace musí být autentické, důraz je kladen na auditování událostí – autentizační prvky známé v Evropě se nepoužívají, elektronický podpis je nahrazen identifikací (vládní obdobaopenID), časové razítko je považováno za komplikaci zejména při dlouhodobém ukládání a nepoužívá se vůbec. Archiv je za informace odpovědný od okamžiku převzetí. Sám archiv spravuje kolem 100 běžných kilometrů archiválií z více než 200 let novozélandské historie. Nemá vlastní IT oddělení (správa sítě, hardware, údržba software), to je zabezpečováno na celovládní úrovni jako služba (placená).

Předchůdcem dnešního digitálního archivu bylo úložiště využívající digitální repozitář Fedora (2008). Data, většinově digitalizáty, zde byly ukládány jako bitstream, bez možnosti jejich udržování s ohledem na dlouhodobé ukládání. Díky napojení na celostátní program pro popis archiválií Archway umožnil i využívání archiválií. Současně s tímto „interním digitálním archivem“ (Interim Digital Archive) vznikl „plán digitální kontinuity“ (Digital Continuity Action Plan), schválený vládou v roce 2009. Na jeho základě vznikl „program vládního digitálního archivu“ (Government Digital Archives Programme). Ten určil právě národní archiv jako vedoucí pracoviště v této oblasti a v rámci čtyřletého projektu (2010-2013, náklady 200 milionů Kč) stanovil cíl: digitální archiv s důrazem na dloouhodobé uchování s ohledem i na born-digital dokumenty. Byly vytvořeny metodiky a sdíleny informace směrem ke státní správě i dovnitř archivu. Za tím účelem dokonce vzniklo samostatné oddělení pro komunikaci a metodiku.
Jako základ pro řešení byl zvolen israelský systém Rosetta (firma Ex Libris), který byl právě díky národnímu archivu významně zdokonalen a doplněn a byly do něho migrována data z Fedora (2012-2013). Umožňuje v současné době vedle ukládání balíčků AIP zejména identifikaci datových formátů a migraci na vstupu. To je právě oblast, kterou se Mgr. Hutař zabývá. V rámci projektu však nebyl realizován zásadní požadavek – umožnit příjem a uložení born-digital dokumentů. Ten je teprve nyní, už bez zvláštní finanční dotace, zpracováván.
Přednášející následně seznámil s personálním obsazením pracoviště (5,7 úvazku, z toho 2 analytici a dva archiváři) s důrazem na svou oblast digitální kontinuity (je jedním ze zmíněných dvou analytiků). Spolu s národním archivem provozuje systém Rosetta i Národní knihovna Nového Zélandu, ovšem data jsou spravována nezávisle obdobným pracovištěm (6 úvazků, z toho 2 analytici a 2 testeři/správci dat).
O vlastní chod systému se staré zmíněné vládní pracoviště (Technology Services and Support), kde jsou k dispozici i vývojáři. V tomto případě se jedná fakticky o outsourcing IT služeb vládou najmutému konsorciu firem, technologicky jde o vládní cloudové řešení (je zcela pod kontrolou státu). Zmíněny byly i problémy v komunikaci, kdy IT na jedné straně a knihovníci/archiváři na straně druhé jsou jiné světy. Např. IT specialisté nechápali, proč chce archiv tolik podrobností o řešení dat a účtování – normální zákazník ze soukromého sektoru vše nechá na poskytovateli. Archiváři a knihovníci jsou tak netypickými zákazníky hlavně s ohledem na požadavek záznamu všech změn a operací s daty. Protože národní archiv byl zde určitým průkopníkem, zhodnotil přednášející i výhody a nevýhody přechodu z nákupu na službu a s tím související otázky účtování výdajů. Dalším rozdílem oproti „normálním zákazníkům“ je nerovnoměrný download/upload související s dávkovým ukládáním dat.
Značná pozornost byla v přednášce věnována politikám ochrany (Preservation Policies), z nichž část je rozpracována, část již využívána. Díky již zmíněnému důrazu na auditování událostí (v naší archivní terminologii transakční protokol) je velmi významná průběžná procesní dokumentace – žádná změna v systému nebo v datech nesmí nastat bez jejího zaznamenání. Obsah digitálního archivu odpovídá zmíněnému – drtivou většinu tvoří digitalizáty.
S born-digital dokumenty souvisí analýza datových souborů a možnosti jejich migrace do formátů vhodných k dloouhodobému uložení, kterou provádí přednášející. Upozornil na nutnost budování knihovny formátů a nástrojů (pro systém Rosetta je národní archiv spolu s národní knihovnou Nového Zélandu jeho správcem, účastní se v mezinárodní pracovní skupině) a zmínil nedostatky v databázi formátů britského národního archivu (PRONOM). Některé problémy nejsou řešitelné – např. dynamicky generované datum v dokumentech MS Word. Jako ukládací formát pro skeny byl využíván TIFF, v současnosti je to JP2.
V bohaté diskusi byla akcentována zejména problematika metadat a konstrukce AIP. Z odpovědi vyplynulo, že AIP obsahuje popisná metadata pouze v minimální míře (nekvalifikovaný Dublin Core), další metadata se řídí standardem PREMIS. Další popisná metadata včetně hierarchie a vazeb mezi uloženými daty jsou již pouze v systému pro popis archiválií Archway. Předávání dat se děje pouze off-line na speciálních HDD discích, on-line předávání umožněno není. V případě migrace zůstává součástí AIP původní datový soubor. V případě hybridních dokumentů (jejich část je v analogové podobě) nejsou schopni toto rozlišit a digitální dokument zpracovávají zcela samostatně.
Celá přednáška umožnila nejen vhled do práce předního světového pracoviště v oblasti digitální kontinuity, ale také možné srovnání se situací u nás. Přítomni byli snad všichni, kdo se touto problematikou v České republice vážně zabývají – zástupci archivů, knihoven, dodavatelských firem software, konzultantů, vědeckých pracovišť. Ti, kteří jsou účastni na vývoji našeho národního digitálního archivu, mohou konstatovat, že na tom špatně opravdu nejsme.

Miroslav Kunt
(9. 6. 2015)

Shares