Dlouhodobé uchovávání digitálních dokumentů

Z WikiKnihovna
Přejít na: navigace, hledání

Autor: Alžběta Lukšů

Klíčová slova: digitální dokument, digitalní archivace

Synonyma: archivace digitálních dokumentů

Související pojmy:

nadřazené: archivace, uchovávání digitálních dokumentů, digitální média
podřazené: metadata, migrace, emulace, hardwarové muzeum

Digitální dokument

Digitální dokument je takový dokument, jehož obsah je kódován v počítačově čitelné a zpracovatelné podobě. Pro označení takového dokumentu se používá také termín elektronický zdroj.

Lze definovat dvě složky digitálního dokumentu: obsah digitálního dokumentu a metadata popisující dokument. Obsah digitálního dokumentu je dán sekvencí znaků z určité konečné množiny znaků. Metadata pak identifikují sadu znaků použitou pro kódování obsahu dokumentu a obsahují i další informace charakterizující dokument (autor, název atd.) [1, s. 10].

Metody dlouhodobého uchovávání digitálních dokumentů

Ohrožení digitálního dokumentu porušením integrity odrazné vrstvy CD

Digitální dokumenty jsou ohroženy jak krátkou životností záznamového média, tak i krátkým technologickým cyklem a rychlým zastaráváním softwarových i hardwarových technologií a standardů. Archivace digitálních dokumentů se tedy nezaměřuje uchování originálu dokumentu na původním médiu, ale na uchování projevu či zobrazení záznamu na výstupním zařízení.

Dlouhodobé uchovávání digitálních dokumentů (digitální archivaci) lze definovat jako užití digitální technologie pro uchování informačního obsahu [2] nebo jako proces zajišťující přístupnost a použitelnost elektronického materiálu v určitém časovém období [3]. Tento proces nezahrnuje pouze činnosti technické povahy (ochrana paměťových médií, ochrana dat), ale má i aspekty organizační (týkající se zejména výběru dokumentů pro dlouhodobou archivaci), finanční a právní (týkající se práv autorů a nakladatelů).

Migrace

Migrace digitálního dokumentu představuje praktickou střednědobou strategii digitální archivace, která se zaměřuje na uchování intelektuálního obsahu dokumentu, přičemž může, ale nemusí být zachována přesná sekvence bitů. Zahrnuje tyto metody:

  • prosté překopírování obsahu na nové médium stejného typu (refreshing),
  • konverze média (např. překopírování dat z diskety na CD),
  • konverze objektu z jednoho datového formátu na jiný, obvykle ze zastaralého formátu na novější formát nebo na formát, který je výhodnější z hlediska přístupu či manipulace,
  • upgrade na vyšší verzi,
  • migrace technického prostředí (např. upgrade operačního systému),
  • migrace na jiné než digitální médium (např. tisk na papír, ochranné mikrofilmování).

Výhody migrace:

  • široce aplikovaný a dobře propracovaný přístup (jsou tedy k dispozici potřebné znalosti, lidské zdroje i softwarové nástroje),
  • migrované dokumenty jsou vždy přístupné v aktuálně používaných zobrazovacích systémech, nekladou tedy zvýšené nároky na specializované znalosti uživatelů a splňují aktuální standardy kvality.

Nevýhody migrace:

  • obtížná automatizace, finanční náročnost,
  • nutnost pravidelného opakování migračního procesu vždy, když daný formát zastará,
  • hrozba ztráty autenticity a akumulace chyb v důsledku opakovaných drobných změn v dokumentu.

Hardwarové či technologické muzeum

Posláním hardwarového muzea je shromáždit a poté ve funkčním stavu udržovat všechny relevantní počítačové systémy pro prohlížení dokumentů v jejich původním prostředí. Zjevnou výhodou tohoto přístupu je maximální autenticita. Z praktického hlediska je však toto řešení neproveditelné, a to vzhledem k nemožnosti shromažďovat a udržovat veškeré kombinace různých verzí hardwaru a softwaru, jež byly a budou používány [1, s.14].

Emulace

Emulací se rozumí zachování původního datového formátu digitálního objektu se znovuvytvořením některých procesů (např. hardwarové konfigurace nebo softwarových aplikací). Tímto způsobem je umožněno zobrazení dokumentu na současných počítačích. Pro každý digitální dokument je nutno uchovat sekvenci znaků a metadata, specifikaci hardwaru, který bude interpretován emulačním programem, a kompletní software systému pro zprostředkování dokumentu [1, s.16], [4].

Výhody:

  • uchování původní sekvence bitů,
  • vysoká autenticita, zachování původního vzhledu a funkčnosti,
  • digitální dokument se pro emulaci zpracuje pouze jednou, pak vyžaduje pouze pravidelné kopírování na nové médium (refreshing).

Nevýhody:

  • obtížný přístup pro uživatele, který na svém lokálním počítači nemá nainstalován odpovídající emulátor,
  • se vznikem nových platforem přichází nutnost tvorby nových emulátorů,
  • uživatel se musí naučit pracovat v původním, tj. zastaralém, počítačovém prostředí (např. znát příkazy DOSu) [4].

Použité zdroje

  1. Borghoff, U., Rödig, P., Schmitz, L. Long-Term Preservation of Digital Documents: Principles and Practices. Berlin: Springer, 2003. ISBN: 13 978-3-540-33639-6.
  2. Styblińska, M. Long-Term Preservation of Digital Assets – Some Specific Aspects [online]. ©2006. [cit. 2010-04-26]. Dostupné z: <http://www.proceedings2006.imcsit.org/pliks/149.pdf>.
  3. Strodl, S. et al. How to Choose a Digital Preservation Strategy: Evaluating a Preservation Planning Procedure [online]. [cit. 2010-04-26]. Dostupné z: < http://www.ifs.tuwien.ac.at/~strodl/paper/FP060-strodl.pdf>.
  4. Heslop, H., Davis, S., Wilson, A. An Approach to the Preservation of Digital Records [online]. December 2002. [cit. 2010-04-26]. Dostupné z: < http://www.naa.gov.au/images/an-approach-green-paper_tcm2-888.pdf>.