WebArchiv

Z WikiKnihovna
Přejít na: navigace, hledání

WebArchiv

Autor: Vladimíra Perlová

Klíčová slova: digitální knihovna, archivace webu, archiv českého webu

Související pojmy:

Nadřazené – digitální knihovna

Podřazené – ----


Obsah:

1. Charakteristika a historie projektu

2. Získávání, archivace, ochrana

3. Legislativa

4. Mezinárodní spolupráce

5. Použitá literatura


1. Charakteristika a historie projektu

Součástí projektu Národní digitální knihovna je kromě systému Manuscriptorium a Kramerius, které se zabývají digitalizací analogových dokumentů, také WebArchiv . Jedná se o digitální archiv českých webových zdrojů, které jsou shromažďovány z důvodu jejich dlouhodobého uchování. WebArchiv je řešen v rámci projektu „Registrace, ochrana a zpřístupnění domácích elektronických zdrojů v síti Internet“ od roku 2000 v Národní knihovně České republiky, spoluřešitelem je Moravská zemská knihovna v Brně a spolupracovníkem Ústav výpočetní techniky Masarykovy univerzity v Brně . V prostředí internetu denně narůstá obrovské množství publikovaných, tzv. digital born, dokumentů, které se rychle mění nebo zcela mizí. Tyto dokumenty by nenávratně zmizely, pokud by nebyly průběžně archivovány. Za archivaci webů jako součásti národního kulturního dědictví a jejich registraci v národní bibliografii nese odpovědnost Národní knihovna ČR . Úlohou WebArchivu je tedy archivace bohemikálních dokumentů zveřejněných na internetu, tzn. jejich shromažďování, archivace a ochrana a zajištění dlouhodobého přístupu k těmto dokumentům. WebArchiv obsahuje digitální dokumenty volně dostupné prostřednictvím Internetu, publikace odborného, uměleckého a publicistického zaměření, periodika, monografie a jiné textové práce a také obrazové a zvukové dokumenty existující pouze v digitální podobě .

2. Získávání, archivace, ochrana

Jak už bylo uvedeno výše, cílem je archivovat celou produkci českého webu. Tohoto stavu ale nelze dosáhnout jednak z technických důvodů, jednak proto, že nemá smysl archivovat všechny publikované zdroje například vzhledem k jejich povaze (typicky reklama) . Dokumenty se archivují těmito způsoby: a) Plošnou sklizní (harvestingem), kdy cílem je archivace co největšího poštu domácích webových zdrojů pomocí aplikovaného softwaru (harvestoru), podmínkou je národní doména. Zdroje umístěné mimo národní doménu musí splňovat výběrová kritéria. b) Výběrovým přístupem, kdy se vychází z pravidel pro registraci v národní bibliografii, tedy hledisko území, jazyka, autorství a obsahu. Kritéria výběru jsou národní doména, národní aspekty, obsah, zdroje volně přístupné nebo se souhlasem vydavatele, běžně dostupné formáty a původní forma digital born. Preferovány jsou online časopisy, monografie, akademické práce, ale také weblogy nebo webové stránky zaměřené na jedinečné téma. Nearchivují se počítačové hry, osobní weblogy, databáze, rozhlasové a televizní vysílání. c) Tematickými sbírkami, které představují soubory webových dokumentů, u kterých se předpokládá celospolečenská debata. Monitorují se očekávané události i nenadálé situace . Český web se sklízí dvakrát ročně, stažená data jsou ukládána v archivu v archivačních formátech, které by měly zajistit v rámci vývoje informačních technologií migraci a trvalé zpřístupnění dat. Kromě serveru se data archivují na diskových polích .

3. Legislativa

Stávající legislativa upravuje povinnost vydavatelů odevzdávat určeným knihovnám povinný výtisk, nevztahuje se ale na zdroje publikované online. Současná verze Autorského zákona neumožňuje zpřístupnění dat z digitálního archivu . Zpřístupněny jsou pouze weby, u kterých to umožňuje licenční smlouva nebo které jsou zpřístupněny pod licencí Creative Commons .

4. Mezinárodní spolupráce

WebArchiv je členem mezinárodního konsorcia IIPC (International Internet Preservation Consortium) od roku 2007 . Posláním konsorcia je získávat a uchovávat znalosti a informace publikované na internetu tak, aby byly přístupné budoucím generacím, podporovat celosvětovou výměnu těchto informací a mezinárodní výměnu zkušeností . Pro českou republiku znamená spolupráci v pracovních skupinách a sdílení zkušeností.

5. Použitá literatura

Celbová, Ludmila; Coufal, Libor. WebArchiv se účastní mezinárodní spolupráce při archivaci webu. Ikaros [online]. 2007, roč. 11, č. 5 [cit. 14.05.2011]. Dostupné z WWW: <http://ikaros.cz/node/4085>. URN-NBN:cz-ik4085. ISSN 1212-5075.

HUTAŘ, Jan. Národní digitální knihovna : Archivace webu v rámci projektu NDK [online]. 05.01.2011.Národní knihovna ČR, c2001-2011, 05.01.2011 [cit. 2011-05-14]. Národní digitální knihovna. Dostupné z WWW: <http://www.ndk.cz/webarchiv>.

WebArchiv [online]. Poslední aktualizace: 13. 5. 2011. [2001] [cit. 2011-05-13]. WebArchiv - archiv českého webu. Dostupné z WWW: <http://www.webarchiv.cz/>.