Digitalizace dokumentů: Porovnání verzí
m (23 revizí: IMPORT D-F: import stránek z hlavního jmenného prostoru z KiskWiki (http://kisk.phil.muni.cz/)) |
|||
| Řádek 1: | Řádek 1: | ||
| + | [[File:OPVK MU rgb.jpg|600x115px|RTENOTITLE]] | ||
| + | |||
| + | |||
Digitalizace dokumentů je jedním z trendů, související s proměnou klasických knihoven (s klasickými dokumenty) v knihovny hybridní a elektronické (s dokumenty v elektronické podobě). V dnešní době vzniká obrovské množství dokumentů již pouze v elektronické podobě. Knihovny a další organizace se však musí vypořádat s převodem tradičních dokumentů do elektronické podoby - proces digitalizace. | Digitalizace dokumentů je jedním z trendů, související s proměnou klasických knihoven (s klasickými dokumenty) v knihovny hybridní a elektronické (s dokumenty v elektronické podobě). V dnešní době vzniká obrovské množství dokumentů již pouze v elektronické podobě. Knihovny a další organizace se však musí vypořádat s převodem tradičních dokumentů do elektronické podoby - proces digitalizace. | ||
| Řádek 280: | Řádek 283: | ||
Zpracovala Pavla Lichnovská | Zpracovala Pavla Lichnovská | ||
| + | |||
| + | |||
| + | |||
| + | [[File:OPVK MU rgb.jpg|600x115px|RTENOTITLE]] | ||
Aktuální verze z 27. 8. 2014, 11:03
Digitalizace dokumentů je jedním z trendů, související s proměnou klasických knihoven (s klasickými dokumenty) v knihovny hybridní a elektronické (s dokumenty v elektronické podobě). V dnešní době vzniká obrovské množství dokumentů již pouze v elektronické podobě. Knihovny a další organizace se však musí vypořádat s převodem tradičních dokumentů do elektronické podoby - proces digitalizace.
S tématem digitalizace souvisí:
- automatické rozpoznávání typu a kvality dokumentu včetně optimalizace kvality obrazu technologií VRS (VirtuslReScan)
- CR/OMR rozpoznávání obsahu dokumentů a formulářů
- automatické získávání indexů, klíčových informací o dokumentu (vytěžování strojově i ručně psaného písma s českou diakritikou, čárové kódy, zaškrtávací boxy)
- vytěžování dat ze strukturovaných i polostrukturovaných dokumentů
- řízení pracovišť určených pro průběžné zpracování malého množství dokumentů i pro dávkové zpracování velkých objemů
- integrace s informačními systémy a export vytěžených dat do databází
Definice pojmu
Digitalizace je konverze obsahu dokumentů v tradiční podobě (tedy na analogovém médiu)do digitální podoby. Informace může být ve formě textové, obrazové, zvukové, audiovizuální popřípadě ve všech jejich kombinacích.
Využití digitalizace
1. Usnadňuje dostupnost informací - při digitalizaci jsou informace převedeny do binární soustavy. Elektronický dokument je tak přístupný kdykoli a všem.
2. Digitální dokumenty jsou úsporné - k hlavním důvodům digitalizace patří právě úspora místa a finančních prostředků. Na jednom CD je místo zhruba pro 235 knih. Pokud uvažujeme o digitálních dokumentech uchovaných v archivu na Internetu, místo nezabírají žádné.
3. Ochrana dat - data v elektronické podobě jsou odolnější. Rizikem je pouze stárnutí technologií.
4. Vyhledávání - díky digitální podobě lze dokument snadno fulltextové prohledávat.
--Tereza 09:38, 5. 3. 2008 (CET)
Postup při digitalizaci dokumentů
- příprava dokumentu - dokumenty jsou připravovány ke scanování a musí vyhovovat stanoveným požadavkům uživatele
- skenování - skenování vybraného dokumentu pomocí nejmodernější techniky
- post-scan processing - zpracování obrazů dokumentů,dochází k jejich vyčištění
- kontrola kvality - při digitalizaci se sleduje a kontroluje kvalita daného dokumentu
- návrh a provedení indexace
- uložení - dokumenty jsou ukládany na CD, DVD média a mikrofilmy
--Lucka 21:09, 14. 3. 2008 (CET)
Anotovaná webová bibliografie
Digitalizace
An Introduction to Digital Projects for Libraries, Museums and Archives
Copyright, digitalizace, hodnocení, metadata, plánování digitalizace, přístup a ochrana, rozpočet, technické informace
Článek shrnuje základní informace spojené s digitalizací. Začíná definicí digitálního obrázku podle Cornell university, která přechází k zjednodušené definici: „digitization converts materials from formats that can be read by people (analog) to a format that can be read only by machines (digital).“ Dále jsou přehledně rozepsány důvody digitalizace – zajištění přístupu a ochrana. Potom se soustřeďuje na shrnutí základních problémů, které jsou s digitalizací spojeny a se kterými se setká každá instituce, která se do digitalizace pustí. Jedná se o stanovení cílů, copyright, způsob řešení, personál, rozpočet, metadata, hodnocení a technické informace.
JONES, Trevor . University of Illinois at Urbana-Champaign : University Library [online]. 2001 [cit. 2010-05-08]. An Introduction to Digital Projects for Libraries, Museums and Archives. Dostupné z WWW: <http://images.library.uiuc.edu/resources/introduction.htm>.
Digitization for Public Librarians
Digitalizace ve veřejných knihovnách, formáty dat, financování, technické řešení
Přehledný souhrn informací o digitalizaci pro veřejné knihovny. Stránka má podpořit knihovny ve snahách digitalizovat lokální historii. Obsahuje popis základních formátů dat, typů digitálních projektů, technických řešení, způsobů financování a odkazy na související stránky.
BARNETT, Andy. South Central Library System [online]. 2006 [cit. 2010-05-08]. Digitization for Public Librarians. Dostupné z WWW: <http://www.scls.lib.wi.us/mcm/programs/digitize.html>.
Digitizing Images and Text
Digitalizace obrazu a textu, rozcestník, Kongresová knihovna, návody a doporučení pro digitalizaci, firmy zabývající se digitalizací, digitalizační projekty
Americký rozcestník na zajímavé články, doporučení, firmy a zdroje, které spojuje téma digitalizace obrazu a textu. Uvádí také odkazy na zajímavé digitalizační projekty v USA. Odkazuje především na různá doporučení, popisy práce, použité formáty a technické specifikace projektů Kongresové knihovny, amerických univerzitních knihoven a dalších institucí nebo firem (IBM).
Berkley Digital Library SunSITE [online]. 2000 [cit. 2010-05-08]. Digitizing Images and Text. Dostupné z WWW: <http://sunsite.berkeley.edu/Imaging/>.
Cornell University - The Department of Preservation and Conservation
Digitalizace, návody, tutorial, technické aspekty digitalizace, management uchování digitalizovaných souborů
Na Cornellově univerzitě vznikly přehledné tutoriály, které umožňují uživatelům naučit se základní pojmy týkající se digitalizace. Jedná se o :
Moving Theory into Practice: Digital Imagining Tutorial
Seznamuje se základními pojmy jako je digitální obraz, rozlišení, pixel, bit, velikost souboru, formát a komprese. Dále rozebírá kritéria výběru materiálů pro digitalizaci a odkazuje na politiky výběru dokumentů velkých knihoven. Věnuje s i dělení dokumentů, faktorům skenování, typům skenerů, benchmarkingu v oblasti digitalizace, kontrole kvality, metadatům, ukládání dat, jejich ochraně a organizaci digitalizačního procesu.
Cornell University Library/ Research Department. Moving Theory into Practice: Digital Imaging Tutorial [online]. c2003 [cit. 2010-05-08]. Dostupné z WWW: <http://www.library.cornell.edu/preservation/tutorial/contents.html>.
Digital Preservation Management
Tutoriál věnovaný ochraně digitalizovaných souborů se zbývá archivováním a skladováním dat, metadaty, strategiemi dlouhodobého uchování dat, nebezpečími, která jsou s uchováním dat spojená (životnost médií, zastarávání formátů apod.) Dále se věnuje financování, organizaci a administraci projektů a jejich zabezpečení.
Digital Preservation Management: Implementing Short-term Strategies or Long-term Problems [online]. 2003, 2008 [cit. 2010-05-08]. Dostupné z WWW: <http://www.library.cornell.edu/preservation/tutorial/contents.html>
Mass Digitization
British Library Online Project, Digital Publishing, Google Book Search, Online Book Publishing, Universal Digital Library
Popis významných projektů v oblasti masové digitalizace dokumentů – především Google books a projekty světových knihoven. Rozebrána je také otázka copyrightu. Část je věnována trhu digitálních knih a trendu digitálního publikování. Obsahuje odkazy na výsledky digitalizačních projektů knihoven.
Mass Digitization [online]. [cit. 2010-05-09]. Digitized Book Collections. Dostupné z WWW: < http://massdigitization.com/>.
Standardy
Standards Related to Digital Imaging of Pictorial Materials
Digitalizace obrazových materiálů, standardy, standardizační organizace, pokyny pro digitalizaci, targets
Přehled formálních standardů pro digitalizaci obrazového materiálu. Seznam byl vytvořen, aby umožňoval sledovat novinky v technickém vývoji, proto obsahuje odkazy na specializované weby, které tyto novinky sledují a kde je možné najít další podrobnosti. Hlavní části dokumentu jsou:
- standardy pro vyhledávání (NSSN, TechStreet, WSSN)
- organizace, které vytváří standardy (AIIM, ANSI, I3A, ICC, ISO, NISO)
- digitalizační standardy a pokyny pro fotografie (terminologie, rozlišení, hlučnost, rychlost, barva, kontrola kvality,…)
- standardy a pokyny pro skladování dat (média, formáty, skladiště)
- targets – nástroje pro kontrolu kvality v produkci a uchování digitálního materiálů.
ETERSON, Kit A. Library of Congress: Prints & Photographs Division [online]. 2004 [cit. 2010-05-08]. Standards Related to Digital Imaging of Pictorial Materials. Dostupné z WWW: <http://www.loc.gov/rr/print/tp/DigitizationStandardsPictorial.pdf>.
Standards at the Library of Congress
Standardy, digitální knihovny, Library of Congress
Přehled standardů používaných v Kongresové knihovně. Obsahuje standardy různých skupin – RDF, standardy pro vyhledávání a standardy pro digitální knihovny (METS, MIX, PREMIS, TEXTMD, ISO, ALTO). Dále obsahuje odkazy na organizace vydávající standardy (NISO, ANSI, ISO)
The Library of Congress: Especially for Librarians and Archivists [online]. 2009-11-25 [cit. 2010-05-08]. Standards at the Library of Congress. Dostupné z WWW: <http://www.loc.gov/standards/>.
Skenování
How to select a scanner for a digitization project
Digitalizace, skenování, skener, kodak, fujitsu, kofax, xerox, magtek, kirtas, B&H, IBML, i2s, kartoscan, ADF
Článek shrnuje zkušenosti autorky se zaváděním digitalizačních řešení s ohledem na výběr skenerů a jejich vlastnosti. Hlavními faktory, které rozhodují jsou rychlost skenování (počet naskenovaných stránek za minutu), velikost skenovaných dokumentů, simplex a duplex skenování, barevné možnosti skeneru, rozlišení, ovladače a software. Na závěr zmiňuje speciální skenery pro zvláštní účely.
amila_hendahewa. Experts Exchange [online]. 2009-10-09 [cit. 2010-05-08]. How to select a scanner for a digitization project. Dostupné z WWW: <http://www.experts-exchange.com/articles/Software/Server_Software/Document_Management/How-to-select-a-scanner-for-a-digitization-project.html>.
How to scan a book
Skenování knih, skener, OCR, editace
Popis specifik skenování knih. Článek začíná upřesněním, proč je skenování knih specifické (tloušťka stránky, obrázky a grafika v knize, textové boxy, atd.) a pokračuje návody a tipy, jak si s ním poradit. Obsahuje doporučení pro nastavení skeneru, vlastní skenování i práci s naskenovanými daty a upozorňuje na textové prvky, které mohou při použití OCR dělat problémy (např. číslování stran, poslední slovo na stránce, poznámky pod čarou).
ADAMS, John F. Proportional Reading [online]. c 1996 [cit. 2010-05-08]. How to scan a book. Dostupné z WWW: <http://www.proportionalreading.com/scan.html>.
Book-scanning uncovered
Amazon, digitalizace knih, knižní skenery
Článek se zabývá digitalizací dokumentů a technologiemi robotického skenování, které zrychluje proces digitalizace. Ukazuje, kde jsou možnosti využití skeneru. Jedním z nich jsou digitalizační projekty velkých knihoven. Představuje novou technologii skenování knih, která je jemnější než lidské ruce. Popisuje i digitalizační projet Amazonu, který se rozhodl digitalizovat miliony knih, aby umožnil nakupujícím vyhledávat v knihách konkrétní fráze.
USA today [online]. 2003-12-29 [cit. 2010-05-08]. Book-scanning uncovered. Dostupné z WWW: <http://www.usatoday.com/tech/news/2003-12-29-bookscan_x.htm>.
Scan This Book!
Digitalizace knih, Google books, skenování, univerzální knihovna
Článek se zabývá současným trendem digitalizace knih, kdy po celém světě probíhá řada projektů s cílem mít na jednom místě všechny znalosti. Dále se věnuje projektu Google Books a ideji univerzální knihovny, která bude demokraticky poskytovat všechny knihy všem. Taková knihovna by mohla obsahovat také veškeré články, umělecká díla a celý obsah webu. Rozsah takové knihovny by byl obrovský. Všechny dokumenty v ní budou polinkovány mezi sebou navzájem. Zamýšlí se nad takovou budoucí knihovnou a možnostmi jejího využívání.
KELLY, Kevin. The New York Times [online]. 2006-05-14 [cit. 2010-05-08]. Scan This Book!. Dostupné z WWW: <http://www.nytimes.com/2006/05/14/magazine/14publishing.html?pagewanted=all&ei=5090&en=c07443d368771bb8&ex=1305259200>.
Zajímavé projekty
International Collections - Newspaper digitization projects
Databáze, digitalizace novin, světové projekty, The International Coalition on Newspapers
Stránka projektu The International Coalition on Newspapers obsahuje odkazy na současné, minulé a plánované projekty digitalizace novin po celém světě. U každého odkazu je uveden krátký popis a možnost vyhledávání nebo prohlížení. Za Českou republiku je zde uveden systém Kramerius. The International Coalition on Newspapers se zaměřuje na strategie uchování a zpřístupnění novin z celé zeměkoule. Databáze obsahuje přes 25,000 novinových titulů.
Newspaper digitization projects [online]. 2010-04-29 [cit. 2010-05-08]. International Coalition on Newspapers. Dostupné z WWW: <International Coalition on Newspapers>.
Digitalizace dokumentů v ČR
Zmapování situace digitalizace v ČR
Digitalizace v ČR, ekonomické informace, hardware, metadata, průzkum, software, výběr dokumentů
Výsledky dotazníkového šetření z roku 2007, které se zabývalo otázkou digitalizace tištěných dokumentů. Hlavní otázky se týkaly použitého hardwaru a softwaru, metadat, ekonomickými informacemi, způsobem provádění digitalizace, výběrem dokumentů a objemem zpracovaných dat. Z oslovených 22 knihoven odpovědělo 19 a 14 z nich pracovalo na digitalizačních projektech. Dokument obsahuje také odkazy na poskytnuté výsledky digitalizace.
Sdružení knihoven ČR [online]. 2007 [cit. 2010-05-08]. Zmapování situace digitalizace v ČR. Dostupné z WWW: <http://www.sdruk.cz/it/Zmapovani_situace_digitalizace_v_CR.pdf>.
Registr digitalizace: evidence digitalizovaných dokumentů a sledování procesu zpracování
Digitalizace v knihovnách, evidence, registr digitalizace,zpracování dat
RD je společným projektem Národní knihovny České republiky, Knihovny Akademie věd a společnosti INCAD. Záměrem výchozího projektu bylo vytvořit národní registr digitalizovaných dokumentů, který by sloužil k řízení digitalizačního workflow jednotlivých institucí, zamezil duplicitě zpracování a umožnil sdílení výsledků digitalizace.
Registr digitalizace: evidence digitalizovaných dokumentů a sledování procesu zpracování [online]. [cit. 2010-05-08]. Dostupné z WWW: <http://sluzby.incad.cz/esp/rdcz/>.
Národní program mikrofilmování a digitálního zpřístupňování dokumentů ohrožených degradací kyselého papíru – Kramerius
Digitalizace dokumentů, Kramerius, Visk 7
Informace o programu VISK 7 - Národní program mikrofilmování a digitálního zpřístupňování dokumentů ohrožených degradací kyselého papíru – Kramerius. Cíle programu je záchrana a zpřístupnění bohemikálních dokumentů tištěných na kyselém papíru, jejichž existence je ohrožena rozpadem (křehnutím) papírového nosiče. Stránka obsahuje informace o realizaci projektů podaných pod projektem VISK za jednotlivé roky a také zápisy z jednání programu Veřejné informační služby knihoven nebo výsledky dotačních řízení.
VISK : Veřejné informační služby knihoven [online]. 2010-04-09 [cit. 2010-05-08]. VISK 7 Národní program mikrofilmování a digitálního zpřístupňování dokumentů ohrožených degradací kyselého papíru - Kramerius. Dostupné z WWW: <http://visk.nkp.cz/VISK7.htm>.
Digitalizace v NK ČR
Digitalizace, digitalizační pracoviště, Kramerius, Národní knihovna ČR, Národní digitální knihovna
Web vytvořený pro informovaní o digitalizační práci NK ČR. Obsahuje informace o projektu Kramerius (databázová aplikace určená pro zpřístupňování digitalizovaných dokumentů buď na lokální síti instituce, nebo v prostředí Internetu), jeho uživatelském rozhraní, metadatech, budoucím vývoji, zapojených pracovištích, prezentacích projektu atd.
Informační portál Kramerius [online]. 2008 [cit. 2010-05-08]. Dostupné z WWW: <http://kramerius-info.nkp.cz/digitalizace-v-nk>.
Digitalizace všech dokumentů by nám trvala asi tři sta let
Digitalizace, dostupnost, Europeana, Národní archív, přístup, živelné katastrofy
Rozhovor s ředitelkou Národního archivu České republiky PhDr. Evou Drašarovou, CSc. o současném stavu českého archivnictví a jeho napojování na evropské projekty, o připravované digitalizaci i o náročném odstraňování následků živelné katastrofy.
DRAŠAROVÁ, Eva; BABKOVÁ, Teresa. Ministerstvo vnitra [online]. 2010 [cit. 2010-05-08]. Digitalizace všech dokumentů by nám trvala asi tři sta let. Dostupné z WWW: <http://www.mvcr.cz/mvcren/article/digitalizace-vsech-dokumentu-by-nam-trvala-asi-tri-sta-let.aspx>.
Digitalizace a digitální zpřístupnění dokumentů
Archivace, autorské právo, digitalizace, mikrofilmy, příprava dokumentů, reformátování, skenování, metadata, standardy, Kramerius, zpřístupnění dokumentů
Informace o digitalizaci a používaných technologiích i postupech v NK ČR. Zahrnuje přípravu dokumentů a tvorbu metadat, skenování mikrofilmů, úpravy obrazových dat, zpřístupňování digitálních dokumentů, archivaci a zálohování digitálních dokumentů, hybridní technologie reformátování, autorské právo a popis koordinace oblasti ochranného refromátování. Ke zpřístupnění digitálních dokumentů slouží systém Kramerius.
Národní knihovna České republiky [online]. 2006 [cit. 2010-05-08]. Digitalizace a digitální zpřístupnění dokumentů. Dostupné z WWW: <http://www.nkp.cz/pages/page.php3?page=weba_digitalizace.htm>.
Současné trendy v digitalizaci novodobých dokumentů
Aplikace Relief, digitalizace, Kramerius, Národní digitální knihovna, Národní kulturní dědictví, OCR, robotické skenování, VISK, vyhledávání
Příspěvek z konference Knihovny v současnosti se zabývá trendy v oblasti digitalizace. Věnuje se programu VISK 7, jeho realizací a financování, dále projektu záchrany bohemikálních monografií 19. stol. Jiným tématem je Aplikace RELIEF a koordinace digitalizačních projektů, jehož součástí je i centrální registr digitalizovaných dokumentů pro řízení a evidenci pracovních procesů během celé realizace. Dále se příspěvek zabývá tvorbou fulltextu pro vyhledávání a problematikou OCR, Národní digitální knihovnou, národním kulturním dědictvím, replikací digitalizovaných dokumentů a technologií robotického skenování.
POLIŠENSKÝ, Jiří. Sdružení knihoven ČR [online]. 2008 [cit. 2010-05-08]. Současné trendy v digitalizaci novodobých dokumentů. Dostupné z WWW: < http://www.sdruk.cz/sec/2008/sbornik/2008-1-051.pdf >.
Proč digitalizujeme?
Digitalizace, postup práce, Knihovna Národního muzea, tvorba metadat, úskalí digitalizace
Stránka shrnuje digitalizační práci knihovny Národního muzea. Uvádí důvody, které vedly k digitalizaci, její přínosy i úskalí a popisuje postup práce v digitalizačním procesu. Na dalších stránkách jsou popsány konkrétní problémy, které byly řešeny během digitalizace projektů spolu s ukázkami výsledků.
Knihovna Národního muzea, Oddělení knižní kultury [online]. 2006-07-12 [cit. 2010-05-09]. Knihovna Národního muzea: Oddělení knižní kultury Proč digitalizujeme?. Dostupné z WWW: <http://knizni-kultura.wz.cz/proc.html>.
Zpracovala Pavla Lichnovská