Skenování pro digitalizaci - techniky

Z WikiKnihovna
Přejít na: navigace, hledání

Autor: Michala Mádlová

Klíčová slova: Digitalizace, skenování, skenery


Způsoby digitalizace

Digitalizovat můžeme několika způsoby. Výchozí digitální objekty každého způsobu jsou vhodné pro jiný druh dalšího využití.

  1. Digitalizace pomocí klávesnice - nejstarší a nejjednodušší způsob digitalizace je přepsání textu pomocí klávesnice.
  2. Skenování bez dalších úprav - naskenováním souboru nám vznikne obrázek, na kterém je zachovaný formát původního dokumentu.
    • Výhoda tohoto typu skenování je ta, že se zamezí chybám a překlepům způsobeným OCR, a neztratí se informace o původním grafickém zobrazení dokumentu
  3. Skenování a OCR - po naskenování se převedou grafické znaky na písmena pomocí OCR =
    • výhodou této metody je, že v dokumentu upraveným pomocí OCR lze vyhledávat full textově, a lze si nechat text přečíst speciálním softwarem 1


Druhy skenerů

V základním rozlišení jde o skenery bubnové a plošné.

  1. Do bubnových se vkládá skleněný válec, na kterém jsou nalepené předlohy ke skenování.
  2. Plošné skenery, nebo také stolní, jsou typičtější.
    • U klasického stolního skeneru se předlohy pokládají na skleněnou skenovací plochu a přitlačí se víkem. U velkoformátových stolních skenerů se předloha pokládá na desku, která je přitlačena na skleněnou skenovací plochu. Tento skener se velmi hodí ke skenování velkých formátů, jako jsou např. mapy. Velkoformátový skener může být vybaven i kolíbkou, která je výborná na skenování knih i velkých formátů, jako jsou atlasy. U obou skenerů jde o bezkontaktní akci, proto nehrozí poškození předlohy.  2
    • Tužkové a ruční skenery - velmi malá zařízení, na skenování malých věcí
  3. Průchodové skenery - dokáží skenovat několik listů najednou
  4. Digitální fotoaparát
    • Vyfotografováním předlohy vznikne digitální dokument. Tato forma digitalizace patří mezi ty nejjednodušší a nejlevnější. Kvalita digitálního dokumentu závidí na kvalitě použitého digitálního fotoaparátu.
  5. 3D skenery - snímají objekty prostorově
  6. technické skenery - používají se ke snímání technických prvků, jako jsou čárové kódy  3


Metadata

"Když naskenujeme knihu, získáme tím sice její digitální kopii, ale pro její zpřístupnění potřebujeme ještě další informace - metadata. Základem jsou metadata strukturální - údaje o tom, jak jdou jednotlivé skeny po sobě, který sken odpovídá kterému číslu stránky fyzické předlohy, jak je monografie rozdělena na kapitoly, nebo periodikum na ročníky, čísla a články. Tyto informace jsou nezbytné pro listování a prohledávání dokumentu v digitální knihovně. Bibliografická metadata jsou převzata z knihovního katalogu a upravena pro potřeby digitálního dokumentu. Administrativní metadata popisují mimo jiné právní okolnosti - zda je digitální dokument možno zpřístupnit veřejnosti a za jakých podmínek - a technická metadata určují parametry naskenovaných obrázků, velikost, rozlišení, použité formáty a jejich verze apod." 4


Průběh digitalizace

Celý průběh digitalizace začíná výběrem dokumentu. Tento výběr má několik kritérií:

  • Knihovny se v první řadě soustředí na dokumenty, které již nejsou ve stavu, aby se mohly fyzicky půjčovat čtenářům
  • Digitalizovat se mohou dokumenty, na které se již nevztahuje autorské právo. To znamená dokumenty, jejichž autor je již sedmdesát let po smrti, či díla z 19. století, na která se autorský zákon již nevztahuje
  • A přednostně se digitalizují i dokumenty, které jsou na kyselém papíře a tím pádem rychleji podléhají zkáze

Vybranému analogovému dokumentu vytvoříme digitální kopii pomocí skeneru. Typy skeneru a způsoby digitalizace jsou již výše zmiňované.

Takto vytvořený dokument se uloží ve formátu vhodném pro digitální objekty, jako je např. PDF či DjVu.

Digitální dokumenty se ukládají na více nosičů, aby se zamezilo nebezpečí ztráty tohoto dokumentu. V digitálních knihovnách se dokumenty ukládají na tři nosiče. Dva jsou online pro potřeby čtenářů a třetí je offline jako případná záloha. Na tomto principu pracuje i projekt Kramerius.

Nosiče digitálních dokumentů se musí neustále obnovovat, protože by se mohlo stát, že nosič bude zastaralý a nečitelný a tím by se ztratily informace.

Cílem skenování je zpřístupnit uživatelům, co nejvíce možných informací, na jednom místě - v dnešní době je to internet. Tyto informace budou tímto zachovány i pro budoucí generace.


Použité zdroje

1.   PRAKS, Vítězslav; PRAKSOVÁ, Tereza. Logo: České Texty Elektronicky ! [online]. 1999, 17. 04. 2002 [cit. 2012-05-20]. O digitalizaci textů. Dostupné z WWW: <http://cte.cuni.cz/otextech.htm>.

2.   TALICH, Milan a Filip ANTOŠ. Metody a postupy digitalizace a zpřístupnění starých kartografických děl. In: [online]. [cit. 2012-05-20]. Dostupné z: http://www.inforum.cz/pdf/2011/talich-milan.pdf

3.  Skenery a skenování. In: [online]. [cit. 2012-05-20]. Dostupné z: http://www.sout-prelouc.cz/stranky/polygrafie_grafika_drobek/dokumenty/maturita10/graf_18_sken.pdf

4.   ŠVÁSTOVÁ,Pavla. MEditor – metadatový editor pro digitální knihovnu Kramerius. Duha: Informace o knihách a knihovnách z Moravy [online]. 2010, č. 3 [cit. 2012-05-20]. Dostupné z: http://duha.mzk.cz/clanky/meditor-metadatovy-editor-pro-digitalni-knihovnu-kramerius