Retrokonverze

Z WikiKnihovna

RTENOTITLE



Závěrečná práce - Lucie Poskierová


Úvod

Technologie RETROKON vznikla před 14 lety v souvislosti se zahájením převodu lístkových katalogů a bibliografických soupisů z papírové do digitální podoby v Národní knihovně České republiky. RETROKON je originální česká technologie, která vznikla jako výsledek spolupráce mezi Národní knihovnou ČR a firmou COMDAT. Firma COMDAT se zaměřuje na vývoj a dodávku systému pro práci s dokumenty. Tato komplexní technologie a její modulárnost umožňuje postupovat po etapách. Při vývoji byl akceptován model strukturování, a ukázal se jako důležitý pro naskenování obrazových katalogů. Tento modul byl obohacen o objednání dokumentů. Z modulu KATIF sloužil ke zpřístupnění naskenovaných katalogů. Postupně vznikl modul Národní informační systém pro retrospektivní konverzi NRIS. V NRIS jsou zpřístupněny katalogy českých knihoven a informace o retrokonverzi v českých knihovnách. Zrodil se model Informační systém pro retrospektivní konverzi – RIS. Ten byl v přehledu o retrospektivní konverzi a její management částečně transformován v Národní informační systém pro retrospektivní konverzi.


Historie retrospektivní konverze

V minulosti byly v Národní knihovně některé katalogy převedeny na mikrofiše. Jednalo se o katalogy hudebního oddělení a katalog Slovanské literatury. Z finančních důvodů se nepodařilo převést na mikrofiše největší katalog Národní knihovny a tím je generální katalog univerzálního knihovního fondu. Analýza ze světových databází, která byla provedena ukázala že záznamy shodné s fondy Národní knihovny je malé procento a kvalita je problematická. Během čtyř let však došlo k dramatickému vývoji v oblasti technologie OCR/ICR. Kvalitní skenery, nástroje pro bezchybný přepis do textové podoby , prostředky pro využití naskenovaných předloh otevřeli cestu k umožnění přístupu ke katalogům Národní knihovny. Zpřístupnit katalogy Národní knihovny v digitální podobě levně a rychle, při úplném převodu záznamu do formátu UNIMARC postupovalo po etapách.

Co je retrokonverze

Převod existujícího tištěného, popř. rukopisného (lístkového i svazkového) katalogu do digitální podoby za pomoci informačních technologií. Výsledkem konverze je obrazová nebo strukturovaná forma záznamů. Účelem je zajištění online dostupnosti katalogu pro uživatele knihovny a využitelnost záznamů pro výměnu bibliografických dat. (viz TDKIV)


Účel

- zajištění online dostupnosti katalogu pro uživatele knihovny

- využitelnost záznamů pro výměnu bibliografických dat.


Cíle

- zpřístupnění katalogů prostřednictvím internetu

- umožňuje otevření katalogů i fondů jednotlivých knihoven pro všechny uživatele

- online objednávání dokumentů (zkvalitnění meziknihovní výpůjční služby)

- zrovnoprávnění uživatelů

- velké množství kvalitních bibliografických záznamů, dostupné i pro ostatní knihovny

Program VISK má také dílčí cíle, ve kterých se snaží o napojení veřejných knihoven na Internet, zpřístupnění katalogu všem uživatelům. Zajistit rychlé vyhledávání v katalozích a zkvalitnit meziknihovní výpůjční službu. S vývojem nových technologií a rychle měnící se dobou je důležitým faktorem zaškolování knihovníků v oblasti ICT. Knihovnicí poté mohou být velice nápomocni uživatelům, kteří si neví rady. Měla by se zlepšovat vzájemná komunikace a kooperace mezi knihovnami především v oblastech získávání, zpracování a sdílení informačních zdrojů.

Zaměření retrokonverze

Retrospektivni konverze se zaměřuje na fondy s velkým rozsahem a dává zásadní význam meziknihovní výpůjční službě a také uchování, zpřístupnění národního kulturního dědictví. Retrospektivní konverze by měla zajistit vysokou úroveň katalogizace a také výsledky by měli odpovídat doporučením uvedeným v materiálu Záznam pro souborný katalog : UNIMARC.

Technologie RETROKON

Se skládá ze čtyř etap:

Etapa I - skenování a archivace - Záznamy obsažené v lístkových katalozích nebo tištěných bibliografických soupisech jsou skenovány špičkovými skenery, které zaručují kvalitní výchozí materiál pro další etapy. Záznamy jsou v obrazové podobě TIFF. Výsledkem první etapy je digitalizovaná "obrazová" podoba katalogu nebo bibliografie. Archivace která je prováděná na magnetooptická media v podobě přepisovatelné, tak v podobě která již po zapsání nelze změnit.

Etapa II - přepis- Obrazová podoba kvalitních předloh je automaticky převáděna do nestrukturované textové podoby pomocí OCR. U méně kvalitních předloh probíhá přepis ručně s použitím speciálního programu, který ergonomicky integruje na jedné obrazovce předlohu i přepisovaný text. Cílem této etapy je převedení záznamu do textové podoby a to jak nejrychleji a s nejvyšší přesností.

Etapa III - strukturování (tagování)- Mezinárodní srozumitelnost a využitelnost záznamů vyžaduje strukturování textu podle mezinárodních standardů. Každý údaj (autor, název, nakladatel atd.) je opatřen jednoznačnou, mezinárodně srozumitelnou identifikací (tagem) podle formátu UNIMARC. Strukturování velice snadno u algoritmizovatelných záznamů, u ostatních jenom částěčně.

Etapa IV - revize - Poslední fází celého procesu je revize záznamů. Revize strukturované podoby provádí zkušený knihovník na základě původní obrazové podoby záznamu dokumentu.

RIS

Jedná se o systém pro řízení retrospektivní konverzi.Tento systém je důležitý pro správu a řízení retrospektivní konverze ve velkých institucích. V nich se jedná o dlouhodobý proces. Systém RIS obsahuje třívrstvou architekturu, která je stavěná na principu klient-server. První vrstva systému je databázová vrstva. Druhá vrstva je business logiky, která poskytuje služby všem uživatelům. Třetí vrstva je klienská část systému.

Systém RIS má několik funkcí

1. Prohlížení záznamů

Prohlížení záznamů je považováno jako základní funkce. Tato funkce probíhá v modulu Katalogy. Tento modul umožňuje procházení katalogů a zobrazování záznamů.Uživatel má možnost záznamy zvětšovat či zmenšovat pomocí lupy. Velký přínos můžeme spatřovat v manipulaci se záznamy. Manipulace je velice důležitá proto, že v naskenovaných lístkových katalozích mohou být chyby. K chybám může docházet při manipulaci s lístkovým katalogem před jeho skenováním. Díky nástrojům jsme schopni chyby opravit ve vlastních záznamech. Tím knihovny ušetří financí, protože nemusí najímat firmu, která by jim provedla provedené operace. Při vkládání můžeme prohlížet a třídit záznmy do skupin dle určených filtrů. Filtry umožňují třídění celého katalogu podle různých kritérií pro retrospektivní konverzi.

2. Správa objednávek

Modul Objednávky poskytuje služby, které souvisejí se zpracováním a vyřízením objednávek. Systém RIS registruje objednávky výpůjčních služeb a pomáhá vést jejich evidenci při zpracování. Po příchodu objednávky systém automaticky vytiskne objednací lístek. Lístek slouží při vyhledávání a následném předání čtenáři. V objednávkovém systému máme možnost vést evidence a statistiku samostatně pro každou část knihovny zvlášť. Díky tomu získá knihovna přehled o počtu objednávek ve studovnách.

3. Označení záznamů

Označování je základní nástroj pro seskupení a třídění záznamů. Pro označení slouží v modulu Příznaky. Příznaky můžeme definovat podle daných kritérií. Knihovník si může katalog nadefinovat, a dále vybírat jednotlivé příznaky a přiřazovat je k jednotlivým záznamům. Za kritéria při definování můžeme považovat : jazyk,časové hledisko, rukopisné záznamy, specifický jazyk, specifické písmo, způsob retrospektivní konverze a v neposlední řadě vyřazení z retrospektivní konverze.

4. Uloženky

Uloženky nalezneme v modulu Uloženky a slouží ke zpřístupnění dokumentů. Jedná se o ty dokumenty, které nejsou přístupné ve skladištích a jsou to dokumenty z příručních knihoven, studoven či dokumenty zcizené nebo odepsané. Pro správu záznamů slouží samostatný modul, ten pomáhá vytvářet správu uloženek a jejich seznamů.

5. Řízení retrospektivní konverze

V modulu Retrokonverze je hlavní službou řízení retrospektivní konverze. Výstupem každé z fází je forma záznamů. Je to meziprodukt se kterým se dále pracuje. Výstupem celého procesu je záznam v dané struktuře a kvalitě.

Národní informační systém

Tuto možnost scanování dokumentu využilo již 13 knihoven v České republice. Národní informační systém umožňuje knihovnám : - získávat celkové a aktuální informace o postupu v retrokonverzi v jiných českých knihovnách - umožňuje koordinovat přidělení financí na retrokonverzi v podprogramu VISK5 - umožňuje efektivně řídit retrokonverzi v knihovnách v České republice - odstranění duplicit a multiplicit v převodu záznamů Nejdůležitějším bodem národního informačního systému je zdokonalení přístupu k naskenovaným katalogům pro uživatele a možnost jejich objednání.

Národní informační systém zpřístupňuje informace:

- jaký mají charakter jednotlivé knihovny

- jakých bylo dosažených výsledků

- o dalších plánech týkající se retrospektivní konverze

- o finančních prostředcích z programu VISK5 a jejich využití


NRIS

NRIS znamená vytvoření kvalitního a spolehlivého národního informačního systému pro rektrokonverzi a zdokonalení způsobu využití naskenovaných katalogů.Vytvořením národního inf. systému došlo ke snadnému umožnění dostupností informací o katalozích, jejich částí nebo v případě kontrétní záznamy (byly převedeny, jsou převáděny, budou převedeny nebo nebudou vůbec převedeny) do formátu MARC s informacemi o kvalitě záznamů, místě a podmínkách jejich získání. Informace jsou nezbytnou podmínkou pro rozhodování Rady podprogramu RETROKON o přidělování finančních prostředků. Základním zdrojem pro přebírání záznamů je Česká národní bibliografie, která zachycuje knižní produkci v České republice během 20.století. Česká národní bibliografie je známá a hojně využíváná pro retrospektivní konverzi katalogů.

Podprogram RETROKON se drží i pravidel, která jsou nutná při předkládání žádostí a výběru účastníků. Podprogram je zaměřen - instituce s fondy velkého rozsahu a které mají význam pro meziknihovní výpůjční službu, nebo uchovávají a zpřístupňují národní kulturní dědictví - instituce s vysokou úrovní katalogizace, která zajistí kvalitní výsledky retrospektivní konverze


Základní podmínky pro přidělení financí

- rozsah a význam fondů

- vysoká úroveň katalogizace, respektování standardů, zkušenosti s automatizací

- ochota poskytnou bibliografické záznamy do CASLIN

- ochota zpřístupnit primární dokumenty v rámci meziknihovní výpůjční služby

- využití existujících bibliografických záznamů a následné připojení vlastních jednotek do existujících záznamů v CASLIN

- ochota spolupracovat na tvorbě a údržbě záznamů autorit

- ochota zapojit se do informačního systému pro retrokonverzi katalogů


Největší prioritu by měla mít v retrokonverzi katalogů Národní knihovny, která má největší a nejvýznamnější fondy, poskytuje záznamy do CASLIN, je garantem České národní bibliografie, je centrem národní autorit jmenných i věcných, má propracovanou metodiku retrospektivní konverze a informační systém pro její řízení. Retrospektivní konverze katalogů Národní knihovny České republiky má v podprogramu absolutní prioritu. Národní knihovna spotřebuje podstatnou část při přidělování finančních prostředků. Postavení Národní knihovny v podprogramu má ještě jiné specifika. Národní knihovna je metodickým a koordinačním centrem podprogramu. Národní knihovna poskytuje knihovnám hardware a software zabezpečení informačního systému pro retrospektivní konverzi.

Průběh retrokonverze ve vybraných knihovnách

Retrokonverze katalogu knihovny Pedagogické fakulty univerzity J.E. Purkyně J. E. v Ústí nad Labem

Knihovna vznikla v roce 1954 na Vyšší pedagogické škole v Ústí nad Labem. V roce 1964 vznikla Pedagogická fakulta, která se stala základem vzniklé Univerzity J.E.Purkyně. V roce 1994 byl zaveden knihovní systém TINGLIB. V roce 1997 došlo k retrokatalogizaci skript a učebnic. Mezi lety 2000-2002 došlo k přebírání záznamů a k naskenování lístkových katalogů. V roce 2005 proběhla retrokonverze. Knihovna se rozhodla k provedení rektrokonverzi pro technologie RETROKON od firmy COMDAT. Retrokonverze jak bylo zmiňováno výše představuje naskenování lístkových katalogů, přepis záznamů, strukturace záznamů a konverze do formánu knihovního systému. Knihovna se rozhodla využít obě výhody : naskenování lístkových katalogů a převzení větší části záznamů z jiných knihoven přístupných přes internet. Záznamy, které byly naskenovány byly přeneseny do systému RIS firmy COMDAT. Systém RIS mám mnoho výhod při práci s naskenovanými záznamy, umožňuje jejich třídění podle kritérií, zpřístupnění záznamů všem pracovníkům, kteří se na konverzi podíleli. Funkcí systému je porovnávání záznamů uložených v RIS s externími systémy.


Projekt, který knihovna rešila byl řešen jako rozvojový projekt MŠMT 295/2005 a 186/2006. Postup zpracování záznamů byl dán určitými kroky :

- posouzení zdali se záznam zpracuje

- vyhledání záznamů v katalozích knihoven a stáhnout jej

- vybrání záznamů, jeho kontrola a zdali neobsahuje chyby

- doplnění lokálních údajů (přírůstkové číslo, signatura)

- uložení záznamu

Pokud by došlo k tomu, že záznam by nebyl v žádné knihovně musí se dát k přepisu. Přepisovači poté nenalezené záznamy přepíší do textového souboru a katalogizátor je pak strukturuje do polí a podpolí UNIMARCU. Následoval další import s konverzí záznamů do databáze T-series. Když došlo k importu do T-series již byly záznamy vyhledatelné.


Retrospektivní konverze katalogů Národni knihovny ČR

Retrospektivní konverze v Národní knihovně je velice náročná jak z časového pohledu tak z množství. Došlo tedy k rozložení procesu na několik etap, které na sebe navazují. Technologie RETROKON vzbudila ohlasy jak na domácí tak zahraniční půdě. V České republice se stává uznávánou technologií a je podpořena Ministerstvem kultury ve formě grantů a dotací.

Aplikace technologie RETROKON v Národní knihovně

Technologie byla uplatněná pro bibliografické záznamy i záznamy autorit v rámci projektů.

RETROKON studijního fondu

Studijní fond je nejvíce využívaným fondem a katalogem v celé NK. Důležité bylo rychle převést starší část katalogu, zahraniční záznamy dokumentů a dokumenty, které národní bibliografie nedpochytila. Důležitý katalog studijního fondu byl převeden do formátu UNIMARC jako první a dnes jsou již v kompletní automatizované podobě ve formě OPACu systému ALEPH. Na převodu katalogu se také podíleli studenti.

RETROKON- Bibliografického katalogu České knihy

je základní částí projektu Zpřístupnění české knížní produkce prostřednictvím internetu a CD-ROM. Došlo ke zpřístupnění záznamů ve formátu UNIMARC do roku 2000. Záznamy jsou kvalitní s podrobným jmenným popisem, které obsahují jmenné i věcné selekční údaje. Projekt mám obrovský národní i mezinárodní význam.V mezinárodní spolupráci je přínosem pro projekty UBCIM, COBRA a jiné, a o výsledný produkt má zájem OCLC. V národním měřítku má projekt význam v zachycení, zmapování a zpřístupnění části české národní knižní produkce. Také v možnosti racionalizovat retrokonverzi v dalších knihovnách a omezit tak multiplicitu. Díky retrospektivě české národní bibliografie ve formátu UNIMARC se můžeme zařadit v oblasti bibliografického zachycení národního kulturního dědictví ve standardizované podobě v mezinárodním kontextu mezi nejvyspělejší země. Kooperační rovina má význam i pro hodnocení zahraničních kolegů, kteří ji mohou využít při dalších kooperačních projektech.

RETROKON – Generálního katalogu univerzálního knihovního fondu

Generální katalog obsahuje 3 milióny lístků monografií a seriálů. Katalog je historickou památkou a je třeba jej chránit. Tento katalog není přístupný široké veřejnosti z důvodu jeho vzácnosti. Ochranu katalogu zajistila digitální kopii, která byla pořízena v roce 1996. Celý katalog byl oskenován. Díky speciálnímu programu KATALOG je možno v této obrazové digitální kopii jednoduchým způsobem vyhledávat. Retrokonverze v NK je velice dobře zpracována a je vedena cíleně a zodpovědně. Díky velice dobré technologii a existujícímu týmu vyškolených odborníků byla navázana spolupráce s devíti velkými českými knihovnami.

Retrokonverze katalogů vědecké knihovny v Olomouci

Vědecká knihovna patří mezi tři nejdůležitější zdroje bibliografický záznamů v České republice. V roce 1994 byl zahájen projekt retrokonverze katalogů. V dalších letech docházelo k realizaci projektu. Následovala implementace systému ALEPH 500 a konverzi dat do bibliografického formátu UNIMARC, díky ní došlo k pozastavení retrokonverze.Další pokračování retrokonverze začalo až s programem Věda a výzkum MK ČR „Pokračování retrokonverze katalogu vědecké knihovny v Olomouci do elektronické podoby s využitím internetu.“ Během roku 2000 byl projekt zahájen a od roku 2002 byla vystavena naskenovaná část generálního katalogu z let 1801-1959. V roce 2003 byl zakončen projekt, kde hlavním cílem bylo vytvořit digitalizovanou podobu generálního lístkového katalogu, katalogu starých tisků.

Retrospektivní konverze místního katalogu

Retrokonverze probíhala v systému ALEPH500 a docházelo k vytváření bibliografických záznamů ve formátu UNIMARC. Záznamy po zpracování byly hned přístupny v elektronické katalogu VKOL. Záznamy jsou také odesílany měsíčně do České národní bibliografie.Vědecká knihovna v Olomouci využívá při zpracování katalogy jiných knihoven a také Jednotnou informační bránu. Jednotná informační brána umožňuje prohledávání v elektronických katalogizích daných knihoven za pomocí jednoho dotazu. V rámci retrospektivní konverze byly zpracovány všechny knihovní jednotky, které si uživatelé objednali a na které dokumenty ještě nebyly záznamy vytvořeny.

Retrospektivní konverze historického fondu

Vědecká knihovna v Olomouci vlastní také historický fond. Historickým fondem je knihovna velice známá. Knihovna vlastní cca 72000 vzácných starých tisků, které byli v zájmu odborníků a badatelů. Pomocí retrokonverze došlo k tomu, že se zpřístupnil tento vzácný fond. Výhodu můžeme spatřovat ve vystavení katalogů historického fondu na internetu. Díky této metodě se k záznamům mohou dostat odborníci ale také i laici. Do roku 2003 bylo zpracováno cca 56000 bibliografických záznamů historického fondu. Zpracování historického fondu je velice náročná práce, protože záznamy jsou špatně čitelné a jsou psány kurzívou. Zpracování starých tisků probíhá podle generálního katalogu starých tisků. Také prvotisky a rukopisy jsou zapisovány v elektronické podobě.


Závěr

Ministerstvo kultury se snaží retrokonverzi podporovat formou dotací i grantů. Grant, který umožnil odstartovat retrokonverzi byl získán od Mellonovy nadace. Doufejme, že retrokonverze bude mít stálou podporu Ministerstva kultury a budou k dizpozici finanční zdroje. Za pomocí technologie bylo zpřístupněno v České republice cca 10 milionů bibliografických a katalogizačních záznamů z různých knihoven. Znamená to velký zlom v otevření a široké zpřístupnosti fondů nejen místním uživatelům ale prostřednictvím internetu také vzdáleným uživatelům. Národní knihovna každým rokem přivítává zahraniční návštěvy, které se zajímají o technologii RETROKON. Technologie RETROKON je snadno modifikována, a využívána jako celek nebo jako moduly. Významnou technologií bude podpora protokolu Z39.50, která bude umožňovat bibliografické a autoritativní záznamy z externích zdrojů.

OCR (Optical Character Recognition, Optical Ccharacter Reader)

„Technologie převodu dokumentu z digitální obrazové do textové podoby pomocí metody optického rozpoznávaní znaků, která je založena na porovnání hustoty bodů předlohy na pomyslné síti s typickými znaky jednotlivých písmen uloženými v databázi programu. Míra schopnosti rozpoznávání závisí na úrovni jazykové analýzy a národních slovníků a na možnostech doplňovat porovnávací databázi o nové znaky. Převádět lze tištěné i rukopisné znaky. „ (viz. TDKIV)

Postup při scanování pomocí OCR Nutným předpokladem pro práci je instalace OCR s Fine Reader, který je optimálním a doporučený program. Pro přenos dat se využívá skener. Záznam který chceme zkopírovat vložíme do skeneru a oskenujeme. Vzniklý obrázek se načte pomocí Fine Readeru nebo jiného OCR programu. Poté probíhá rozpoznávání, může být provedena korektura a poté data uložíme do předem zvoleného souboru např. txt, doc. OCR program rozpoznává text obrázku, který musí být jasný a ostrý. OCR program vyžaduje rozlišení 300dpi pro své obrázky textu. 300Dpi je základním požadakem pro práci v OCR.


Použitá literatura

BAREŠ, Miroslav. Technická řešení retrokonverze katalogů. In INFOS ´95. Bratislava: Spolok slovenských knihovníkov, 1995, s. 76-83.

BROŽEK, I. Retrokonverze katalogu knihovny Pedagogické fakulty Univerzity J.E. Purkyně v Ústí nad Labem. In: Archivy, knihovny, muzea v digitálním světě 2005. Praha : Národní technické muzeum, 2006. ISBN 80-7037-149-8 (brož.).

DVOŘÁKOVÁ, Helena. Souborný katalog zahraničních periodik v knihovnách České republiky : od kartoték a soupisů CEZL k databázi v Internetu : problémy konverze a retrokonverze. Národní knihovna. 1997, roč. 8, č. 2, s. 61-67. ISSN 0862-7487.

MACHÁČOVÁ, L. Retrokonverze katalogů vědecké knihovny v Olomouci. Knižnica, 2004. roč. 5, č. 10. Dostupný z WWW: < http://www.snk.sk/swift_data/source/casopis_kniznica/2004/oktober/447.pdf>.

NÁDVORNÍKOVÁ, M. Retrokonverze katalogů ve vědeckých knihovnách In: Čtenář. 1995, roč. 47, č. 2, s.45-47. ISSN 0011-2321.

STOKLASOVÁ,B. Technologie RETROKON jako komplexní nástroj pro digitalizaci a zpřístupnění katalogů, kartoték a soupisů prostřednictvím internetu. Praha : Národní knihovna, 2004. 34 s. ISBN 80-7050-458-7

STOKLASOVÁ, B. Retrospektivní konverze katalogů (nejen) v Národní knihovně České republiky. In: Infocus. 1995. roč. 1, č.9, s.222-224, 233-234. ISSN 1211-0892.

<http://retrokon.nkp.cz/zobraz.phtml?lang=cz&co=retro_konv_kat-nkcr.phtml>.

<http://visk.nkp.cz/VISK5.htm>.

<http://knihovnam.nkp.cz/docs/retrokon-web.pdf>.

<http://NRIS.NKP.CZ>.

<http://digineff.cz/jaknato/ocr/ocr.html>.


Další odkazy

Kadlec 10:49, 7. 5. 2008 (CEST)

RETROKON http://retrokon.nkp.cz/zobraz.phtml?lang=cz

Národní program retrospektivní konverze http://nprk.nkp.cz/Default.aspx

Národní informační systém pro retrokonverzi http://nris.nkp.cz/

Naskenované katalogy Národní knihovny ČR http://katif.nkp.cz/Default.aspx?lang=0


RTENOTITLE