Dokumentografické informační systémy

Z WikiKnihovna
Přejít na: navigace, hledání

Zpět na: KISK:Kniha Elektronické informační zdroje (Ondřej Fabián)

Elektronické informační zdroje - Ondřej Fabián

Vymezení pojmu

Dokumentografickým systémem je míněn systém, který zpracovává, ukládá a zpřístupňuje dokumentografické informace [BRATKOVÁ, 2001b]. V současné době se pro toto označení používá spíše dobře vžitý termín „databáze“. V minulosti byla převažujícím typem databáze bibliografická, která přinášela uživateli pouze bibliografické informace o dokumentu. S rozvojem výpočetní techniky přešly databáze téměř výhradně do elektronické podoby a postupem času začaly vznikat plnotextové báze dat, které nepřinášejí jen informace bibliografického charakteru, nýbrž řeší i dostupnost samotného primárního dokumentu. Databáze se již staly součástí informačního průmyslu, proto je většina z nich přístupná na základě placených licencí. Mnohdy jsou však i některé velmi hodnotné zdroje k dispozici zdarma.

Předchůdci dokumentografických systémů

V době, kdy ještě svět neznal automatizované systémy, existovali již předchůdci dnešních elektronických databází v tištěné podobě. Byly to tzv. referátové časopisy, které obsahovaly tištěné soubory bibliografických záznamů dokumentů pro dané obory. K samotné automatizaci a přechodu do elektronické podoby došlo u prvních databází v 60. letech minulého století [BRATKOVÁ, 2001b]. Pochopitelně ne každá dnešní databáze má svého předchůdce v podobě referátového časopisu, ale prestižní světové systémy (Medline, Compendex atd.) vycházely ve formě referátových časopisů již od konce 19. století. Některé současné systémy doplňují své elektronické fondy retrospektivně také o starší, původně tištěné záznamy:

  • 1871 referátový časopis Index Medicus (od roku 1966 databáze Medline)
  • 1884 referátový časopis Engineering Card Service (od roku 1969 databáze COMPENDEX)
  • 1898 referátový časopis Science Abstracts (od roku 1969 databáze INSPEC)
  • 1907 referátový časopis Chemical Abstracts (od roku 1967 databáze Chemical Abstracts) [BRATKOVÁ, 2001b]

Producenti dokumentografických systémů

Producenty databází jsou typicky:

  1. knihovny (zejména národní či specializované)
  2. soukromé instituce (zejména komerční firmy)
  3. neziskové organizace
  4. mezinárodní organizace (zejména oborové)

Tvorba dokumentografických systémů a zdrojová základna

Jak již bylo zmíněno, fungují v dnešní době databáze v elektronické podobě. Pro jejich tvorbu a provoz je proto zapotřebí těch nejmodernějších informačních technologií. Na budování systémů se tak podílejí nejenom specializovaní informační pracovníci, ale také technici a programátoři vyvíjející stále sofistikovanější prostředky pro snadnější a pohodlnější zpracování a vyhledávání dat.

Každá databáze má svoji excerpční základnu periodik, ze kterých čerpá bibliografické záznamy či samotné plné texty. Nejčastějším obsahem databází jsou články z časopisů, respektive jejich bibliografické záznamy. Jinak, avšak většinou okrajově, se v tradičních databázích mohou pochopitelně objevit i další typy dokumentů, např. sborníky, knihy, kapitoly knih, patenty, normy nebo výzkumné zprávy. Odlišným případem jsou tzv. databáze pro speciální druhy dokumentů, ty jsou primárně určeny k registraci určitého média (patentové databáze, databáze pro normy atd.).

Bibliografický záznam

Struktura bibliografického záznamu je v každé databázi řízena vlastními pravidly. Neuplatňuje se zde tedy knihovní standard MARC21, ačkoliv některé databáze již nabízejí svým uživatelům možnost konverze záznamů do tohoto formátu. Záznamy jsou ve většině systémů opatřeny abstrakty.

Věcné zpracování dokumentů

Ani zde zpravidla nenalezneme příliš shodných rysů s oblastí knihovnictví. Nejrozšířenější světové selekční jazyky (DDT, MDT, LOC Classification) jsou využívány poměrně výjimečně. Naopak producenti databází vyvíjejí velmi často vlastní speciální třídění, a to jak systematické, tak předmětové povahy. Všechny systémy provozují vyhledávání na základě klíčových slov, předmětových hesel či deskriptorů z tezaurů. Tyto předmětové selekční jazyky se v několika případech staly převažujícími ve svém oboru (např. heslář MeSH v oblasti medicíny). Na druhé straně jsou používány i selekční jazyky systematické, typicky ve formě číselníků a kódovníků.

Možnosti přístupu k databázím

V současné době převažují tři hlavní možnosti, jak se dostat do obsahu vědeckých databází:

  1. přes internetové rozhraní producenta databáze
  2. přes databázová centra
  3. přes CD ROM

V minulosti byly databáze dostupné rovněž na jiných médiích (např. magnetopáskové výstupy, tištěné výstupy nebo mikrofiše) [VLASÁK, 1999]. V dnešní době se však jedná už pouze o minoritní a z velké části překonané možnosti zpřístupnění. Nejčastější formou zpřístupnění databází je pochopitelně využití internetového rozhraní (a to i v případě nákupu databáze od databázového centra). Po zaplacení poplatků přistupuje uživatel do databáze bez jakýchkoliv restrikcí na základě shody IP adresy počítače s podmínkami uvedenými v licenční smlouvě. Zadávání hesel pro přístup do systému je spíše výjimečné. Autorizovaný uživatel má navíc obvykle možnost tzv. vzdáleného přístupu, který mu umožňuje vyhledávání v databázi i z domácího počítače. Přidělení potřebné IP adresy je přitom řešeno pomocí různých technologií (proxy servery, VPN, autentifikační systémy), které budou popsány v závěru této práce.

Instituce umožňující přístup k databázím

Pro konečného uživatele je pochopitelně nejvýhodnější možností navštívit některou z institucí, které mají k databázím přístup. Nejčastěji se přitom jedná o knihovny. Ale i ty musí nějakým způsobem navázat kontakt s producenty a poskytovateli přístupu do databází, aby mohly posléze jejich informační produkty nabídnout uživatelům. Existuje pochopitelně varianta, kdy knihovna jedná přímo s provozovatelem databáze a na podmínkách zpřístupnění se dohodne. V druhém případě, který je v České republice běžnější, probíhá jednání přes prostředníka, zástupce pro distribuci dané databáze v ČR. Nejvýznamnější v této oblasti jsou níže uvedené firmy:

Albertina Icome

RTENOTITLE

Albertina icome Praha (AiP) zahájila svou činnost již v roce 1991 a v současné době má v oblasti zpřístupňování elektronických informačních zdrojů v ČR dominantní postavení. AiP zajišťuje výhradní zastoupení v České republice pro celou řadu významných producentů informací (např. Proquest, Gale a mnoho dalších). Kromě velkého množství nabízených databází spolupořádá každoročně také významnou konferenci o informačních zdrojích INFORUM. Také systém Infozdroje.cz , který umožňuje jednotlivým institucím komfortní přístup do předplacených databází, je oceňovanou službou z produkce této firmy. V poměrně dávné minulosti byla s AiP spojena i společnost Albertina Data, která je nyní součástí skupiny CreditInfo a specializuje se zejména na tvorbu a distribuci firemních informací.

Další informace: http://www.aip.cz

Medistyl

Medistyl.jpg

Kromě zprostředkovatelů databází se mohou uživatelé obracet také na tzv. konzultační informační firmy. Tyto subjekty disponují přístupem do vědeckých databází a poskytují řadu služeb, především pak služby rešeršní. Tento typ organizací je rozšířen spíše na západ od našich hranic, ale i u nás už takové firmy působí. Nejznámější institucí tohoto druhu na našem trhu je firma Medistyl, která je prioritně zaměřena na informace z oblasti medicíny a farmacie. Za zmínku stojí také fakt, že Medistyl je zástupcem známého databázového centra STN International pro Českou republiku.

Další informace: http://www.medistyl.info

Suweco

RTENOTITLE

V oblasti zpřístupňování informačních zdrojů v podobě elektronických časopisů, částečně také elektronických knih, má na českém trhu velmi solidní postavení společnost Suweco. Firma organizuje celou řadu národních konsorcií (často ve spolupráci s Národní technickou knihovnou), přes něž je poskytován přístup do kolekcí elektronických časopisů mnoha prestižních zahraničních vydavatelství. Kromě toho se Suweco podílí, jakožto výhradní zástupce firmy Elsevier pro Českou republiku, na organizaci celonárodního konsorcia pro zajištění přístupu do citačního rejstříku Scopus. Nově se společnost snaží nabízet i další služby, například federativní vyhledávač Naviga, který umožňuje paralelní vyhledávání v informačních zdrojích zpřístupňovaných Suwecem a v mnoha volně dostupných databázích.

Další informace: http://www.suweco.cz

V současné době je zpřístupňování databází v režimu online absolutně převažující. V minulosti se však ukázal jako velmi dobré médium pro distribuci databází také CD ROM. Jeho podstatnou nevýhodou jsou však problémy s aktualizacemi. Zatímco ve webových verzích databází probíhají aktualizace týdně, v některých případech dokonce denně, u CD ROM je aktualizace poněkud komplikovanější záležitostí, nicméně i zde existuje možnost pravidelného stahování aktualizací z internetu. Řada významných producentů informací pochopitelně nabízí i nadále možnost přístupu do svých informačních produktů také formou CD ROM.

Financování databází v ČR

Databáze a elektronické informační zdroje všeobecně nejsou v žádném případě levnou záležitostí. Cena ročního předplatného se u kvalitních zdrojů pohybuje v řádu statisíců korun. Vědomí důležitosti databází však na druhé straně nutí informační instituce v ČR i státní orgány získávat finanční prostředky na jejich obstarávání. Nejčastěji jsou informační zdroje zakupovány konsorciální formou. Ta předpokládá, že knihovny a instituce, které mají zájem o pořízení určité databáze, vytvoří konsorcium. Instituce pověřená vedením konsorcia pak jedná za všechny účastníky s producenty informačních služeb. Při takovémto způsobu financování se předpokládá, že prodejce poskytne jakousi „množstevní slevu“, neboť za jeho produkt platí více institucí. Tato forma financování informačních zdrojů je běžná také ve vyspělých zahraničních státech. V ČR konsorcia často čerpají státní podporu z níže popsaných programů. Existují také konsorcia, která stát finančně nedotuje. Ta pak profitují pouze ze zvýhodněné ceny na základě většího počtu zapojených knihoven. První konsorcia financovaná státem vznikla v ČR v roce 2000, kdy zahájily realizaci projekty LI. Nejdůležitější databáze pro jednotlivé obory byly do konce roku 2008 financovány z peněz Ministerstva kultury ČR přes programy VISK (Veřejné informační služby knihoven) a především projekty 1N. V roce 2005, kdy tyto projekty startovaly, dostaly z rozpočtu Ministerstva školství, mládeže a tělovýchovy (MŠMT) 136 milionů korun [Ikaros, 2005]. Účinnost projektů 1N skončila na konci roku 2008. Na ně měl volně navázat nový program INFOZ, který měl řešit financování elektronických informačních zdrojů v letech 2009-2011. Plánem MŠMT bylo získat pro tento program prostředky z Evropské unie, což celý proces poněkud zbrzdilo. Přes veškerou snahu se nakonec INFOZ podařilo vypsat až k 1. 7. 2009. Zveřejnění výsledků soutěže, tedy prezentace informačních zdrojů, které jsou z tohoto programu financovány, proběhlo v září 2009. Teprve poté mohly být peníze čerpány. Dostupnost nezbytných databází byla mezitím v roce 2009 přechodně kryta z peněz MŠMT. Některé databáze přestaly být financovány úplně. Projekty INFOZ nakonec zajistily potřebnou dostupnost nejkvalitnějších informačních zdrojů, u některých databází až do konce roku 2012 (v zadání projektu byla možnost předplatit přístup na konci roku 2011 ještě na následující kalendářní rok).

Přehled financovaných projektů v programu INFOZ a jejich finanční dotace: http://www.msmt-vyzkum.cz/cz/infoz/

Od roku 2013 by se měl systém financování elektronických informačních zdrojů změnit. Zhruba v polovině roku 2011 byla v rámci operačního programu Evropské unie Věda a výzkum pro inovace (VaVpI) zveřejněna výzva 4.3 - Vybavení odborných vědeckých a oborových knihoven. V rámci této výzvy mohly mimopražské knihovny podávat partnerské projekty na pořízení přístupu k elektronickým informačním zdrojům pro roky 2013-2019. Specifická úprava pravidel programu umožňuje stoprocentní předplacení databází až do konce roku 2017, přičemž pro roky 2018 a 2019 platí povinná udržitelnost, což znamená, že účastníci konsorcií si budou muset hradit přístup k informačním zdrojům, zahrnutým do projektů, z vlastních finančních prostředků. Několik vysokoškolských knihoven v rámci výzvy podalo projekty a pokusilo se tak alespoň částečně zajistit přístup k odborným elektronickým informačním zdrojům konsorciální formou pro celou ČR. Bohužel se však z různých důvodů (administrativní náročnost, nízká finanční dotace programu atd.) nepodařilo zpracovat projekty, které by v celorepublikovém měřítku zajistily přístup k nejnákladnějším, ale zároveň nejdůležitějším databázím (Scopus, Elsevier ScienceDirect, Wiley Online Library a SpringerLink). Dalším problémem tohoto řešení je skutečnost, že z programu VaVpI (který podporuje pouze osm strategických prioritních oborů výzkumu) nemohou být financovány informační zdroje pro společenskovědní a humanitní obory, a také fakt, že z programu jsou dopředu vyloučeny pražské instituce (Praha nemá na peníze z operačních programů nárok), což znamenalo do značné míry destrukci stávajících konsorcií. V této souvislosti se hovoří o vypsání navazujícího dotačního programu Informace – základ výzkumu, který by měl zajistit financování pro instituce a vědní obory, jež nemohou být podpořeny z programu VaVpI. Realizace tohoto programu však bude s vysokou pravděpodobností opožděna a financování některých velmi důležitých zdrojů zřejmě nebude v roce 2013 systémově zajištěno.

Další informační prameny, které nejsou do konsorciálních projektů zahrnuty, si už knihovny musí pořizovat samy, a to jednak z vlastních finančních prostředků, jednak prostřednictvím nejrůznějších grantů.

Typologie databází

Electronic Resource Management System – Systém managementu elektronických zdrojů. [KAREN 2009]

Databáze lze rozdělovat podle nejrůznějších kritérií.


Podle typu zpřístupňované informace

  • Bibliografické databáze – systém obsahuje pouze bibliografické záznamy o primárních dokumentech. V dřívější době to byl zcela převažující typ databází, rovněž v současnosti jsou nejprestižnější světové databáze bibliografické povahy. Novým trendem je obohacování tohoto druhu služeb o odkazy na plné texty, které však vedou na stránky jiných komerčních institucí, a tak dojde k samotnému získání plného textu pouze zřídka. Velmi populární je v současné době systém DOI (Digital Object Identifier). Jedná se o komerční technologii, kdy je dokumentu přidělen jedinečný identifikátor, díky němuž se lze snadno na daný materiál propojit. Zmiňovaný problém s konečnou dostupností plného textu však ani tato technologie neřeší. Některé bibliografické databáze (např. Medline nebo ERIC) si budují kolekce plných textů dokumentů v rámci vlastního systému, což je pro uživatele mnohem přínosnější než výše zmiňované varianty. Využívány jsou i moderní technologie, jako je SFX, které dávají uživateli přehled o dostupnosti plného textu dokumentu v rámci jeho instituce a přinášejí i další návazné služby.
  • Plnotextové databáze – v tomto případě obsahuje databáze nikoliv pouze bibliografické záznamy, ale i samotné plné texty indexovaných dokumentů. V současné době nabývá tento druh databází na důležitosti, avšak jsou zde i určitá negativa, zejména vysoké ceny a velké nároky na provoz.
  • Faktografické databáze – faktografické databáze poskytují uživateli jako výsledek vyhledávání soubor faktů a dat o určité věci či jevu. Typickým příkladem tohoto druhu databáze mohou být statistiky. Faktografické databáze jsou dále využívány například v ekonomických vědách (údaje o ekonomických subjektech), chemii (údaje o prvcích a sloučeninách), geografii (údaje o zemích) apod. Do sféry faktografických databází se dají zahrnout i encyklopedie.

Podle typu zpřístupnění

Databáze volně dostupné (neplacené) × databáze placené

Přístup do většiny systémů je možný po zaplacení licence, avšak existují i některé databáze, které jsou dostupné bezplatně. Řada služeb má navíc vícero mutací a zprostředkovatelů, tudíž je přístup k nim na některých platformách bezplatný, na jiných naopak striktně placený. Někdy je bezplatný přístup do databáze podmíněn řádnou registrací uživatele. Producenti rovněž standardně poskytují zájemcům různě dlouhé testovací přístupy.

Podle druhu dokumentu

Tradiční databáze mají ve svých informačních obsazích převážně články. Můžeme však vymezit i databáze pro speciální druhy dokumentů, např. patentové databáze, databáze norem atd.

Podle tematického zaměření

Databáze polytematické (víceoborové) × databáze oborové (např. pro chemii, medicínu apod.)

Konkrétní databáze a jejich služby budou podrobným způsobem popsány v dalších kapitolách tohoto materiálu.

Z uvedených faktů jednoznačně vyplývá skutečnost, že pořízování a zpřístupňovnání databází představuje poměrně náročný proces. Instituce tak musí pečlivě zvažovat, jaké zdroje nakupovat, musí volit co možná nejefektivnější formu jejich zpřístupnění a propagace u uživatelů a poctivě sbírat a vyhodnocovat data o využívanosti jednotlivých zdrojů. Existují pochopitelně i sofistikované systémy pro správu elektronických informačních zdrojů, které automatizují veškeré činnosti spojené se všemi „životními cykly“ pořizovaných databází (viz kapitola Nástroje pro efektivní správu elektronických informačních zdrojů).