Zpět na: KISK:Kniha Elektronické informační zdroje (Ondřej Fabián)

Vymezení pojmu

Nástup a prudký rozvoj internetu obrovským způsobem ovlivnil chod celého informačního sektoru. Kromě služeb informačních je namístě zdůraznit i komunikační funkci internetu, jež velmi výrazně zasáhla do života všech lidí, kteří jej využívají. V oblasti informačních služeb se otevřely zcela nové možnosti. V první řadě se jedná o skutečnost, že publikování informací už není výlučně záležitostí vydavatelů a informačních společností, ale že šíření informací pomocí internetu je umožněno mnohem širšímu spektru autorů. Důkazem toho jsou stále populárnější blogy, prostřednictvím kterých může vyjadřovat své názory prakticky kdokoliv. Internet se stal podstatným kanálem pro zpřístupňování informací koncovému uživateli. Veškeré organizace, subjekty, podniky či firmy (nikoliv pouze z informační sféry) mají své internetové prezentace, kterými se snaží přiblížit svoji činnost a služby co největšímu počtu uživatelů. Producenti informačních služeb pak přes síť internet efektivně zpřístupňují v režimu online své databáze, elektronické časopisy, elektronické knihy a další služby. Knihovny dávají prostřednictvím svých internetových OPACů čtenářům k dispozici pohodlnou možnost vyhledávání, ale také prodlužování nebo rezervování knih. Jiné projekty jsou na elektronickém prostředí a síti internet závislé ještě více. Jde o nejrůznější fondy striktně v elektronické podobě, například digitální knihovny, internetové archivy a repozitáře apod. V celkovém vyznění působí dnešní síť internet jako neuspořádaná změť obrovského množství informačních obsahů, v nichž je velmi složité se orientovat. Hlasy, že na internetu se dají najít veškeré informace, je však třeba brát s velkou rezervou. V první řadě je nutné rozdělit internet na několik částí. Největší část internetu tvoří bezplatně dostupné anonymní stránky a informační obsahy, jejichž věrohodnost lze jen velmi těžko ověřit. Daleko menší podíl mají na této síti producenti informačních služeb, kteří prostřednictvím sítě internet šíří svoje informační produkty (např. databáze), a to jak za úplatu, tak bezplatně. Standardní internetové vyhledávače do obsahů těchto informačních pramenů obvykle nedokážou proniknout. Proto je velmi důležité vnímat internet rozdělený na dvě velmi rozdílné části. Menší část nabízí vědecké, ověřené informace, které jsou vždy spojeny se svým autorem nebo vydavatelem. Na druhé straně stojí nepoměrně větší sféra sítě internet, obsahující obrovské množství informací, které jsou však anonymní, neověřené a v četných případech naprosto zavádějící. Pro ilustraci lze uvést tuto tabulku, která porovnává internet s informacemi obsaženými v profesionálních databázích.

Pro oblast informačních služeb internetu jsou velmi důležité následující dva pojmy:

Hypertext – velmi dobrou pomůckou jsou v digitálním prostředí hypertextové odkazy, které působí jako určitá navigace uživatele a jednoduchým způsobem odkazují na jiné internetové stránky. Propojování elektronických dokumentů pomocí hypertextu je velmi příjemným doplňkem, který uživateli značně ulehčuje studium daných informačních pramenů.

Metadata – pro pořádání informací v prostředí internetu je velmi důležitý popis jednotlivých internetových zdrojů. Pro tyto účely byly vyvinuty různé metadatové formáty. V podstatě se jedná o to, že autor internetových stránek napíše veškeré potřebné informace o dané stránce do metadatového formuláře. Ta je poté dobře připravena pro katalogizaci nebo strojové zpracování. Vše probíhá na dobrovolné bázi. Velmi používaným formátem je v současné době Dublin Core. Jakým způsobem zdroje správně popisovat pak z velké části určuje standard RDF - Resource Description Framework. Soubory metadat, které popisují obsahy jednotlivých internetových stránek, jsou zapsány a uloženy v jazyce XML. Internetové stránky, které jsou takovýmto způsobem zpracovány, jsou označovány souhrnně jako tzv. sémantický web. Ten usiluje o zpřehlednění současného stavu, kdy internet obsahuje stále rostoucí neuspořádanou množinu www stránek. Sémantický web se přitom snaží o lepší spolupráci mezi počítači a lidmi [MATULÍK a PITNER, 2004]. Velmi aktivní institucí zabývající se rozvojem internetových standardů a sémantického webu je konsorcium W3C.

V rámci internetu působí služby, které se snaží uživateli ulehčit orientaci v obrovském množství informací, jež tato síť obsahuje.

Internetové portály

Portály jsou jednou z naprosto základních služeb, které dává internet k dispozici. Představují tematicky uspořádané množiny internetových stránek. Je možné setkat se jak s portály národní povahy, tak s portály globálními. Vysokou informační hodnotu mají portály oborové, které sestavují reprezentativní soubory odkazů na stránky nejvýznamnějších institucí a služeb z příslušného vědeckého odvětví.

Příklady portálů:

české:

Seznam – http://www.seznam.cz/

Centrum – http://www.centrum.cz/

globální:

Yahoo – http://dir.yahoo.com/

MSN – http://www.msn.com/

oborové:

český internetový oborový portál pro oblast dopravy Doprava.cz – http://www.doprava.cz/

světový internetový oborový portál pro oblast práva Law.com – http://www.law.com/

Portály obvykle pracují v kombinaci s internetovými vyhledávači představujícími nejpoužívanější službu pro uživatele, kteří mají zájem vyhledávat informace na internetu.

Internetové vyhledávače

Velkou oblíbenost u uživatelů internetu získaly vyhledávače. Jedná se o takové služby, kdy jsou po zadání dotazu vyhledány a zobrazeny odkazy na relevantní internetové stránky. Internetové vyhledávače disponují svými roboty, kteří indexují obsahy jednotlivých internetových stránek. Dosah těchto robotů je však v mnoha případech velmi omezený a ani ty nejsofistikovanější z nich nedokážou v žádném případě zindexovat veškeré zdroje v prostředí sítě internet. Vyhledávačem, který má v databázi největší množství setříděných stránek, je Google. Hegemonie této služby je v poslední době stále zřetelnější a ostatní vyhledávače jsou tak poněkud vytlačeny na okraj dění. Velmi hodnotnou funkcí vyhledávačů je také tzv. cache, který si ukládá do paměti jednotlivé internetové stránky a je schopen zobrazit je i poté, co už požadovaná stránka zanikla. Jinak pochopitelně fungují tyto služby jak v národním, tak v globálním prostředí.

Nejznámější internetové vyhledávače:

Google – http://www.google.com/

Yahoo – http://www.yahoo.com/

Alta Vista – http://www.altavista.com/

HotBot – http://www.hotbot.com/

Ask – http://www.ask.com/

Bing – http://www.bing.com/

Metavyhledávače

Metavyhledávací nástroje pracují na stejné bázi jako služby popsané v předchozí kapitole, avšak jedná se zde o sdružené vyhledávání ve více internetových vyhledávačích. Uživatel tak získává větší množství výsledků a má zde i možnost porovnání vyhledaných internetových stránek v rámci jednotlivých vyhledávačů.

Nejznámější metavyhledávače:

Vivisimo (nyní ve vlastnictví IBM pod názvem InfoSphere Data Explorer) – http://vivisimo.com/

MetaCrawler – http://www.metacrawler.com/

Dogpile – http://www.dogpile.com/

WebCrawler – http://www.webcrawler.com/info.wbcrwl/

Polymeta – http://www.polymeta.com/

Vyhledávače vědecké literatury

Jak již bylo výše zmíněno, dnešní internet je možno rozdělit na dvě části. Právě části vědeckých informačních obsahů se věnují tzv. vyhledávače vědecké literatury. Pokud provede uživatel vyhledávání v rámci této služby, jsou mu nabídnuty odkazy na dokumenty, které pocházejí výhradně z prověřené odborné sféry. Tento druh vyhledávacích služeb získává stále více příznivců, a proto se i nadále objevují na tomto poli nové a nové projekty.

Nejznámější vyhledávače vědecké literatury:

Google Scholar – http://scholar.google.com/

Scirus (zároveň prohledává neviditelný web – viz další podkapitola, služba bude v roce 2014 ukončena) – http://www.scirus.com/

FindArticles – http://findarticles.com/

MagPortal – http://www.magportal.com/

InfoMine – http://infomine.ucr.edu/

Vyhledávače (adresáře) neviditelného webu

Studie firmy Bright Planet ukázala, že klasické internetové vyhledávače a metavyhledávače přinášejí výsledky hledání pouze z tzv. povrchového webu a mnoho cenných zdrojů ukrytých v internetu zůstává neodhaleno [BERGMAN, 2001]. Proto byly vyvinuty speciální vyhledávací nástroje, které se zabývají kompletním prohledáváním zdrojů i z takzvaného deep (hlubokého, neviditelného) webu. Neviditelný web obsahuje mnohem více informací než web viditelný. Jedná se především o dokumenty z databází, digitální objekty v nestandardním formátu a často také o informační obsahy stránek chráněných heslem. Materiály obsažené v databázích mají totiž dynamicky generované stránky bez přímých odkazů, proto velmi často uniknou indexaci robotů, které používají klasické internetové vyhledávače. Ve výsledcích vyhledávání se u vyhledávačů neviditelného webu neobjevuje obrovské množství internetových stránek, nýbrž výčet služeb, kde se dokumenty na požadované téma vyskytují nejčastěji.

Nejznámější vyhledávače neviditelného webu:

Complete Planet – http://aip.completeplanet.com/

Incywincy – http://www.incywincy.com

The WWW Virtual Library – http://vlib.org/

Scirus (zároveň prohledává i povrchový web, služba bude v roce 2014 ukončena) – http://www.scirus.com/

Možnosti archivace webu

Obrovské množství materiálů už je v současné době publikováno pouze výhradně elektronicky v rámci sítě internet, proto se logicky nabízí otázka, zda by nebylo vhodné tyto obsahy archivovat a uchovávat. Registraci tištěných materiálů řeší Zákon o povinném výtisku, avšak v českém prostředí není problematika elektronických dokumentů v rámci tohoto zákona brána v úvahu. V řadě zemí (např. na Slovensku) je legislativa v tomto směru pružnější a archivaci elektronických dokumentů podchycuje. Otázka archivace webu se dostává do popředí ve všech vyspělých zemích a ani Česká republika v tomto směru netvoří výjimku. Kromě otázek zákonných předpisů je třeba hned na začátku vymezit, co bude předmětem archivace, jakým způsobem budou obsažené dokumenty zpřístupňovány a také jaké standardy se budou při veškerých procesech spojených s archivací a šířením dokumentů dodržovat. V ČR je nejvýznamnějším projektem tohoto typu WebArchiv, který řešilo Ministerstvo kultury ČR ve spolupráci s Národní knihovnou ČR a dalšími knihovnami a institucemi. Ve světě je již v provozu řada mnohem obsáhlejších systémů. Příkladem je Minerva, kterou produkuje Library of Congress, nebo systém PANDORA vytvářený National Library of Australia. Důležitá byla rovněž iniciativa NEDLIB, na níž se podílelo několik evropských národních knihoven a další partnerské organizace. V jejím rámci byla definována a vyvinuta pravidla a funkční modely pro archivaci digitálních materiálů.

Galerie

Porovnání internetu s informacemi obsaženými v profesionálních databázích.
Podíl jednotlivých internetových vyhledávačů na trhu v USA v roce 2011. [PERRIN, 2012]
Schéma fungování povrchového a hlubokého webu [BERGMAN, 2001]

Neregistrovaný

Hledat

Informační služby internetu

Jmenné prostory

Více

Možnosti stránky

Obsah

Vymezení pojmu

Internetové portály

Internetové vyhledávače

Metavyhledávače

Vyhledávače vědecké literatury

Vyhledávače (adresáře) neviditelného webu

Možnosti archivace webu

Galerie

Navigace

Navigace

Pracovní prostory

Wiki nástroje

Wiki nástroje

Neregistrovaný

Hledat

Informační služby internetu

Vymezení pojmu

Internetové portály

Internetové vyhledávače

Metavyhledávače

Vyhledávače vědecké literatury

Vyhledávače (adresáře) neviditelného webu

Možnosti archivace webu

Galerie

Navigace

Wiki nástroje

Nástroje ke stránkám