Vyhledávání v databázích – rešerše
Zpět na: KISK:Kniha Elektronické informační zdroje (Ondřej Fabián)
Vymezení pojmu
Pojem rešerše v sobě skrývá hned dva základní významy. Rešerší (či spíše rešeršováním) se rozumí na jedné straně samotný proces vyhledávání informací. Druhý výklad zmiňovaného pojmu definuje rešerši jako soupis vyhledaných informačních zdrojů na určité téma [MATOUŠOVÁ, 1988]. Rešerše se realizují nejen v obsazích vědeckých databází, ale také například v katalozích knihoven, na internetu atd.
Typologie rešerší
Rešerše lze rozdělovat podle mnoha hledisek. Pro účely tohoto materiálu však postačí rozlišit typy rešerší podle hlediska časového na:
- retrospektivní – vyhledávání v určitém vědeckém oboru za určité časové období
- souběžné – vyhledávání probíhající v daných periodách opakovaně. Účelem tohoto druhu rešerší je získat přehled o novinkách ve sledovaném oboru.
A podle hlediska úplnosti na:
- úplné
- orientační
- výběrové
Dále lze rešerše třídit podle tematických, jazykových, druhových, teritoriálních a mnoha dalších hledisek.
Typologie vyhledávání
V principu lze stanovit dva hlavní typy vyhledávání:
- plnotextové – systém vyhledává v plných textech dokumentů. Na tomto principu fungují například plnotextové databáze nebo internetové vyhledávače.
- katalogové – vyhledávání probíhá pouze přes množiny slov, které popisují daný dokument (např. předmětová hesla, klíčová slova, slova z názvu atd.). Typickým příkladem pro tento druh vyhledávání jsou knihovní katalogy.
Realizace rešerší
Kdo vyhotovuje rešerše
- Informační pracovník – v tomto případě dostane odborný informační pracovník, který má zkušenosti s vyhledáváním ve vybraných informačních zdrojích, požadavek od uživatele a na základě jeho zadání vyhotoví rešerši. Informační instituce mají obvykle na svých internetových stránkách speciální rešeršní formuláře pro správné zadání rešerše. Nebezpečím při tomto druhu vyhledávání může být fakt, že rešeršér nemusí zcela správně pochopit informační požadavek uživatele.
- Uživatel – uživatel si může rešerši provést vlastními silami. Vystavuje se však nebezpečí, že při nedostatečné znalosti informačních zdrojů a vyhledávacích strategií nedosáhne kýžených výsledků.
- Informační pracovník v přítomnosti uživatele – tato varianta vyhledávání je pro účely rešerše optimální. Uživatel může v průběhu vyhledávacího procesu upřesňovat a korigovat svoje požadavky. Informační pracovník provádí samotné vyhledávání v systému. Jestliže bylo uvedeno, že je tato alternativa ideální, je nutno rovněž poznamenat, že je nejméně frekventovaná [VLASÁK, 1999].
Fáze realizace rešerší
Samotný průběh rešeršní činnosti lze rozdělit do několika fází:
- zadání (převzetí) dotazu,
- výběr selekčních prvků (zvolení klíčových slov pro vyhledávání),
- výběr optimálního informačního zdroje,
- definice dotazu (kombinace klíčových slov spojených booleovskými či proximitními operátory),
- vyhledání záznamů,
- posouzení relevance,
- případné doladění nebo přeformulování dotazu,
- výběr relevantních záznamů pro samotné použití.
Rešeršní strategie
Při vyhledávání informací je možno postupovat několika odlišnými způsoby. Ty jsou definovány jako tzv. rešeršní strategie.
- Strategie rostoucí perly – jedná se o postupné rozšiřování dotazu a doplňování dalších klíčových slov tak, abychom získali více výsledků. Na začátku vyhledávání máme velmi malou množinu výsledných záznamů, avšak při postupném rozšiřování vyhledávaných pojmů získáváme další výsledky.
- Strategie osekávání – postup je opačný než u předchozího příkladu. V první fázi vyhledávání definujeme velmi všeobecný pojem, po jehož vyhledání získáme velké množství záznamů. Postupným zpřesňováním (osekáváním) dotazu dostáváme stále menší množinu relevantních výsledků.
- Strategie stavebních kamenů – v tomto případě definujeme hned na začátku rešerše několik základních pojmů, které postupně kombinujeme, a získáváme tak relevantní záznamy.
- Strategie širšího pojmu – u tohoto druhu vyhledávání postupujeme směrem od konkrétního pojmu k pojmům všeobecným. Počet vyhledaných výsledků se tak postupně navyšuje.
V praxi informačního pracovníka je populární také tzv. strategie existujícího předchůdce. Nejedná se pochopitelně o svébytnou rešeršní strategii, nýbrž o to, že informační specialista disponuje již z dřívější doby rešerší na zadané téma, a tudíž už nemusí provádět žádné další vyhledávání, popřípadě pouze provede aktualizaci rešerše podle již vypracovaného rešeršního dotazu.
Vyhledávací pomůcky
Booleovské operátory
Pomocí booleovských operátorů vymezujeme vztahy mezi hledanými termíny.
AND
Operátor AND udává, že ve výsledcích vyhledávání musí být pouze dokumenty obsahující oba vyhledávané pojmy.
Příklad: management AND marketing. Při zadání takovéhoto dotazu nalezne systém veškeré dokumenty, které obsahují slovo management a zároveň slovo marketing.
OR
Při použití tohoto operátoru je postačující to, že se ve výsledcích vyhledávání objeví dokumenty, které obsahují alespoň jeden z požadovaných termínů.
Příklad: management OR marketing. V tomto případě se ve výsledcích objevily všechny dokumenty, které obsahují slovo management nebo slovo marketing, a taktéž dokumenty, které obsahují oba tyto výrazy.
NOT
V tomto případě je vymezeno, že se ve výsledcích vyhledávání musí objevit dokumenty obsahující první ze zadaných výrazů, avšak vyloučeny jsou dokumenty, které mají ve svém obsahu pojem druhý.
Příklad: management NOT marketing. Systém vyhledá dokumenty, které obsahují slovo management, ale neobsahují zároveň slovo marketing.
Proximitní operátory
Proximitní operátory vyjadřují vztahy mezi hledanými termíny v kontextu jejich postavení v textu. U některých z nich lze navíc číselně vyjádřit, v jakém rozptylu se v textu mohou hledané pojmy vyskytovat.
Near – jsou nalezena slovní spojení, v nichž se objevují požadovaná slova odděleně od sebe maximálně ve vzdálenosti určené číslem, a to bez ohledu na pořadí, ve kterém se vyskytují.
- Příklad: auto N2 škoda – ve výsledcích se objeví jak spojení „auto značky škoda“, tak spojení „škoda auto“.
Within – systém nalezne slovní spojení, ve kterých se vyskytují požadovaná slova v pořadí, v jakém byla zapsána, a to v rozmezí, které je udáno číslem.
- Příklad: daňová W3 reforma – ve výsledcích se objeví např. spojení „daňová a sociální reforma“, nikoliv však spojení „reforma daňová a sociální“.
Adjacent – vyhledávané termíny musí stát v textu vedle sebe, a to v jakémkoliv pořadí.
- Příklad: česká ADJ koruna – ve výsledcích se objeví dokumenty obsahující sousloví „česká koruna“ i „koruna česká“.
Followed by – druhý zadaný termín musí následovat termín první.
- Příklad: česká followed by koruna – ve výsledcích se zobrazí dokumenty obsahující sousloví „česká koruna“.
Pre – druhý zadaný termín musí předcházet termín první.
- Příklad: koruna pre1 česká – ve výsledcích budou obsaženy dokumenty obsahující sousloví „česká koruna“.
Další vyhledávací prostředky
Informační systémy používají pro vyhledávání ve svých fondech také další pomůcky.
Vymezení fráze
Pokud chceme, aby informační systém vyhledával pouze přesně dané sousloví, je nutno tuto vazbu uvést do uvozovek. Některé systémy používají na tomto místě i kulaté závorky.
- Příklady: „kyselý déšť“, popř. (kyselý déšť)
Pravostranné rozšíření
V případě, že chceme vyhledávaný termín najít v dokumentu ve všech modifikacích, je nutno použít pravostranného rozšíření, které je realizováno přes znak *.
- Příklady: ekonomi* V tomto případě nalezne systém veškeré modifikace daného termínu, např. ekonomika, ekonomie, ekonomický atd.
Vynechání neznámého znaku
Jestliže si nejsme jisti, jaké znaky jsou v námi vyhledávaném termínu obsaženy, můžeme je vynechat a na jejich místo dosadit znak ?. V takovém případě může znak ? nahradit jakékoliv písmeno. Pro tuto funkci slouží v některých databázích rovněž znak % nebo $.
- Příklad: filo?ofie Systém vyhledá jak výraz filozofie, tak pojem filosofie.
Kromě těchto prostředků je třeba zmínit také pokročilé nástroje, které přinášejí uživatelům samotné databáze či vyhledávače. K základním funkcím patří možnost omezení vyhledávání například časově, jazykově, podle typu dokumentu nebo tematické skupiny. Samozřejmostí je možnost dalšího vyhledávání v rámci zobrazených výsledků. V poslední době se do popředí dostává tzv. clustering (shlukování). Po vyhledání výsledků dotazu jsou zobrazené dokumenty rozčleněny do mnoha skupin podle různých kritérií. Těmi mohou být například téma dokumentu, typ dokumentu, jazyk, autor, rok vydání atd.
Instituce poskytující rešeršní služby
Rešeršní služby mají ve své nabídce povětšinou knihovny a další informační instituce. V převážné míře bývají tyto služby zpoplatněny. Pokud uživatel nedisponuje přístupem do těchto institucí, může využít služeb takzvaných informačních konzultačních firem, které mají přístup do vědeckých databází a které za úplatu rešerši vyhotoví (v ČR například již zmiňovaná firma Medistyl).
Formální úprava rešerší
Formální úprava rešerše byla vymezena v normě ČSN 01 0198. Tato norma byla schválena v roce 1972 a nabyla účinnost 1.1.1973. V roce 2002 však byla bez náhrady zrušena.