Vyhledávání v databázích – rešerše: Porovnání verzí
| Řádek 87: | Řádek 87: | ||
dotazu. | dotazu. | ||
== Vyhledávací pomůcky == | == Vyhledávací pomůcky == | ||
| + | Booleovské operátory | ||
| + | Pomocí booleovských operátorů vymezujeme vztahy mezi hledanými termíny. | ||
| + | AND | ||
| + | Operátor AND udává, že ve výsledcích vyhledávání musí být pouze dokumenty obsahující | ||
| + | oba vyhledávané pojmy. | ||
| + | Příklad: management AND marketing. Při zadání | ||
| + | takovéhoto dotazu nalezne systém veškeré | ||
| + | dokumenty, které obsahují slovo management | ||
| + | a zároveň slovo marketing. | ||
| + | OR | ||
| + | Při použití tohoto operátoru je postačující to, | ||
| + | že se ve výsledcích vyhledávání objeví dokumenty, | ||
| + | které obsahují alespoň jeden z požadovaných | ||
| + | termínů. | ||
| + | Příklad: management OR marketing. V tomto | ||
| + | případě se ve výsledcích objevily všechny | ||
| + | dokumenty, které obsahují slovo management nebo | ||
| + | slovo marketing, a taktéž dokumenty, které obsahují | ||
| + | oba tyto výrazy. | ||
| + | NOT | ||
| + | V tomto případě je vymezeno, že se ve výsledcích | ||
| + | vyhledávání musí objevit dokumenty obsahující | ||
| + | první ze zadaných výrazů, avšak vyloučeny jsou | ||
| + | dokumenty, které mají ve svém obsahu pojem | ||
| + | druhý. | ||
| + | Příklad: management NOT marketing. Systém vyhledá dokumenty, které obsahují slovo | ||
| + | management, ale neobsahují zároveň slovo marketing. | ||
| + | 2.4.4.2 Proximitní operátory | ||
| + | Proximitní operátory vyjadřují vztahy mezi hledanými termíny v kontextu jejich postavení | ||
| + | v textu. U některých z nich lze navíc číselně vyjádřit, v jakém rozptylu se v textu mohou | ||
| + | hledané pojmy vyskytovat. | ||
| + | Near – jsou nalezena slovní spojení, v nichž se objevují požadovaná slova odděleně od sebe | ||
| + | maximálně ve vzdálenosti určené číslem, a to bez ohledu na pořadí, ve kterém se vyskytují. | ||
| + | Příklad: auto N2 škoda – ve výsledcích se objeví jak spojení „auto značky škoda“, tak | ||
| + | spojení „škoda auto“. | ||
| + | Within – systém nalezne slovní spojení, ve kterých se vyskytují požadovaná slova v pořadí, | ||
| + | v jakém byla zapsána, a to v rozmezí, které je udáno číslem. | ||
| + | Příklad: daňová W3 reforma – ve výsledcích se objeví např. spojení „daňová | ||
| + | a sociální reforma“, nikoliv však spojení „reforma daňová a sociální“. | ||
| + | Adjacent – vyhledávané termíny musí stát v textu vedle sebe, a to v jakémkoliv pořadí. | ||
| + | Příklad: česká ADJ koruna – ve výsledcích se objeví dokumenty obsahující sousloví | ||
| + | „česká koruna“ i „koruna česká“. | ||
| + | Followed by – druhý zadaný termín musí následovat termín první. | ||
| + | Příklad: česká followed by koruna – ve výsledcích se zobrazí dokumenty obsahující | ||
| + | sousloví „česká koruna“. | ||
| + | Pre – druhý zadaný termín musí předcházet termín první. | ||
| + | Příklad: koruna pre1 česká – ve výsledcích budou obsaženy dokumenty obsahující | ||
| + | sousloví „česká koruna“. | ||
= Instituce poskytující rešeršní služby = | = Instituce poskytující rešeršní služby = | ||
= Formální úprava rešerší = | = Formální úprava rešerší = | ||
Verze z 5. 10. 2013, 12:57
Zpět na: KISK:Kniha Elektronické informační zdroje (Ondřej Fabián)
Vymezení pojmu
Pojem rešerše v sobě skrývá hned dva základní významy. Rešerší (či spíše rešeršováním) se rozumí na jedné straně samotný proces vyhledávání informací. Druhý výklad zmiňovaného pojmu definuje rešerši jako soupis vyhledaných informačních zdrojů na určité téma [MATOUŠOVÁ, 1988]. Rešerše se realizují nejen v obsazích vědeckých databází, ale také například v katalozích knihoven, na internetu atd.
Typologie rešerší
Rešerše lze rozdělovat podle mnoha hledisek. Pro účely tohoto materiálu však postačí rozlišit typy rešerší podle hlediska časového na: a) retrospektivní – vyhledávání v určitém vědeckém oboru za určité časové období b) souběžné – vyhledávání probíhající v daných periodách opakovaně. Účelem tohoto druhu rešerší je získat přehled o novinkách ve sledovaném oboru. A podle hlediska úplnosti na: a) úplné b) orientační c) výběrové. Dále lze rešerše třídit podle tematických, jazykových, druhových, teritoriálních a mnoha dalších hledisek.
Typologie vyhledávání
V principu lze stanovit dva hlavní typy vyhledávání: a) plnotextové – systém vyhledává v plných textech dokumentů. Na tomto principu fungují například plnotextové databáze nebo internetové vyhledávače. b) katalogové – vyhledávání probíhá pouze přes množiny slov, které popisují daný dokument (např. předmětová hesla, klíčová slova, slova z názvu atd.). Typickým příkladem pro tento druh vyhledávání jsou knihovní katalogy.
Realizace rešerší
Kdo vyhotovuje rešerše
a) Informační pracovník – v tomto případě dostane odborný informační pracovník, který má zkušenosti s vyhledáváním ve vybraných informačních zdrojích, požadavek od uživatele a na základě jeho zadání vyhotoví rešerši. Informační instituce mají obvykle na svých internetových stránkách speciální rešeršní formuláře pro správné zadání rešerše. Nebezpečím při tomto druhu vyhledávání může být fakt, že rešeršér nemusí zcela správně pochopit informační požadavek uživatele. b) Uživatel – uživatel si může rešerši provést vlastními silami. Vystavuje se však nebezpečí, že při nedostatečné znalosti informačních zdrojů a vyhledávacích strategií nedosáhne kýžených výsledků. c) Informační pracovník v přítomnosti uživatele – tato varianta vyhledávání je pro účely rešerše optimální. Uživatel může v průběhu vyhledávacího procesu upřesňovat a korigovat svoje požadavky. Informační pracovník provádí samotné vyhledávání v systému. Jestliže bylo uvedeno, že je tato alternativa ideální, je nutno rovněž poznamenat, že je nejméně frekventovaná [VLASÁK, 1999].
Fáze realizace rešerší
Samotný průběh rešeršní činnosti lze rozdělit do několika fází: 1) zadání (převzetí) dotazu, 2) výběr selekčních prvků (zvolení klíčových slov pro vyhledávání), 3) výběr optimálního informačního zdroje, 4) definice dotazu (kombinace klíčových slov spojených booleovskými či proximitními operátory), 5) vyhledání záznamů, 6) posouzení relevance, 7) případné doladění nebo přeformulování dotazu, 8) výběr relevantních záznamů pro samotné použití.
Rešeršní strategie
Při vyhledávání informací je možno postupovat několika odlišnými způsoby. Ty jsou definovány jako tzv. rešeršní strategie. a) Strategie rostoucí perly – jedná se o postupné rozšiřování dotazu a doplňování dalších klíčových slov tak, abychom získali více výsledků. Na začátku vyhledávání máme velmi malou množinu výsledných záznamů, avšak při postupném rozšiřování vyhledávaných pojmů získáváme další výsledky. b) Strategie osekávání – postup je opačný než u předchozího příkladu. V první fázi vyhledávání definujeme velmi všeobecný pojem, po jehož vyhledání získáme velké množství záznamů. Postupným zpřesňováním (osekáváním) dotazu dostáváme stále menší množinu relevantních výsledků. c) Strategie stavebních kamenů – v tomto případě definujeme hned na začátku rešerše několik základních pojmů, které postupně kombinujeme, a získáváme tak relevantní záznamy. d) Strategie širšího pojmu – u tohoto druhu vyhledávání postupujeme směrem od konkrétního pojmu k pojmům všeobecným. Počet vyhledaných výsledků se tak postupně navyšuje. V praxi informačního pracovníka je populární také tzv. strategie existujícího předchůdce. Nejedná se pochopitelně o svébytnou rešeršní strategii, nýbrž o to, že informační specialista disponuje již z dřívější doby rešerší na zadané téma, a tudíž už nemusí provádět žádné další vyhledávání, popřípadě pouze provede aktualizaci rešerše podle již vypracovaného rešeršního dotazu.
Vyhledávací pomůcky
Booleovské operátory Pomocí booleovských operátorů vymezujeme vztahy mezi hledanými termíny. AND Operátor AND udává, že ve výsledcích vyhledávání musí být pouze dokumenty obsahující oba vyhledávané pojmy. Příklad: management AND marketing. Při zadání takovéhoto dotazu nalezne systém veškeré dokumenty, které obsahují slovo management a zároveň slovo marketing. OR Při použití tohoto operátoru je postačující to, že se ve výsledcích vyhledávání objeví dokumenty, které obsahují alespoň jeden z požadovaných termínů. Příklad: management OR marketing. V tomto případě se ve výsledcích objevily všechny dokumenty, které obsahují slovo management nebo slovo marketing, a taktéž dokumenty, které obsahují oba tyto výrazy. NOT V tomto případě je vymezeno, že se ve výsledcích vyhledávání musí objevit dokumenty obsahující první ze zadaných výrazů, avšak vyloučeny jsou dokumenty, které mají ve svém obsahu pojem druhý. Příklad: management NOT marketing. Systém vyhledá dokumenty, které obsahují slovo management, ale neobsahují zároveň slovo marketing. 2.4.4.2 Proximitní operátory Proximitní operátory vyjadřují vztahy mezi hledanými termíny v kontextu jejich postavení v textu. U některých z nich lze navíc číselně vyjádřit, v jakém rozptylu se v textu mohou hledané pojmy vyskytovat. Near – jsou nalezena slovní spojení, v nichž se objevují požadovaná slova odděleně od sebe maximálně ve vzdálenosti určené číslem, a to bez ohledu na pořadí, ve kterém se vyskytují. Příklad: auto N2 škoda – ve výsledcích se objeví jak spojení „auto značky škoda“, tak spojení „škoda auto“. Within – systém nalezne slovní spojení, ve kterých se vyskytují požadovaná slova v pořadí, v jakém byla zapsána, a to v rozmezí, které je udáno číslem. Příklad: daňová W3 reforma – ve výsledcích se objeví např. spojení „daňová a sociální reforma“, nikoliv však spojení „reforma daňová a sociální“. Adjacent – vyhledávané termíny musí stát v textu vedle sebe, a to v jakémkoliv pořadí. Příklad: česká ADJ koruna – ve výsledcích se objeví dokumenty obsahující sousloví „česká koruna“ i „koruna česká“. Followed by – druhý zadaný termín musí následovat termín první. Příklad: česká followed by koruna – ve výsledcích se zobrazí dokumenty obsahující sousloví „česká koruna“. Pre – druhý zadaný termín musí předcházet termín první. Příklad: koruna pre1 česká – ve výsledcích budou obsaženy dokumenty obsahující sousloví „česká koruna“.