Strategie vyhledávání
Taktiky vyhledávání v EIZ
Pro vyhledání informací můžete využít následující metody. Každá je vhodná pro jiný typ vyhedávání. Využijete je také v různých fázích vyhledávání
Základní pojem : Searching Synonyma : Search Strategie, Searching Methods Nadřazený pojem : Information retrieval Podřazené pojmy : Browsing, Search Engine, Online Searching, Offline Searching
Strategie stavebních kamenů – identifikujeme skupinu klíčových pojmů, které následně spojujeme pomocí operátorů
Searching OR Browsing OR Information Retrieval AND Internet OR Network OR World Wide Web OR WWW OR Invisible Web OR Search engine
Strategie rostoucí perly – vybereme nejužší pojem, kterým začneme vyhledávat informace. Tento pojem při malém počtu výsledků zobecňujeme
Internet AND searching (konkrétní dotaz)
Search Engine AND Information Retrieval (obecnější dotaz)
Strategie osekávání – pro vyhledání formulujeme obecnou, širší kategorii. Po prvním zobrazení a prohlédnutí nalezených výsledků, použijeme taktiky pro zúžení výsledků
Information Retrieval (obecný dotaz)
Searching OR Browsing (konkrétnější dotaz)
Strategie vyhledávání v placených EIZ
Vyhledání relevantní informace vždy začíná výběrem vyhledávacího nástroje a následnou definicí problému a vytvoření skupiny výrazů pro vyhledání relevantních informací.
Pro formulaci dotazu je důležité zamyslet se nad tématem, jako nad celkem a zodpovědět tři základní otázky:
- S jakými dalšími obory/tématy/problémy souvisí
- Jakou odpověď chcete dostat
- Co vědět nechcete
Zatímco ve fulltextových vyhledávačích lze zadávat dotazy v podobě přirozené řeči, databáze odborných informací tuto funkci stále nenabízí. Výběr vhodných klíčových slov pro vyhledávání se často podceňuje a bývá hlavní příčinou neúspěchu. V této fázi bude nejvíce k užitku, výše zmiňovaná znalost dané problematiky, která napomůže vhodnému výběru pojmů. Obecně se doporučuje vynechávat STOP slova (předložky, spojky), přísudky, přídavná jména nebo slovesa. Při vyhledávání je vhodné používat výhradně podstatná jména.
Spojky lze vynechat a místo nich použít tzv. operátory. Ty umožní nejen pojmy spojit, ale také vyjádřit mezi nimi vztahy, nebo některá slova z vyhledávání vyloučit. Takovým spojením jednotlivých klíčových slov vznikne fráze, kterou lze modifikovat podle dosažených výsledků vyhledávání.
BOOLEOVSKÉ OPERÁTORY
Pro spojení klíčových slov se nejčastěji využívají booleovské operátory, které vyjadřují logické vztahy mezi pojmy.
AND
- vyhledají se všechny pojmy, spojené operátorem AND
- používá se pro spojení významově odlišných slov
- operátor AND se využívá pro zúžení výsledků vyhledávání
OR
- vyhledá se alespoň jeden z uvedených pojmů
- většinou se používá pro spojení synonym
- operátor OR se používá pro rozšíření výsledků vyhledávání
NOT
- pojem uvedený jako první bude vyhledán, zatímco pojem uvedený za operátorem NOT bude z výsledků vyhledávání vyloučen
- operátor NOT se využívá pro zúžení výsledků vyhledávání informací
PROXIMITNÍ OPERÁTORY
Mimo booleovské operátory existují ještě tzv. proximitní. Zatímco booleovské operátory vyjadřují vztahy mezi jednotlivými pojmy, proximitní operátory vyjadřují jejich vzájemnou vzdálenost.
NEAR
- Uvádí požadovanou vzdálenost, v jaké od sebe mají být jednotlivé pojmy uvedeny
WITHIN
- Pojmy budou vyhledány přesně v tom pořadí, jak byly zapsány
- Operátor within určuje vzdálenost, v jaké od sebe mohou být
Mimo tyto, obecně známé operátory, lze využít i dalších možností. Tyto možnosti nejsou standardní a zvolený vyhledávací nástroj je nemusí podporovat. Vždy je tedy důležité, ověřit si jejich použití v nápovědě systému.
Mezi zvláštní metody patří truncation, stemming a wild cards.
Truncation
- krácení podle slovních kořenů
- používají se znaky ? (nahrazuje jeden znak) nebo * (nahrazuje více znaků)
- těmito znaky se nahradí počáteční, nebo koncová část slova
Stemming
- automatické vyhledání příbuzných pojmů
- nepoužívají se žádné zástupné znaky, pouze zadáte slovo a systém automaticky vyhledá pojmy podobné
- tento systém využívá např. Google
Wild cards (zástupné znaky)
- nahrazování písmen, nebo částí slov uprostřed (truncation nahrazuje začátky a konce slov)
- používají se znaky ?, *, # a další
Většina elektronických informačních zdrojů nabízí dvě základní možnosti vyhledávání informací. Jednoduché vyhledávání, kdy do vyhledávacího pole zapíšete jedno, nebo více slov a necháte je vyhledat a pokročilé vyhledávání. V rámci pokročilého lze využít celou řadu možností, jak modifikovat dotaz. Nejčastěji bývá využívána kombinace klíčových slov, kombinace frází, možnost vyhledávání v různých polích (název, abstrakt atd.), omezení vyhledávání na jazyk, časové omezení a omezení na typ dokumentu.
Pokud i při tomto postupu není nalezen potřebný výsledek, lze zadaný dotaz modifikovat. Existuje několik možností jak zúžit, nebo rozšířit výsledky vyhledávání:
Taktiky pro zúžení výsledků
- kombinace více klíčových slov najednou
- používání proximitních operátorů
- použít operátor NOT pro vyloučení určitých pojmů
- použít omezení na pole, ve kterém se má vyhledávat (název dokumentu, klíčová slova, abstrakt atd.)
- omezit typ dokumentu, který má být vyhledán
- jazykové vymezení
- časové vymezení
Taktiky pro rozšíření výsledků
- použití synonym, jiných tvarů slov
- použít operátor OR, pro vyhledání více výrazů najednou
- použít zástupné znaky, krácení podle kořene slova (stemming využívá i Google)
- použití nadřazených, nebo obecnějších pojmů
- vynechání předběžných omezení
Strategie vyhledávání ve volně dostupných EIZ
První fáze, tedy výběr vyhledávacího nástroje a výběr klíčových slov pro vyhledávání je totožný, jako u předchozí části. Při vyhledávání na webu existuje ale mnohem více možností, než je tomu u placených bází dat. Tvůrci fulltextových vyhledávačů soupeří nejen o nejlepší služby, ale i o to, jaké funkce pro vyhledávání přináší. Výsledkem konkurenčního boje jsou téměř neomezené možnosti, jak si vyhledávání usnadnit, zpřesnit jej a urychlit.
Jaké možnosti nám tedy fulltextové vyhledávače nabízí? Frázové vyhledávání, vyhledávání synonym, definice pojmů, zadávání otázek, kdy je zobrazena konkrétní odpověď, vyhledávání konkrétních typů dokumentů, obrázků, multimediálních souborů a mnohé další.
Fulltextové vyhledávače umožňují zadání dotazu formou konkrétní otázky, ale také pouze pomocí jednoho klíčového slova. Největší chybou při tomto vyhledávání je, že nepřemýšlíme nad vhodně zvolenými klíčovými slovy. Zatímco prostředí placených EIZ nás svazuje a nutí nás jednat zodpovědně, neomezené možnosti fulltextových vyhledávačů činí pravý opak. Vzhledem k tomu, že obsahují téměř neomezené množství informací, tu naši (nebo jí podobnou) najdeme téměř vždy. V tuto chvíli ovšem nastupují otázky důvěryhodnosti a kvality nalezené informace.
Tipy pro vyhledávání na webu
Při vyhledávání na webu existuje mnohem více možností, než je tomu v placených bázích dat. Tvůrci fulltextových vyhledávačů soupeří nejen o nejlepší služby, ale i o to, jaké funkce pro vyhledávání přináší. Výsledkem konkurenčního boje jsou téměř neomezené možnosti, jak si vyhledávání usnadnit, zpřesnit jej a urychlit.
Níže uvedené tipy můžete využít zejména na Googlu. Podobné funkce mají i ostatní vyhledávače (Alltheweb, Jyxo, Ask). Dříve, než se ale budete využívat, projděte si nápovědu. Tipy na vyhledávání jsou tam přehledně vysvětleny.
Frázové vyhledávání – vyhledá se přesně zadaná fráze. Použít můžete uvozovky, nebo pomlčku mezi slovy (vyhledávání na Google vyhledávání-na-Google)
Do vyhledávacího pole se může zapsat maximálně 32 slov. Těžko ale budete potřebovat tolik slov, pro vyjádření Vašeho dotazu
Vyhledávání synonym – pokud chcete vyhledat i synonyma zadaného výrazu, uveďte před slovo vlnovku (~house)
Definice pojmů – pokud před výraz zadáte define, vyhledá se definice tohoto výrazu (define:search engine)
Zadávání otázek – vyhledávat informace můžete i následujícím způsobem. Pokud bevíte, jak vyjádřit Váš požadavek, jednoduše zadejte do vyhledávacího pole otázku (Kdy se narodil Masaryk?)
Typy dokumentů – vyhledávat můžete konkrétní typ dokumentů. Za dotaz zadejte filetype:pdf (nebo jiný typ dokumentů
Další typy příkazů:
intitle – zadané slovo hledá v názvu stránky allintitle – všechna zadaná slova hledá v názvu stránky inurl – zadané slovo vyhledá v URL allinurl – všechna zadaná slova hledá v názvu stránky inanchor – zadané slovo hledá v textu odkazů na stránce allinanchor - všechna zadaná slova hledá v textu odkazů na stránce site – omezení vyhledávání pouze na zadanou doménu link – najde stránky s odkazem na web, jehož název je uveden za link: related – najde stránky podobné té zadané
Více informací naleznete v nápovědách http://www.google.com/intl/cs/help/features.html http://jyxo.cz/d/help http://about.ask.com/en/docs/about/ask_technology.shtml http://alltheweb.com/help/index
Výhody a nevýhody placených a volně dostupných zdrojů
Placené báze dat
Profesionálná databáze jsou považovány za běžnou obchodní komoditu.
- Přístup k nim je placený/licencovaný
- Přístup je zprostředkovaný určitou institucí, tedy producentem databáze. Databázi může zpřístupnit i knihovna popř. informační centrum.
Výhody
- Věrohodnost a kvalita informací
- Kontrolovaný vstup – nevznikají duplicity
- Pravidelné aktualizace obsahu
- Prohledává se celá databáze
- Nástroje pro vyhledávání – indexy a rejstříky
Nevýhody
- Vysoká cena
- Ztížený přístup
- Odlišná rozhraní
- Odlišné funkce a nástroje
- Většinou pouze v angličtině
Volně dostupné zdroje
Volně dostupné EIZ jsou takové zdroje, ke kterým má přístup kdokoliv, bez omezení.
Výhody
- Bezplatný, snadný přístup odkudkoli
- Vyhledávání různých informací v různých formátech z jednoho rozhraní
- Obsahují informace ze všech odvětví lidské činnosti
- Stejný princip vyhledávání
- Doplňkové služby (viz. Google)
Nevýhody
- Vstup dat není kontrolován (vložit může kdokoli, cokoli)
- Nízká možnost informace ověřit
- Hůře rozeznatelné odborné zdroje
- Deep Web – velká část dat není prohledávána
- Duplicity v obsahu, neaktuální nebo zkreslené informace, nízká životnost stránek atd.
Související pojmy
Elektronické informační zdroje - zdroje uchovávané v elektronické podobě, dostupné pomocí počítačových sítí, nebo jiných technologií (např. na discích CD-ROM, DVD).
Strategie vyhledávání – plánovaná činnost, při níž je vybrán nejvhodnější vyhledávací nástroj a metoda, kterou se budou vyhledávat relevantní informace. Spadá sem formulace dotazu i výběr metod pro zúžení, popř. rozšíření výsledku vyhledávání. Jako druhé označení pro strategii vyhledávání používáme pojem rešeršní strategie.
Rešerše - soupis záznamů dokumentů, jeho částí nebo faktografických informací, které jsou vybrány podle obsahových nebo formálních hledisek zadaných v rešeršním dotazu. Rešeršní požadavek – informační potřeba formulovaná pomocí přirozeného jazyka
Rešeršní dotaz - vyjádření rešeršního požadavku v příslušném dotazovacím jazyce. Může jej formulovat informační pracovník nebo uživatel.
Více informací
http://www.boldis.cz/index.php?internet
http://www.infozdroje.cz/infozdroje.php
http://www.lupa.cz/clanky/internet-jako-zdroj-informaci-a-dezinformaci/
http://www.virtualchase.com/howto/gg_tips.html
http://searchenginewatch.com/showPage.html?page=facts
--Tereza 16:19, 4. 6. 2008 (CEST)