Strategie vyhledávání

Z WikiKnihovna
Verze z 20. 2. 2012, 12:05, kterou vytvořil Michal Klajban (diskuse | příspěvky) (14 revizí: IMPORT Q-S: import stránek z hlavního jmenného prostoru z KiskWiki (http://kisk.phil.muni.cz/))
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)

Taktiky vyhledávání v EIZ

Pro vyhledání informací můžete využít následující metody. Každá je vhodná pro jiný typ vyhedávání. Využijete je také v různých fázích vyhledávání

Základní pojem : Searching Synonyma : Search Strategie, Searching Methods Nadřazený pojem : Information retrieval Podřazené pojmy : Browsing, Search Engine, Online Searching, Offline Searching


Strategie stavebních kamenů – identifikujeme skupinu klíčových pojmů, které následně spojujeme pomocí operátorů

Searching OR Browsing OR Information Retrieval AND Internet OR Network OR World Wide Web OR WWW OR Invisible Web OR Search engine

Strategie rostoucí perly – vybereme nejužší pojem, kterým začneme vyhledávat informace. Tento pojem při malém počtu výsledků zobecňujeme

Internet AND searching (konkrétní dotaz)

Search Engine AND Information Retrieval (obecnější dotaz)

Strategie osekávání – pro vyhledání formulujeme obecnou, širší kategorii. Po prvním zobrazení a prohlédnutí nalezených výsledků, použijeme taktiky pro zúžení výsledků

Information Retrieval (obecný dotaz)

Searching OR Browsing (konkrétnější dotaz)


Strategie vyhledávání v placených EIZ

Vyhledání relevantní informace vždy začíná výběrem vyhledávacího nástroje a následnou definicí problému a vytvoření skupiny výrazů pro vyhledání relevantních informací.

Pro formulaci dotazu je důležité zamyslet se nad tématem, jako nad celkem a zodpovědět tři základní otázky:

  • S jakými dalšími obory/tématy/problémy souvisí
  • Jakou odpověď chcete dostat
  • Co vědět nechcete

Zatímco ve fulltextových vyhledávačích lze zadávat dotazy v podobě přirozené řeči, databáze odborných informací tuto funkci stále nenabízí. Výběr vhodných klíčových slov pro vyhledávání se často podceňuje a bývá hlavní příčinou neúspěchu. V této fázi bude nejvíce k užitku, výše zmiňovaná znalost dané problematiky, která napomůže vhodnému výběru pojmů. Obecně se doporučuje vynechávat STOP slova (předložky, spojky), přísudky, přídavná jména nebo slovesa. Při vyhledávání je vhodné používat výhradně podstatná jména.

Spojky lze vynechat a místo nich použít tzv. operátory. Ty umožní nejen pojmy spojit, ale také vyjádřit mezi nimi vztahy, nebo některá slova z vyhledávání vyloučit. Takovým spojením jednotlivých klíčových slov vznikne fráze, kterou lze modifikovat podle dosažených výsledků vyhledávání.

BOOLEOVSKÉ OPERÁTORY

Pro spojení klíčových slov se nejčastěji využívají booleovské operátory, které vyjadřují logické vztahy mezi pojmy.

AND

  • vyhledají se všechny pojmy, spojené operátorem AND
  • používá se pro spojení významově odlišných slov
  • operátor AND se využívá pro zúžení výsledků vyhledávání

OR

  • vyhledá se alespoň jeden z uvedených pojmů
  • většinou se používá pro spojení synonym
  • operátor OR se používá pro rozšíření výsledků vyhledávání

NOT

  • pojem uvedený jako první bude vyhledán, zatímco pojem uvedený za operátorem NOT bude z výsledků vyhledávání vyloučen
  • operátor NOT se využívá pro zúžení výsledků vyhledávání informací


PROXIMITNÍ OPERÁTORY

Mimo booleovské operátory existují ještě tzv. proximitní. Zatímco booleovské operátory vyjadřují vztahy mezi jednotlivými pojmy, proximitní operátory vyjadřují jejich vzájemnou vzdálenost.

NEAR

  • Uvádí požadovanou vzdálenost, v jaké od sebe mají být jednotlivé pojmy uvedeny

WITHIN

  • Pojmy budou vyhledány přesně v tom pořadí, jak byly zapsány
  • Operátor within určuje vzdálenost, v jaké od sebe mohou být

Mimo tyto, obecně známé operátory, lze využít i dalších možností. Tyto možnosti nejsou standardní a zvolený vyhledávací nástroj je nemusí podporovat. Vždy je tedy důležité, ověřit si jejich použití v nápovědě systému.

Mezi zvláštní metody patří truncation, stemming a wild cards.

Truncation

  • krácení podle slovních kořenů
  • používají se znaky ? (nahrazuje jeden znak) nebo * (nahrazuje více znaků)
  • těmito znaky se nahradí počáteční, nebo koncová část slova

Stemming

  • automatické vyhledání příbuzných pojmů
  • nepoužívají se žádné zástupné znaky, pouze zadáte slovo a systém automaticky vyhledá pojmy podobné
  • tento systém využívá např. Google

Wild cards (zástupné znaky)

  • nahrazování písmen, nebo částí slov uprostřed (truncation nahrazuje začátky a konce slov)
  • používají se znaky ?, *, # a další


Většina elektronických informačních zdrojů nabízí dvě základní možnosti vyhledávání informací. Jednoduché vyhledávání, kdy do vyhledávacího pole zapíšete jedno, nebo více slov a necháte je vyhledat a pokročilé vyhledávání. V rámci pokročilého lze využít celou řadu možností, jak modifikovat dotaz. Nejčastěji bývá využívána kombinace klíčových slov, kombinace frází, možnost vyhledávání v různých polích (název, abstrakt atd.), omezení vyhledávání na jazyk, časové omezení a omezení na typ dokumentu.


Pokud i při tomto postupu není nalezen potřebný výsledek, lze zadaný dotaz modifikovat. Existuje několik možností jak zúžit, nebo rozšířit výsledky vyhledávání:

Taktiky pro zúžení výsledků

  • kombinace více klíčových slov najednou
  • používání proximitních operátorů
  • použít operátor NOT pro vyloučení určitých pojmů
  • použít omezení na pole, ve kterém se má vyhledávat (název dokumentu, klíčová slova, abstrakt atd.)
  • omezit typ dokumentu, který má být vyhledán
  • jazykové vymezení
  • časové vymezení

Taktiky pro rozšíření výsledků

  • použití synonym, jiných tvarů slov
  • použít operátor OR, pro vyhledání více výrazů najednou
  • použít zástupné znaky, krácení podle kořene slova (stemming využívá i Google)
  • použití nadřazených, nebo obecnějších pojmů
  • vynechání předběžných omezení


Strategie vyhledávání ve volně dostupných EIZ

První fáze, tedy výběr vyhledávacího nástroje a výběr klíčových slov pro vyhledávání je totožný, jako u předchozí části. Při vyhledávání na webu existuje ale mnohem více možností, než je tomu u placených bází dat. Tvůrci fulltextových vyhledávačů soupeří nejen o nejlepší služby, ale i o to, jaké funkce pro vyhledávání přináší. Výsledkem konkurenčního boje jsou téměř neomezené možnosti, jak si vyhledávání usnadnit, zpřesnit jej a urychlit.

Jaké možnosti nám tedy fulltextové vyhledávače nabízí? Frázové vyhledávání, vyhledávání synonym, definice pojmů, zadávání otázek, kdy je zobrazena konkrétní odpověď, vyhledávání konkrétních typů dokumentů, obrázků, multimediálních souborů a mnohé další.

Fulltextové vyhledávače umožňují zadání dotazu formou konkrétní otázky, ale také pouze pomocí jednoho klíčového slova. Největší chybou při tomto vyhledávání je, že nepřemýšlíme nad vhodně zvolenými klíčovými slovy. Zatímco prostředí placených EIZ nás svazuje a nutí nás jednat zodpovědně, neomezené možnosti fulltextových vyhledávačů činí pravý opak. Vzhledem k tomu, že obsahují téměř neomezené množství informací, tu naši (nebo jí podobnou) najdeme téměř vždy. V tuto chvíli ovšem nastupují otázky důvěryhodnosti a kvality nalezené informace.


Tipy pro vyhledávání na webu


Při vyhledávání na webu existuje mnohem více možností, než je tomu v placených bázích dat. Tvůrci fulltextových vyhledávačů soupeří nejen o nejlepší služby, ale i o to, jaké funkce pro vyhledávání přináší. Výsledkem konkurenčního boje jsou téměř neomezené možnosti, jak si vyhledávání usnadnit, zpřesnit jej a urychlit.

Níže uvedené tipy můžete využít zejména na Googlu. Podobné funkce mají i ostatní vyhledávače (Alltheweb, Jyxo, Ask). Dříve, než se ale budete využívat, projděte si nápovědu. Tipy na vyhledávání jsou tam přehledně vysvětleny.

Frázové vyhledávání – vyhledá se přesně zadaná fráze. Použít můžete uvozovky, nebo pomlčku mezi slovy (vyhledávání na Google vyhledávání-na-Google)

Do vyhledávacího pole se může zapsat maximálně 32 slov. Těžko ale budete potřebovat tolik slov, pro vyjádření Vašeho dotazu

Vyhledávání synonym – pokud chcete vyhledat i synonyma zadaného výrazu, uveďte před slovo vlnovku (~house)

Definice pojmů – pokud před výraz zadáte define, vyhledá se definice tohoto výrazu (define:search engine)

Zadávání otázek – vyhledávat informace můžete i následujícím způsobem. Pokud bevíte, jak vyjádřit Váš požadavek, jednoduše zadejte do vyhledávacího pole otázku (Kdy se narodil Masaryk?)

Typy dokumentů – vyhledávat můžete konkrétní typ dokumentů. Za dotaz zadejte filetype:pdf (nebo jiný typ dokumentů

Další typy příkazů:

intitle – zadané slovo hledá v názvu stránky allintitle – všechna zadaná slova hledá v názvu stránky inurl – zadané slovo vyhledá v URL allinurl – všechna zadaná slova hledá v názvu stránky inanchor – zadané slovo hledá v textu odkazů na stránce allinanchor - všechna zadaná slova hledá v textu odkazů na stránce site – omezení vyhledávání pouze na zadanou doménu link – najde stránky s odkazem na web, jehož název je uveden za link: related – najde stránky podobné té zadané

Více informací naleznete v nápovědách http://www.google.com/intl/cs/help/features.html http://jyxo.cz/d/help http://about.ask.com/en/docs/about/ask_technology.shtml http://alltheweb.com/help/index

Výhody a nevýhody placených a volně dostupných zdrojů

Placené báze dat

Profesionálná databáze jsou považovány za běžnou obchodní komoditu.

  • Přístup k nim je placený/licencovaný
  • Přístup je zprostředkovaný určitou institucí, tedy producentem databáze. Databázi může zpřístupnit i knihovna popř. informační centrum.

Výhody

  • Věrohodnost a kvalita informací
  • Kontrolovaný vstup – nevznikají duplicity
  • Pravidelné aktualizace obsahu
  • Prohledává se celá databáze
  • Nástroje pro vyhledávání – indexy a rejstříky

Nevýhody

  • Vysoká cena
  • Ztížený přístup
  • Odlišná rozhraní
  • Odlišné funkce a nástroje
  • Většinou pouze v angličtině

Volně dostupné zdroje

Volně dostupné EIZ jsou takové zdroje, ke kterým má přístup kdokoliv, bez omezení.

Výhody

  • Bezplatný, snadný přístup odkudkoli
  • Vyhledávání různých informací v různých formátech z jednoho rozhraní
  • Obsahují informace ze všech odvětví lidské činnosti
  • Stejný princip vyhledávání
  • Doplňkové služby (viz. Google)


Nevýhody

  • Vstup dat není kontrolován (vložit může kdokoli, cokoli)
  • Nízká možnost informace ověřit
  • Hůře rozeznatelné odborné zdroje
  • Deep Web – velká část dat není prohledávána
  • Duplicity v obsahu, neaktuální nebo zkreslené informace, nízká životnost stránek atd.


Související pojmy

Elektronické informační zdroje - zdroje uchovávané v elektronické podobě, dostupné pomocí počítačových sítí, nebo jiných technologií (např. na discích CD-ROM, DVD).

Strategie vyhledávání – plánovaná činnost, při níž je vybrán nejvhodnější vyhledávací nástroj a metoda, kterou se budou vyhledávat relevantní informace. Spadá sem formulace dotazu i výběr metod pro zúžení, popř. rozšíření výsledku vyhledávání. Jako druhé označení pro strategii vyhledávání používáme pojem rešeršní strategie.

Rešerše - soupis záznamů dokumentů, jeho částí nebo faktografických informací, které jsou vybrány podle obsahových nebo formálních hledisek zadaných v rešeršním dotazu. Rešeršní požadavek – informační potřeba formulovaná pomocí přirozeného jazyka

Rešeršní dotaz - vyjádření rešeršního požadavku v příslušném dotazovacím jazyce. Může jej formulovat informační pracovník nebo uživatel.


Více informací

http://www.boldis.cz/index.php?internet

http://www.infozdroje.cz/infozdroje.php

http://www.lupa.cz/clanky/internet-jako-zdroj-informaci-a-dezinformaci/

http://www.virtualchase.com/howto/gg_tips.html

http://searchenginewatch.com/showPage.html?page=facts


--Tereza 16:19, 4. 6. 2008 (CEST)