Sémantické vyhledávání

Z WikiKnihovna
Přejít na: navigace, hledání

Autor: Martin Kravec

Klíčová slova: vyhledávání, sémantika, web 3.0

Synonyma: semantic searching, významové vyhledávání

Související pojmy: web 3.0

nadřazené - vyhledávání
podřazené -


Charakteristika

Sémantické vyhledávání, na rozdíl od běžného vyhledávání, očekává dotazování v přirozeném jazyce. Použití sémantické informace v procesu vyhledávání umožňuje uživatelům vyhledávat vysoce relevantní informace. Sémantické prvky jsou běžnou součástí vyhledávání a mění jak výsledky, tak postupy a strategie.[1] Sémantické neboli znalostní[2] vyhledávání není založeno jen na výskytech slova, ale také na jejich významech a vztazích. Je též nutné podotknout, že pomocí sémantického vyhledávání bude jednodušší provádět egosurfing a získávat tak osobní údaje. V oblasti informační vědy se o vyhledávání informací mluví jako o Information Retrieval. Mezi první meta-vyhledávače patří MetaCrawler, který kombinoval výsledky vícero vyhledávačů.[3] V době před internetem byl tímto vyhledávacím systémem knihovník.

Současný stav a vývoj

Pokusy o sémantické vyhledávání existují i dnes. Příkladem může být WolframAlpha nebo Siri. Sémantického webu se v současné době dosahuje pomocí mikroformátů, mikrodat nebo jiných technologií jako jsou RDF či hCard, které posouvají sémantické hranice HTML. Tyto technologie přiřazují jednotlivým částem webu význam (např. Toto je osoba, toto je adresa atd.)[4] Dokumenty obsahují metadata, která je blíže popisují a s kterými pak vyhledávače pracují. O sémantickém webu se mluví v souvislosti s Webem 3.0, který se ho snaží do sebe implementovat. Otec internetu, Tim Berners-Lee, považuje sémantický web za budoucnost internetu.[5]

O sémantické vyhledávání se snaží zejména dnes nejznámější a největší vyhledávače jako Ask, Bing, Google či Yahoo! Sémantické funkce je možné vidět na reklamách Google, které jsou cílené na zájmy uživatelů. Dosahuje toho zaznamenáváním hledaných výrazů. Webové společnosti nečekají na příchod Webu 3.0 a své nástroje a služby přizpůsobují existujícím nebo je nakupují a integrují do sebe. Příkladem může být Microsoft, který koupil vyhledávácí systém Powerset a integroval ho do svého Bingu. Bing je také lepší v sémantickém hledání zdravotnických informací díky koupi zdravotnického systému Medstory.[3][6]

Funkčnost sémantického vyhledávání závisí ve velké míře od implementace sémantických prvků a technologií do webu. Již v roce 2002 byl představen jazyk OWL (Web Ontology Language), který by měl rozumět obsahu informací. Systém OWL řeší klasifikaci dat, která by dostatečně rozumně rozdělila data podle významu v různých kontextech. Když se každý výraz propojí s centrálním zdrojem dat, nebude potřeba vše definovat na jednom místě. V jistém smyslu sémantický web funguje i dnes a je to vidět na příkladu CC licencí (Creative Commons). Všechny informace o CC jsou uloženy v centrální databázi, a tak je není nutno pokaždé definovat na příslušné stránce. Předělat web na web sémantický je velice obtížné už jen proto, že je zahlcen různými, často nepravdivými, informacemi a také tím, že vyhledávače indexují jen malý zlomek veškerého obsahu. Je proto složité vytvořit technologii, která by automaticky přiřazovala význam obsahu webu jak indexovanému, tak i hlubokému.[5] Mezi další problémy ve vývoji patří rozhodně nejednotnost v přístupu k "sémantizování" webu a nedostatečně popsané webové stránky sémantickými značkami.[7]

Reference

  1. Ikaros, redakce. Personalizace, lokalizace a sémantické vyhledávání skutečně fungují? (Karen Blakeman). Ikaros [online]. 2011, roč. 15, č. 5/2 [cit. 2014-03-08]. Dostupný z http://www.ikaros.cz/node/6917. urn:nbn:cz:ik‐006917. ISSN 1212-5075.
  2. JONÁK, Zdeněk. Sémiotika. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2014-03-06]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000002794&local_base=KTD.
  3. 3,0 3,1 DOSZKOCS, Tamas. SEMANTIC Search Engines Mean Well. Online [online]. 2010, roč. 34, č. 4, s. 36-41 [cit. 2014-03-06]. Dostupné z: http://ezproxy.muni.cz/login?url=http://search.ebscohost.com/login.aspx?direct=true&AuthType=ip,cookie,uid&db=bth&AN=52686610&lang=cs&site=eds-live&scope=site
  4. THE RDF WEB APPS WORKING GROUP AT W3C. RDFa: The Resource Description Framework in Attributes [online]. 2014 [cit. 2014-03-06]. Dostupné z: http://rdfa.info/
  5. 5,0 5,1 CHATFIELD, Tom. Digitální svět: 50 myšlenek, které musíte znát. Vyd. 1. Překlad Irena Grusová. Praha: Slovart, s.184-187.
  6. ENDLER, James. Web 3.0: The Dawn of Semantic Search. Computer: 2 Color Photographs [online]. 2010, roč. 43, č. 1, s. 77-80 [cit. 2014-03-06]. 0018-9162. Dostupné z: http://ezproxy.muni.cz/login?url=http://search.ebscohost.com/login.aspx?direct=true&AuthType=ip,cookie,uid&db=a9h&AN=48241093&lang=cs&site=eds-live&scope=site
  7. JELÍNEK, Jiří a Tomáš KINCL. Techniky a nástroje sémantického vyhledávání. INFORUM 2005: 11. konference o profesionálních informačních zdrojích [online]. 2005, 5 s. [cit. 2014-03-08]. Dostupné z: http://www.inforum.sk/pdf/2005/Jelinek_Jiri.pdf

Zdroje

  • CHATFIELD, Tom. Digitální svět: 50 myšlenek, které musíte znát. Vyd. 1. Překlad Irena Grusová. Praha: Slovart, 208. ISBN 978-807-3917-203.
  • JELÍNEK, Jiří a Tomáš KINCL. Techniky a nástroje sémantického vyhledávání. INFORUM 2005: 11. konference o profesionálních informačních zdrojích [online]. 2005, 5 s. [cit. 2014-03-08]. Dostupné z: http://www.inforum.sk/pdf/2005/Jelinek_Jiri.pdf
  • THE RDF WEB APPS WORKING GROUP AT W3C. RDFa: The Resource Description Framework in Attributes [online]. 2014 [cit. 2014-03-06]. Dostupné z: http://rdfa.info/

Rozšiřující materiály

  • IKAROS, Redakce. Sémantické vyhledávání je blíže? (Vilém Sklenák). Ikaros [online]. 2009, roč. 13, 5/2 [cit. 2014-03-06]. Dostupné z: http://www.ikaros.cz/node/5473