Sémantické vyhledávání

Z WikiKnihovna

Autor: Martin Kravec

Klíčová slova: vyhledávání, sémantika, web 3.0

Synonyma: semantic searching, významové vyhledávání

Související pojmy: web 3.0

nadřazené - vyhledávání

podřazené -


Charakteristika

Sémantické prvky jsou běžnou součástí vyhledávání a mění jak výsledky, tak postupy a strategie.[1] Na rozdíl od běžného vyhledávání se od sémantického očekává dotazování v přirozeném jazyce. V době před internetem byl tímto vyhledávacím systémem knihovník. Sémantické neboli znalostní[2] vyhledávání není založeno jen na výskytech slova ale také na jejich významech a vztazích. Mezi první meta vyhledávače patří MetaCrowler, který kombinoval výsledky vícerích vyhledávačů.[3]

Současný stav a vývoj

Pokusy o sémantické vyhledávání existují i dnes. Příkladem může být WolframAlpha nebo Siri. Sémentického webu se v současné době dosahuje pomocí mikroformátů, a to zejména RDF nebo hCard, které posouvají sémantické hranice HTML. Tyto mikroformáty přiřazují jednotlivým částem webu význam (např. Toto je osoba, toto je adresa atd.)[4] Dokumenty obsahují metadata, které je blíže popisují a s kterými pak vyhledávače pracují. O sémantickém webu se mluví v souvislosti s Webem 3.0, který se ho snaží do sebe implementovat. Otec internetu, Tim Bernerse-Lee, považuje sémantický web za budoucnost internetu.[5] O sémantické vyhledávání se snaží zejména dnes nejznámější a největší vyhledávače jako Ask, Bing, Google či Yahoo! Sémantické funkce je možné vidět na reklamách Google, které jsou cílené na zájmy uživatelů. Dosahuje toho zaznamenáváním hledaných výrazů. Webové společnosti nečekají na příchod Webu 3.0 a své nástroje a služby přispůsobují existujícím nebo je nakupují a integrují do sebe.[3][6]

Funkčnost sémantického vyhledávání závisí ve velké míře od implementace sémantikých prvku a technologií do webu. Již v roce 2002 byl představen jazyk OWL (Web Ontology Language), který by měl rozmět obsahu informací. Systém OWL řeší klasifikaci dat, která by dostatečně rozumně rozdelila data podle významu v různých kontextech. Aby to fungovalo, musí být každý výraz propojen s centrálním zdrojem dat, aby se nemuselo všechno definovat na jednom míste. V jistém smyslu sémantický web funguje i dnes a je to vidět na příkladu CC licencí (Creative Commons). Všechny informace o CC jsou uložena v centrální databázi a tak je není nutné zakaždým definovat na příslušné stránce. Předělat web na web sémantický je velice obtížné už jen proto, že je zahlcen různými, často nepravdivými informacemi a také tím, že vyhledávače indexují jen malý zlomek veškerého obsahu. Je proto složité vytvořit technologii, která by přiřazovala význam obsahu webu jak tomu indexovanému, tak hlubokému automaticky. [5]

Reference

  1. Ikaros, redakce. Personalizace, lokalizace a sémantické vyhledávání skutečně fungují? (Karen Blakeman). Ikaros [online]. 2011, roč. 15, č. 5/2 [cit. 08.03.2014]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/6917>. urn:nbn:cz:ik‐006917. ISSN 1212-5075.
  2. JONÁK, Zdeněk. Sémiotika. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2014-03-06]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000002794&local_base=KTD.
  3. 3,0 3,1 DOSZKOCS, Tamas. SEMANTIC Search Engines Mean Well. Online [online]. 2010, vol. 34, issue 4, s. 36-41 [cit. 2014-03-06]. Dostupné z: http://ezproxy.muni.cz/login?url=http://search.ebscohost.com/login.aspx?direct=true&AuthType=ip,cookie,uid&db=bth&AN=52686610&lang=cs&site=eds-live&scope=site
  4. THE RDF WEB APPS WORKING GROUP AT W3C. RDFa: The Resource Description Framework in Attributes [online]. 2014 [cit. 2014-03-06]. Dostupné z: http://rdfa.info/
  5. 5,0 5,1 CHATFIELD, Tom. Digitální svět: 50 myšlenek, které musíte znát. Vyd. 1. Překlad Irena Grusová. Praha: Slovart, s.184-187.
  6. ENDLER, James. Web 3.0: The Dawn of Semantic Search. Computer: 2 Color Photographs [online]. 2010, roč. 43, č. 1, s. 77-80 [cit. 2014-03-06]. 0018-9162. Dostupné z: http://ezproxy.muni.cz/login?url=http://search.ebscohost.com/login.aspx?direct=true&AuthType=ip,cookie,uid&db=a9h&AN=48241093&lang=cs&site=eds-live&scope=site

Zdroje

  • CHATFIELD, Tom. Digitální svět: 50 myšlenek, které musíte znát. Vyd. 1. Překlad Irena Grusová. Praha: Slovart, 208. ISBN 978-807-3917-203.
  • THE RDF WEB APPS WORKING GROUP AT W3C. RDFa: The Resource Description Framework in Attributes [online]. 2014 [cit. 2014-03-06]. Dostupné z: http://rdfa.info/

Rozšiřující materiály

  • IKAROS, Redakce. Sémantické vyhledávání je blíže? (Vilém Sklenák). Ikaros [online]. 2009, roč. 13, 5/2 [cit. 2014-03-06]. Dostupné z: http://www.ikaros.cz/node/5473