Linked data

Z WikiKnihovna
Přejít na: navigace, hledání

Autor: Martin Holec

Klíčová slova: web, data, RDF

Synonyma: propojená data

Související pojmy: metadata, hypertext, silo problem, ontology, open data

nadřazené - sémantický web; vyhledávání
podřazené - RDF, Web of Data, FOAF

Definice

Linked Data využívají Webu k propojení dat pocházejících z různých zdrojů. Příkladem mohou být databáze spravované dvěma různými organizacemi vzájemně spojenými sítí nebo heterogenní systémy v rámci jedné organizace, které nejsou vzájemně interoperabilní na úrovni dat. Linked Data jsou data publikovaná na Webu ve strojově čitelné podobě, odkazují na externí zdroje dat a umožňují, aby na ně odkazovaly další data. Od klasického hypertextového Webu propojeného odkazy se Linked Data liší použitím jazyka RDF pro ukládání dat s popisem jejich sémantického významu. Výsledkem je Web of Data, který lze popsat jako síť entit vyjádřených vzájemně propojenými daty na Webu. [1]

Pravidla

"Tim Berners-Lee v roce 2006 vytvořil soubor pravidel pro publikování Linked Data na Webu, tak aby se data staly součástí globálního celku:

  1. Použití URI pro pojmenování entit.
  2. Použití HTTP URI aby bylo možné tyto pojmy vyhledávat
  3. Poskytovat užitečné informace při vyhledávání prostřednictvím URI použitím standardů (RDF, SPARQL).
  4. Zahrnout odkazy na další URI pro vyhledávání ostatních entit.

Tyto principy Linked Data poskytují základní návod pro publikování a propojování dat užitím webové infrastruktury s využitím webových standardů a architektury." [2]

Linked Data řeší tzv. silo problem, resp. pohled na databáze jako na uzavřené celky uvnitř organizací. Tento pohled je založený na předpokladech ze 70. let, kdy přístup k databázím měla jen hrstka expertů znající vnitřní schéma databáze a význam dat v ní uložený. Linked Data usnadňují integraci dat z různých zdrojů, tvorbu tzv. data mashing. Což je obvykle časově náročná a drahá činnost.



Vztah k otevřeným datům

Linked Data (Propojená data) jsou princip reprezentace a propojování dat. Otevřená data[3] se zabývají přístupností dat z hlediska práva (otevřené podmínky užití, otevřené formáty) a technologií (strukturovaná data). Z hlediska otevřených dat jsou propojená data nejlepším technickým způsobem publikace otevřených dat. Data, která jsou publikována dle principů propojených dat, a jsou zároveň otevřená, se nazývají propojená otevřená data (Linked Open Data). Vzniklý Web dat (Web of Data) je pak globální distribuovaná databáze umožňující vznik nových aplikací. Publikace otevřených propojených dat v České republice se řídí Otevřenou formální normou Propojená data[4], kterou vydává Ministerstvo vnitra.

Databáze a vyhledavače

  1. The Linking Open Data Project - Projekt vznikl v roce 2007. Jeho cílem je podpořit vznik Web of Data převodem existujících Open Data do formátu RDF a jejich publikováním na Webu.
  2. DBpedia - Získává strukturované informace z Wikipedie. V součanosti obsahuje 4,58 milionu entit. DBpedia je centrálním uzlem rozvíjejícího se Web Of Data. Jen v roce 2009 obsahovala 2,6 milionu entit a odkazovala na 4,7 miliardy informací.
  3. GeoNames - Geografická databáze čítající více než 10 miliónů názvů. Kromě názvů v různých jazycích obsahuje geografická data a souřadnice.
  4. FOAF search engine - Friend of a friend (FOAF) je decentralizovaná sociální síť využívající Linked Data.

Citace

  1. SHETH, Amit. Semantic Services, Interoperability and Web Applications: Emerging Concepts: Emerging Concepts. Information Science Reference [online]. 30/6/2011 [cit. 2015-02-11]. Dostupný z WWW: <http://www.google.cz/books?id=tP8HLETgbKcC>. ISBN 9781609605940
  2. BERNERS-LEE, Tim. Linked Data - Design Issue. The World Wide Web Consortium (W3C) [online]. 27/7/2006 [cit. 2015-02-12]. Dostupný z WWW: <http://www.w3.org/DesignIssues/LinkedData.html>.
  3. Ministerstvo vnitra. Otevřená data. Dostupné z: https://data.gov.cz/
  4. Ministerstvo vnitra. Propojená data. Dostupné z: https://data.gov.cz/otevřené-formální-normy/propojená-data/

Použité zdroje

SHETH, Amit. Semantic Services, Interoperability and Web Applications: Emerging Concepts. Information Science Reference [online]. 30/6/2011 [cit. 2015-02-11]. Dostupný z WWW: <http://www.google.cz/books?id=tP8HLETgbKcC>. ISBN 9781609605940

BIZER, Christian, HEATH, Tom, BERNERS-LEE, Tim. Linked Data - The Story So Far. International Journal on Semantic Web and Information Systems (IJSWIS). [online]. 2009 [cit. 2015-02-12]. Dostupný z WWW: <http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf>.

DBpedia 2014 Data Set Statistics. DBpedia [online]. 1/9/2014 [cit. 2015-02-12]. Dostupný z WWW: <http://wiki.dbpedia.org/Datasets2014/DatasetStatistics>.

BIZER, C; et al. DBpedia - A crystallization point for the Web of Data. Web Semantics: Science, Services and Agents on the World Wide Web. [online]. 1/1/2009 [cit. 2015-02-12]. Dostupný z WWW: <http://linkinghub.elsevier.com/retrieve/pii/S1570826809000225>. ISSN 1570-8268

About GeoNames. GeoNames [online]. [cit. 2015-02-13]. Dostupný z WWW: <http://www.geonames.org/about.html>.

BRICKLEY, Dan, MILLER, Libby. FOAF Vocabulary Specification 0.99. foaf-project.org [online]. 14/1/2014 [cit. 2015-02-13]. Dostupný z WWW: <http://xmlns.com/foaf/spec/>.

BAUER, Florian, KALTENBÖCK, Martin. Linked Open Data: The Essentials: A Quick Start Guide for Decision Makers. edition mono/monochrom, Vienna, Austria [online]. 2012 [cit. 2015-02-11]. Dostupný z WWW: <http://www.semantic-web.at/LOD-TheEssentials.pdf>. ISBN 9783902796059