Linked data

Z WikiKnihovna

Autor: Martin Holec

Klíčová slova: web, data, RDF

Synonyma: propojená data

Související pojmy: metadata, hypertext, silo problem, ontology, open data

nadřazené - sémantický web; vyhledávání

podřazené - RDF, Web of Data, FOAF

Definice

Linked Data využívají Webu k propojení dat pocházejících z různých zdrojů. Příkladem mohou být databáze spravované dvěma různými organizacemi vzájemně spojenými sítí nebo heterogenní systémy v rámci jedné organizace, které nejsou vzájemně interoperabilní na úrovni dat. Linked Data jsou data publikovaná na Webu ve strojově čitelné podobě, odkazují na externí zdroje dat a umožňují, aby na ně odkazovaly další data. Od klasického hypertextového Webu propojeného odkazy se Linked Data liší použitím jazyka RDF pro ukládání dat s popisem jejich sémantického významu. Výsledkem je Web of Data, který lze popsat jako síť entit vyjádřených vzájemně propojenými daty na Webu. [1]

Pravidla

"Berners-Lee v roce 2006 vytvořil soubor pravidel pro publikování Linked Data na Webu, tak aby se data staly součástí globálního celku:

  1. Použití URI pro pojmenování entit.
  2. Použití HTTP URI aby bylo možné tyto pojmy vyhledávat
  3. Poskytovat užitečné informace při vyhledávání prostřednictvím URI použitím standardů (RDF, SPARQL).
  4. Zahrnout odkazy na další URI pro vyhledávání ostatních entit.

Tyto principy Linked Data poskytují základní návod pro publikování a propojování dat užitím webové infrastruktury s využitím webových standardů a architektury." [2]

Linked Data řeší tzv. silo problem, resp. pohled na databáze jako na uzavřené celky uvnitř organizací. Tento pohled je založený na předpokladech ze 70. let, kdy přístup k databázím měla jen hrstka expertů znající vnitřní schéma databáze a význam dat v ní uložený. Linked Data usnadňují integraci dat z různých zdrojů, tvorbu tzv. data mashing. Což je obvykle časově náročná a drahá činnost.

Vztah k Open Data

Linked Data jsou součástí "modelu 5 hvězd" (5 Stars Model) představeného Tim Berners-Lee, kde Open Data jsou propojeny s dalšími daty za účelem vytvoření kontextu. Mezi Open Data a Linked Data je však rozdíl v základní myšlence, kde Open Data staví na konceptu sociálního webu, naopak Linked Data pochází původně ze sémantického webu. Proto se používá kombinovaný pojem Linked Open Data. Ty se stávají důležitým zdrojem informací a dat o státu a organizacích. Vzniklý Web of Data je obrovská globální databáze umožňující vznik nových aplikací. Mezi příklady aplikací patří sledování ekonomického růstu, spotřeby elektrické energie a podílu obnovitelných zdrojů na její výrobě, úmrtnost nebo třeba veřejné náklady na vzdělávání.


Databáze a vyhledavače

  1. The Linking Open Data Project - Projekt vznikl v roce 2007. Jeho cílem je podpořit vznik Web of Data převodem existujících Open Data do formátu RDF a jejich publikováním na Webu.
  2. DBpedia - Získává strukturované informace z Wikipedie. V součanosti obsahuje 4,58 milionu entit. DBpedia je centrálním uzlem rozvíjejícího se Web Of Data. Jen v roce 2009 obsahovala 2,6 milionu entit a odkazovala na 4,7 miliardy informací.
  3. GeoNames - Geografická databáze čítající více než 10 miliónů názvů. Kromě názvů v různých jazycích obsahuje geografická data a souřadnice.
  4. FOAF search engine - Friend of a friend (FOAF) je decentralizovaná sociální síť využívající Linked Data.

Citace

  1. SHETH, Amit. Semantic Services, Interoperability and Web Applications: Emerging Concepts: Emerging Concepts. Information Science Reference [online]. 30/6/2011 [cit. 2015-02-11]. Dostupný z WWW: <http://www.google.cz/books?id=tP8HLETgbKcC>. ISBN 9781609605940
  2. BERNERS-LEE, Tim. Linked Data - Design Issue. The World Wide Web Consortium (W3C) [online]. 27/7/2006 [cit. 2015-02-12]. Dostupný z WWW: <http://www.w3.org/DesignIssues/LinkedData.html>.

Použité zdroje

SHETH, Amit. Semantic Services, Interoperability and Web Applications: Emerging Concepts. Information Science Reference [online]. 30/6/2011 [cit. 2015-02-11]. Dostupný z WWW: <http://www.google.cz/books?id=tP8HLETgbKcC>. ISBN 9781609605940

BIZER, Christian, HEATH, Tom, BERNERS-LEE, Tim. Linked Data - The Story So Far. International Journal on Semantic Web and Information Systems (IJSWIS). [online]. 2009 [cit. 2015-02-12]. Dostupný z WWW: <http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf>.

DBpedia 2014 Data Set Statistics. DBpedia [online]. 1/9/2014 [cit. 2015-02-12]. Dostupný z WWW: <http://wiki.dbpedia.org/Datasets2014/DatasetStatistics>.

BIZER, C; et al. DBpedia - A crystallization point for the Web of Data. Web Semantics: Science, Services and Agents on the World Wide Web. [online]. 1/1/2009 [cit. 2015-02-12]. Dostupný z WWW: <http://linkinghub.elsevier.com/retrieve/pii/S1570826809000225>. ISSN 1570-8268

About GeoNames. GeoNames [online]. [cit. 2015-02-13]. Dostupný z WWW: <http://www.geonames.org/about.html>.

BRICKLEY, Dan, MILLER, Libby. FOAF Vocabulary Specification 0.99. foaf-project.org [online]. 14/1/2014 [cit. 2015-02-13]. Dostupný z WWW: <http://xmlns.com/foaf/spec/>.

BAUER, Florian, KALTENBÖCK, Martin. Linked Open Data: The Essentials: A Quick Start Guide for Decision Makers. edition mono/monochrom, Vienna, Austria [online]. 2012 [cit. 2015-02-11]. Dostupný z WWW: <http://www.semantic-web.at/LOD-TheEssentials.pdf>. ISBN 9783902796059