Linked data
Autor: Martin Holec
Klíčová slova: web, data, RDF
Synonyma: propojená data
Související pojmy: metadata, hypertext, silo problem, ontology, open data
nadřazené - sémantický web; vyhledávání
podřazené - RDF, Web of Data, FOAF
Definice
Linked Data využívají Webu k propojení dat pocházejících z různých zdrojů. Příkladem mohou být databáze spravované dvěma různými organizacemi vzájemně spojenými sítí nebo heterogenní systémy v rámci jedné organizace, které nejsou vzájemně interoperabilní na úrovni dat. Linked Data jsou data publikovaná na Webu ve strojově čitelné podobě, odkazují na externí zdroje dat a umožňují, aby na ně odkazovaly další data. Od klasického hypertextového Webu propojeného odkazy se Linked Data liší použitím jazyka RDF pro ukládání dat s popisem jejich sémantického významu. Výsledkem je Web of Data, který lze popsat jako síť entit vyjádřených vzájemně propojenými daty na Webu. [1]
Pravidla
"Tim Berners-Lee v roce 2006 vytvořil soubor pravidel pro publikování Linked Data na Webu, tak aby se data staly součástí globálního celku:
- Použití URI pro pojmenování entit.
- Použití HTTP URI aby bylo možné tyto pojmy vyhledávat
- Poskytovat užitečné informace při vyhledávání prostřednictvím URI použitím standardů (RDF, SPARQL).
- Zahrnout odkazy na další URI pro vyhledávání ostatních entit.
Tyto principy Linked Data poskytují základní návod pro publikování a propojování dat užitím webové infrastruktury s využitím webových standardů a architektury." [2]
Linked Data řeší tzv. silo problem, resp. pohled na databáze jako na uzavřené celky uvnitř organizací. Tento pohled je založený na předpokladech ze 70. let, kdy přístup k databázím měla jen hrstka expertů znající vnitřní schéma databáze a význam dat v ní uložený. Linked Data usnadňují integraci dat z různých zdrojů, tvorbu tzv. data mashing. Což je obvykle časově náročná a drahá činnost.
Vztah k otevřeným datům
Linked Data (Propojená data) jsou princip reprezentace a propojování dat. Otevřená data[3] se zabývají přístupností dat z hlediska práva (otevřené podmínky užití, otevřené formáty) a technologií (strukturovaná data). Z hlediska otevřených dat jsou propojená data nejlepším technickým způsobem publikace otevřených dat. Data, která jsou publikována dle principů propojených dat, a jsou zároveň otevřená, se nazývají propojená otevřená data (Linked Open Data). Vzniklý Web dat (Web of Data) je pak globální distribuovaná databáze umožňující vznik nových aplikací. Publikace otevřených propojených dat v České republice se řídí Otevřenou formální normou Propojená data[4], kterou vydává Ministerstvo vnitra.
Databáze a vyhledavače
- The Linking Open Data Project - Projekt vznikl v roce 2007. Jeho cílem je podpořit vznik Web of Data převodem existujících Open Data do formátu RDF a jejich publikováním na Webu.
- DBpedia - Získává strukturované informace z Wikipedie. V součanosti obsahuje 4,58 milionu entit. DBpedia je centrálním uzlem rozvíjejícího se Web Of Data. Jen v roce 2009 obsahovala 2,6 milionu entit a odkazovala na 4,7 miliardy informací.
- GeoNames - Geografická databáze čítající více než 10 miliónů názvů. Kromě názvů v různých jazycích obsahuje geografická data a souřadnice.
- FOAF search engine - Friend of a friend (FOAF) je decentralizovaná sociální síť využívající Linked Data.
Citace
- ↑ SHETH, Amit. Semantic Services, Interoperability and Web Applications: Emerging Concepts: Emerging Concepts. Information Science Reference [online]. 30/6/2011 [cit. 2015-02-11]. Dostupný z WWW: <http://www.google.cz/books?id=tP8HLETgbKcC>. ISBN 9781609605940
- ↑ BERNERS-LEE, Tim. Linked Data - Design Issue. The World Wide Web Consortium (W3C) [online]. 27/7/2006 [cit. 2015-02-12]. Dostupný z WWW: <http://www.w3.org/DesignIssues/LinkedData.html>.
- ↑ Ministerstvo vnitra. Otevřená data. Dostupné z: https://data.gov.cz/
- ↑ Ministerstvo vnitra. Propojená data. Dostupné z: https://data.gov.cz/otevřené-formální-normy/propojená-data/
Použité zdroje
SHETH, Amit. Semantic Services, Interoperability and Web Applications: Emerging Concepts. Information Science Reference [online]. 30/6/2011 [cit. 2015-02-11]. Dostupný z WWW: <http://www.google.cz/books?id=tP8HLETgbKcC>. ISBN 9781609605940
BIZER, Christian, HEATH, Tom, BERNERS-LEE, Tim. Linked Data - The Story So Far. International Journal on Semantic Web and Information Systems (IJSWIS). [online]. 2009 [cit. 2015-02-12]. Dostupný z WWW: <http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf>.
DBpedia 2014 Data Set Statistics. DBpedia [online]. 1/9/2014 [cit. 2015-02-12]. Dostupný z WWW: <http://wiki.dbpedia.org/Datasets2014/DatasetStatistics>.
BIZER, C; et al. DBpedia - A crystallization point for the Web of Data. Web Semantics: Science, Services and Agents on the World Wide Web. [online]. 1/1/2009 [cit. 2015-02-12]. Dostupný z WWW: <http://linkinghub.elsevier.com/retrieve/pii/S1570826809000225>. ISSN 1570-8268
About GeoNames. GeoNames [online]. [cit. 2015-02-13]. Dostupný z WWW: <http://www.geonames.org/about.html>.
BRICKLEY, Dan, MILLER, Libby. FOAF Vocabulary Specification 0.99. foaf-project.org [online]. 14/1/2014 [cit. 2015-02-13]. Dostupný z WWW: <http://xmlns.com/foaf/spec/>.
BAUER, Florian, KALTENBÖCK, Martin. Linked Open Data: The Essentials: A Quick Start Guide for Decision Makers. edition mono/monochrom, Vienna, Austria [online]. 2012 [cit. 2015-02-11]. Dostupný z WWW: <http://www.semantic-web.at/LOD-TheEssentials.pdf>. ISBN 9783902796059