Metadata

Z WikiKnihovna
Přejít na: navigace, hledání

Autor: Jiří Beran

Klíčová slova: metadata; formáty metadat

Synonyma: ---

Související pojmy:

nadřazené: sémantický web; vyhledávání

podřazené: ID3 tag; Dublin Core


Metadata

Metadata jsou data, popisující vlastnosti digitálních objektů. Příkladem budiž datový záznam v hlavičce webových stránek.

Definice

Metadata jsou strukturovaná data - parametry - poskytující základní popisné informace o digitálních objektech, jejichž primárním účelem je usnadnění vyhledávání ve zdrojích. Zahrnují elementární informace o primárních datech, strukturované dle určitých pravidel a standardů, čímž zefektivňují spravování velkého množství objektů v datových strukturách. Z definice vyplývá, že metadata sama mohou být předmětem popisu.

Metadata jsou zadávána informačním jazykem a tedy strojově čitelná, což vznáší nároky na jejich jednoznačnost a přesné následování pravidel.

Medatada v sobě uchovávají základní informace, jako například údaje o:

- autorovi

- názvu

- předmětu dokumentu

- jazyku dokumentu

- vydavateli

- souvisejících autorských právech


Formáty metadat

Jelikož se historie metadat začíná psát již v osmdesátých letech minulého století, bylo vyvinuto mnoho formátů, většinou však k velmi omezeným účelům. Uveďme několik příkladů:


TEI Independent Headers

Komplexní formát vyvíjený od konce osmdesátých let minulého století v USA. Jeho zaměřením je digitální text a pracuje na principu hlaviček (viz. příklad). Vychází z něj další formáty, jako například Encoding Archival Description) a Computer Interchange of Museum Information.


<title>

<author>

<sponsor>

<funder>

<principal>


GILS Core

Vyvinut USA v roce 1994 pro potřeby informačních zdrojů státní a veřejné správy a je tedy cílen na digitální texty. Jeho účelem je zpřístupňování veřejně garantovaných informací státních orgánů. Vychází z formátu MARC


Title:

Orginator:

Department/Agency Name:

Major Organization Subdivison:

Name of Unit:

Local Subject Index:


Dublin Core Americký projekt z roku 1995. Dublin Core je zaměřen na popis webů, nicméně se vyznačuje značnou univerzalitou, a proto je dnes také nejznámějším a nejrozšířenějším formátem. V základním popisu obsahuje jen nejpodstatnější údaje, což je výhodně předně pro internetové vyhledávání.


<meta name="DC.title" content="" />

<meta name="DC.creator" content="" />

<meta name="DC.subject" content="" />

<meta name="DC.description" content="" />

<meta name="DC.type" scheme="" />

<meta name="DC.format" content="" />

<meta name="DC.format" content="" />

Použití

Metadata jsou mocným nástrojem při vyhledávání digitalizovaných obrazových dokumentů. Při správném popisu jsou vyhledávací engine díky nim schopny dekódovat jejich obsah a přiradit klíčová slova. Pokud tedy zadáme řetězce "stom" "jablko" "dítě", můžeme očekávat, že se nám ve výsledcích zobrazí obrázek s dítětem stojícím pod jabloní (popř. podobné variace).


Podobné principy platí i u audio záznamů, které jsou nejčastěji popisovány pomocí ID3 tagů, ty ovšem nejsou příliš komplexní.


header

title

artist

album

year

comment

zero-byte


V souvislosti s informační dálnicí se očekává nástup metadat v souvislosti se sémantickým webem, jehož myšlenku lze naplnit právě jen skrze metadata. Zde byl k popisu vybrán formát RDF (Resource Description Framework) díky své nezávislosti na konkrétní implementaci.

Použitá literatura

1. EVA, Bratková. Metadata jako nový nástroj pro komunikaci webovských informačních zdrojů. Národní knihovna. Knihovnická revue [online]. 1999, 4, [cit. 2010-06-13]. Dostupný z WWW: <http://knihovna.nkp.cz/Nkkr9904/9904178.html>. ISSN 1214-0678. , National Archives of Australia

2. Digital Preservation Europe [online]. 2009 [cit. 2010-06-13]. Použití metadat ve veřejné správě. Dostupné z WWW: <http://www.digitalpreservationeurope.eu/publications/briefs/cz_uses_of_metadata_in_public_administration.pdf>.

3. Wikipedia: the free encyclopedia [online]. 2001, last modified on 7 June 2010 [cit. 2010-06-13]. Metadata. Dostupné z WWW: <http://en.wikipedia.org/wiki/Metadata>.

4. Dublin Core Czech [online]. c2006, poslední aktualizace 20.11.2006 [cit. 2010-06-13]. Termíny metadat DCMI. Dostupné z WWW: <http://www.ics.muni.cz/dublin_core/terms.html>.

5. P. Matulík, T. Pitner. Sémantický web a jeho technologie. Zpravodaj ÚVT MU. ISSN 1212-0901, 2004, roč. XIV, č. 3, s. 15-17.