Metadatová schémata - srovnání: Porovnání verzí

Z WikiKnihovna
Řádek 17: Řádek 17:
  
 
Machine-Readable Cataloging (MARC, strojově čitelná katalogizace) je rodina formátů a standardů určených pro ukládání a přenos bibliografických informací. Vznik se datuje do 60. let 20. století, vyvinula je Kongresová knihovna za účelem digitalizace knihovních katalogů, projekt vedla Henriette Avramová. Jedná se o relativně zastaralé a velmi složité formáty, ovšem velmi popisné. Je mu vlastní velká uživatelská základna a miliardy záznamů. Mezi nejvýznamnější formáty patří MARC 21 a MARCXML.<ref>MARC Standards [online]. Network Development and MARC Standards Office, The Library of Congress, 5. 4. 2011 [cit. 2. 5. 2011]. Dostupné
 
Machine-Readable Cataloging (MARC, strojově čitelná katalogizace) je rodina formátů a standardů určených pro ukládání a přenos bibliografických informací. Vznik se datuje do 60. let 20. století, vyvinula je Kongresová knihovna za účelem digitalizace knihovních katalogů, projekt vedla Henriette Avramová. Jedná se o relativně zastaralé a velmi složité formáty, ovšem velmi popisné. Je mu vlastní velká uživatelská základna a miliardy záznamů. Mezi nejvýznamnější formáty patří MARC 21 a MARCXML.<ref>MARC Standards [online]. Network Development and MARC Standards Office, The Library of Congress, 5. 4. 2011 [cit. 2. 5. 2011]. Dostupné
na Internetu: <http://loc.gov/marc>.</ref><ref name="drusa">Drusa. Konvertor bibliografických formátů</ref> MARC jako základ zápisu používá tři prvky - strukturu záznamu (tříciferný kód, definuje význam záznamu (název, jméno autora atd.) ISO 2709 a Z39), označení obsahu (tzn. třímístné číselné kódy charakterizující údajové prvky a podporující manipulaci s údaji a interpretaci obsahu - např. případné rozdělení osbahu na části; liší se podle verze MARC) a obsah záznamu (obsah jednotlivých polí definují různé standardy - např. ISBD či AACR2, jedná se jednoduchý textový řetězec, jenž lze rozdělit na části pomocí oddělovače, každá část může mít specifický význam, oddělovač doplňuje znak definující pořadí části).<ref>Talich. FORMÁTY REPOZITÁŘŮ DIGITÁLNÍCH KNIHOVEN</ref> Vzhledem k tehdejší kapacitě úložišť a jejich technickým možnostem byl navržen efektivně a tak aby velikost záznamu byla co nejmenší. Kvůli tomuto místo pojmenování záznamů používá jednoduché číselné kódy, což je v současnosti jeho hlavní nevýhodou, neboť je kvůli tomu pro laika nečitelný.<ref name="drusa"/> MARC byl původně vytvořen pouze pro potřeby knihoven, později se přizpůsobil i pro využití k popisu digitálních objektů. Slouží ke zpracování a identifikaci bibliografických prvků a k jejich výměně mezi institucemi (především knihovnami), které jej používají. Používá se i název výměnný formát.<ref>BARTOŠEK, Miroslav. Digitální knihovny - teorie a praxe. Národní knihovna: knihovnická revue[online]. Praha: Národní knihovna ČR, 2004. 2004, roč. 15, č. 4 [cit. 2012-04-26], s. 233-254. Dostupný z WWW: <http://knihovna.nkp.cz/NKKR0404/0404233.html>. ISSN 1214-0678.</ref> Prvními uživateli bylo 16 knihoven, které si záznamy vyměňovaly na magnetických páscích. V 70. letech se rozšířil do knihoven po celém světě. Základ zůstal stejný, avšak vzniklo mnoho národních mutací (např. USMARC – USA, UKMARC – Spojené království, CANMARC – Kanada, DANMARC – Dánsko, Japan/MARC – Japonsko). Ovšem tyto národní formáty mezi sebou nejsou dostatečně kompatibilní, což znemožňuje plnohodnotnou výměnu záznamů. Proto vznikl mezinárodní formát MARC 21, který se inspiroval americkou a kanadskou formou a nahradil ve většině zemí stávající formáty. K tomu došlo i v České republice, která do té doby používala UNIMARC, který vytvořila IFLA roku 1977. Později vznikl MARCXML spojením standardů MARC a jazyka SGML.<ref name="svastova"/> Kvůli vysoké náročnosti a rozsáhlosti formátu MARC je třeba řádně proškolit katalogizátory (manuál má skoro tisíc stran a k tomu ještě katalogizační pravidla AACR2 a další standardy k užívání MARC), přesto to je velká náchylnost k chybám. Velkou výhodou je dokonalá popisnost se všemi podrobnostmi o díle. Díky MARC 21 v prostředí XML jej lze využít pro původní popis či jako flexibilní formát pro konverzi záznamů do jiných schémat (především MODS a Dublin Core).<ref>MARCXML : MARC 21 XML Schema [online]. The Library of Congress, 2007 [cit. 2012-04-26]. Dostupný z WWW: <http://www.loc.gov/standards/marcxml/>.</ref>
+
na Internetu: <http://loc.gov/marc>.</ref><ref name="drusa">Drusa. Konvertor bibliografických formátů</ref> MARC jako základ zápisu používá tři prvky - strukturu záznamu (tříciferný kód, definuje význam záznamu (název, jméno autora atd.) ISO 2709 a Z39), označení obsahu (tzn. třímístné číselné kódy charakterizující údajové prvky a podporující manipulaci s údaji a interpretaci obsahu - např. případné rozdělení osbahu na části; liší se podle verze MARC) a obsah záznamu (obsah jednotlivých polí definují různé standardy - např. ISBD či AACR2, jedná se jednoduchý textový řetězec, jenž lze rozdělit na části pomocí oddělovače, každá část může mít specifický význam, oddělovač doplňuje znak definující pořadí části).<ref name="talich">Talich. FORMÁTY REPOZITÁŘŮ DIGITÁLNÍCH KNIHOVEN</ref> Vzhledem k tehdejší kapacitě úložišť a jejich technickým možnostem byl navržen efektivně a tak aby velikost záznamu byla co nejmenší. Kvůli tomuto místo pojmenování záznamů používá jednoduché číselné kódy, což je v současnosti jeho hlavní nevýhodou, neboť je kvůli tomu pro laika nečitelný.<ref name="drusa"/> MARC byl původně vytvořen pouze pro potřeby knihoven, později se přizpůsobil i pro využití k popisu digitálních objektů. Slouží ke zpracování a identifikaci bibliografických prvků a k jejich výměně mezi institucemi (především knihovnami), které jej používají. Používá se i název výměnný formát.<ref>BARTOŠEK, Miroslav. Digitální knihovny - teorie a praxe. Národní knihovna: knihovnická revue[online]. Praha: Národní knihovna ČR, 2004. 2004, roč. 15, č. 4 [cit. 2012-04-26], s. 233-254. Dostupný z WWW: <http://knihovna.nkp.cz/NKKR0404/0404233.html>. ISSN 1214-0678.</ref> Prvními uživateli bylo 16 knihoven, které si záznamy vyměňovaly na magnetických páscích. V 70. letech se rozšířil do knihoven po celém světě. Základ zůstal stejný, avšak vzniklo mnoho národních mutací (např. USMARC – USA, UKMARC – Spojené království, CANMARC – Kanada, DANMARC – Dánsko, Japan/MARC – Japonsko). Ovšem tyto národní formáty mezi sebou nejsou dostatečně kompatibilní, což znemožňuje plnohodnotnou výměnu záznamů. Proto vznikl mezinárodní formát MARC 21, který se inspiroval americkou a kanadskou formou a nahradil ve většině zemí stávající formáty. K tomu došlo i v České republice, která do té doby používala UNIMARC, který vytvořila IFLA roku 1977. Později vznikl MARCXML spojením standardů MARC a jazyka SGML.<ref name="svastova"/> Kvůli vysoké náročnosti a rozsáhlosti formátu MARC je třeba řádně proškolit katalogizátory (manuál má skoro tisíc stran a k tomu ještě katalogizační pravidla AACR2 a další standardy k užívání MARC), přesto to je velká náchylnost k chybám. Velkou výhodou je dokonalá popisnost se všemi podrobnostmi o díle. Díky MARC 21 v prostředí XML jej lze využít pro původní popis či jako flexibilní formát pro konverzi záznamů do jiných schémat (především MODS a Dublin Core).<ref>MARCXML : MARC 21 XML Schema [online]. The Library of Congress, 2007 [cit. 2012-04-26]. Dostupný z WWW: <http://www.loc.gov/standards/marcxml/>.</ref>
  
 +
Dublin Core je obecnější sada metadat. Není to typický bibliografický formát, je to spíše standart, který definuje pouze značky, jejich vyplnění a konkrétní zápis závisí na uživateli. Nejčastěji se užívá v metatazích X/HTML a v rámci RDF. Název vznikl podle města Dublin ve státě Ohio. Tam se v roce 1995 konal OCLC5/NCSA6 Metadata Workshop, kde odborníci stanovili základní, minimální a univerzální sadu metadat (Core - jádro).<ref>WEIBEL, S., et al. OCLC/NCSA Metadata Workshop Report [online]. Dublin Core Metadata Initiative, Mar 1995 [cit. 3. 5. 2011]. Dostupné: <http://dublincore.org/workshops/dc1/>.</ref> DC má dvě úrovně, základní a vyšší (kvalifikovanou). Základní Dublin Core Metadata Elements Set (DCMES) se skládá z 15 nepovinných prvků (Identifier, Title, Creator, Contributor, Publisher, Subject, Description, Date, Type, Format, Source, Language, Relation, Coverage a Rights), které nemají pevné pořadí a lze je opakovat. Vyšší (kvalifikovaná) úroveň navíc obsahuje tři prvky (Audience, Provenance a RightsHolder) a umožňuje využívat kvalifikátory, které jsou připojeny k prvku či hodnotě a upřesňují jejich význam nebo formát, tedy sémantiku. K jejich vyhodnocování se používá tzv. Dumb-Down Principle. Což znamená, že pokud není známý význam kvalifikátoru, tak se ignoruje a jeho hodnota se vyhodnocuje v širším kontextu nadřazeného prvku.<ref name="drusa"/> Slouží pro popis digitálních objektů, vznikl pro sjednocení mnoha formátů popisných metadat, které se používají v různých oborech, do jednoho dostatečně obecného formátu, který bude čitelný i pro laika. Používá se k popisu libovolného digitálního zdroje (od webových stránek po hudební partitury). Nejčastěji se k zápisu elementů DC používá jazyk XML.<ref name="talich"/><ref>Skonnard, Aaron; Gudgin, Martin: XML pohotová referenční příručka. Grada. 2006. ISBN 80-247-0972-4</ref>
  
 
== Struktura ==
 
== Struktura ==

Verze z 26. 4. 2012, 09:08

Autor: Jana Lánová

Klíčová slova:

Synonyma:

Související pojmy:

nadřazené

podřazené MODS, MARC, Dublin Core, Text Encoding Initiative

Vznik

Metadatové schéma MODS (Metadata Object Description Schema) vytvořili odborníci z Kongresové knihovny a Marc Standard Office[1] Provozovatelé digitálních knihoven požadovali projekt, který by umožňoval bohatý popis jakéhokoliv dokumentu v XML, správu složitých digitálních objektů a sjednocení metadat z různých schémat (MARC atd.).[2] Původním záměrem bylo vytvořit jej jako podmnožinu MARC, který by měl pouze jiné názvy prvků, poté bylo rozhodnuto, že vnikne nové samostatné schéma. To sice nezahrnuje kompletní set prvků MARC, avšak jeho obsahem jsou i nové prvky. V červnu 2002 vyšla první verzce MODS 1.2. Projekt se nadále rozvíjel, přibyly další atributy a prvky a zlepšila se převoditelnost dat z jiných a do jiných formátů tak, aby se snížila ztrátovost a data se blížila originálu. Poslední verze vyšla v lednu 2008 a nese označení 3.3.[3] MODS se sestává ze souboru bibliografických prvků, který byly speciálně navrženy pro knihovny (dříve pouze pro práci s papírovými dokumenty), použít jej lze však i v jiných institucích, neboť schématem MODS jde popisovat jakékoliv médium (monografie, CD-ROMy, mapy, webové stránky). MODS je založen na jazyce XML.[4] Pomocí šablon do něj lze převádět data z MARC či Dublin Core.[3] Obsah prvků lze instruovat jakýmikoliv katalogizačními pravidly, doporučené je používat AACR2. Šablona XSLT automaticky generuje interpunkci ISBD podle jednotlivých tagů. Při konverzi záznamů z MARC 21, kde se interpunkce vkládá ručně, může docházet ke zdvojení.[3] K plné verzi MODS vznikla i jednodušší verze MODS Lite s 15 prvky, které má i nekvalifikovaný Dublin Core, čímž ho dokáže nahradit a díky stejným prvkům umožňuje lepší převádění záznamů mezi MODS a DC.[3] Verze 3.3 čítá 20 základních prvků umožňující popsat dokument. Prvky se dále dělí na podprvky (dílčí prvky). K jednotlivým prvkům i podprvkům lze přiřadit atributy, které jsou ovšem nepovinné. Prvky i podprvky se dají opakovat. Podprvky musí dodržovat přesně dané pořadí, atributy žádné takové pevné pořadí nemají a nedají se opakovat. Kořenový prvek <mods> uzavírá celý obsah. Na rozdíl od MARC 21 lze význam většiny prvků a atributů pochopit přímo ze záznamu, aniž bychom potřebovali manuál.[1] MODS se používá v knihovních katalozích, archivech, muzeích, digitálních knihovnách či k popisu webových stránek. Popisují se jím papírové knihy, digitální objekty, hudební partitury, obrazy, videa či 3D objekty. Lze vytvořit individuální schéma pouze s prvky, které jsou potřeba. Umožňuje tvorbu originálních popisků v XML a konverzi dat z MARC 21 a Dublin Core, tudíž instituce nemusí při přechodu na MODS znovu katalogizovat celý fond.[1] Používá se ve webovém archivu Minerva, hudebním archivu MusicAustralia či v programu Biblio. Většina projektů na bázi MODS se realizuje v USA, postupně se rozšiřuje i do Velké Británie, Japonska, Brazílie nebo Řecka. U nás se uvažuje o jeho zavedení především v projektech digitálních depozitních knihoven, například v rámci integrace Jednotné informační brány a dalších nadnárodních portálů.[1] Byl vyvinut jako kompromis mezi jednoduchým formátem Dublin Core a specializovaným a těžko čitelným MARC, při vývoji byl kladen důraz na snížení ztrátovosti při převádění z a do jiných formátů. Elementy MODS byly optimalizovány pro popis bibliografických metadat. Díky podprvkům lze dosáhnout větší detailnosti a přesnosti popisu.[1]

Machine-Readable Cataloging (MARC, strojově čitelná katalogizace) je rodina formátů a standardů určených pro ukládání a přenos bibliografických informací. Vznik se datuje do 60. let 20. století, vyvinula je Kongresová knihovna za účelem digitalizace knihovních katalogů, projekt vedla Henriette Avramová. Jedná se o relativně zastaralé a velmi složité formáty, ovšem velmi popisné. Je mu vlastní velká uživatelská základna a miliardy záznamů. Mezi nejvýznamnější formáty patří MARC 21 a MARCXML.[5][6] MARC jako základ zápisu používá tři prvky - strukturu záznamu (tříciferný kód, definuje význam záznamu (název, jméno autora atd.) ISO 2709 a Z39), označení obsahu (tzn. třímístné číselné kódy charakterizující údajové prvky a podporující manipulaci s údaji a interpretaci obsahu - např. případné rozdělení osbahu na části; liší se podle verze MARC) a obsah záznamu (obsah jednotlivých polí definují různé standardy - např. ISBD či AACR2, jedná se jednoduchý textový řetězec, jenž lze rozdělit na části pomocí oddělovače, každá část může mít specifický význam, oddělovač doplňuje znak definující pořadí části).[7] Vzhledem k tehdejší kapacitě úložišť a jejich technickým možnostem byl navržen efektivně a tak aby velikost záznamu byla co nejmenší. Kvůli tomuto místo pojmenování záznamů používá jednoduché číselné kódy, což je v současnosti jeho hlavní nevýhodou, neboť je kvůli tomu pro laika nečitelný.[6] MARC byl původně vytvořen pouze pro potřeby knihoven, později se přizpůsobil i pro využití k popisu digitálních objektů. Slouží ke zpracování a identifikaci bibliografických prvků a k jejich výměně mezi institucemi (především knihovnami), které jej používají. Používá se i název výměnný formát.[8] Prvními uživateli bylo 16 knihoven, které si záznamy vyměňovaly na magnetických páscích. V 70. letech se rozšířil do knihoven po celém světě. Základ zůstal stejný, avšak vzniklo mnoho národních mutací (např. USMARC – USA, UKMARC – Spojené království, CANMARC – Kanada, DANMARC – Dánsko, Japan/MARC – Japonsko). Ovšem tyto národní formáty mezi sebou nejsou dostatečně kompatibilní, což znemožňuje plnohodnotnou výměnu záznamů. Proto vznikl mezinárodní formát MARC 21, který se inspiroval americkou a kanadskou formou a nahradil ve většině zemí stávající formáty. K tomu došlo i v České republice, která do té doby používala UNIMARC, který vytvořila IFLA roku 1977. Později vznikl MARCXML spojením standardů MARC a jazyka SGML.[1] Kvůli vysoké náročnosti a rozsáhlosti formátu MARC je třeba řádně proškolit katalogizátory (manuál má skoro tisíc stran a k tomu ještě katalogizační pravidla AACR2 a další standardy k užívání MARC), přesto to je velká náchylnost k chybám. Velkou výhodou je dokonalá popisnost se všemi podrobnostmi o díle. Díky MARC 21 v prostředí XML jej lze využít pro původní popis či jako flexibilní formát pro konverzi záznamů do jiných schémat (především MODS a Dublin Core).[9]

Dublin Core je obecnější sada metadat. Není to typický bibliografický formát, je to spíše standart, který definuje pouze značky, jejich vyplnění a konkrétní zápis závisí na uživateli. Nejčastěji se užívá v metatazích X/HTML a v rámci RDF. Název vznikl podle města Dublin ve státě Ohio. Tam se v roce 1995 konal OCLC5/NCSA6 Metadata Workshop, kde odborníci stanovili základní, minimální a univerzální sadu metadat (Core - jádro).[10] DC má dvě úrovně, základní a vyšší (kvalifikovanou). Základní Dublin Core Metadata Elements Set (DCMES) se skládá z 15 nepovinných prvků (Identifier, Title, Creator, Contributor, Publisher, Subject, Description, Date, Type, Format, Source, Language, Relation, Coverage a Rights), které nemají pevné pořadí a lze je opakovat. Vyšší (kvalifikovaná) úroveň navíc obsahuje tři prvky (Audience, Provenance a RightsHolder) a umožňuje využívat kvalifikátory, které jsou připojeny k prvku či hodnotě a upřesňují jejich význam nebo formát, tedy sémantiku. K jejich vyhodnocování se používá tzv. Dumb-Down Principle. Což znamená, že pokud není známý význam kvalifikátoru, tak se ignoruje a jeho hodnota se vyhodnocuje v širším kontextu nadřazeného prvku.[6] Slouží pro popis digitálních objektů, vznikl pro sjednocení mnoha formátů popisných metadat, které se používají v různých oborech, do jednoho dostatečně obecného formátu, který bude čitelný i pro laika. Používá se k popisu libovolného digitálního zdroje (od webových stránek po hudební partitury). Nejčastěji se k zápisu elementů DC používá jazyk XML.[7][11]

Struktura

Použití a využití

Vzájemná kompatibilita a konverze

Výhody/nevýhody

Reference

  1. 1,0 1,1 1,2 1,3 1,4 1,5 Švástová.
  2. GUENTHER, Rebecca S. Using the Metadata Object Description Schema (MODS) for resource description: guidelines and applications. Library Hi Tech. Vol. 22, No 1, January 2004, p. 89-98. MCB University Press. ISSN 0737-8831. Dostupný z WWW:< http://www.ingentaconnect.com/content/mcb/238/2004/00000022/00000001/art00010 >.
  3. 3,0 3,1 3,2 3,3 MODS: Metadata Object Description Schema[online]. 2008 [cit. 2008-03-25] Dostupný z WWW: <http://www.loc.gov/standards/mods/>.
  4. MODS User Guidelines : Introduction and Implementation [online]. 2005 [cit. 2008-03-06]. Dostupný z WWW: <http://www.loc.gov/standards/mods/v3/mods-userguide-intro.html>.
  5. MARC Standards [online]. Network Development and MARC Standards Office, The Library of Congress, 5. 4. 2011 [cit. 2. 5. 2011]. Dostupné na Internetu: <http://loc.gov/marc>.
  6. 6,0 6,1 6,2 Drusa. Konvertor bibliografických formátů
  7. 7,0 7,1 Talich. FORMÁTY REPOZITÁŘŮ DIGITÁLNÍCH KNIHOVEN
  8. BARTOŠEK, Miroslav. Digitální knihovny - teorie a praxe. Národní knihovna: knihovnická revue[online]. Praha: Národní knihovna ČR, 2004. 2004, roč. 15, č. 4 [cit. 2012-04-26], s. 233-254. Dostupný z WWW: <http://knihovna.nkp.cz/NKKR0404/0404233.html>. ISSN 1214-0678.
  9. MARCXML : MARC 21 XML Schema [online]. The Library of Congress, 2007 [cit. 2012-04-26]. Dostupný z WWW: <http://www.loc.gov/standards/marcxml/>.
  10. WEIBEL, S., et al. OCLC/NCSA Metadata Workshop Report [online]. Dublin Core Metadata Initiative, Mar 1995 [cit. 3. 5. 2011]. Dostupné: <http://dublincore.org/workshops/dc1/>.
  11. Skonnard, Aaron; Gudgin, Martin: XML pohotová referenční příručka. Grada. 2006. ISBN 80-247-0972-4