Beth - metadatový popis

Z WikiKnihovna

Tato stránka slouží jako závěrečná práce z předmětu Nové technologie v knihovnictví v jarním semestru 2009.

Upřesnění tématu

Česká terminologická databáze knihovnictví a informační vědy (TDKIV) definuje metadatový popis (přesněji metadata) takto:

Strukturovaná data, která nesou informace o primárních datech. Pojem metadat je používán především v souvislosti s elektronickými zdroji a vztahuje se k datům v nejširším smyslu slova (datové soubory, textové informace, obrazové informace, hudba aj.). Funkce metadat je popisná, selekční a archivační. V souvislosti s těmito funkcemi se rozlišují metadata pro účely popisu, správy, právních nároků, technické funkčnosti, užití a archivace...

Ačkoliv definice je zaměřená především na elektronické zdroje, její první věta je nejdůležitější a má obecnou platnost.

Metadatový popis je stěžejním atributem každého zdroje informací a jeho kvalitní a funkční zpracování patří dlouhodobě mezi základní úkoly každého poskytovatele či tvůrce informací. V kontextu konkrétních systémů plní v zásadě čtyři hlavní role:

  1. Údaji se plní rejstříky a indexy, které slouží k vyhledávání dokumentů.
  2. Metadata jsou prezentována uživateli a poskytují mu informace o dokumentu.
  3. Metadata slouží jako další vstupní body do systému, případně jsou body propojení s jinými systémy.
  4. Metadata řídí chování systému.

Tradiční pojetí metadatového popisu předpokládá využívání extenzivních metadatových schémat (typickým příkladem je formát MARC 21) a profesionální zpracování odborníky - katalogizátory v knihovnách. Celý proces spěje k co nejdokonalejšímu a nejobjektivnějšímu popisu zdroje a klade důraz na systematičnost.

S nástupem heterogenních elektronických médií se značně ztížil zvláště formální popis zdrojů. Centrálně udržovaná klasická metadatová schémata nestačí reagovat na vznik nových formátů a médií. Zároveň se prosazuje trend orientace na uživatele, což má za následek zjednodušení metadatového popisu na funkční minimum, které je dostatečné pro identifikaci dokumentu a jeho vyhledání. Metadatová schémata jsou jednoduchá s možností rozšíření. Příkladem může být Dublin Core, který má ve své jednoduché variantě 15 elementů, existuje však i jeho rozšířená (kvalifikovaná) varianta, která představuje kompromis mezi funkční jednoduchostí a popisnou komplexností. Navíc lze vytvářet uživatelské aplikace, které mohou být šity na míru konkrétním a specifickým potřebám instituce či druhu dokumentu.

Trend orientace na uživatele se ovšem v oblasti metadatového popisu projevuje ještě výrazněji. Doposud byl metadatový popis starostí profesionálů - katalogizátorů v knihovnách. Proč by ale metadata nemohli vytvářet sami uživatelé systémů? Různé systémy začaly být obohacovány o možnost přidávání štítků, uživatelských hodnocení, recenzí a komentářů; systémy spravující záložky jsou na uživatelských štítcích založeny. Uživatelská metadata jsou levná (žádní knihovníci, žádná draze udržovaná schémata), populární a do jisté míry funkční. Do konzervativního knihovnického prostředí si hledají cestu pomalu, ale přece. Pro knihovnické systémy jsou obohacením a vstřícným krokem k uživatelům, současně jsou zachovány tradičních přístupy představující stabilitu a funkčnost.

Příklady realizace, popis, analýza

Soubor:Vut full.png
Aleph VUT - úplné zobrazení
Soubor:Vut marc.png
Aleph VUT - zobrazení ve formátu MARC 21

Začněme klasickými knihovními katalogy. Většinou věnují prezentcai metadatového popisu značnou pozornost. Nabízejí několik druhů a formátů zobrazení, často včetně formátu, ve kterém jsou v systému metadata přímo uložena. To může pomoci při práci knihovníkům, nicméně běžného uživatele pramálo zajímá. Zároveň se při zobrazování jednotlivých záznamů příliš kopíruje struktura systému. Záznamy jsou odlišeny na úrovní jednotlivých vydání, což uživatele většinou také nezajímá. Příklady mohou být Souborný katalog knihovne VUT (OPAC systému Aleph) nebo Katalog knihoven Jihočeské Univerzity (Daimon OPAC).

Na obrázcích je možno spatřit, že některé údaje jsou podtrhané - jsou to hypertextové odkazy. Zatím pouze dovnitř systémů, kde slouží jako vstupní body do různých rejstříků a umožňují uživatelům systém procházet, aniž by museli zadávat nové dotazy.

Soubor:Cb full.png
OPAC Jihočeské univerzity - úplné zobrazení
Soubor:Cb marc.png
OPAC Jihočeské univerzity - zobrazení ve formátu MARC 21

Většina systémů vrací jako odpověď na dotaz seznam odpovídajících záznamů ve formě tabulky obsahující základní selekční metadata (Autor, název, rok vydání, lokaci jednotky). Z tabulky vede cesta typicky přes jeden klik na úplný záznam, přes 2 kliky na libovolný formát zobrazení. Není to mnoho, přesto by stálo za to, pokusit se o jednoduché a ergonomické zkracení této cesty. V tomto kokrétním případě je tabulka obohacena o náhled obálky. Ta není uložena v systému, ale prostřednictvím javascriptového rozšíření je získávána ze vzdáleného obálkoveho serveru (http://www.obalkyknih.cz), kterému je předáván jeden z údajů - standardní číslo knihy (ISBN).

Soubor:Vut tabulka.png
Výsledky vyhledávání ve formě tabulky

Jak si jistě všimnete, prezentovaná metadata se systém od systému příliš neliší a to ani když používají odlišná metadatová schémata. Uživatel nemusí vědět, jak jsou metadata v systému uložena, ani je nemusí znát všechna. V následujícím systému (Digitální univerzitní repozitář Univerzity Karlovy v Praze - systém Digitool) jsou metadata uložena ve formátu Dublin Core, přesto se jejich prezentace a obsah od jiných systémů příliš neliší. Většinou se jedná o standradní číslo, názvové údaje, údaje o odpovědnosti, údaje věcného popisu, případně obsahovou charakteriastiku.

Soubor:Cuni full.png
Digitool UK - úplné zobrazení

Doposud platilo, že knihovny jsou pozadu za bouřlivě se rozvíjejícími službami na internetu. Dnes si již producenti a tvůrci knihovních systémů nemohou dovolit ignorovat venkovní svět a začínají do svých produktů implementovat funkcionalitu, která je pro běžného uživatele internetu...běžná. Vedle klasické funkce identifikační a popisné se začíná u metadat klást důraz na funkci propojovací. Knihovní katalogy jsou obohacovány o data z externích systémů nebo nabízejí propojení. Toto bylo umožněno především tím, že velcí hráči (Goolge, Amazon...) otevřeli svá rozhranní systémům třetích stran. Zároveň se knihovní katalogy po vzoru internetu obecně otevřely svým uživatelů a umožnily jikm podílet se na obsahu.

Soubor:Primo.png
University of Iowa - úplné zobrazení

Příkladem budiž systém Primo, konkrétně jeho implementace na University of Iowa. Zde je vidět symbióza mezi starým a novým. Kromě klasického metadatového popisu (1) se zde nachází integrace se systémem poskytujícím obálky (2), deep linky do třetích systémů (3) - obojí na základě standardního čísla; a nakonec je zde možnost doplnit metadata uživateli a to prostřednictvím recenzí (4) nebo štítků (5).

Porovnání, hodnocení

Při porovnání metadatových popisů je potřeba odlišit kvalitu ve smyslu katalogizačním a ve smyslu prezentačním a funkčním. Hodnocení kvality práce katalogizátorů je vysoko nad rámec tohoto článku, zbývá tedy hodnocení prezentace a funkčního využití metadat.

Všechny zmiňované systémy staví uživatele před dilema co se prezentace metadat týče. Buď má k dispozici přehledné tabulkové zobrazení, nebo úplné zobrazení ze všemi případnými funkcemi. Zde se nabízí možnost kompromisu v podobě AJAXového řešení, které by umožňovalo v tabulkovém zobrazení zobrazovat úplný záznam. Beth má tímto stylem vyřešené zobrazování exemplářů.

Ještě není příliš obvyklé, aby se mohli uživatelé podílet na metadatovém popisu. Zvláště užitečnou funkcí je možnost přidání uživatelského hodnocení, které poskytne případnému zájemci cennější informaci o užitečnosti knihy, než suchý popis katalogizátora. Taktéž štítkování může nahradit případné nedostatky v katalogizaci a umožnit snadnější vyhledání pertinentního dokumentu.

Katalogy jsou zatím poměrně uzavřené a nenabízejí mnoho cest ven - do systémů třetích stran, které mohou také uspokojovat uživatelské problémy. I když na tomto poli je situace asi nejlepší, protože realizovat propojení do systému, který většinou má zdokumentované a otevřené rozhraní.

Taktéž je patrná přílišná atomizace záznamů, která uživateli nepomáhá v získání kýženého titulu. Zde by mělo docházet k analýze metadat a slučování záznamů právě na úroveň titulu.

Nejlépe z porovnávaných systémů vychází Primo na University of Iowa, a to zkrátka proto, že je nejnovější a nejmodernější. Vzhledem k velmi omezenému rozsahu srovnání však tento závěr nemá prakticky žádný význam.

Výběr nebo návrh realizace

  1. Sloučení tabulkového a úplného pohledu na záznam. Úplným zánamem zde ovšem nejsou myšlena všechna metadata, ale sekce, ve které by se kromě metadat nacházela rozhraní pro přidávání uživatelských metadat a vstupní body do jiných systémů v kontextu aktuálního záznamu. Uživatel tak bude mít plný přístup k záznamu a neztratí orientaci v celkovém obraze.
  2. Online sloučení podobných či stejných záznamů. Omezí a zpřehlední se výsledková množina, aniž by uživatel utrpěl ztrátu.
  3. Přidání bodů vstupu do jiných systémů. Zde se fantazii meze nekladou. Kromě jednoduchých záležitostí typu odkazů do GoogleBooks, Amazonu či LibraryThing se nabízejí i složitější věci. Bude-li například někdy Beth obsahovat fulltextové indexy knih, které by si koneckonců mohl stahovat z GoogleBooks, bude si moci uživatel na kliknutí ověřit prostřednictvím služby http://odevzdej.cz, jak moc jeho kolegové opisovali z té či které knihy, což bude určitě cenná informace.
  4. Ad hoc anylýzy metadat v reálném čase. Beth by mohl někdy v budoucnu odebírat různými kanály obsahy médií, provádět jejich analýzu, vytvářet selekční obraz aktuální reality a nabízet uživatelům dokumenty, které takovému obrazu odpovídají.

Zdroje