OAI-PMH

Z WikiKnihovna
Verze z 20. 2. 2012, 11:52, kterou vytvořil Michal Klajban (diskuse | příspěvky) (2 revize: IMPORT O: import stránek z hlavního jmenného prostoru z KiskWiki (http://kisk.phil.muni.cz/))

Open Archives Initiative

Rámec pro podporu komunikace mezi informačními systémy na principu sklízení metadat (harvesting).

Slouží k tomu hlavně:

  • Protocol for Metadata Harvesting OAI-PMH (viz Wikipedia)
  • Dublin Core metadatový formát kódovaný pomocí XML

Určitá aplikace může působit v OAI jako:

  • Data Provider - poskytovatel dat, který zveřejňuje metadata o svých datových objektech (např. o obsahu digitální knihovny),
  • Service Provider - poskytovatel služeb, který od data providerů sklízí metadata, obvukle je agreguje a indexuje, a na jejich základě poskytuje přidané služby, třeba vyhledávací.

Komunikace probíhá na principu klient-server. Klientem je harvester, serverem je repository. Objekty v repository musí být jednoznačně identifikovány identifikátory, používá se URI.

Repository může poskytovat metadata v různých formátech, povinný je nekvalifikovaný Dublin Core. Záznamy mohou být organizovány do skupin, nazývaných Sets. Harvester získává data buď pravidelně na základě časových údajů (např. požaduje jen nové objekty nebo změněná metadata), nebo na základě zadaných setů.

Existují registry OAI repozitářů, např. http://www.openarchives.org/Register/BrowseSites.

Dokumentace k protokolu OAI-PMH: http://www.openarchives.org/OAI/2.0/openarchivesprotocol.htm

Pro testování správnosti implementace a taky jako příklad zobrazení příkazů OAI-PMH je možné použít např. Open Archives Initiative - Repository Explorer

Příklad data providera http://kramerius.nkp.cz/kramerius/oai?verb=Identify

Příklady vytažení záznamu z repository:

Příklad service providera, který agreguje metadata obrázků z různých zdrojů a poskytuje vyhledávací službu - Picture Australia