Využití protokolu OAI-PMH
Možnost „shrabování“ záznamů
Od roku 2008 umožňuje SK ČR knihovnám, které mají OAI provider, dodávat data touto cestou.
Využití OAI provideru je preferovaná forma spolupráce.
Předpoklady:
- OAI provider schopný pracovat na úrovni setu, který nezahrnuje celou databázi:
- set = podmnožina plnohodnotných záznamů určená k exportu pro souborný katalog
- formát shrabovaných dat: marc21 (=marcxml)
- kódování UTF-8
Další podmínky:
- set nesmí v žádném případě obsahovat:
- nehotové záznamy (i pokud by prošly kontrolami, nemusejí mít korektní klíč, čímž by vznikaly duplicity)
- záznamy z katalogizace "přes pult" nebo z retrokonverze, pokud jsou méně kvalitní a mají mít nižší váhu (zde lze zvážit možnost zvláštního setu)
- záznamy seriálů, pokud knihovna nemá se správcem SK dohodnutý příjem těchto záznamů
- pokud knihovna velmi často zasahuje do již odeslaných záznamů (tj. značná část shrábnutých záznamů by po předimportním zpracování byla odmítnuta, protože se již v bázi nacházejí), musí zajistit, aby set již dříve odeslané záznamy neobsahoval
- jestliže knihovna používá v záznamech lokální pole či podpole (s výjimkou polí bloku 99X), musí zajistit, aby se do shrabovaných dat nedostaly - jinak jsou poté záznamy odmítnuty při kontrolách
Co je třeba nahlásit pro zahájení testování:
- URL OAI provideru
- jméno setu
- e-mailovou adresu, na kterou má být odesílána zpráva o výsledku shrabování
- periodicitu shrabování (denní, týdenní, měsíční nebo čtvrtletní)
Jak sklizeň pomocí protokolu OAI-PMH probíhá:
Po otestování knihovny a jejích dat jsou parametry, které knihovna dodala, uloženy do tabulky, se kterou pracuje "shrabovací program". Ten je automaticky spouštěn určitý den v týdnu (pro knihovny s týdenní periodicitou) nebo vždy na počátku měsíce (pro knihovny s měsíční periodicitou, např. první čtvrtek v měsíci).
Program zajišťuje:
- sklizeň záznamů pomocí OAI harvesteru, který požádá OAI provider příslušné knihovny o záznamy, patřící do příslušného setu a vytvořené/aktualizované od data poslední sklizně
- další úpravy záznamů a vytvoření souboru s patřičným pojmenováním, který je umístěn do adresáře, kam přicházejí dávky stažené z ftp a odkud si je bere program pro předimportní zpracování
- odeslání e-mailu na kontaktní adresu se zprávou o tom, že sklizeň proběhla a kolik záznamů bylo staženo