Zadání pro vývoj aplikací v systému
Tištěné seriály
0.verze
Zpracovaly:
- Ing.Kateřina Hajná
- Mgr.Danuše Vyorálková
- PhDr. Eva Svobodová
- PhDr. Hana Nová
Oddělení pro souborné katalogy
Oddělení periodik
Národní knihovna ČR
Zadání pro vývoj aplikací CASLIN - Souborného katalogu ČR (CASLIN - SK ČR) v systému ORACLE obsahuje slovní vyjádření funkcí katalogu, které jsou řešeny vývojem aplikací v systému ORACLE. Předmětem zadání není podrobný popis struktur a procedur. Dokumentace k jednotlivým procedurám bude vznikat v průběhu jejich vytváření a bude průběžně aktualizována do konečné podoby na základě úprav navržených členy Pracovní skupiny pro CASLIN - SK ČR
a Týmu technického rozvoje CASLIN - SK ČR v průběhu testování dokončených funkcí CASLIN - SK ČR. Obsah zadání byl projednán s dodavatelem aplikací a bylo dohodnuto, že detailní řešení jednotlivých aplikací bude operativně konzultováno v konkrétních možnostech. V zadání jsou uvedeny standardy pouze s odkazem na příslušné zdroje.V zadání není formulována, avšak v rámci fungování souborného katalogu bude řešena mimo jiné bezpečnost dat, napojení na e-mail a anglická verze katalogu.
Obsah:
- Příjem dat
- Vyhledávání
- Zobrazení záznamů - pohledy
- Stahování záznamů
- Aktualizace odběru dokumentu
- Připsání sigly k záznamu
- Sdílená katalogizace
- Statistiky
- Kategorie uživatelů
- Vlastník záznamu
- Správce souborného katalogu
- Nároky na technické vybavení uživatelů souborného katalogu
Přílohy:
- Názvová konvence
- Pohled LIST, SHORT
- Pohled LISTAKT
- Pohled LONG
- Pohled ISBD
Úvod
Přechod k provozování báze seriálů CASLIN - Souborného katalogu ČR v systému ORACLE směřuje ke zkvalitnění všech dosud poskytovaných služeb uživatelům a také k vývoji takových aplikací, které umožní služby nové. Veškeré služby budou realizovány prostřednictvím SQL Serveru ORACLE a WebServeru ORACLE. Báze seriálů bude mít kromě funkce informační možnost sdílené katalogizace, on-line aktualizace odběru seriálů a přímého napojení na meziknihovní výpůjční služby, a to při zachování všech současných standardů pro dodavatele a příjemce dat. Dalším důležitým cílem je značná automatizace všech činností spojených se správou bází Souborného katalogu ČR včetně analýzy vstupních dat, a to s maximálním využitím k tomu účelu dosud vytvořených softwarových prostředků.
1. Příjem dat
1.1 Forma předání
1.1.1 Forma předání nových dat
a) disketa
Uživatelé zasílají nové záznamy klasicky na disketách, správce má tudíž možnost je analyzovat před spuštěním procesů v ORACLE aplikaci. Uživatel musí dodržovat názvovou konvenci, která umožňuje popsat formát dodaných dat a použitou znakovou sadu. Názvová konvence byla stanovena správcem v průběhu vývoje aplikací a je popsána v příl. č. 1.
b) upload
Uživatelé používají upload do určeného adresáře s podmínkou dodržení názvové konvence souborů.
c) zaslání dat na ftp server do stanoveného adresáře při dodržení názvové konvence souborů
1.1.2 Forma předání dávkových oprav
Možnosti stejné jako v 1.1.1, pouze název souboru je v souladu s názvovou konvencí a je posílán do speciálního adresáře.
Povolené formáty dat a znakové sady pro předávání záznamů
Znakový repertoár:
Abecedy na základě latinky, přípustné kódy jsou:
- ISO 646 nebo ISO 5426 (manuál UNIMARC ,Příloha J )
- veškerá diakritika kódována pomocí GIZMO notace (tabulka GIZMO notace instrukce Záznam pro souborný katalog, příloha H)
- kód PC Latin 2 (Microsoft Code Page 852) + GIZMO
- kód Kamenických + GIZMO
- UNICODE UTF 8
- ISO 8859-2 + GIZMO
Formát souborů dat:
- Řádkový UNIMARC ( manuál UNIMARC) používá pro označení stopslov v Latin 2 PC znaky l ë
- UNIMARC ISO 2709 (manuál UNIMARC, Záznam pro souborný katalog UNIMARC) používá pro označení stopslov v Latin 2 PC znaky l ë
- Výměnný formát ISO 2709 (manuál CDS/ISIS) používá pro označení stopslov znaky <>
- Exportní soubor z ALEPH používá pro označení stopslov znaky <<>>
- Výměnný formát, exportní soubor ze systému CDS/ISIS (je totožný s ISO 2709, ale rozsegmentovaný na řádky po 80 znacích). používá pro označení stopslov znaky <>
1.2 Kontrola kvality dat
Všechny nové záznamy (nezávisle na způsobu dodání) a upravované záznamy budou před importem do souborného katalogu testovány. Součástí automatické kontroly je:
- test na UNIMARC
- přidělení kvalitativní váhy
- test na duplicitu
1.2.1 Test na UNIMARC
Pomocí vyvinuté aplikace budou jednotlivé záznamy automaticky testovány na správnost zápisu do polí formátu UNIMARC.
Algoritmus testování na UNIMARC
U všech polí se prověří:
a) Zápis obecně
- po tagu pole následuje znak pro indikátory nebo $ (kromě návěští a tagů 001, 005)
- za každým označením podpole (znak $ plus jeden znak) následuje v podpoli minimálně jeden znak
- v záznamu se vylučuje současná existence polí 700,710,720
b) Opakovatelnost, přítomnost a hodnota indikátorů
- opakovatelnost polí
- přítomnost a hodnota indikátorů
- opakovatelnost podpolí
Vše podle tabulky hodnot UNIMARC manuál a tabulky hodnot pro národní pole.
c) Různé podmínky zápisu v poli
- správnost ISSN lze kontrolovat dle postupu popsaném v definici tohoto pole v UNIMARC
- 101 je-li přítomno podpole b nebo c, hodnota prvního indikátoru je 1 nebo 2
- 600,700,701,702: je-li přítomno podpole b, hodnota druhého indikátoru je 1. Hodnota druhého indikátoru 1 není vyloučena při nepřítomnosti podpole b.
- jestliže v pozici 6 návěští (labelu) je jiný kód než a, musí být 200b vyplněno
Test na přítomnost polí nezbytných k jednoznačné identifikaci dokumentu
(Povinná pole testu na UNIMARC)
Návěští: povinná délka 24 znaků
001
005: repertoár - arabské číslice plus tečka, 8 až 16 znaků
100: pozice 0-7 číselné znaky, pozice 21 hodnota 0 či 1, pozice 22-24 repertoár viz UNIMARC, Příloha A, pozice 26-29 hodnoty 0,1,3, pozice 30-33 obsahuje mezery
101: repertoár viz UNIMARC, příloha A
102: repertoár viz ISO 3166 plus možnost xx, XX pro nezjistitelnou zemi vydání
200: povinné podpole a
801 podpole a,b (repertoár k dispozici u správce SK),c
910 podpole a (repertoár k dispozici u správce SK) , r nebo s
1.2.2 Váha záznamů
Váha je numerická hodnota vyjadřující kvalitu záznamu , která bude dávce záznamů přidělena na základě níže popsaného algoritmu.
Seznam vah
VÁHA | KVALITA ZÁZNAMU |
---|---|
4 | Nestandardní |
9 | Záznam vyhovuje ve jmenném popisu, chybí MDT |
10 | Záznam vyhovuje ve jmenném i věcném popisu |
12 | Záznam obsahuje i nepovinná pole |
13 | Přidělena při ručním zpracování správcem |
20 | Záznam Národní knihovny ČR |
21 | Přidělena při ručním zpracování správcem záznamům NK ČR |
Postup přidělování vah:
- Vytvořit tabulku sigel a k nim přidělených vah pro knihovny, které budou dodávat záznamy.
- Každá nová knihovna bude ručně analyzována, správce jí přidělí váhu a zapíše do tabulky.
- Vyskytne-li se v prostoru pro vstupní data soubor se siglou v názvu, která dosud není v tabulce, nebude se automaticky analyzovat, ale bude upozorněn správce, který data zanalyzuje.
- Data došlá od knihoven, které již mají přidělenou váhu v tabulce, projdou automatickým testem na přidělování vah. Takto přidělená váha bude automaticky porovnána s vahou v tabulce. Bude-li shodná, data se zpracují automaticky. Bude-li se váha lišit, zpracování dat se zastaví a bude upozorněn správce.
Algoritmus přidělování vah
- Záznamy v dávce splňující povinná pole testu na UNIMARC obdrží váhu 4
- Záznamy v dávce splňující bod 1) a některé z následujících povinných polí 011, 205, 210, 215, 225, 326, 43X, 44X, 510, 517, 700, 701, 702, 710, 711, 712 obdrží váhu 9
- Záznamy v dávce splňující bod 2) a povinné pole 675 obdrží váhu 10
- Záznamy splňující bod 3) a některé z následujících nepovinných polí obdrží váhu 12 Nepovinná pole: 110, 207, 3XX (kromě 326), 410, 421, 422, 423, 451-454, 512, 514, 516, 520, 530, 531, 532, 540, 6XX (kromě 675), 952, 968, 969, 970, 979, 980.
- Záznamy v dávce splňující bod 4) a patřící Národní knihovně ČR (sigla ABA001) obdrží váhu 20
1.2.3 Test na duplicitu klíčů
Záznamy budou automaticky testovány na duplicitu, záznamy s vyšší váhou budou přemazávat záznamy s nižší váhou.
Klíče pro porovnávání záznamů:
Primární klíč
- ISSN (pole 011a) - použít pouze znaky (0 - 9,X), znak "x" převést na "X", není-li zdroj 011a, klíč nelze sestavit, je-li více výskytů 011a, pak záznam do souboru "ISSN" a klíč nesestavovat
- první tři alfanumerické znaky z prvního slova z názvu, 3., 4. a 5. alfanumerický znak z druhého slova z názvu a 2., 3. a 4. alfanumerický znak z třetího slova z názvu a první tři alfanumerické znaky ze čtvrtého slova z názvu (pole 200a)
- první tři alfanumerické znaky z prvního slova z názvu části, 3., 4. a 5. alfanumerický znak z druhého slova z názvu části a 2., 3. a 4. alfanumerický znak z třetího slova z názvu části a první tři alfanumerické znaky ze čtvrtého slova z názvu (pole 200i)
- obsah pozice 6 v návěští (labelu)
Sekundární klíč
Je tvořen ze dvou částí:
První část má proměnnou délku a je tvořena obsahem celého podpole 200a (název dokumentu), přičemž jsou určena pravidla ohledně diakritiky, stopslov a údajů v < >. Rovněž se nerozlišují malá a velká písmena.
Druhá část má konstantní délku a je složena z více zdrojových podpolí.
- 9 alfanumerických znaků z názvu části tak, že se vezmou první 3 alfanumerické znaky z prvního slova, 3., 4. a 5. alfanumerický znak z druhého slova a 2., 3. a 4. alfanumerický znak z třetího slova (z pole 200i)
- následuje 9 alfanumerických znaků z podnázvu tak, že se vezmou první 3 alfanumerické znaky z prvního slova, 3., 4. a 5. alfanumerický znak z druhého slova a 2., 3. a 4. alfanumerický znak z třetího slova (z pole 200e)
- následuje 1 znak, a to pozice 6 v návěští (labelu)
Tato druhá část sekundárního klíče je koncipována pozičně, takže chybí-li některý zdroj tvořící počáteční pozice klíče a následující zdroj je přítomen, doplní se chybějící zdroj nebo jeho část mezerami. Druhá část sekundárního klíče je testována na délku pro stanovení krátkých klíčů.Minimální délka je 19 znaků.
Porovnávání záznamů
1) primární klíč | existuje, pak 2) neexistuje, pak 5) |
2) primární klíč | je duplicitní, pak 3) není duplicitní, pak 4) |
3) porovnat 200h | je duplicitní, pak záznamy jsou duplicitní (prázdné 200h je také hodnota) a provede se 10) není duplicitní, pak dvojici záznamů do souboru "číslo části" a záznam v bázi zamknout (viz níže) |
4) porovnat 011a | je duplicitní, pak dvojice záznamů do souboru "ISSN" a záznam v bázi zamknout (viz níže) není duplicitní, záznamy jsou různé |
5) porovnat sekundární klíč | je duplicitní, pak 6) není duplicitní, pak jsou záznamy různé |
6) porovnat 200h | je duplicitní, pak 7) není duplicitní, pak dvojice záznamů do souboru "číslo části" a záznam v bázi zamknout (viz níe) |
7) porovnat 710a,b(vechny výskyty b v řadě za sebou), pokud v jednom ze záznamů chybí 710, porovnat 710 a všechny výskyty 711 nebo chybí-li v obou 710 porovnat všechny výskyty 711 a 711 výše popsaným způsobem; pokud chybí i 711, porovnat všechny výskyty 712 a 712 | je alespoň jedna duplicita nebo není přítomno 7XX ani v jednom ze záznamů, pak 8) není duplicita, pak dvojice záznamů do souboru "korporace" a záznam v bázi zamknout (viz níže) |
8) porovnat všechny kombinace výskytů 210a v obou záznamech | najde se alespoň jedna duplicita, pak jsou záznamy duplicitní (prázdné 210a není hodnota) a provede se 9) nenajde se duplicita v obou záznamech, pak dvojici záznamů do souboru "místo vydání" a záznam v bázi zamknout (viz níže) |
9) porovnat 910r a chybí-li porovnat 910s u výskytů tagu 910 s totožným 910a | je duplicitní, pak 10) není duplicitní, pak záznam do souboru "odběr" a odpovídající záznam v bázi zamknout (viz níže) |
10) spojit záznamy dle TABPER a záznam do báze |
Při slučování duplicitních záznamů zůstane v bázi záznam s vyšší vahou a v něm dojde k těmto změnám uvedeným v tabulce Tabper.
TABPER:
POLE | OZNAČENÍ | OPAKOVATELNOST | ZMĚNA |
---|---|---|---|
návěští (label) | pozice 5 - status záznamu | neopakovatelné | změna kódu n na c |
005 | datum posledního zpracování | neopakovatelné | uloží se nejvyšší datum z duplicitních záznamů |
326a,b | poznámka o periodicitě | opakovatelné | uloží se všechny výskyty ze záznamu s nejvyšším datem v 005, a to v pořadí, v jakém byly v původním záznamu |
517a | variantní název | opakovatelné | uloží se všechny různé výskyty z obou duplicitních záznamů, na pořadí nezáleží |
520a | předchozí název | opakovatelné | uloží se všechny různé výskyty z obou duplicitních záznamů, na pořadí nezáleží |
540a | další název dodaný katalogizátorem | opakovatelné | uloží se všechny různé výskyty z obou duplicitních záznamů, na pořadí nezáleží |
711a,b 712a,b |
korporace | opakovatelné | uloží se všechny různé výskyty z obou duplicitních záznamů, na pořadí nezáleží |
910r,s | odběr | opakovatelné | do výskytu pole 910 s totožným 910a se uloží totožný výskyt 910r,s z jednoho ze záznamů z výskytu s totožným 910a |
Při dávkovém i dialogovém režimu zpracování seriálů nastanou situace (níže popsané), kdy dostane správce báze záznamy ke kontrole. Tyto záznamy budou rozděleny do několika souborů podle typu kontroly a úprav, které bude správce provádět. K tomu účelu bude vytvořena speciální obrazovka, v níž bude správce volit, který ze souborů chce právě kontrolovat.
Záznamy do jednotlivých souborů budou přibývat chronologicky tak, jak přijdou ze vstupu. Ubývat budou tak, jak je správce bude odesílat jako zpracované.
JEDNOTLIVÉ SOUBORY:
1) ISSN
Záznam z báze bude uzamčen pro editaci uživatelem, ale ne pro automatické porovnávání přes klíče. Po stisknutí tlačítka ISSN má správce má možnost úplné editace (včetně vah) obou záznamů. Po kontrole a úpravách potvrdí příslušnou dvojici (nebo vstupní záznam v případě více výskytů 011a) a tím docílí případného přepsání záznamu v bázi a opětovného automatického porovnání vstupního záznamu přes klíče pro import do báze.
2) číslo části
Záznamy zamkni stejně jako Ad1). Po kontrole a úpravách správce potvrdí příslušnou dvojici a tím docílí případného přepsání záznamu v bázi a opětovného automatického porovnání vstupního záznamu přes klíče pro import do báze.
3) místo vydání
Záznamy zamkni stejně jako Ad1). Správce po kontrole a úpravách potvrdí příslušnou dvojici
a) jako duplicitní, pak se vstupní záznam zpracuje jako upd nebo add dle vah,
b) jako různou, pak se vstupní záznam přihraje jako new.
4) odběr
Odpovídající záznam v bázi zamkni Ad1) až do provedení kontroly a úprav správcem. Po potvrzení záznamu ze souboru "odběr" tento záznam přepíše příslušný záznam v bázi.
V souborech, které jsou tvořeny dvojicemi (báze - vstup), se zobrazí záznam z báze vždy aktuální. To znamená, přísluší-li ke dvěma různým vstupním záznamům v souboru týž záznam z báze, zobrazí se po úpravě a potvrzení první dvojice ve druhé dvojici již aktualizovaný záznam z báze.
Všechny soubory pro kontrolu vznikají při dávkovém zpracování a při dialogovém ukládání nových záznamů (7.2). Při ukládání takto vytvořeného záznamu bude záznam automaticky porovnán přes klíče pro import do báze. Váha mu bude přidělena dle tabulky sigel.
1.3 Statistiky chyb
Při automatizovaném zpracování dávek dat budou vznikat statistiky chyb v těchto krocích:
- při čtení záznamu
- při konverzi z Výměnného formátu do UNIMARCu
- při testu na UNIMARC
Statistiky chyb budou prostřednictvím e-mailu s příslušným komentářem zaslány zpět dodavateli k opravě.
2. Vyhledávání
2.1 Na základě přístupových souborů
V režimu vyhledávání má uživatel možnost prohlížet přístupové soubory na základě zadání selekčního termínu. Přístupové soubory jsou abecedně setříděné. Při zadání dotazu se zobrazí seznam selekčních termínů, který začíná termínem předcházejícím abecedně zadanému dotazu. V seznamu termínů je možno se pohybovat dopředu i zpět a také vybrat termín pro vyhledání odkazovaných záznamů do souboru hitů.
Uživatel má také možnost zadat dotaz pro přímé vytvoření souboru hitů. V tomto případě lze zadávat složitější dotazy kombinací selekčních termínů z jednoho i více přístupových souborů pomocí logických operátorů (and,or,not). Při zadávání selekčního termínu je možno používat pravostranné i levostranné krácení a maskovací znaky pro náhradu jednoho nebo více znaků uprostřed slova. Při vyhledávání budou vyloučena stopslova. Při prohlížení přístupového souboru bude ze záznamu v přístupovém souboru zobrazen selekční termín a počet k němu odkazovaných záznamů. Při vyhledávání má uživatel možnost filtrovat záznamy vyhledávaných dokumentů dle jazyka dokumentu (101a), provenience (102a), druhu dokumentu (200b), sigly odběratele (910a) a roku aktualizace (910o).
Rešerši má uživatel možnost dále zjemňovat nebo rozšiřovat pomocí logických operátorů omezením dotazu na již vytvořený soubor hitů. Uživatel má možnost mít dočasně uloženo v paměti více souborů hitů.
Pokud by výsledkem rešeršního dotazu bylo více než 200 záznamů, nezíská uživatel soubor hitů, ale dostane na obrazovku zprávu: "Počet vyhledaných záznamů je větší než 200, zjemněte rešerši". Zjemnění rešerše je dále možné pomocí : free (všechna slova)
slova z - názvu
edice
korporace
vydavatele
místa vydání
klíčová slova
rok odběru
Uživatel má také možnost získat výsledek rešerše jako tiskový výstup ve formátu SHORT, přičemž má možnost výstup setřídit dle názvu (200a) nebo podle země vydání (102a) nebo podle data vydání (210d) jak je uvedeno ve formátu SHORT.
Zalogovaný uživatel bude mít možnost vytvořit soubor záznamů pro pozdější export. Soubor záznamů bude vyhledán podle data aktualizace bibliografického záznamu (pole 005) - jednotlivé datum nebo interval v kombinaci se siglou (910a) uživatele.
Soubory autorit
Vyhledávání podle autorit přes prohlížení abecedně setříděného seznamu zadaného typu autority (autor, korporace, MDT ap.) a to tak, že po vybrání konkrétní autority ze seznamu se uživateli zobrazí počet vyhledaných záznamů a přímo tyto záznamy v určitém pohledu opět ve tvaru seznamu. Bude možná volba zúžení nebo rozšíření rešerše např. kombinací s jiným typem autority booleovským operátorem. Soubory autorit budou mít ve svých záznamech i pole pro odkazy. Soubory autorit tvoří:
Názvy - NZ(TI):
zdroj 200a, 200i, 200d, 43X, 44X, 510a, 517a. Z každého uvedeného podpole se vytvoří jeden řádek v přístupovém souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů. Údaj v podpoli 200d může začínat rovnítkem (=). V takovém případě je třeba do přístupového souboru přenést pouze údaj bez počátečního rovnítka.
MDT - DT(DC):
zdroj 675a. Z každého uvedeného podpole se vytvoří jeden řádek v přístupovém souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.
ISSN - SN (SN):
zdroj 011a, 011z, 011y, 225x, 43X $1 011$$a, 44X$1 011$$a. Z každého uvedeného podpole se vytvoří jeden řádek v přístupovém souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.
Korporace, autoři - KO(CP):
zdroj 700abdcf, 701abdcf, 702abcdf, 710aghbcdfe, 711aghbcdfe, 712aghbcdfe. Z každého uvedeného tagu se vytvoří jeden řádek v přístupovém souboru z podpolí v pořadí, jak jsou uvedena, přičemž u opakovatelného podpole budou vypsány nejprve všechny výskyty a teprve pak bude řádek pokračovat dalším podpolem v pořadí. Záznam autority bude zobrazen jako obsahy podpolí ze zdroje v uvedeném pořadí oddělené interpunkcí v apostrofech takto: 700a', '700b' '700d', 'všechny výskyty 700c oddělené ', ' následuje ', '700f pro tagy 701 a 702 platí stejná interpunkce jako pro tag 700, 710a'( '710g')' následuje ' 'všechny výskyty 710h oddělené ' ' následuje '. 'všechny výskyty 710b oddělené '. ' následuje '( 'všechny výskyty 710c oddělené ', ' následuje ') ' následuje '( 'všechny výskyty 710d oddělené ' : ' následuje ' : '710f' : '710e') ' Pokud chybí některé z podpolí, interpunkce, která je předchází, se vynechá. Pokud kompletně chybí zdroj pro výraz v kulatých závorkách, tyto se vynechají. Záznam autority bude též udávat počet odkazovaných záznamů.
Edice - ED(SR):
zdroj 410$1podpole200a, 200d, 200i, chybí-li pole 410, pak je zdroj 225a, 225d, 225i. Z každého uvedeného podpole se vytvoří jeden řádek přístupového souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů. Údaj v podpolích 200d a 225d může začínat rovnítkem (=). V takovém případě je třeba do přístupového souboru přenést pouze údaj bez počátečního rovnítka.
Zpracovatel - ZP(CT):
zdroj 801b. Z každého výskytu uvedeného podpole se vytvoří jeden řádek přístupového souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.
Vlastník dokumentu - VL(OW):
zdroj 910a. Z každého výskytu uvedeného podpole se vytvoří jeden řádek přístupového souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.
Aktualizace odběru - AO(US):
zdroj 910o. Z každého výskytu uvedeného podpole se vytvoří jeden řádek přístupového souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.
Při abecedním řazení přístupových souborů je třeba ignorovat pomlčky (oddělené mezerami), velká písmena, čárky, dvojtečky, tečky a středník.
Soubory slov
Vyhledávání podle slov z vybraných polí (opět bude možné postupné zužování rešerše) umožňuje vyhledávat v určitém vybraném souboru slov a nebo přes všechny soubory slov, následně bude zobrazen počet nalezených záznamů a jejich seznam (viz výše). Soubory slov tvoří:
- Slova z názvů - SNZ(WTI): zdroj 200adeic, 225adi, 510a, 517a, 43X, 44X
- Slova z korporací a autorů - SKO(WCP): zdroj 700ab, 701ab, 702 ab, 710abce, 711abce, 712abce
- Klíčová slova - SKL(WKW): zdroj 6XX (kromě pole 675)
- Druh dokumentu - SDR(WSO): zdroj 200b
- Slova z nakladatele - SNA(WPU): zdroj 210c
- Místo vydání - SMV(WPE): zdroj 210a
Při vytváření souborů slov je třeba od jednotlivých slov odstranit pomlčky (oddělené mezerami), čárky, dvojtečky, tečky a středník.
2.2 Řetězcové vyhledávání
Řetězcové vyhledávání umožní vyhledávat podle řetězce znaků obsaženého v určitém (uživatelem zadaném) poli a podpoli. Protože takováto rešerše bude časově náročná při velkém počtu dat, bude probíhat jako procedura na pozadí a po skončení ohlásí jméno výsledného souboru hitů.
Pozn.: Možnost řetězcového vyhledávání pro uživatele bude během vývoje aplikace zvážena dle zatížení serveru.
3. Zobrazení záznamů - pohledy
Pro zobrazení vyhledaných záznamů dokumentů budou vytvořeny různé pohledy, jejichž používání bude povoleno na základě přístupových práv uživatele. Po ukončení vyhledávání si uživatel vybere konkrétní záznam ze seznamu zobrazeném v pohledu LIST (viz. příl. č. 2) a ten se mu zobrazí v pohledu SHORT (viz příl. č. 2), který mu dodá základní identifikaci dokumentu a lokační informace (v rozsahu údajů 1.úrovně popisu podle AACR2). V tomto místě bude mít možnost přes siglu vlastníka dokumentu dostat zobrazení jeho záznamu z Adresáře knihoven a institucí a v případě, že vlastník má e-mailovou adresu, bude mít možnost poslat přímo z tohoto zobrazení mailem zprávu dané instituci. Rovněž je možnost kliknutím na url adresu vstoupit na domácí stránku vlastníka. Uživatel má rovněž možnost přímo využít meziknihovní výpůjční službu souborného katalogu. Pokud má uživatel zájem o podrobné bibliografické údaje může zvolit pohled LONG (viz příl. č. 3), kde se zobrazí rozšířený záznam. Zde je žádoucí vytvářet statistiku kolik záznamů a kdo si v tomto pohledu prohlížel. Pohled LISTAKT (viz. příl. č. 3) je určen k aktualizaci odběru seriálů.
Údaje, z nichž se vytváří soubory autorit, budou v pohledech zvýrazněny a uživatel kliknutím na některý z těchto údajů spustí vyhledávání. Zobrazí se mu seznam selekčních termínů abecedně setříděný a začínající termínem předcházejícím abecedně zvolený údaj. Uživatel bude mít k dispozici nápovědu.
Úplný UNIMARC
Pohled je určen k zobrazení všech údajů v záznamu ve formátu řádkového formátu UNIMARC, přičemž budou zobrazeny všechny výskyty polí a podpolí.
Dynamický pohled
Pohled umožňuje uživateli předem vybrat a předdefinovat pole, která mají být zobrazena, a tento formát zobrazení si pojmenovat a uložit ve svém prostoru pro další použití. Záznam se zobrazí jako řádkový UNIMARC omezený pouze na vybraná pole. Další výskyty polí a podpolí zobrazovaných ve formátu dynamický pohled lze zobrazit najetím na příslušný údaj a kliknutím myší nebo stiskem určené klávesy. Uživatel bude mít k dispozici nápovědu.
Pohled ISBD - minimální záznam dle doporučení ISBD
Formát zobrazuje pouze údaje povinné pro souborný katalog, a to dle doporučení ISBD (viz. příl. č. 5). Jednotlivé oblasti ve formátu zobrazení jsou odděleny interpunkcí dle doporučení ISBD. Chybí-li v datech pro některou oblast údaj, oblast se vynechá včetně interpunkce, která ji předchází.
4. Stahování záznamů
Dávkově
Po naplnění paměti záznamy z rešerše bude mít uživatel možnost z ní vymazat ty záznamy, které nechce stahovat do své báze. Při vlastním stažení je nutno je zaúčtovat. Při účtování regulérně stažených záznamů je třeba vyloučit ty, které si stáhl vlastník (jsou jeho a není důvod mu je účtovat). Správce souborného katalogu obdrží výstup, který bude obsahovat celkový počet záznamů a počty záznamů v podskupinách s touž váhou včetně její hodnoty. Uživatel má možnost stahování jednotlivých záznamů nebo dávek záznamů ve zvoleném formátu a znakovém repertoáru, který zadá v menu. Při využití obsahu pole 001 u záznamů editovaných vlastníkem záznamu může uživatel vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším (staženým ze souborného katalogu).
5. Pravidelná aktualizace odběru dokumentu
Pravidelná aktualizace odběru může probíhat po jednotlivých titulech nebo dávkově.
5.1 Po jednotlivých titulech
Uživatel má možnost upravovat roky odběru u jednotlivých tiutulů, které vlastní a jsou uvedeny v bázi. Po zalogování a vyhledání požadovaného titulu se uživateli otevře pro editaci pole 910 b,s,r,p,u, přičemž v zobrazeném podpoli 910a je jeho sigla. Po skončení úprav systém před uložením do databáze zkontroluje, zda je vyplněné podpole 910r a automaticky doplní do podpole 910o datum aktualizace údajů ve tvaru RRRRMM. Dialogová obrazovka umožňuje také zrušení odběru jedním tlačítkem.
Tuto možnost má oprávněný uživatel i mimo pravidelnou aktualizaci.
Jestliže uživatel, který zrušil roky odběru, je vlastníkem záznamu, přechází vlastnictví záznamu na správce. Zruší-li vlastník dokumentu podpole odběru tak, že 910r a současně 910s budou prázdné, systém zjistí, zda existuje ještě alespoň jeden výskyt pole 910 s obsazeným 910r nebo 910s. Jestli ano, systém vymaže celý výskyt pole 910, u něhož byl zrušen odběr (910r a 910s prázdné), jestli ne, systém ponechá pouze 910a a do 910p vloží text "vyřazeno" u pole 910, kde byl zrušen odběr.
5.2 Dávkově
Uživatel po zalogování zadá z menu požadavek dávková editace a systém mu nabídne seznam jeho titulů, u nichž v podpoli 910r nebo 910s není ukončen odběr. Uživatel v seznamu označí tituly, které chce editovat a potom postupuje stejně jako v bodě 5.1. Po ukončení editace vybraných titulů systém před uložením dat do báze zkontroluje, zda je vyplněné podpole 910r nebo 910s. U všech titulů ze seznamu celé dávky systém automaticky doplní datum aktualizace ve tvaru RRRRMM. Při velkém počtu titulů uloží celý soubor do schránky. Takto uložený soubor lze zpracovávat po částech. U zpracovaných titulů systém před uložením do báze zkontroluje, zda je vyplněné podpole 910r nebo 910s a po schválení doplní automaticky datum aktualizace ve tvaru RRRRMM. Takto zpracované záznamy uloží do báze a vymaže ze souboru uloženém ve schránce.Pro aktualizaci, kterou provádí správce, je nutný tiskový výstup, tzn. seznam titulů vybraný podle sigly odběratele (910a) a neukončeným odběrem (910r nebo 910s). Seznam je ve formátu LISTAKT (pole 011a, 200a, 102a, 910r, 910s). Seznam je uveden hlavičkou SIGLA + editovatelný text.
6. Připsání sigly k záznamu
Uživatel má možnost k existujícím záznamům v souborném katalogu připsat svou siglu a roky odběru (signaturu, poznámku, dobu uchovávání), v případě, že vlastní daný dokument. Po zalogování se oprávněnému uživateli otevřou podpole 910b, s, r, p, t, u do nichž uloží data. Do podpole 910a se automaticky doplní jeho sigla. Systém zkontroluje, zda je vyplněno podpole 910r a automaticky doplní datum aktualizace do podpole 910o.
Zároveň s potvrzením sigly má uživatel příslušné kategorie možnost záznam si stáhnout buď přímo nebo do schránky.
7. Sdílená katalogizace
Oprávněný uživatel má možnost editace a doplňování nových záznamů pomocí vstupních formulářů, které umožní editaci pole, mazání pole a vkládání pole na určenou pozici v záznamu. Uživatel má možnost do pole 001 uložit identifikační číslo záznamu, které může využít při zpětném stažení záznamu do své báze. Se všemi změnami záznamů se automaticky aktualizují přístupové soubory.
7.1 Úpravy bibliografických záznamů (editace)
Při úpravách záznamů vlastníkem přímo v souborném katalogu bude možné rozhodnout zda prohlížený záznam chce vlastník otevřít k následným úpravám. Po provedených úpravách bude mít možnost akci zrušit nebo potvrdit. Dále bude mít možnost rozhodnout, zda takto upravený záznam zahrne do dávky určené pro stažení do své báze. Účtování jako v kapitole 4. Při editaci má možnost vložit do svého záznamu identifikační číslo (tag 001), a tím může vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším, který upravil v souborném katalogu. Použití tagu 001 umožní plně využít tuto službu také knihovnám, které jsou nuceny provádět konverzi formátu záznamů vlastními prostředky. Bude existovat možnost předem určit pole záznamu, která bude moci editovat jen správce např. pole VÁHA. Zvýšení váhy dosažené editací v souborném katalogu lze uživateli kladně zaúčtovat. V zobrazení SHORT bude automaticky zobrazováno systémové datum (z pole 005, ve tvaru RRRRMMDD), kdy došlo k úpravě záznamu. Zároveň s potvrzením úpravy záznamu má uživatel příslušné kategorie možnost záznam si stáhnout buď přímo nebo do schránky.
Při editaci záznamů v dialogovém režimu jsou zakázána pro editaci tato pole a podpole:
005 (datum vloží systém)
011a
200a.i
200h pokud je již vyplněno
910 všechny výskyty, kde 910a se nerovná sigle uživatele
910a
910r,s další výskyty
7.2 Tvorba nových záznamů
Při vytváření nového záznamu bude v souborném katalogu uživateli nabídnut formulář bibliografického záznamu, který bude odpovídat minimálnímu záznamu a nebude obsahovat nepovolená pole. V podpoli 910a se automaticky vyplní sigla příslušné zalogované knihovny. Vstupní formulář je rozepsán v příl. č. 5.
Pro editaci bude k dispozici vstupní formulář, který zobrazí kompletní obsah editovaného záznamu a nevyplněná pole minimálního záznamu.
U zvolených polí, která nejsou jednotlivě uvedena ve formuláři, má katalogizátor možnost takto předvolená pole pro ukládání zahrnout do verze vstupního formuláře, kterou si pojmenuje, uloží do svého prostoru a kdykoli znovu použije.
Vysvětlení ke vstupnímu formuláři pro ukládání nových záznamů:
Nad skupinou návěští pro jednotlivá podpole je nadřazeno návěští pro celé pole, aby bylo možno volit další výskyty celých polí a také jednotlivých podpolí v rámci jednoho výskytu pole pro ukládání dat.
- po zvolení dalšího výskytu celého pole se vyprázdní všechna okénka (vstupní prostor) pro jednotlivá podpole daného pole.
- po zvolení dalšího výskytu určitého podpole v rámci téhož výskytu celého pole se vyprázdní pouze okénko příslušné tomuto podpoli.
Další výskyt pole bude možno volit stiskem tlačítka návěští celého pole. Výskyty podpolí bude možno volit stiskem příslušného návěští podpole. Uživatel má možnost při katalogizaci přetahovat do záznamu údaje ze souborů autorit. Do příslušného vstupního okénka zadá začátek údaje a kliknutím na ikonu dostane na obrazovku seznam autorit abecedně setříděný a začínající termínem předcházejícím v abecedě zadaný údaj. Vybere zvolenou autoritu, kliknutím na ikonu se autorita přetáhne do katalogizovaného záznamu a zobrazí se ve vstupním formuláři. Uživatel bude mít k dispozici systém nápověd (helpů). Opakovatelná pole a podpole jsou ve vstupním formuláři označena (O) . Neoznačená pole a podpole jsou neopakovatelná.
Vstupní okénka pro 200a a 200e budou dvouřádková (aby se údaj celý zobrazil).
Zároveň s potvrzením úpravy záznamu má uživatel příslušné kategorie možnost záznam si stáhnout buď přímo nebo do schránky.
8. Statistiky
Statistiky budou vytvářeny pro uživatele i správce a bude je možno využít pro pozdější účtování. Uživatel má možnost zobrazit si statistiku a zprávy systému vztahující se k jeho činnosti v bázi na konci své aktivity. Tyto statistiky budou archivovány po dobu stanovenou správcem a přístupné uživateli.
8.1 Statistika pro uživatele obsahuje:
- siglu uživatele (login)
- IP adresu, ze které akce probíhala
- činnosti, které systém prováděl
- počty zpracovávaných záznamů při sdílené katalogizaci rozdělené na editované, nově uložené, stažené svoje a cizí
- hlášení o provedení úpravy pole 910r nebo 910s
- chybová hlášení
- datum a čas relace.
8.2 Statistika pro správce (za 24 hodin):
- počet přihlášených aktivních uživatelů
- seznam jejich login (kliknutím na položku se zobrazí příslušná statistika uživatele)
- počet přihlášených pasivních uživatelů
- chybová hlášení
- počet naimportovaných záznamů (přidaných - add, přepsaných - upd, nových) včetně uvedení jejich váhy.
9. Kategorie uživatelů
Uživatelé budou rozděleni do několika kategorií podle oprávnění využívat určitých služeb, které souborný katalog poskytuje. Toto bude řešeno přidělováním přístupových práv uživatelům správcem souborného katalogu.
Kategorie uživatelů:
1. kategorie - pasivní uživatel
využívá pouze informační funkci souborného katalogu, a to lokační i bibliografickou s možností přímého propojení na meziknihovní výpůjční službu vlastníka dokumentu.
- vyhledávání
2. kategorie
využívá služby kategorie 1. a má také možnost stahovat záznamy
- vyhledávání
- stahování záznamů
3. kategorie
využívá služby kategorie 1. a má také možnost připsat k záznamu svoji siglu (dle login).
- vyhledávání
- připsání sigly a roků odběru
4. kategorie
využívá služby kategorie 3. a má také možnost stahování (downloading) jednotlivých záznamů nebo předem vybraných dávek záznamů ve zvoleném formátu (viz platné standardy kapitola 1) do svého prostoru. Stažené záznamy budou účtovány, v případě že uživatel není jejich vlastníkem.
- vyhledávání
- stahování záznamů
- připsání své sigly a roků odběru k záznamu dokumentu, který vlastní
5. kategorie - aktivní uživatel
využívá služby kategorie 4. a má také možnost editovat záznamy, jichž je vlastníkem, případně si takto upravené záznamy může stáhnout do své báze a pomocí příznaku (tag 001), který má při výše zmíněné editaci v souborném katalogu možnost vložit do záznamu, může vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším, který upravil v souborném katalogu. Uživatel této kategorie má také možnost vytvářet zcela nový záznam přímo v souborném katalogu do připraveného formuláře (viz příl č. 5). Takto vytvořené záznamy se budou účtovat jako dávkově dodané.
- vyhledávání
- stahování záznamů
- připsání své sigly k záznamu dokumentu, který vlastní
- oprava (editace) záznamů
- vytváření nových záznamů přímo v souborném katalogu
10. Vlastník záznamu
Vlastník záznamu (z hlediska účtování) je ten, kdo záznam do báze dodal a na základě porovnání na duplicity před vlastním importem do báze mu zůstala původní vlastnická práva. To znamená, že záznam byl přijat jako nový nebo jako duplicitní, ale s vyšší přidělenou vahou, než měl týž záznam v souborném katalogu od jiného vlastníka. Z toho vyplývá skutečnost, že během plnění databáze se tato vlastnická práva (ale i určitá odpovědnost za kvalitu) u určitého záznamu mohou stále měnit až do určité maximálně dosažitelné váhy.
11. Správce souborného katalogu
11.1 Zpracování vstupní dávky dat
- konverze vstupních dat do řádkového formátu UNIMARC, pokud jsou dodána v jiném povoleném formátu
- formálně logické kontroly a přidělení váhy záznamům procedurou, přičemž na výstupu bude soubor přijatých záznamů s přidělenou váhou a statistika o chybných záznamech, správce má možnost jednorázově pro konkrétní dávku změnit váhu automaticky přidělenou bez ručního zásahu do tabulky sigel
- porovnání nově přijatých záznamů na duplicity a vytvoření statistiky
- import záznamů do báze
Celý tento proces má správce možnost spustit jako celek, takže jednotlivé kroky proběhnou automaticky v návaznosti na sebe, nebo po jednotlivých krocích tak, že má možnost kontroly výstupů z každého kroku. V obou variantách správce může nastavit datum a čas spuštění celého procesu nebo kroků.
11.2 Zpracování záznamů vzniklých on-line katalogizací
Záznamy editované vlastníkem a nově uložené budou zpracovány automaticky jako vstupní dávka dat. Editované budou odlišeny od nově uložených. Správce bude o takových záznamech informován v denní statistice o bázi tak, že dojde-li ke zvýšení váhy u editovaných záznamů, bude to ve statistice patrné.
Podrobné zadání vlastní správy dat bude provedeno pouze interně mezi správcem souborného katalogu a softwarovou firmou.
12. Nároky na technické vybavení uživatelů souborného katalogu
Uživatel 1. a 3. kategorie (viz kapitola 9)
HW vybavení, které umožňuje používání prohlížeče www (Explorer, Netscape), prohlížeč musí obsahovat znakovou sadu UNICODE.
Uživatel 2., 4., a 5.kategorie (viz kapitola 9)
- PC 486
- Operační paměť 16 MB
- Prohlížeč www Netscape od verze 4.04, Explorer od verze 4.01
Příloha č. 1
Názvová konvence
Délka názvu datového souboru je 8+3 tedy 11 znaků. Prvních 6 znaků názvu tvoří sigla instituce, znaky 7 a 8 popisují použitou znakovou sadu a znaky 9, 10 a 11 popisují formát dat (např. aba001kg.vfi).
Znaková sada (znaky 7 a 8): | |
---|---|
um | ISO 646 nebo ISO 5426 |
gi | veškerá diakritika pomocí GIZMO notace |
lg | PC Latin 2 + GIZMO |
kg | kód Kamenických + GIZMO |
uc | UNICODE UTF 8 |
sg | ISO 8859-2 + GIZMO |
Formát dat (znaky 9 až 11): | |
---|---|
dat | exportní soubor z ALEPH |
rum | řádkový UNIMARC |
uis | UNIMARC ISO 2709 |
vfo | Výměnný formát ISO 2709 |
vfi | Výměnný formát, exportní soubor ze systému CDS/ISIS |
V případě dávkové opravy dat bude název souboru rozšířen o příponu opr.
Při současném zaslání více souborů je třeba názvy odlišit např. číslem na konci názvu souboru.
Příklad: aba006lg.uis.....sigla=aba006, znaková sada=PC Latin2 + GIZMO formát dat=UNIMARC ISO 2709
Příklad dávkové opravy: aba006lg.uis.opr...sigla=aba006, znaková sada=PC Latin2 + GIZMO formát dat=UNIMARC ISO 2709
Příloha č. 2
Pohled LIST
Pohled je určen pro zobrazení seznamu výsledků rešerše (více záznamů).
Zdroje dle UNIMARC:
011a (ISSN), 200a (název), 102a (země vydání), 210d (datum vydání), 700a,b (autor), v případě, že autor chybí, bude zdroj 701a,b (alternativní autor), v případě že i 701 chybí, bude zdroj 702a,b (sekundární autor).
Formát zobrazení:
011a, 200a, 102a, 210d | 011a - 1.výskyt, 200a - 1.výskyt, 102a - 1.výskyt, 210d - v1.výskyt |
nebo | |
011a , 700a, 700b, 102a, 210d | 011a - 1. výskyt, 700a,b - 1.výskyt, 102a - 1. výskyt,210d - 1.výskyt |
nebo | |
011a, 701a, 701b, 102a, 210d | 011a - 1. výskyt, 701a,b - 1.výskyt, 102a - 1. výskyt, 210d - 1.výskyt |
nebo | |
011a, 702a , 702b (sekundární odpovědnost) 102a, 210d | 011a - 1. výskyt, 702a,b - 1.výskyt, 102a - 1. výskyt, 210d - 1.výskyt |
Pohled SHORT
Pohled je určen pro zkrácené zobrazení jednoho záznamu a vychází z 1.úrovně rozsahu údajů AACR2.
Zdroje dle UNIMARC:
200a,e,i,h , 700a,b,f chybí-li, pak 701a,b,f, chybí-li, pak 702a,b,f , 205a , 207a, 210a,c,d, 215a , 102a, 326a, 011a,z, 43X, 44X, VAHA, 910a,b,r,o
Formát zobrazení:
Název: | 200a | 1.výskyt |
Podnázev: | 200e | 1.výskyt v rámci 1.výskytu 200a |
Název části: | 200i | 1.výskyt v rámci 1.výskytu 200a |
Číslo části: | 200h | 1.výskyt v rámci 1.výskytu 200a |
Autor: | 700a, 700b, 700f nebo 701a, 701b ,701f nebo 702a, 702b, 702f, (sekundární odpovědnost)". | vždy 1.výskyt příslušného tagu |
Vydání: | 205a | 1.výskyt, pokud není uvedeno, neuvádí se |
Číslování seriálů | 207a | všechny výskyty |
Nakladatelské údaje: | 210a, 210c, 210d | 1.výskyt podpolí v rámci 1.výskytu tagu 210 |
Rozsah dokumentu: | 215a | 1.výskyt |
Země vydání | 102a | 1. výskyt |
Periodicita | 326a | 1. výskyt |
ISSN: | 011a 011z |
1. výskyt |
Předcházející název | 43X | všechny výskyty |
Následující název | 44X | všechny výskyty |
Váha: | VAHA | |
Sigla vlastníka: | 910a | všechny výskyty |
Roky odběru | 910r | všechny výskyty |
Signatura: | 910b | není-li vyplněno příslušné podpole 910b, vloží se text 'neuvedena' |
Datum aktualizace | 910o | poslední výskyt |
Příloha č. 3
Pohled LISTAKT
Pohled je určen k aktualizaci odběru seriálů a zobrazuje se po volbě dávková editace z menu služby.
Zdroje dle UNIMARC:
011a (ISSN), 200a (název), 700a,b (autor), v případě, že autor chybí, bude zdroj 701a,b (alternativní autor), v případě že i 701 chybí, bude zdroj 702a,b (sekundární autor), 102a (země vydání), 910r (roky odběru pro danou siglu).
Formát zobrazení:
011a, 200a, 102a, 910r | 011a - 1.výskyt, 200a - 1.výskyt, 102a - 1.výskyt, 910r |
nebo | |
011a , 700a, 700b, 102a, 910r | 011a - 1. výskyt, 700a,b - 1.výskyt, 102a - 1.výskyt, 910r |
nebo | |
011a, 701a, 701b, 102a, 910r | 011a - 1. výskyt, 701a,b - 1.výskyt, 102a - 1.výskyt, 910r |
nebo | |
011a, 702a , 702b (sekundární odpovědnost) 102a, 910r | 011a - 1. výskyt, 702a,b - 1.výskyt, 102a - 1. výskyt, 910r |