Zadání pro vývoj aplikací v systému

Tištěné seriály

0.verze

Zpracovaly:

Ing.Kateřina Hajná
Mgr.Danuše Vyorálková
PhDr. Eva Svobodová
PhDr. Hana Nová

Oddělení pro souborné katalogy
Oddělení periodik
Národní knihovna ČR

Zadání pro vývoj aplikací CASLIN - Souborného katalogu ČR (CASLIN - SK ČR) v systému ORACLE obsahuje slovní vyjádření funkcí katalogu, které jsou řešeny vývojem aplikací v systému ORACLE. Předmětem zadání není podrobný popis struktur a procedur. Dokumentace k jednotlivým procedurám bude vznikat v průběhu jejich vytváření a bude průběžně aktualizována do konečné podoby na základě úprav navržených členy Pracovní skupiny pro CASLIN - SK ČR
a Týmu technického rozvoje CASLIN - SK ČR v průběhu testování dokončených funkcí CASLIN - SK ČR. Obsah zadání byl projednán s dodavatelem aplikací a bylo dohodnuto, že detailní řešení jednotlivých aplikací bude operativně konzultováno v konkrétních možnostech. V zadání jsou uvedeny standardy pouze s odkazem na příslušné zdroje.V zadání není formulována, avšak v rámci fungování souborného katalogu bude řešena mimo jiné bezpečnost dat, napojení na e-mail a anglická verze katalogu.

Obsah:

Příjem dat
Vyhledávání
Zobrazení záznamů - pohledy
Stahování záznamů
Aktualizace odběru dokumentu
Připsání sigly k záznamu
Sdílená katalogizace
Statistiky
Kategorie uživatelů
Vlastník záznamu
Správce souborného katalogu
Nároky na technické vybavení uživatelů souborného katalogu

Přílohy:

Názvová konvence
Pohled LIST, SHORT
Pohled LISTAKT
Pohled LONG
Pohled ISBD

Úvod

Přechod k provozování báze seriálů CASLIN - Souborného katalogu ČR v systému ORACLE směřuje ke zkvalitnění všech dosud poskytovaných služeb uživatelům a také k vývoji takových aplikací, které umožní služby nové. Veškeré služby budou realizovány prostřednictvím SQL Serveru ORACLE a WebServeru ORACLE. Báze seriálů bude mít kromě funkce informační možnost sdílené katalogizace, on-line aktualizace odběru seriálů a přímého napojení na meziknihovní výpůjční služby, a to při zachování všech současných standardů pro dodavatele a příjemce dat. Dalším důležitým cílem je značná automatizace všech činností spojených se správou bází Souborného katalogu ČR včetně analýzy vstupních dat, a to s maximálním využitím k tomu účelu dosud vytvořených softwarových prostředků.

1. Příjem dat

1.1 Forma předání

1.1.1 Forma předání nových dat

a) disketa
Uživatelé zasílají nové záznamy klasicky na disketách, správce má tudíž možnost je analyzovat před spuštěním procesů v ORACLE aplikaci. Uživatel musí dodržovat názvovou konvenci, která umožňuje popsat formát dodaných dat a použitou znakovou sadu. Názvová konvence byla stanovena správcem v průběhu vývoje aplikací a je popsána v příl. č. 1.
b) upload
Uživatelé používají upload do určeného adresáře s podmínkou dodržení názvové konvence souborů.
c) zaslání dat na ftp server do stanoveného adresáře při dodržení názvové konvence souborů

1.1.2 Forma předání dávkových oprav

Možnosti stejné jako v 1.1.1, pouze název souboru je v souladu s názvovou konvencí a je posílán do speciálního adresáře.

Povolené formáty dat a znakové sady pro předávání záznamů

Znakový repertoár:

Abecedy na základě latinky, přípustné kódy jsou:

ISO 646 nebo ISO 5426 (manuál UNIMARC ,Příloha J )
veškerá diakritika kódována pomocí GIZMO notace (tabulka GIZMO notace instrukce Záznam pro souborný katalog, příloha H)
kód PC Latin 2 (Microsoft Code Page 852) + GIZMO
kód Kamenických + GIZMO
UNICODE UTF 8
ISO 8859-2 + GIZMO

Formát souborů dat:

Řádkový UNIMARC ( manuál UNIMARC) používá pro označení stopslov v Latin 2 PC znaky l ë
UNIMARC ISO 2709 (manuál UNIMARC, Záznam pro souborný katalog UNIMARC) používá pro označení stopslov v Latin 2 PC znaky l ë
Výměnný formát ISO 2709 (manuál CDS/ISIS) používá pro označení stopslov znaky <>
Exportní soubor z ALEPH používá pro označení stopslov znaky <<>>
Výměnný formát, exportní soubor ze systému CDS/ISIS (je totožný s ISO 2709, ale rozsegmentovaný na řádky po 80 znacích). používá pro označení stopslov znaky <>

1.2 Kontrola kvality dat

Všechny nové záznamy (nezávisle na způsobu dodání) a upravované záznamy budou před importem do souborného katalogu testovány. Součástí automatické kontroly je:

test na UNIMARC
přidělení kvalitativní váhy
test na duplicitu

1.2.1 Test na UNIMARC

Pomocí vyvinuté aplikace budou jednotlivé záznamy automaticky testovány na správnost zápisu do polí formátu UNIMARC.

Algoritmus testování na UNIMARC

U všech polí se prověří:

a) Zápis obecně

po tagu pole následuje znak pro indikátory nebo $ (kromě návěští a tagů 001, 005)
za každým označením podpole (znak $ plus jeden znak) následuje v podpoli minimálně jeden znak
v záznamu se vylučuje současná existence polí 700,710,720

b) Opakovatelnost, přítomnost a hodnota indikátorů

opakovatelnost polí
přítomnost a hodnota indikátorů
opakovatelnost podpolí

Vše podle tabulky hodnot UNIMARC manuál a tabulky hodnot pro národní pole.

c) Různé podmínky zápisu v poli

správnost ISSN lze kontrolovat dle postupu popsaném v definici tohoto pole v UNIMARC
101 je-li přítomno podpole b nebo c, hodnota prvního indikátoru je 1 nebo 2
600,700,701,702: je-li přítomno podpole b, hodnota druhého indikátoru je 1. Hodnota druhého indikátoru 1 není vyloučena při nepřítomnosti podpole b.
jestliže v pozici 6 návěští (labelu) je jiný kód než a, musí být 200b vyplněno

Test na přítomnost polí nezbytných k jednoznačné identifikaci dokumentu

(Povinná pole testu na UNIMARC)
Návěští: povinná délka 24 znaků
001
005: repertoár - arabské číslice plus tečka, 8 až 16 znaků
100: pozice 0-7 číselné znaky, pozice 21 hodnota 0 či 1, pozice 22-24 repertoár viz UNIMARC, Příloha A, pozice 26-29 hodnoty 0,1,3, pozice 30-33 obsahuje mezery
101: repertoár viz UNIMARC, příloha A
102: repertoár viz ISO 3166 plus možnost xx, XX pro nezjistitelnou zemi vydání
200: povinné podpole a
801 podpole a,b (repertoár k dispozici u správce SK),c
910 podpole a (repertoár k dispozici u správce SK) , r nebo s

1.2.2 Váha záznamů

Váha je numerická hodnota vyjadřující kvalitu záznamu , která bude dávce záznamů přidělena na základě níže popsaného algoritmu.

Seznam vah

VÁHA	KVALITA ZÁZNAMU
4	Nestandardní
9	Záznam vyhovuje ve jmenném popisu, chybí MDT
10	Záznam vyhovuje ve jmenném i věcném popisu
12	Záznam obsahuje i nepovinná pole
13	Přidělena při ručním zpracování správcem
20	Záznam Národní knihovny ČR
21	Přidělena při ručním zpracování správcem záznamům NK ČR

Postup přidělování vah:

Vytvořit tabulku sigel a k nim přidělených vah pro knihovny, které budou dodávat záznamy.
Každá nová knihovna bude ručně analyzována, správce jí přidělí váhu a zapíše do tabulky.
Vyskytne-li se v prostoru pro vstupní data soubor se siglou v názvu, která dosud není v tabulce, nebude se automaticky analyzovat, ale bude upozorněn správce, který data zanalyzuje.
Data došlá od knihoven, které již mají přidělenou váhu v tabulce, projdou automatickým testem na přidělování vah. Takto přidělená váha bude automaticky porovnána s vahou v tabulce. Bude-li shodná, data se zpracují automaticky. Bude-li se váha lišit, zpracování dat se zastaví a bude upozorněn správce.

Algoritmus přidělování vah

Záznamy v dávce splňující povinná pole testu na UNIMARC obdrží váhu 4
Záznamy v dávce splňující bod 1) a některé z následujících povinných polí 011, 205, 210, 215, 225, 326, 43X, 44X, 510, 517, 700, 701, 702, 710, 711, 712 obdrží váhu 9
Záznamy v dávce splňující bod 2) a povinné pole 675 obdrží váhu 10
Záznamy splňující bod 3) a některé z následujících nepovinných polí obdrží váhu 12 Nepovinná pole: 110, 207, 3XX (kromě 326), 410, 421, 422, 423, 451-454, 512, 514, 516, 520, 530, 531, 532, 540, 6XX (kromě 675), 952, 968, 969, 970, 979, 980.
Záznamy v dávce splňující bod 4) a patřící Národní knihovně ČR (sigla ABA001) obdrží váhu 20

1.2.3 Test na duplicitu klíčů

Záznamy budou automaticky testovány na duplicitu, záznamy s vyšší váhou budou přemazávat záznamy s nižší váhou.

Klíče pro porovnávání záznamů:

Primární klíč

ISSN (pole 011a) - použít pouze znaky (0 - 9,X), znak "x" převést na "X", není-li zdroj 011a, klíč nelze sestavit, je-li více výskytů 011a, pak záznam do souboru "ISSN" a klíč nesestavovat
první tři alfanumerické znaky z prvního slova z názvu, 3., 4. a 5. alfanumerický znak z druhého slova z názvu a 2., 3. a 4. alfanumerický znak z třetího slova z názvu a první tři alfanumerické znaky ze čtvrtého slova z názvu (pole 200a)
první tři alfanumerické znaky z prvního slova z názvu části, 3., 4. a 5. alfanumerický znak z druhého slova z názvu části a 2., 3. a 4. alfanumerický znak z třetího slova z názvu části a první tři alfanumerické znaky ze čtvrtého slova z názvu (pole 200i)
obsah pozice 6 v návěští (labelu)

Sekundární klíč

Je tvořen ze dvou částí:
První část má proměnnou délku a je tvořena obsahem celého podpole 200a (název dokumentu), přičemž jsou určena pravidla ohledně diakritiky, stopslov a údajů v < >. Rovněž se nerozlišují malá a velká písmena.
Druhá část má konstantní délku a je složena z více zdrojových podpolí.

9 alfanumerických znaků z názvu části tak, že se vezmou první 3 alfanumerické znaky z prvního slova, 3., 4. a 5. alfanumerický znak z druhého slova a 2., 3. a 4. alfanumerický znak z třetího slova (z pole 200i)
následuje 9 alfanumerických znaků z podnázvu tak, že se vezmou první 3 alfanumerické znaky z prvního slova, 3., 4. a 5. alfanumerický znak z druhého slova a 2., 3. a 4. alfanumerický znak z třetího slova (z pole 200e)
následuje 1 znak, a to pozice 6 v návěští (labelu)

Tato druhá část sekundárního klíče je koncipována pozičně, takže chybí-li některý zdroj tvořící počáteční pozice klíče a následující zdroj je přítomen, doplní se chybějící zdroj nebo jeho část mezerami. Druhá část sekundárního klíče je testována na délku pro stanovení krátkých klíčů.Minimální délka je 19 znaků.

Porovnávání záznamů

1) primární klíč	existuje, pak 2) neexistuje, pak 5)
2) primární klíč	je duplicitní, pak 3) není duplicitní, pak 4)
3) porovnat 200h	je duplicitní, pak záznamy jsou duplicitní (prázdné 200h je také hodnota) a provede se 10) není duplicitní, pak dvojici záznamů do souboru "číslo části" a záznam v bázi zamknout (viz níže)
4) porovnat 011a	je duplicitní, pak dvojice záznamů do souboru "ISSN" a záznam v bázi zamknout (viz níže) není duplicitní, záznamy jsou různé
5) porovnat sekundární klíč	je duplicitní, pak 6) není duplicitní, pak jsou záznamy různé
6) porovnat 200h	je duplicitní, pak 7) není duplicitní, pak dvojice záznamů do souboru "číslo části" a záznam v bázi zamknout (viz níe)
7) porovnat 710a,b(vechny výskyty b v řadě za sebou), pokud v jednom ze záznamů chybí 710, porovnat 710 a všechny výskyty 711 nebo chybí-li v obou 710 porovnat všechny výskyty 711 a 711 výše popsaným způsobem; pokud chybí i 711, porovnat všechny výskyty 712 a 712	je alespoň jedna duplicita nebo není přítomno 7XX ani v jednom ze záznamů, pak 8) není duplicita, pak dvojice záznamů do souboru "korporace" a záznam v bázi zamknout (viz níže)
8) porovnat všechny kombinace výskytů 210a v obou záznamech	najde se alespoň jedna duplicita, pak jsou záznamy duplicitní (prázdné 210a není hodnota) a provede se 9) nenajde se duplicita v obou záznamech, pak dvojici záznamů do souboru "místo vydání" a záznam v bázi zamknout (viz níže)
9) porovnat 910r a chybí-li porovnat 910s u výskytů tagu 910 s totožným 910a	je duplicitní, pak 10) není duplicitní, pak záznam do souboru "odběr" a odpovídající záznam v bázi zamknout (viz níže)
10) spojit záznamy dle TABPER a záznam do báze

Při slučování duplicitních záznamů zůstane v bázi záznam s vyšší vahou a v něm dojde k těmto změnám uvedeným v tabulce Tabper.
TABPER:

POLE	OZNAČENÍ	OPAKOVATELNOST	ZMĚNA
návěští (label)	pozice 5 - status záznamu	neopakovatelné	změna kódu n na c
005	datum posledního zpracování	neopakovatelné	uloží se nejvyšší datum z duplicitních záznamů
326a,b	poznámka o periodicitě	opakovatelné	uloží se všechny výskyty ze záznamu s nejvyšším datem v 005, a to v pořadí, v jakém byly v původním záznamu
517a	variantní název	opakovatelné	uloží se všechny různé výskyty z obou duplicitních záznamů, na pořadí nezáleží
520a	předchozí název	opakovatelné	uloží se všechny různé výskyty z obou duplicitních záznamů, na pořadí nezáleží
540a	další název dodaný katalogizátorem	opakovatelné	uloží se všechny různé výskyty z obou duplicitních záznamů, na pořadí nezáleží
711a,b 712a,b	korporace	opakovatelné	uloží se všechny různé výskyty z obou duplicitních záznamů, na pořadí nezáleží
910r,s	odběr	opakovatelné	do výskytu pole 910 s totožným 910a se uloží totožný výskyt 910r,s z jednoho ze záznamů z výskytu s totožným 910a

Při dávkovém i dialogovém režimu zpracování seriálů nastanou situace (níže popsané), kdy dostane správce báze záznamy ke kontrole. Tyto záznamy budou rozděleny do několika souborů podle typu kontroly a úprav, které bude správce provádět. K tomu účelu bude vytvořena speciální obrazovka, v níž bude správce volit, který ze souborů chce právě kontrolovat.

Záznamy do jednotlivých souborů budou přibývat chronologicky tak, jak přijdou ze vstupu. Ubývat budou tak, jak je správce bude odesílat jako zpracované.

JEDNOTLIVÉ SOUBORY:

1) ISSN
Záznam z báze bude uzamčen pro editaci uživatelem, ale ne pro automatické porovnávání přes klíče. Po stisknutí tlačítka ISSN má správce má možnost úplné editace (včetně vah) obou záznamů. Po kontrole a úpravách potvrdí příslušnou dvojici (nebo vstupní záznam v případě více výskytů 011a) a tím docílí případného přepsání záznamu v bázi a opětovného automatického porovnání vstupního záznamu přes klíče pro import do báze.

2) číslo části
Záznamy zamkni stejně jako Ad1). Po kontrole a úpravách správce potvrdí příslušnou dvojici a tím docílí případného přepsání záznamu v bázi a opětovného automatického porovnání vstupního záznamu přes klíče pro import do báze.

3) místo vydání
Záznamy zamkni stejně jako Ad1). Správce po kontrole a úpravách potvrdí příslušnou dvojici
a) jako duplicitní, pak se vstupní záznam zpracuje jako upd nebo add dle vah,
b) jako různou, pak se vstupní záznam přihraje jako new.

4) odběr
Odpovídající záznam v bázi zamkni Ad1) až do provedení kontroly a úprav správcem. Po potvrzení záznamu ze souboru "odběr" tento záznam přepíše příslušný záznam v bázi.

V souborech, které jsou tvořeny dvojicemi (báze - vstup), se zobrazí záznam z báze vždy aktuální. To znamená, přísluší-li ke dvěma různým vstupním záznamům v souboru týž záznam z báze, zobrazí se po úpravě a potvrzení první dvojice ve druhé dvojici již aktualizovaný záznam z báze.

Všechny soubory pro kontrolu vznikají při dávkovém zpracování a při dialogovém ukládání nových záznamů (7.2). Při ukládání takto vytvořeného záznamu bude záznam automaticky porovnán přes klíče pro import do báze. Váha mu bude přidělena dle tabulky sigel.

1.3 Statistiky chyb

Při automatizovaném zpracování dávek dat budou vznikat statistiky chyb v těchto krocích:

při čtení záznamu
při konverzi z Výměnného formátu do UNIMARCu
při testu na UNIMARC

Statistiky chyb budou prostřednictvím e-mailu s příslušným komentářem zaslány zpět dodavateli k opravě.

2. Vyhledávání

2.1 Na základě přístupových souborů

V režimu vyhledávání má uživatel možnost prohlížet přístupové soubory na základě zadání selekčního termínu. Přístupové soubory jsou abecedně setříděné. Při zadání dotazu se zobrazí seznam selekčních termínů, který začíná termínem předcházejícím abecedně zadanému dotazu. V seznamu termínů je možno se pohybovat dopředu i zpět a také vybrat termín pro vyhledání odkazovaných záznamů do souboru hitů.

Uživatel má také možnost zadat dotaz pro přímé vytvoření souboru hitů. V tomto případě lze zadávat složitější dotazy kombinací selekčních termínů z jednoho i více přístupových souborů pomocí logických operátorů (and,or,not). Při zadávání selekčního termínu je možno používat pravostranné i levostranné krácení a maskovací znaky pro náhradu jednoho nebo více znaků uprostřed slova. Při vyhledávání budou vyloučena stopslova. Při prohlížení přístupového souboru bude ze záznamu v přístupovém souboru zobrazen selekční termín a počet k němu odkazovaných záznamů. Při vyhledávání má uživatel možnost filtrovat záznamy vyhledávaných dokumentů dle jazyka dokumentu (101a), provenience (102a), druhu dokumentu (200b), sigly odběratele (910a) a roku aktualizace (910o).

Rešerši má uživatel možnost dále zjemňovat nebo rozšiřovat pomocí logických operátorů omezením dotazu na již vytvořený soubor hitů. Uživatel má možnost mít dočasně uloženo v paměti více souborů hitů.

Pokud by výsledkem rešeršního dotazu bylo více než 200 záznamů, nezíská uživatel soubor hitů, ale dostane na obrazovku zprávu: "Počet vyhledaných záznamů je větší než 200, zjemněte rešerši". Zjemnění rešerše je dále možné pomocí : free (všechna slova)
slova z - názvu
edice
korporace
vydavatele
místa vydání
klíčová slova
rok odběru

Uživatel má také možnost získat výsledek rešerše jako tiskový výstup ve formátu SHORT, přičemž má možnost výstup setřídit dle názvu (200a) nebo podle země vydání (102a) nebo podle data vydání (210d) jak je uvedeno ve formátu SHORT.

Zalogovaný uživatel bude mít možnost vytvořit soubor záznamů pro pozdější export. Soubor záznamů bude vyhledán podle data aktualizace bibliografického záznamu (pole 005) - jednotlivé datum nebo interval v kombinaci se siglou (910a) uživatele.

Soubory autorit
Vyhledávání podle autorit přes prohlížení abecedně setříděného seznamu zadaného typu autority (autor, korporace, MDT ap.) a to tak, že po vybrání konkrétní autority ze seznamu se uživateli zobrazí počet vyhledaných záznamů a přímo tyto záznamy v určitém pohledu opět ve tvaru seznamu. Bude možná volba zúžení nebo rozšíření rešerše např. kombinací s jiným typem autority booleovským operátorem. Soubory autorit budou mít ve svých záznamech i pole pro odkazy. Soubory autorit tvoří:

Názvy - NZ(TI):
zdroj 200a, 200i, 200d, 43X, 44X, 510a, 517a. Z každého uvedeného podpole se vytvoří jeden řádek v přístupovém souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů. Údaj v podpoli 200d může začínat rovnítkem (=). V takovém případě je třeba do přístupového souboru přenést pouze údaj bez počátečního rovnítka.

MDT - DT(DC):
zdroj 675a. Z každého uvedeného podpole se vytvoří jeden řádek v přístupovém souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.

ISSN - SN (SN):
zdroj 011a, 011z, 011y, 225x, 43X $1 011$$a, 44X$1 011$$a. Z každého uvedeného podpole se vytvoří jeden řádek v přístupovém souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.

Korporace, autoři - KO(CP):
zdroj 700abdcf, 701abdcf, 702abcdf, 710aghbcdfe, 711aghbcdfe, 712aghbcdfe. Z každého uvedeného tagu se vytvoří jeden řádek v přístupovém souboru z podpolí v pořadí, jak jsou uvedena, přičemž u opakovatelného podpole budou vypsány nejprve všechny výskyty a teprve pak bude řádek pokračovat dalším podpolem v pořadí. Záznam autority bude zobrazen jako obsahy podpolí ze zdroje v uvedeném pořadí oddělené interpunkcí v apostrofech takto: 700a', '700b' '700d', 'všechny výskyty 700c oddělené ', ' následuje ', '700f pro tagy 701 a 702 platí stejná interpunkce jako pro tag 700, 710a'( '710g')' následuje ' 'všechny výskyty 710h oddělené ' ' následuje '. 'všechny výskyty 710b oddělené '. ' následuje '( 'všechny výskyty 710c oddělené ', ' následuje ') ' následuje '( 'všechny výskyty 710d oddělené ' : ' následuje ' : '710f' : '710e') ' Pokud chybí některé z podpolí, interpunkce, která je předchází, se vynechá. Pokud kompletně chybí zdroj pro výraz v kulatých závorkách, tyto se vynechají. Záznam autority bude též udávat počet odkazovaných záznamů.

Edice - ED(SR):
zdroj 410$1podpole200a, 200d, 200i, chybí-li pole 410, pak je zdroj 225a, 225d, 225i. Z každého uvedeného podpole se vytvoří jeden řádek přístupového souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů. Údaj v podpolích 200d a 225d může začínat rovnítkem (=). V takovém případě je třeba do přístupového souboru přenést pouze údaj bez počátečního rovnítka.

Zpracovatel - ZP(CT):
zdroj 801b. Z každého výskytu uvedeného podpole se vytvoří jeden řádek přístupového souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.

Vlastník dokumentu - VL(OW):
zdroj 910a. Z každého výskytu uvedeného podpole se vytvoří jeden řádek přístupového souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.

Aktualizace odběru - AO(US):
zdroj 910o. Z každého výskytu uvedeného podpole se vytvoří jeden řádek přístupového souboru. Záznam autority bude zobrazen jako obsah podpole ze zdroje plus počet odkazovaných záznamů.

Při abecedním řazení přístupových souborů je třeba ignorovat pomlčky (oddělené mezerami), velká písmena, čárky, dvojtečky, tečky a středník.

Soubory slov

Vyhledávání podle slov z vybraných polí (opět bude možné postupné zužování rešerše) umožňuje vyhledávat v určitém vybraném souboru slov a nebo přes všechny soubory slov, následně bude zobrazen počet nalezených záznamů a jejich seznam (viz výše). Soubory slov tvoří:

Slova z názvů - SNZ(WTI): zdroj 200adeic, 225adi, 510a, 517a, 43X, 44X
Slova z korporací a autorů - SKO(WCP): zdroj 700ab, 701ab, 702 ab, 710abce, 711abce, 712abce
Klíčová slova - SKL(WKW): zdroj 6XX (kromě pole 675)
Druh dokumentu - SDR(WSO): zdroj 200b
Slova z nakladatele - SNA(WPU): zdroj 210c
Místo vydání - SMV(WPE): zdroj 210a

Při vytváření souborů slov je třeba od jednotlivých slov odstranit pomlčky (oddělené mezerami), čárky, dvojtečky, tečky a středník.

2.2 Řetězcové vyhledávání

Řetězcové vyhledávání umožní vyhledávat podle řetězce znaků obsaženého v určitém (uživatelem zadaném) poli a podpoli. Protože takováto rešerše bude časově náročná při velkém počtu dat, bude probíhat jako procedura na pozadí a po skončení ohlásí jméno výsledného souboru hitů.
Pozn.: Možnost řetězcového vyhledávání pro uživatele bude během vývoje aplikace zvážena dle zatížení serveru.

3. Zobrazení záznamů - pohledy

Pro zobrazení vyhledaných záznamů dokumentů budou vytvořeny různé pohledy, jejichž používání bude povoleno na základě přístupových práv uživatele. Po ukončení vyhledávání si uživatel vybere konkrétní záznam ze seznamu zobrazeném v pohledu LIST (viz. příl. č. 2) a ten se mu zobrazí v pohledu SHORT (viz příl. č. 2), který mu dodá základní identifikaci dokumentu a lokační informace (v rozsahu údajů 1.úrovně popisu podle AACR2). V tomto místě bude mít možnost přes siglu vlastníka dokumentu dostat zobrazení jeho záznamu z Adresáře knihoven a institucí a v případě, že vlastník má e-mailovou adresu, bude mít možnost poslat přímo z tohoto zobrazení mailem zprávu dané instituci. Rovněž je možnost kliknutím na url adresu vstoupit na domácí stránku vlastníka. Uživatel má rovněž možnost přímo využít meziknihovní výpůjční službu souborného katalogu. Pokud má uživatel zájem o podrobné bibliografické údaje může zvolit pohled LONG (viz příl. č. 3), kde se zobrazí rozšířený záznam. Zde je žádoucí vytvářet statistiku kolik záznamů a kdo si v tomto pohledu prohlížel. Pohled LISTAKT (viz. příl. č. 3) je určen k aktualizaci odběru seriálů.

Údaje, z nichž se vytváří soubory autorit, budou v pohledech zvýrazněny a uživatel kliknutím na některý z těchto údajů spustí vyhledávání. Zobrazí se mu seznam selekčních termínů abecedně setříděný a začínající termínem předcházejícím abecedně zvolený údaj. Uživatel bude mít k dispozici nápovědu.

Úplný UNIMARC
Pohled je určen k zobrazení všech údajů v záznamu ve formátu řádkového formátu UNIMARC, přičemž budou zobrazeny všechny výskyty polí a podpolí.

Dynamický pohled
Pohled umožňuje uživateli předem vybrat a předdefinovat pole, která mají být zobrazena, a tento formát zobrazení si pojmenovat a uložit ve svém prostoru pro další použití. Záznam se zobrazí jako řádkový UNIMARC omezený pouze na vybraná pole. Další výskyty polí a podpolí zobrazovaných ve formátu dynamický pohled lze zobrazit najetím na příslušný údaj a kliknutím myší nebo stiskem určené klávesy. Uživatel bude mít k dispozici nápovědu.

Pohled ISBD - minimální záznam dle doporučení ISBD
Formát zobrazuje pouze údaje povinné pro souborný katalog, a to dle doporučení ISBD (viz. příl. č. 5). Jednotlivé oblasti ve formátu zobrazení jsou odděleny interpunkcí dle doporučení ISBD. Chybí-li v datech pro některou oblast údaj, oblast se vynechá včetně interpunkce, která ji předchází.

4. Stahování záznamů

Dávkově
Po naplnění paměti záznamy z rešerše bude mít uživatel možnost z ní vymazat ty záznamy, které nechce stahovat do své báze. Při vlastním stažení je nutno je zaúčtovat. Při účtování regulérně stažených záznamů je třeba vyloučit ty, které si stáhl vlastník (jsou jeho a není důvod mu je účtovat). Správce souborného katalogu obdrží výstup, který bude obsahovat celkový počet záznamů a počty záznamů v podskupinách s touž váhou včetně její hodnoty. Uživatel má možnost stahování jednotlivých záznamů nebo dávek záznamů ve zvoleném formátu a znakovém repertoáru, který zadá v menu. Při využití obsahu pole 001 u záznamů editovaných vlastníkem záznamu může uživatel vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším (staženým ze souborného katalogu).

5. Pravidelná aktualizace odběru dokumentu

Pravidelná aktualizace odběru může probíhat po jednotlivých titulech nebo dávkově.

5.1 Po jednotlivých titulech

Uživatel má možnost upravovat roky odběru u jednotlivých tiutulů, které vlastní a jsou uvedeny v bázi. Po zalogování a vyhledání požadovaného titulu se uživateli otevře pro editaci pole 910 b,s,r,p,u, přičemž v zobrazeném podpoli 910a je jeho sigla. Po skončení úprav systém před uložením do databáze zkontroluje, zda je vyplněné podpole 910r a automaticky doplní do podpole 910o datum aktualizace údajů ve tvaru RRRRMM. Dialogová obrazovka umožňuje také zrušení odběru jedním tlačítkem.

Tuto možnost má oprávněný uživatel i mimo pravidelnou aktualizaci.

Jestliže uživatel, který zrušil roky odběru, je vlastníkem záznamu, přechází vlastnictví záznamu na správce. Zruší-li vlastník dokumentu podpole odběru tak, že 910r a současně 910s budou prázdné, systém zjistí, zda existuje ještě alespoň jeden výskyt pole 910 s obsazeným 910r nebo 910s. Jestli ano, systém vymaže celý výskyt pole 910, u něhož byl zrušen odběr (910r a 910s prázdné), jestli ne, systém ponechá pouze 910a a do 910p vloží text "vyřazeno" u pole 910, kde byl zrušen odběr.

5.2 Dávkově

Uživatel po zalogování zadá z menu požadavek dávková editace a systém mu nabídne seznam jeho titulů, u nichž v podpoli 910r nebo 910s není ukončen odběr. Uživatel v seznamu označí tituly, které chce editovat a potom postupuje stejně jako v bodě 5.1. Po ukončení editace vybraných titulů systém před uložením dat do báze zkontroluje, zda je vyplněné podpole 910r nebo 910s. U všech titulů ze seznamu celé dávky systém automaticky doplní datum aktualizace ve tvaru RRRRMM. Při velkém počtu titulů uloží celý soubor do schránky. Takto uložený soubor lze zpracovávat po částech. U zpracovaných titulů systém před uložením do báze zkontroluje, zda je vyplněné podpole 910r nebo 910s a po schválení doplní automaticky datum aktualizace ve tvaru RRRRMM. Takto zpracované záznamy uloží do báze a vymaže ze souboru uloženém ve schránce.Pro aktualizaci, kterou provádí správce, je nutný tiskový výstup, tzn. seznam titulů vybraný podle sigly odběratele (910a) a neukončeným odběrem (910r nebo 910s). Seznam je ve formátu LISTAKT (pole 011a, 200a, 102a, 910r, 910s). Seznam je uveden hlavičkou SIGLA + editovatelný text.

6. Připsání sigly k záznamu

Uživatel má možnost k existujícím záznamům v souborném katalogu připsat svou siglu a roky odběru (signaturu, poznámku, dobu uchovávání), v případě, že vlastní daný dokument. Po zalogování se oprávněnému uživateli otevřou podpole 910b, s, r, p, t, u do nichž uloží data. Do podpole 910a se automaticky doplní jeho sigla. Systém zkontroluje, zda je vyplněno podpole 910r a automaticky doplní datum aktualizace do podpole 910o.

Zároveň s potvrzením sigly má uživatel příslušné kategorie možnost záznam si stáhnout buď přímo nebo do schránky.

7. Sdílená katalogizace

Oprávněný uživatel má možnost editace a doplňování nových záznamů pomocí vstupních formulářů, které umožní editaci pole, mazání pole a vkládání pole na určenou pozici v záznamu. Uživatel má možnost do pole 001 uložit identifikační číslo záznamu, které může využít při zpětném stažení záznamu do své báze. Se všemi změnami záznamů se automaticky aktualizují přístupové soubory.

7.1 Úpravy bibliografických záznamů (editace)

Při úpravách záznamů vlastníkem přímo v souborném katalogu bude možné rozhodnout zda prohlížený záznam chce vlastník otevřít k následným úpravám. Po provedených úpravách bude mít možnost akci zrušit nebo potvrdit. Dále bude mít možnost rozhodnout, zda takto upravený záznam zahrne do dávky určené pro stažení do své báze. Účtování jako v kapitole 4. Při editaci má možnost vložit do svého záznamu identifikační číslo (tag 001), a tím může vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším, který upravil v souborném katalogu. Použití tagu 001 umožní plně využít tuto službu také knihovnám, které jsou nuceny provádět konverzi formátu záznamů vlastními prostředky. Bude existovat možnost předem určit pole záznamu, která bude moci editovat jen správce např. pole VÁHA. Zvýšení váhy dosažené editací v souborném katalogu lze uživateli kladně zaúčtovat. V zobrazení SHORT bude automaticky zobrazováno systémové datum (z pole 005, ve tvaru RRRRMMDD), kdy došlo k úpravě záznamu. Zároveň s potvrzením úpravy záznamu má uživatel příslušné kategorie možnost záznam si stáhnout buď přímo nebo do schránky.

Při editaci záznamů v dialogovém režimu jsou zakázána pro editaci tato pole a podpole:
005 (datum vloží systém)
011a
200a.i
200h pokud je již vyplněno
910 všechny výskyty, kde 910a se nerovná sigle uživatele
910a
910r,s další výskyty

7.2 Tvorba nových záznamů

Při vytváření nového záznamu bude v souborném katalogu uživateli nabídnut formulář bibliografického záznamu, který bude odpovídat minimálnímu záznamu a nebude obsahovat nepovolená pole. V podpoli 910a se automaticky vyplní sigla příslušné zalogované knihovny. Vstupní formulář je rozepsán v příl. č. 5.

Pro editaci bude k dispozici vstupní formulář, který zobrazí kompletní obsah editovaného záznamu a nevyplněná pole minimálního záznamu.
U zvolených polí, která nejsou jednotlivě uvedena ve formuláři, má katalogizátor možnost takto předvolená pole pro ukládání zahrnout do verze vstupního formuláře, kterou si pojmenuje, uloží do svého prostoru a kdykoli znovu použije.

Vysvětlení ke vstupnímu formuláři pro ukládání nových záznamů:
Nad skupinou návěští pro jednotlivá podpole je nadřazeno návěští pro celé pole, aby bylo možno volit další výskyty celých polí a také jednotlivých podpolí v rámci jednoho výskytu pole pro ukládání dat.

po zvolení dalšího výskytu celého pole se vyprázdní všechna okénka (vstupní prostor) pro jednotlivá podpole daného pole.
po zvolení dalšího výskytu určitého podpole v rámci téhož výskytu celého pole se vyprázdní pouze okénko příslušné tomuto podpoli.

Další výskyt pole bude možno volit stiskem tlačítka návěští celého pole. Výskyty podpolí bude možno volit stiskem příslušného návěští podpole. Uživatel má možnost při katalogizaci přetahovat do záznamu údaje ze souborů autorit. Do příslušného vstupního okénka zadá začátek údaje a kliknutím na ikonu dostane na obrazovku seznam autorit abecedně setříděný a začínající termínem předcházejícím v abecedě zadaný údaj. Vybere zvolenou autoritu, kliknutím na ikonu se autorita přetáhne do katalogizovaného záznamu a zobrazí se ve vstupním formuláři. Uživatel bude mít k dispozici systém nápověd (helpů). Opakovatelná pole a podpole jsou ve vstupním formuláři označena (O) . Neoznačená pole a podpole jsou neopakovatelná.

Vstupní okénka pro 200a a 200e budou dvouřádková (aby se údaj celý zobrazil).
Zároveň s potvrzením úpravy záznamu má uživatel příslušné kategorie možnost záznam si stáhnout buď přímo nebo do schránky.

8. Statistiky

Statistiky budou vytvářeny pro uživatele i správce a bude je možno využít pro pozdější účtování. Uživatel má možnost zobrazit si statistiku a zprávy systému vztahující se k jeho činnosti v bázi na konci své aktivity. Tyto statistiky budou archivovány po dobu stanovenou správcem a přístupné uživateli.

8.1 Statistika pro uživatele obsahuje:

siglu uživatele (login)
IP adresu, ze které akce probíhala
činnosti, které systém prováděl
počty zpracovávaných záznamů při sdílené katalogizaci rozdělené na editované, nově uložené, stažené svoje a cizí
hlášení o provedení úpravy pole 910r nebo 910s
chybová hlášení
datum a čas relace.

8.2 Statistika pro správce (za 24 hodin):

počet přihlášených aktivních uživatelů
seznam jejich login (kliknutím na položku se zobrazí příslušná statistika uživatele)
počet přihlášených pasivních uživatelů
chybová hlášení
počet naimportovaných záznamů (přidaných - add, přepsaných - upd, nových) včetně uvedení jejich váhy.

9. Kategorie uživatelů

Uživatelé budou rozděleni do několika kategorií podle oprávnění využívat určitých služeb, které souborný katalog poskytuje. Toto bude řešeno přidělováním přístupových práv uživatelům správcem souborného katalogu.

Kategorie uživatelů:

1. kategorie - pasivní uživatel
využívá pouze informační funkci souborného katalogu, a to lokační i bibliografickou s možností přímého propojení na meziknihovní výpůjční službu vlastníka dokumentu.

vyhledávání

2. kategorie
využívá služby kategorie 1. a má také možnost stahovat záznamy

vyhledávání
stahování záznamů

3. kategorie
využívá služby kategorie 1. a má také možnost připsat k záznamu svoji siglu (dle login).

vyhledávání
připsání sigly a roků odběru

4. kategorie
využívá služby kategorie 3. a má také možnost stahování (downloading) jednotlivých záznamů nebo předem vybraných dávek záznamů ve zvoleném formátu (viz platné standardy kapitola 1) do svého prostoru. Stažené záznamy budou účtovány, v případě že uživatel není jejich vlastníkem.

vyhledávání
stahování záznamů
připsání své sigly a roků odběru k záznamu dokumentu, který vlastní

5. kategorie - aktivní uživatel
využívá služby kategorie 4. a má také možnost editovat záznamy, jichž je vlastníkem, případně si takto upravené záznamy může stáhnout do své báze a pomocí příznaku (tag 001), který má při výše zmíněné editaci v souborném katalogu možnost vložit do záznamu, může vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším, který upravil v souborném katalogu. Uživatel této kategorie má také možnost vytvářet zcela nový záznam přímo v souborném katalogu do připraveného formuláře (viz příl č. 5). Takto vytvořené záznamy se budou účtovat jako dávkově dodané.

vyhledávání
stahování záznamů
připsání své sigly k záznamu dokumentu, který vlastní
oprava (editace) záznamů
vytváření nových záznamů přímo v souborném katalogu

10. Vlastník záznamu

Vlastník záznamu (z hlediska účtování) je ten, kdo záznam do báze dodal a na základě porovnání na duplicity před vlastním importem do báze mu zůstala původní vlastnická práva. To znamená, že záznam byl přijat jako nový nebo jako duplicitní, ale s vyšší přidělenou vahou, než měl týž záznam v souborném katalogu od jiného vlastníka. Z toho vyplývá skutečnost, že během plnění databáze se tato vlastnická práva (ale i určitá odpovědnost za kvalitu) u určitého záznamu mohou stále měnit až do určité maximálně dosažitelné váhy.

11. Správce souborného katalogu

11.1 Zpracování vstupní dávky dat

konverze vstupních dat do řádkového formátu UNIMARC, pokud jsou dodána v jiném povoleném formátu
formálně logické kontroly a přidělení váhy záznamům procedurou, přičemž na výstupu bude soubor přijatých záznamů s přidělenou váhou a statistika o chybných záznamech, správce má možnost jednorázově pro konkrétní dávku změnit váhu automaticky přidělenou bez ručního zásahu do tabulky sigel
porovnání nově přijatých záznamů na duplicity a vytvoření statistiky
import záznamů do báze

Celý tento proces má správce možnost spustit jako celek, takže jednotlivé kroky proběhnou automaticky v návaznosti na sebe, nebo po jednotlivých krocích tak, že má možnost kontroly výstupů z každého kroku. V obou variantách správce může nastavit datum a čas spuštění celého procesu nebo kroků.

11.2 Zpracování záznamů vzniklých on-line katalogizací

Záznamy editované vlastníkem a nově uložené budou zpracovány automaticky jako vstupní dávka dat. Editované budou odlišeny od nově uložených. Správce bude o takových záznamech informován v denní statistice o bázi tak, že dojde-li ke zvýšení váhy u editovaných záznamů, bude to ve statistice patrné.
Podrobné zadání vlastní správy dat bude provedeno pouze interně mezi správcem souborného katalogu a softwarovou firmou.

12. Nároky na technické vybavení uživatelů souborného katalogu

Uživatel 1. a 3. kategorie (viz kapitola 9)
HW vybavení, které umožňuje používání prohlížeče www (Explorer, Netscape), prohlížeč musí obsahovat znakovou sadu UNICODE.
Uživatel 2., 4., a 5.kategorie (viz kapitola 9)

PC 486
Operační paměť 16 MB
Prohlížeč www Netscape od verze 4.04, Explorer od verze 4.01

Příloha č. 1

Názvová konvence

Délka názvu datového souboru je 8+3 tedy 11 znaků. Prvních 6 znaků názvu tvoří sigla instituce, znaky 7 a 8 popisují použitou znakovou sadu a znaky 9, 10 a 11 popisují formát dat (např. aba001kg.vfi).

Znaková sada (znaky 7 a 8):
um	ISO 646 nebo ISO 5426
gi	veškerá diakritika pomocí GIZMO notace
lg	PC Latin 2 + GIZMO
kg	kód Kamenických + GIZMO
uc	UNICODE UTF 8
sg	ISO 8859-2 + GIZMO

Formát dat (znaky 9 až 11):
dat	exportní soubor z ALEPH
rum	řádkový UNIMARC
uis	UNIMARC ISO 2709
vfo	Výměnný formát ISO 2709
vfi	Výměnný formát, exportní soubor ze systému CDS/ISIS

V případě dávkové opravy dat bude název souboru rozšířen o příponu opr.
Při současném zaslání více souborů je třeba názvy odlišit např. číslem na konci názvu souboru.

Příklad: aba006lg.uis.....sigla=aba006, znaková sada=PC Latin2 + GIZMO formát dat=UNIMARC ISO 2709
Příklad dávkové opravy: aba006lg.uis.opr...sigla=aba006, znaková sada=PC Latin2 + GIZMO formát dat=UNIMARC ISO 2709

Příloha č. 2

Pohled LIST

Pohled je určen pro zobrazení seznamu výsledků rešerše (více záznamů).
Zdroje dle UNIMARC:
011a (ISSN), 200a (název), 102a (země vydání), 210d (datum vydání), 700a,b (autor), v případě, že autor chybí, bude zdroj 701a,b (alternativní autor), v případě že i 701 chybí, bude zdroj 702a,b (sekundární autor).

Formát zobrazení:

011a, 200a, 102a, 210d	011a - 1.výskyt, 200a - 1.výskyt, 102a - 1.výskyt, 210d - v1.výskyt
nebo
011a , 700a, 700b, 102a, 210d	011a - 1. výskyt, 700a,b - 1.výskyt, 102a - 1. výskyt,210d - 1.výskyt
nebo
011a, 701a, 701b, 102a, 210d	011a - 1. výskyt, 701a,b - 1.výskyt, 102a - 1. výskyt, 210d - 1.výskyt
nebo
011a, 702a , 702b (sekundární odpovědnost) 102a, 210d	011a - 1. výskyt, 702a,b - 1.výskyt, 102a - 1. výskyt, 210d - 1.výskyt

Pohled SHORT

Pohled je určen pro zkrácené zobrazení jednoho záznamu a vychází z 1.úrovně rozsahu údajů AACR2.

Zdroje dle UNIMARC:
200a,e,i,h , 700a,b,f chybí-li, pak 701a,b,f, chybí-li, pak 702a,b,f , 205a , 207a, 210a,c,d, 215a , 102a, 326a, 011a,z, 43X, 44X, VAHA, 910a,b,r,o

Formát zobrazení:

Název:	200a	1.výskyt
Podnázev:	200e	1.výskyt v rámci 1.výskytu 200a
Název části:	200i	1.výskyt v rámci 1.výskytu 200a
Číslo části:	200h	1.výskyt v rámci 1.výskytu 200a
Autor:	700a, 700b, 700f nebo 701a, 701b ,701f nebo 702a, 702b, 702f, (sekundární odpovědnost)".	vždy 1.výskyt příslušného tagu
Vydání:	205a	1.výskyt, pokud není uvedeno, neuvádí se
Číslování seriálů	207a	všechny výskyty
Nakladatelské údaje:	210a, 210c, 210d	1.výskyt podpolí v rámci 1.výskytu tagu 210
Rozsah dokumentu:	215a	1.výskyt
Země vydání	102a	1. výskyt
Periodicita	326a	1. výskyt
ISSN:	011a 011z	1. výskyt
Předcházející název	43X	všechny výskyty
Následující název	44X	všechny výskyty
Váha:	VAHA
Sigla vlastníka:	910a	všechny výskyty
Roky odběru	910r	všechny výskyty
Signatura:	910b	není-li vyplněno příslušné podpole 910b, vloží se text 'neuvedena'
Datum aktualizace	910o	poslední výskyt

Příloha č. 3

Pohled LISTAKT

Pohled je určen k aktualizaci odběru seriálů a zobrazuje se po volbě dávková editace z menu služby.

Zdroje dle UNIMARC:
011a (ISSN), 200a (název), 700a,b (autor), v případě, že autor chybí, bude zdroj 701a,b (alternativní autor), v případě že i 701 chybí, bude zdroj 702a,b (sekundární autor), 102a (země vydání), 910r (roky odběru pro danou siglu).