Konvence pro pojmenování souborů
Soubory záznamů pro souborný katalog musí striktně dodržovat konvenci v pojmenování, jinak nemohou být přijaty. Pojmenování souboru neodpovídající použitému kódování diakritiky nebo datovému formátu by sice již nyní měly odchytit kontrolní programy, ale i nezpracovaný soubor znamená pro dodavatele i správce zbytečnou práci navíc. Není žádoucí provádět konverzi kódování na straně dodavatele - záznamy zasílejte v originálním kódování.
Když knihovna (většinou se změnou systému) změní kódování nebo formát, před zasláním první dávky "po novu" by měla tuto změnu správci nahlásit a poslat vzorek.
Jméno souboru pro standardní import plnohodnotných záznamů musí mít strukturu aaa000kk.ddd_xxx.
Pro jiné situace (viz dále) následuje za podtržítkem upřesnění: _z/_o/_d/_r?.
Použít lze pouze malá písmena, číslice a podtržítka.
uc | Unicode UTF-8 |
Pro záznamy v UTF-8 plati určitá omezení - některé znaky UTF-8 nejsou povolené:
- kontrolní znaky (U+007F - U+009F)
- "pevná" mezera (U+00A0)
- kombinující diakritická znaménka (U+0300 - U+036F) - povolené jsou pouze kombinované znaky (tj. písmeno s diakritikou jako jeden znak), např. písmeno "è" pouze jako znak U+00E8, ne jako kombinace znaků U+0065 a U+0300 (čárka nad vlevo)
- všeobecná interpunkční znaménka (U+2000 - U+206F)
Celý seznam nepovolených znaků najdete zde
Ukázku nežádoucího stavu najdete zde
- první tři znaky extenze (ddd) = formát dat, datová struktura
mal | MARC21 - exportní soubor Aleph500 |
mis |
MARC21 - ISO 2709 |
mar | MARC21 řádkový* |
uis | UNIMARC - ISO 2709 |
rum | UNIMARC řádkový* |
- Další znaky extenze za podtržítkem se liší podle toho, zda jde o zaslání nových standardních záznamů, retrokonverzi nebo opakované zaslání záznamů k opravě.
(xxx je zde použito jako zástupný znak pro vlastní pojmenování konkrétního souboru, r[1-9] znamená, že za písmenem r následuje číslo vyjadřující váhu)
_xxx nové záznamy standardní kvality
běžný přírůstek,
záznamy odpovídající přidělené váze
_xxx_r[1-9] nové záznamy horší kvality
retrokonverze či zběžná rekatalogizace = záznamy, které mají dostat nižší váhu
(lze posílat po dohodě se správcem po analýze záznamů a přidělení váhy)
_xxx_z již dříve přijaté záznamy k opravě
celého záznamu
záznamy, které již byly do SKC přijaty dříve, ale dodavatel má zájem na jejich výměně za kvalitnější (budou mít nyní vyšší váhu)
_xxx_d záznamy , které již byly do SKC přijaty dříve , ale dodavatel chce doplnit údaje o digitalizaci z pole 911
_xxx_o již dříve přijaté záznamy k opravě údajů v poli 910
záznamy, kde od původního přijetí záznamu do SKC došlo ke změnám v poli 910, takže je třeba tyto údaje aktualizovat
(též odpisy)
Vlastní pojmenování souboru (xxx) by mělo být krátké, ale výstižné (např. datum RRMMDD, RRMM, MMDD, zkratka+poř.č. ap.). Může v případě nutnosti obsahovat uvnitř další podtržítko, ale za ním nesmí následovat pouze jediný znak (zejména ne z,o,d, které odlišují opravované záznamy, a také ne p,m,i,x, které systém používá k odlišování pomocných souborů v průběhu zpracování) a kombinace r+jednomístná číslice (používá se pro retrokonverzi).
Příklady pojmenování souborů:
boa001uc.mal_0611p
nebo
boa001uc.mal_0611_per
sigla BOA001
utf-8, MARC21- Aleph500
záznamy periodik/seriálů za listopad 2006
(knihovna zvolila posílání periodik v samostatném souboru; pozor, za podtržítkem nesmí následovat samostatné "p")
aba001uc.mal_vrc_15
sigla ABA001
utf-8, MARC21- Aleph500
standardní záznamy, česká produkce po věcné revizi, poř.č. souboru 15
ola001uc.mal_0609_z
sigla OLA001
utf-8, MARC21- Aleph500
opravené záznamy za září 2006
*Ukázka řádkového MARC formátu (příklad Unimarc, neúplný záznam):
LAB -----nam 22----- i 450
001 kpw61206
005 20061002151243.0
100 $a20040806d2003 0czey0103 ba
200 1 $aNejvýznamnějsí postavy v historii světa$f[překlad Tadeusz W. Schmidt]
010 $a80-7237-925-9$b(váz.)
702 1 $aSchmidt$bTadeus W.
210 $aPraha$cSvojtka & Co.$d2003
215 $a48 s.
Upozornění: oddělovačem řádků (každého pole) musí být znak "LF" nebo "CR/LF" (nikoli pouze "CR"). Prostor pro nepoužité indikátory musí být vyplněn mezerami.
Dotazy: