Konvence pro pojmenování souborů - stav k 1.1.2017
Soubory záznamů pro souborný katalog musí striktně dodržovat konvenci v pojmenování, jinak nemohou být přijaty. Pojmenování souboru neodpovídající použitému kódování diakritiky nebo datovému formátu by sice již nyní měly odchytit kontrolní programy, ale i nezpracovaný soubor znamená pro dodavatele i správce zbytečnou práci navíc. Není žádoucí provádět konverzi kódování na straně dodavatele - záznamy zasílejte v originálním kódování.
Když knihovna (většinou se změnou systému) změní kódování nebo formát, před zasláním první dávky "po novu" by měla tuto změnu správci nahlásit a poslat vzorek.
Jméno souboru pro standardní import plnohodnotných záznamů musí mít strukturu aaa000kk.ddd_xxx.
Pro jiné situace (viz dále) následuje za podtržítkem upřesnění: _z/_o/_d/_r?.
Použít lze pouze malá písmena, číslice a podtržítka.
- prvních 6 znaků (aaa000) = sigla instituce - malými písmeny
- znaky 7 a 8 před extenzí (kk) = použitá znaková sadu (kódování diakritiky)
uc Unicode UTF-8 lg PC Latin 2 (+ GIZMO) sg ISO 8859-2 (+ GIZMO) wg CP-1250 (+GIZMO)
Pro záznamy v UTF-8 plati určitá omezení - některé znaky UTF-8 nejsou povolené:
- kontrolní znaky (U+007F - U+009F)
- "pevná" mezera (U+00A0)
- kombinující diakritická znaménka (U+0300 - U+036F) - povolené jsou pouze kombinované znaky (tj. písmeno s diakritikou jako jeden znak), např. písmeno "è" pouze jako znak U+00E8, ne jako kombinace znaků U+0065 a U+0300 (čárka nad vlevo)
- všeobecná interpunkční znaménka (U+2000 - U+206F)
Celý seznam nepovolených znaků najdete zde
Ukázku nežádoucího stavu najdete zde
- první tři znaky extenze (ddd) = formát dat, datová struktura
- Další znaky extenze za podtržítkem se liší podle toho, zda jde o zaslání nových standardních záznamů, retrokonverzi nebo opakované zaslání záznamů k opravě.
(xxx je zde použito jako zástupný znak pro vlastní pojmenování konkrétního souboru, r[1-9] znamená, že za písmenem r následuje číslo vyjadřující váhu)
mal | MARC21 - exportní soubor Aleph500 |
mis |
MARC21 - ISO 2709 |
mar | MARC21 řádkový* |
uis | UNIMARC - ISO 2709 |
rum | UNIMARC řádkový* |
_xxx | nové záznamy standardní kvality |
běžný přírůstek, záznamy odpovídající přidělené váze |
_xxx_r[1-9] | nové záznamy horší kvality |
retrokonverze či zběžná rekatalogizace = záznamy, které mají dostat nižší váhu (lze posílat po dohodě se správcem po analýze záznamů a přidělení váhy) |
_xxx_z | již dříve přijaté záznamy k opravě celého záznamu |
záznamy, které již byly do SKC přijaty dříve, ale dodavatel má zájem na jejich výměně za kvalitnější (budou mít nyní vyšší váhu) |
_xxx_o | již dříve přijaté záznamy k opravě údajů v poli 910 |
záznamy, kde od původního přijetí záznamu do SKC došlo ke změnám v poli 910, takže je třeba tyto údaje aktualizovat (též odpisy) |
Vlastní pojmenování souboru (xxx) by mělo být krátké, ale výstižné (např. datum RRMMDD, RRMM, MMDD, zkratka+poř.č. ap.). Může v případě nutnosti obsahovat uvnitř další podtržítko, ale za ním nesmí následovat pouze jediný znak (zejména ne z,o,d, které odlišují opravované záznamy, a také ne p,m,i,x, které systém používá k odlišování pomocných souborů v průběhu zpracování) a kombinace r+jednomístná číslice (používá se pro retrokonverzi).
Příklady pojmenování souborů:
osa001lg.uis_050110 | sigla OSA001 PC Latin2 (+ GIZMO), UNIMARC - ISO 2709 soubor standardních záznamů odeslaný 10.1.2005 |
boa001uc.mal_0611p nebo boa001uc.mal_0611_per |
sigla BOA001 utf-8, MARC21- Aleph500 záznamy periodik/seriálů za listopad 2006 (knihovna zvolila posílání periodik v samostatném souboru; pozor, za podtržítkem nesmí následovat samostatné "p") |
aba001uc.mal_vrc_15 |
sigla ABA001 utf-8, MARC21- Aleph500 standardní záznamy, česká produkce po věcné revizi, poř.č. souboru 15 |
aba013sg.rum_0601_r6 | sigla ABA013 ISO 8859-2 (+ GIZMO), Unimarc řádkový retrokonverze s váhou 6, soubor za leden 2006 |
ola001uc.mal_0609_z |
sigla OLA001 utf-8, MARC21- Aleph500 opravené záznamy za září 2006 |
*Ukázka řádkového MARC formátu (příklad Unimarc, neúplný záznam):
LAB -----nam 22----- i 450
001 kpw61206
005 20061002151243.0
100 $a20040806d2003 0czey0103 ba
200 1 $aNejvýznamnějsí postavy v historii světa$f[překlad Tadeusz W. Schmidt]
010 $a80-7237-925-9$b(váz.)
702 1 $aSchmidt$bTadeus W.
210 $aPraha$cSvojtka & Co.$d2003
215 $a48 s.
Upozornění: oddělovačem řádků (každého pole) musí být znak "LF" nebo "CR/LF" (nikoli pouze "CR"). Prostor pro nepoužité indikátory musí být vyplněn mezerami.
Dotazy: