Information for libraries

  • na webu

Nacházíte se zde: Úvod O nás Archiv Archiv webu Pro přispívající knihovny Konvence pro pojmenování souborů - stav k 1.1.2017

Konvence pro pojmenování souborů - stav k 1.1.2017

Pozor změna: od 1.1.2017 bude SK ČR přijímat pouze záznamy v kódování UTF-8.

Soubory záznamů pro souborný katalog musí striktně dodržovat konvenci v pojmenování, jinak nemohou být přijaty. Pojmenování souboru neodpovídající použitému kódování diakritiky nebo datovému formátu by sice již nyní měly odchytit  kontrolní programy, ale i nezpracovaný soubor znamená pro dodavatele i správce zbytečnou práci navíc.  Není žádoucí provádět konverzi kódování na straně dodavatele - záznamy zasílejte v originálním kódování.

Když  knihovna (většinou se změnou systému) změní kódování nebo formát, před zasláním první dávky "po novu" by měla tuto změnu správci nahlásit a poslat vzorek.

Jméno souboru pro standardní import plnohodnotných záznamů musí mít strukturu aaa000kk.ddd_xxx.
Pro jiné situace (viz dále) následuje za podtržítkem upřesnění: _z/_o/_d/_r?.
Použít lze pouze malá písmena, číslice a podtržítka.

  • prvních 6 znaků (aaa000) = sigla instituce - malými písmeny
  • znaky 7 a 8 před extenzí (kk) = použitá znaková sadu (kódování diakritiky)

    uc Unicode UTF-8
    lg PC Latin 2 (+ GIZMO)
    sg ISO 8859-2 (+ GIZMO)
    wg CP-1250 (+GIZMO)

 

Pro záznamy v UTF-8 plati určitá omezení - některé znaky UTF-8 nejsou povolené:

- kontrolní znaky (U+007F - U+009F)

- "pevná" mezera (U+00A0)

- kombinující diakritická znaménka (U+0300 - U+036F) - povolené jsou pouze kombinované znaky (tj. písmeno s diakritikou jako jeden znak), např. písmeno "è" pouze jako znak U+00E8, ne jako kombinace znaků U+0065 a U+0300 (čárka nad vlevo)

-  všeobecná interpunkční znaménka (U+2000 - U+206F)

Celý seznam  nepovolených znaků najdete  zde

Ukázku nežádoucího stavu  najdete zde

 

  • první tři znaky extenze (ddd) = formát dat, datová struktura

  • mal MARC21 - exportní soubor Aleph500
    mis
    MARC21 - ISO 2709
    mar MARC21 řádkový*
    uis UNIMARC - ISO 2709
    rum UNIMARC řádkový*


  • Další znaky extenze za podtržítkem se liší podle toho, zda jde o zaslání nových standardních záznamů, retrokonverzi nebo opakované zaslání záznamů k opravě.
    (xxx je zde použito jako zástupný znak pro vlastní pojmenování konkrétního souboru, r[1-9] znamená, že za písmenem r následuje číslo vyjadřující váhu)

 

_xxx nové záznamy standardní kvality
běžný přírůstek,
záznamy odpovídající přidělené váze
_xxx_r[1-9] nové záznamy horší kvality
retrokonverze či zběžná rekatalogizace = záznamy, které mají dostat nižší váhu
(lze posílat po dohodě se správcem po analýze záznamů a přidělení váhy)
_xxx_z již dříve přijaté záznamy k opravě
celého záznamu
záznamy, které již byly do SKC přijaty dříve, ale dodavatel má zájem na jejich výměně za kvalitnější (budou mít nyní vyšší váhu)
_xxx_o již dříve přijaté záznamy k opravě údajů v poli 910
záznamy, kde od původního přijetí záznamu do SKC došlo ke změnám v poli 910, takže je třeba tyto údaje aktualizovat
(též odpisy)

 

Vlastní pojmenování souboru (xxx) by mělo být krátké, ale výstižné (např. datum RRMMDD, RRMM, MMDD, zkratka+poř.č. ap.). Může v případě nutnosti obsahovat uvnitř další podtržítko, ale za ním nesmí následovat pouze jediný znak (zejména ne z,o,d, které odlišují opravované záznamy, a také ne p,m,i,x, které systém používá k odlišování pomocných souborů v průběhu zpracování) a kombinace r+jednomístná číslice (používá se pro retrokonverzi).

 

Příklady pojmenování souborů:

osa001lg.uis_050110 sigla OSA001
PC Latin2 (+ GIZMO), UNIMARC - ISO 2709
soubor standardních záznamů odeslaný 10.1.2005
boa001uc.mal_0611p
nebo
boa001uc.mal_0611_per
sigla BOA001
utf-8, MARC21- Aleph500
záznamy periodik/seriálů za listopad 2006
(knihovna zvolila posílání periodik v samostatném souboru; pozor, za podtržítkem nesmí následovat samostatné "p")
aba001uc.mal_vrc_15
sigla ABA001
utf-8, MARC21- Aleph500
standardní záznamy, česká produkce po věcné revizi, poř.č. souboru 15
aba013sg.rum_0601_r6 sigla ABA013
ISO 8859-2 (+ GIZMO), Unimarc řádkový
retrokonverze s váhou 6, soubor za leden 2006
ola001uc.mal_0609_z
sigla OLA001
utf-8, MARC21- Aleph500
opravené záznamy za září 2006

 

*Ukázka řádkového MARC formátu (příklad Unimarc, neúplný záznam):

LAB    -----nam 22----- i 450
001    kpw61206
005    20061002151243.0
100    $a20040806d2003       0czey0103 ba
200 1  $aNejvýznamnějsí postavy v historii světa$f[překlad Tadeusz W. Schmidt]
010    $a80-7237-925-9$b(váz.)
702  1 $aSchmidt$bTadeus W.
210    $aPraha$cSvojtka & Co.$d2003
215    $a48 s.

Upozornění: oddělovačem řádků (každého pole) musí být znak "LF" nebo "CR/LF" (nikoli pouze "CR"). Prostor pro nepoužité indikátory musí být vyplněn mezerami.

 

Dotazy:

Eva Svobodová
Radovan Záhořík

18.04.2017
Hledej
Multivyhledávač
Klíčové slovo
Název
Autor
« listopad 2024 »
listopad
PoÚtStČtSoNe
123
45678910
11121314151617
18192021222324
252627282930
Anketa

Co z níže uvedeného využíváte v záznamech v SK ČR nejčastěji?

zobrazení na mapě
propojení do katalogu knihovny
citace
obálky a obsahy
plné texty
spinner
Total Votes: 685