Set di caratteri validi per gli script supportati
Arabo, CJK, cirillico, greco ed ebraico
I set di caratteri per questi script sono elencati nelle specifiche MARC 21 per la struttura dei record, i set di caratteri e i supporti di scambio, tabelle codici. Questi set di caratteri MARC-8 sono sottoinsiemi di caratteri Unicode approvati per l'uso nella catalogazione MARC 21 .
Gli script definiti dai set di caratteri MARC-8 sono supportati per i record bibliografici e per le intestazioni dei nomi delle varianti nei record di autorità.
L'elenco seguente definisce l'ambito dei caratteri validi nelle applicazioni di catalogazione di OCLC per caratteri arabi (incluso il persiano), CJK, cirillici, greci ed ebraici:
- Arabo di base = 33(hex) [ Grafica ASCII : 3]
- Arabo esteso = 34(hex) [ Grafica ASCII : 4]
- Cinese, giapponese, coreano (EACC) = 31(hex) [ Grafica ASCII : 1]
- Cirillico base = 4E(hex) [ Grafica ASCII : N]
- Cirillico esteso = 51(hex) [ Grafica ASCII : Q]
- Greco di base = 53(hex) [ Grafica ASCII : S]
- Ebraico di base = 32(hex) [ Grafica ASCII : 2]
Nota: nei record bibliografici, l'applicazione inserisce la notazione (3, (4, $1, (N, (Q, (S) o (2, rispettivamente, nel campo 066 per indicare quale(i) script sono usati in un record. Se vengono utilizzati più script, le notazioni vengono inserite singolarmente, ciascuna in un sottocampo separato c.
Armeno, bengalese, devanagari, etiope, siriaco, tamil e tailandese
Questi script sono supportati solo per i record bibliografici.
Non ci sono set di caratteri MARC-8 definiti per armeno, bengalese, devanagari, etiope, siriaco, tamil o tailandese. Inoltre, Record Manager supporta anche i caratteri cirillici al di fuori del set di caratteri MARC-8. OCLC ha implementato i seguenti codici di identificazione dello script per questi script in base agli elenchi di codici ISO 15924.
L'elenco seguente mostra gli intervalli di caratteri UTF-8 Unicode che definiscono caratteri validi per questi script in Gestione record:
- Armn = Armeno (intervallo di caratteri da U+0530 a U+058F)
- Beng = bengalese (intervallo di caratteri da U+0980 a U+09FF)
- Cyrl = set di caratteri cirillici (fuori dal set di caratteri MARC-8)
- Deva = Devanagari (intervallo di caratteri da U+0900 a U+097F)
- Ethi = Ethiopic (intervallo di caratteri da U+1200 a U+1399, da U+2D80 a U+2DDF, da U+AB00 a U+AB2F)
- Syrc = Syriac (intervallo di caratteri da U+0700 a U+074F)
- Taml = Tamil (intervallo di caratteri da U+0B80 a U+0BFF)
- Tailandese = Tailandese (intervallo di caratteri da U+0E00 a U+0E7F)
Nota: Gestione record inserisce Armn, Beng, Cyrl, Deva, Ethi, Syrc, Taml o Thai, rispettivamente, nel campo 066 di un record bibliografico per indicare che viene utilizzato lo script. Se vengono utilizzati più script, le notazioni vengono inserite singolarmente, ciascuna in un sottocampo separato c.
Limitazioni all'uso dei caratteri armeno, bengalese, cirillico (al di fuori del set di caratteri MARC-8), devanagari, etiope, siriaco, tamil e tailandese
- Per esportare record contenenti armeno, bengalese, cirillico (fuori dal set di caratteri MARC-8), devanagari, etiope, siriaco, tamil e tailandese, è necessario selezionare l'opzione del set di caratteri Unicode UTF-8 in:
- Preferenze utente > Esportazione - Record bibliografici > Generali; selezionare il formato MARC21 con UTF Unicode
Poiché gli script armeno, bengalese, cirillico (esterno al set di caratteri MARC-8), devanagari, etiope, siriaco, tamil e tailandese non fanno parte dei caratteri MARC-8, non è possibile esportare o importare questi script utilizzando l'opzione del set di caratteri MARC-8.
Poiché i caratteri MARC-8 fanno parte di UTF-8 Unicode, è possibile esportare o importare in sicurezza record arabi, CJK, cirillici, cirillici (al di fuori del set di caratteri MARC-8), greci ed ebraici utilizzando MARC-8 o il UTF-8 Opzione set di caratteri Unicode.
- Le intestazioni di armeno, cirillico (fuori dal set di caratteri MARC-8), bengalese, devanagari, etiope, siriaco, tamil e tailandese non sono supportate per le intestazioni di varianti nei record di autorità
Caratteri non validi in Gestione record
Tutti i caratteri che non sono inclusi negli elenchi di caratteri definiti sopra o che non possono essere inseriti tramite Inserisci diacritici non sono validi. Per includere i caratteri non latini necessari ma che non sono validi in Gestione record, è possibile:
- Immettere il carattere nel record, esportare il record nel sistema locale utilizzando il formato di esportazione Unicode, quindi rimuovere il carattere prima di elaborare il record in WorldCat.
Oppure
- Immettere il nome del carattere tra parentesi quadre, utilizzando lo standard Unicode se disponibile (ad es., immettere [schwa]), oppure per i caratteri CJK, immettere la lettura del carattere (ad es., immettere [yin]).
Per riferimento, vedere i grafici Unicode, che hanno un indice di nomi di caratteri.
Nota: l'accesso Z39.50 ai record WorldCat supporta anche i set di caratteri MARC-8 e Unicode UTF-8. Vedere Z39.50 Cataloging per informazioni sul supporto degli script non latini in Z39.50.
I multiscript in un singolo record sono validi
Utilizzare tutti gli script non latini supportati necessari in qualsiasi punto di un record, anche all'interno dello stesso campo.
