ISO 15924

Az ISO 15924 szabvány listák „kódjai a script nevét  ”. Az Unicode konzorcium az ISO nevében irányítja a szabvány nyilvántartási és karbantartási hatóságának irodáját, amely meghatározza és jóváhagyja a szabványt. Az ISO 15924 szabvány azonban nem része az Unicode szabványnak (amely egységes szkripteket használ, amelyek csak elvont karakterkülönbségekkel foglalkoznak).

Írásrendszerek kijelölése és szervezése az ISO 15924 szerint

A szabvány minden írási rendszerre meghatározza:

A definiált kódok és nevek teljes (és naprakész) listájához egyszerűen keresse fel a cikk végén feltüntetett weboldalt.

Nómenklatúra és numerikus osztályozás

A digitális kód elemei vannak csoportosítva sorozat mintegy száz szerint a tipológia és a relatív közelsége írásrendszerek (lásd az alábbi példákat).

A kódelemeket és neveket úgy határoztuk meg, hogy figyelembe vegyék a teljes szövegekre és dokumentumokra vonatkozó bibliográfiai igényeket, és nem csak az elszigetelt karakterekre vannak fenntartva. Emellett az ugyanazon absztrakt ábécét használó különféle írásmódok sajátos elemekkel rendelkeznek, lehetőség szerint egymás után ugyanazon sorozathoz közeli elemekkel osztályozva. Ehhez a digitális kódelemeket nem osztják fel egyszerűen 1-es lépésekben (vannak „lyukak” a számozásban).

A következő sorozatokat használják jelenleg:

ABC kódelemek összetétele és elosztása

A négybetűs ábécés kódelemek az alap 26 betűs latin ábécét használják. Ezeknek a kódelemeknek az esete nem szignifikáns, de az ajánlott esetben nagybetűt, majd három kisbetűt használ. Ezeket az ábécé szerinti kódelemeket emlékiratok miatt a szentírások nevei ihlették. Ugyanazon szkript variánsstílusai, amennyire csak lehetséges, csak a negyedik betűjükben térnek el. Ezek a variánsok szintén felismerhetők ugyanabban a sorozatban található hasonló digitális kódelemek alapján. Például :

Vagy:

És még :

Két, ugyanolyan első három betűvel kezdődő ábécés kódelem azonban nem feltétlenül jelöli ugyanazon írásrendszer két változatát (ami a különálló sorozatok numerikus besorolásának köszönhető).

Speciális kodetek

Ha a szabványosított írások nem elegendőek, akkor 50 kódelem használható, amelyek a felhasználók belátása szerint használhatók (a használt nevek nem normatívak és módosíthatók):

Vannak speciális kódelemek íratlan nyelvek esetére (például fényképek, video- vagy hangfelvételek osztályozására a médiatárak és múzeumok gyűjteményeiben), vagy amikor az írás nem határozható meg megbízhatóan, mert több ( különálló családokban, és amelyeknek az egésznek nincs pontosabban előre definiált kódja), vagy akkor is, ha az írás nincs megadva, de esetleg más kóddal pontosabban meg lehetne jelölni:

Történelmi

Ezt a kódelemek és szkriptnevek listáját Michael Everson készítette, és annak karbantartója az Unicode Technical Committee (UTC) tagja is . Az ISO 15924 szövegét először elfogadta 2004. január 9, amely meghatározta a kódpontok meghatározásának általános elveit.

A kódelemek első listáját, amely akkoriban nagyon teljes volt, a 1 st May 2004-esonline a Unicode Konzorcium weboldalán . Többek között az összes Unicode 4.0 és ISO / IEC 10646 szabványban használt vagy definiált szkriptet tartalmazta . A következő hetekben jelentős számú javítás következett, és a lista véglegesítésre került. 2004. május 29.

Azóta néhány új szkriptet rendszeresen hozzáadnak a szkriptek igényeihez az ISO / IEC 10646 és az Unicode szabványosítás során, vagy bibliográfiai célokra, valamint a még nem szabványosított szkriptekhez, amelyeknek még mindig tárgyuknak kell lenniük. " tanulmányok.

Kapcsolat más normákkal és ajánlásokkal

Kapcsolat az ISO 639 nyelvi kód elemeivel

Ezen túlmenően, az ISO 15924 ábécé kódos elemei, amennyire csak lehetséges, ugyanolyan betűkkel kezdődnek, mint az ISO 639 -2 vagy annak kiterjesztése ISO 639 -3 szerinti hárombetűs nyelvi kódelemek (amelyek kiterjesztik a nyelvek listáját) , amikor a szkript és a nyelv neve azonos. Például :

A készülő jövőbeni ISO 639 -6 szabvány , amelynek ki kell terjesztenie a nyelvkód elemeket négy betűre (a nagyobb számú nyelvváltozat azonosítása érdekében), ezt az elvet alkalmazza, és lehetőség szerint ugyanazokat a kódelemeket használja, amelyek már megmaradtak az ISO 15924 szabványban homonim nyelvű szkriptek esetében, a jelenlegi RFC  5646 (BCP 47) szabvány kompatibilitásának fenntartása érdekében :

IETF nyelvkód

Az ISO 15924 szabványt az IETF nyelvi kód szabvány használja .

Területi beállítások

Az ISO 15924 szabványt néha használják a regionális beállításokhoz .

A nevek eltérései az ISO / IEC 10646 szabványban leírtaktól

Van nincs pontos bijekciót között az angol és francia script nevek meghatározása az ISO 15924 és az angol és francia használt megnevezések normatív nevek karakter és karakter lefoglalt blokkok az ISO / IEC 10646 szabványok (és így a Unicode ).

Az ISO / IEC 10646 (és ennélfogva az Unicode) szabványosított jövőbeni karakter- és karakterblokkok azonban, ha lehetséges, az ISO 15924 szerint kerülnek elnevezésre.

Az ABC és az Unicode szabvány elemei közötti különbségek

Hasonlóképpen nincs pontos bijekció az ISO 15924 szabványban szabványosított ábécés kódelemek és az Unicode karakterek tulajdonságtábláiban használt szkriptkódok között . Valójában az ISO 15924 szabvány további elemeket tartalmaz, amelyek megkülönböztetik a bibliográfiai felhasználást az ISO és az Unicode karakterkódolási szabványokban egységesített szkriptek között. Az ISO 15924 szabvány olyan kódelemeket és megkülönböztetett neveket tartalmaz a szkriptekhez, amelyeket így egyesítettek eggyé az Unicode-ban (ami tipográfiai változatokként kezeli őket, a karakterek kódolása és normatív vagy informatív tulajdonságaik között nincs különbség).

Másrészt, mivel az ISO 15924 szabványt az Unicode szabvány után hozták létre, az ISO 15924 alfabetikus kódelemek formátuma eltérhet az Unicode tulajdonságtáblákban használt normatív kódoktól (amelyek hosszabbak lehetnek és aláhúzásokat tartalmazhatnak).

Kizárólag tájékoztatási célokból az ISO 15924 szabvány álnevet (vagy "a tulajdonság értékének szinonimáját") határozza meg a szabványos szkriptekhez, annak ismerete érdekében, hogy megfelel-e az Unicode szabványban meghatározott karaktertulajdonságoknak, ha ilyen eltérés létezik. Az ISO 15924 szabvány közzététele óta az Unicode Konzorcium kötelezettséget vállalt arra, hogy az ISO 15924 szabványban meghatározottaktól eltérő új kódokat már nem határoz meg, ezért lehetőség szerint az ISO 15924 szabvány betűrendes kódelemeit használja. Ezért nem minden szinonima mert az Unicode tulajdonságokat az ISO 15924 táblázatok említik (a használt kódok megtalálhatók az Unicode szabvány tulajdonságfájljaiban, az Unicode pedig szinonimákat adott hozzá a karakter tulajdonságok értékéhez, ami most már csak az ISO 15924 kódpontok használatát teszi lehetővé Unicode kompatibilisnek alkalmazások).

Lásd is

Külső linkek

Kapcsolódó cikkek

  1. (a) Request for Comments n o  5646 .