Diakritikus

A megkülönböztető vagy mellékjel (az ókori görög : διακριτικός / diakritikós „ami megkülönbözteti”) egy jel kísérő levél vagy graféma módosítani annak jelentését vagy kiejtés.

A betű vagy a graféma vonatkozásában a diakritikus elhelyezhető fent (felső indexű diakritikus), alatt (feliratkozott diakritikus), előtt (előírt diakritikus), mögött (írott diakritikus), mögött vagy keresztben (beírt diakritikus) vagy körül (körülírt diakritikus) ). Az akcentus , az umlaut és a cedilla diakritikus jegyek.

Bemutatás

Célja:

módosítsa a betű (vagy graféma) fonetikai értékét;
lehetővé teszi a szöveg jobb megértését (a diakritikusok akkor nem kötelezőek);
kerülje a homográfok közötti kétértelműséget .

Vannak diakritikus betűk is, amelyek némaak és szükségszerűen az általuk módosított betű mellé vannak írva. Egyébként diakritikus jellé válhattak (vö. Umlaut és kerek fő ).

Mint a ligatúrák és az extra betűk, amelyeket utólag találtak ki, a diakritikusok hozzáadása megnöveli a script grafémáinak számát. Sok esetben a leírt betűt nem önálló grafémának, hanem allográfnak , vagyis az egyszerű levél másik írott változatának tekintjük . A leírt levél ekkor nem avatkozik be az ábécé szerinti osztályozásba .

Például az akut akcentus a franciában módosítja egy e fonetikai értékét, amelyet általában [ǝ] ( e "néma" ) -nak ejtenek : é ekkor [e]. A sír kiemelő egy olyan , de csak azt teszi lehetővé, hogy megkülönböztessék homographs: la (cikk) ~ là (határozószó hely), mind értékben [la] francia (de tűnnek orálisan egyes nyelvjárásokban. Francia). Az é és a à- t azonban nem tekintjük e és a független betűinek .

A latin írásban a diakritikusokat általában nem használják az olvasás finomítására: ezek mind kötelezőek.

Az arab írásban , ahol a magánhangzókat elvileg nem írják, a diakritikusok éppen ellenkezőleg szolgálják az olvasat finomítását. Oktatási vagy vallási művekben diakritikus formában jegyezhetjük fel őket. A fenti kissé ferde vonalú fatḥa a magánhangzó [a] jelenlétének jelzésére szolgál: a عدل szó jelentése ʿadl ('adl), de átírása ʿdl . Az olvasat tisztázása érdekében hozzáadhatunk egy fatḥa-t : عَدل. Ebben az ábécében diakritikusnak is tekinthetjük azokat a feliratkozott vagy feliratkozott pontokat, amelyek a hangon különböző módon megvalósítható graféma megkülönböztetésére szolgálnak. Így a ح graféma három másik betű alátámasztására szolgál, amelyeket írásban egy pont jelenléte vagy hiánya különböztet meg: ج ح خ - kiejtve, balról jobbra: ǧ, ḥ, ḫ .

Jellemzően, ha egy leírt betű van egy nyelven, akkor az egyetlen betű is. Kivételek a következők:

a máltai , amelynek ċ van, de nincs c ;

A belorusz , akinek van © tulajdonosa, de nem и ;

és bizonyos mértékig az alap latin ábécé kisbetűs alakja , amelynek van i, de nincs ı . ( Török , másrészt, ami a különbséget ı / i és I / İ mindkét esetben azt , hogy ebben az esetben a tőke formájában ı és İ hogy az i ).

Diakritikusok forgatókönyv és ábécé szerint

Minden írás képes volt kidolgozni a saját kritikáit:

a latin ábécé diakritikusai (ezt a romanizálásra is használják , az ábécé ismeri a legtöbb diakritikust):
- vö. a vietnami ábécé ( quốc ngữ ) diakritikusai is ,
- a franciául használt diakritikusokat , azok használatát és a felhasználási szabályokat külön kezeljük;
a görög ábécé diakritikusai ;
a cirill ábécé diakritikusai ;
az arab ábécé diakritikusai ;
a héber ábécé diakritikusai ;
az olasz ábécé diakritikusai ;
a devanâgarî diakritikusai ;
a japán szótagok kritikái ;
a tibeti ábécé diakritikusai ;
a török ábécé diakritikusai ;
a nemzetközi fonetikus ábécé diakritikusai .

Számítógépes átírás

ASCII

Az ASCII- t (1963 körül) ékezetekkel (~ `, ^" ~) hozták létre, hogy ékezetes karaktereket alkossanak karakterrel és akcentussal. Az ASCII első verziója a törlés vagy a visszalépés szimbólum használatát írta elő a kettő összeállításához. karakterek eggyé. Az érintett lobbik azonban megsemmisítették ezt a szabványt az ASCII második változatában. Azóta az ASCII önmagában már nem teszi lehetővé ékezetes karakterekkel történő szövegcserét.

A karakterkészlet ASCII szabvány, függ a rendszer oktális széles körben használják az első napokban a számítástechnikai, 128 kód, 95 karakter jeleníthető meg, köztük 52 karakter ábécé , a 26 betűjét a latin ábécé a törések nagybetűs és kisbetűs (vagy kisbetűs ), de ékezetes betű nincs.

Számos, gyakran kiterjesztett ASCII- ként emlegetett karakterkészlet létezik , amelyek 256 kóddal rendelkeznek. A 128 további kódot különösen a latin ábécé egyes magánhangzóinak és mássalhangzóinak diakritikusokkal való ábrázolására használják.

Az első kiterjesztett karakterkészlet, úgynevezett code oldalak jöttek létre a cég IBM annak PC „ PC ” ; ebben a rendszerben egy kódlapot vagy "CP" -et ( kódlapot ) egy szám határoz meg és társít egy adott készlethez: a CP437 az "amerikai" vagy "grafikus" készlet; a CP850 az „európai többnyelvű” készlet.

A grafikus környezetek ( Apple Macintosh , Microsoft Windows , X Window stb.) Megjelenésével a kódlapok "grafikus" karaktereit már nem kell bővebb kódokat használtunk a karakterek diakritikus jelölésére. Az IBM és a Microsoft cég által a két grafikus platformra, a Windows és az OS / 2 "Presentation Manager" -re közösen létrehozott készletek alapul szolgáltak az ISO karakterkészletek sorozatához , az ISO / IEC 8859 szabványhoz, amely tizenöt készletben található. :

8859-1-től 8859-4-ig, 8859-9, 8859-10, 8859-13-tól 8859-16-ig: "Latin1" - "Latin10", a latin ábécé változatai különböző országok és régiók (Franciaország, Olaszország) diakritikus karakterekkel (Spanyolország, Albánia, Törökország, skandináv országok, Magyarország, Lengyelország stb.);
8859-6: latin és arab ábécé;
8859-7: latin és görög ábécé;
8859-8: latin és héber ábécé;
8859-11: thai ábécé.

Ha nincs francia számítógépes billentyűzete, vagy ha egy alkalmazás nem támogatja az ékezetes karaktereket, akkor ezeket a kritikákat úgy teheti meg, hogy az ékezetes betű elé, vagy mögé, vagy akár elé és mögé egy karaktert ad. Ez adhat például:

Le garc,on ne pouvait 'e`tre l`a cet e'te'.

Lásd még a példákat a diakritikus cikkekről, valamint a VIQR cikkről . Az eszperantó jelentése adott esetben ugyanaz cikke 15-1 nyilatkozat az emberi jogok felírható C- iu rajtas Havi ŝ tatanecon vagy Cx iu rajtas Havi sx tatanecon szerint a kívánt kódolás, ha a számítógép egy Levélírás gombot vagy hasonló.

Unicode

Az Unicode konzorciumot , amely a számítástechnikában a nagy nevek többségét egyesíti, az 1980- as évek közepén hozták létre annak érdekében, hogy megoldják a különféle hardveres és szoftveres platformokhoz fejlesztett különféle karakterkódolások ( EBCDIC és "kódlap" rendszer IBM / Microsoft, az Apple-re jellemző játékok, HP , Unix játékok stb.) És az ISO / IEC 10646 szabvány fejlesztésével kapcsolatban .

A kezdeti cél egy olyan kódolási rendszer fejlesztése volt, amely már nem 8, hanem 16 bitet tartalmaz, amely lehetővé teszi 2 16 vagy 65 536 karakter kódolását . Jelenleg a standard kiterjesztése meghaladta a 16 bitet, mert a megjelenítendő karakterek és szimbólumok (különösen matematikai és tudományos szimbólumok) változatossága jelentősen meghaladja ezt a határt, az egyetlen kínai írás különféle változataival már meghaladja ezt a 65 536 határt.

Az elfogadott elv az volt, hogy a karakterek és szimbólumok halmazait vagy részhalmazait 256 kód vagy blokk „oldalai” szerint csoportosítsák; például a 0–3 blokk a latin ábécé négy részhalmazának felel meg, a 6. blokk a latin ábécé karaktereihez társított „kombinált diakritikusok”, a 7. blokk görög és kopt karakterek, a 11. blokk héberül, a 12–14. blokk arabul és szír ábécé, az 58. blokk valuta szimbólumokkal, a 63., 73., 77. és 78. blokk matematikai szimbólumokkal stb.

Végső változatában a 16 bites Unicode rendszer nem őrizte meg a másik szabványnak megfelelő piktogramokat.

Legalább háromféle módon ( beviteli módszer ) lehet Unicode karaktert beilleszteni a dokumentumba:

érték szerint;
sorozatszám szerint;
álnéven.

Az érték szerinti írás abból áll, hogy a 16 bites numerikus sorrendet elhelyezzük, amely megfelel egy adott karakternek a dokumentumban. A sorozatszám szerinti módszereket csak bizonyos típusú dokumentumokban használják, különösen RTF és HTML formátumú fájlokban vagy hasonló formában ( különösen XML , PHP ). Az elv minden esetben ugyanaz: előzze meg vagy vegye körbe a számot vagy az álnevet egy „menekülési szekvenciával”.

A HTML dokumentumokba az „&” (alias) vagy a „& #” (szám) szekvenciát tesszük az elejére és a „; »A sorozat végén és a kettő között a sorozatszám vagy az álnév.

Például a "  " és " & " szekvenciák lehetővé teszik az "és kereskedelmi" (más néven "ampersand" vagy "ampersand"), "&" jel ábrázolását.

Html

Ehhez a számalapú jelöléshez (lásd fent) egyesek az alias jelölést részesítik előnyben, amely könnyebben megjegyezhető. A lista hosszú, mindegyikre csak egy példa tartozik. Ha a példát adnak a levelet egy , fel tudjuk használni a HTML kódot (és ezért a megfelelő ékezet jelzés) az összes vagy a legtöbb levél, a szabály alapján az alábbiakban. Ha a példa egy másik betűvel van megadva, akkor a HTML entitás csak néhány betűvel használható.

Ha a diakritikus jelölést a példánként megadott betűtől eltérő betűre helyezzük, elegendő az amperjelet követő betű megváltoztatása. Így a & aacute; ad egy akut hangsúlyt ( á ), az i akut akcentus ( í ) megszerzéséhez a & iacute; . Ez vonatkozik a nagybetűkre is: & Aacute; ad Á , & Iacute; Í-t ad .

nál nél	ŉ	nál nél	vs.	vs.	nál nél	ő	vs.	nál nél	nál nél
& aacute;	& napos;	& abreve;	& ccaron;	& ccedil;	& acirc;	& odblac;	& cdot;	& egy sír;	& amacr;
ŀ	én	nál nél	nál nél	ø	đ	ł	nál nél	nál nél
& lmidot;	& inodot;	& aogon;	& egy gyűrű;	& oslash;	& dstrok;	& lstrok;	& atilde;	& auml;

"	"	˘	ˇ	¸	ˆ	˝	˙	"	¯	˛	˚	˜	¨
& akut;	& apos;	& breve;	&mert mi;	& cedil;	& circ;	& dblac;	&hozomány;	&komoly;	& macr;	& ogon;	&gyűrű;	& tilde;	& uml;

Bibliográfia

(en) " Ékezetek Project @ Typo.cz " , a diacritics.typo.cz
en) Palo Bálik , Fikip Blažek , Robert Kravjanszki , Agnieszka Małecka és Zofia Oslislo , A rovarok projekt, a közép-európai nyelvek diakritikus kialakításának problémái ,2016( online olvasás )
(en) JC Wells , „ Ortográfiai diakritikusok és többnyelvű számítástechnika ” , Nyelvi problémák és nyelvtervezés , vol. 24, n o 3,2001( online olvasás )