A megkülönböztető vagy mellékjel (az ókori görög : διακριτικός / diakritikós „ami megkülönbözteti”) egy jel kísérő levél vagy graféma módosítani annak jelentését vagy kiejtés.
A betű vagy a graféma vonatkozásában a diakritikus elhelyezhető fent (felső indexű diakritikus), alatt (feliratkozott diakritikus), előtt (előírt diakritikus), mögött (írott diakritikus), mögött vagy keresztben (beírt diakritikus) vagy körül (körülírt diakritikus) ). Az akcentus , az umlaut és a cedilla diakritikus jegyek.
Célja:
Vannak diakritikus betűk is, amelyek némaak és szükségszerűen az általuk módosított betű mellé vannak írva. Egyébként diakritikus jellé válhattak (vö. Umlaut és kerek fő ).
Mint a ligatúrák és az extra betűk, amelyeket utólag találtak ki, a diakritikusok hozzáadása megnöveli a script grafémáinak számát. Sok esetben a leírt betűt nem önálló grafémának, hanem allográfnak , vagyis az egyszerű levél másik írott változatának tekintjük . A leírt levél ekkor nem avatkozik be az ábécé szerinti osztályozásba .
Például az akut akcentus a franciában módosítja egy e fonetikai értékét, amelyet általában [ǝ] ( e "néma" ) -nak ejtenek : é ekkor [e]. A sír kiemelő egy olyan , de csak azt teszi lehetővé, hogy megkülönböztessék homographs: la (cikk) ~ là (határozószó hely), mind értékben [la] francia (de tűnnek orálisan egyes nyelvjárásokban. Francia). Az é és a à- t azonban nem tekintjük e és a független betűinek .
A latin írásban a diakritikusokat általában nem használják az olvasás finomítására: ezek mind kötelezőek.
Az arab írásban , ahol a magánhangzókat elvileg nem írják, a diakritikusok éppen ellenkezőleg szolgálják az olvasat finomítását. Oktatási vagy vallási művekben diakritikus formában jegyezhetjük fel őket. A fenti kissé ferde vonalú fatḥa a magánhangzó [a] jelenlétének jelzésére szolgál: a عدل szó jelentése ʿadl ('adl), de átírása ʿdl . Az olvasat tisztázása érdekében hozzáadhatunk egy fatḥa-t : عَدل. Ebben az ábécében diakritikusnak is tekinthetjük azokat a feliratkozott vagy feliratkozott pontokat, amelyek a hangon különböző módon megvalósítható graféma megkülönböztetésére szolgálnak. Így a ح graféma három másik betű alátámasztására szolgál, amelyeket írásban egy pont jelenléte vagy hiánya különböztet meg: ج ح خ - kiejtve, balról jobbra: ǧ, ḥ, ḫ .
Jellemzően, ha egy leírt betű van egy nyelven, akkor az egyetlen betű is. Kivételek a következők:
Minden írás képes volt kidolgozni a saját kritikáit:
Az ASCII- t (1963 körül) ékezetekkel (~ `, ^" ~) hozták létre, hogy ékezetes karaktereket alkossanak karakterrel és akcentussal. Az ASCII első verziója a törlés vagy a visszalépés szimbólum használatát írta elő a kettő összeállításához. karakterek eggyé. Az érintett lobbik azonban megsemmisítették ezt a szabványt az ASCII második változatában. Azóta az ASCII önmagában már nem teszi lehetővé ékezetes karakterekkel történő szövegcserét.
A karakterkészlet ASCII szabvány, függ a rendszer oktális széles körben használják az első napokban a számítástechnikai, 128 kód, 95 karakter jeleníthető meg, köztük 52 karakter ábécé , a 26 betűjét a latin ábécé a törések nagybetűs és kisbetűs (vagy kisbetűs ), de ékezetes betű nincs.
Számos, gyakran kiterjesztett ASCII- ként emlegetett karakterkészlet létezik , amelyek 256 kóddal rendelkeznek. A 128 további kódot különösen a latin ábécé egyes magánhangzóinak és mássalhangzóinak diakritikusokkal való ábrázolására használják.
Az első kiterjesztett karakterkészlet, úgynevezett code oldalak jöttek létre a cég IBM annak PC „ PC ” ; ebben a rendszerben egy kódlapot vagy "CP" -et ( kódlapot ) egy szám határoz meg és társít egy adott készlethez: a CP437 az "amerikai" vagy "grafikus" készlet; a CP850 az „európai többnyelvű” készlet.
A grafikus környezetek ( Apple Macintosh , Microsoft Windows , X Window stb.) Megjelenésével a kódlapok "grafikus" karaktereit már nem kell bővebb kódokat használtunk a karakterek diakritikus jelölésére. Az IBM és a Microsoft cég által a két grafikus platformra, a Windows és az OS / 2 "Presentation Manager" -re közösen létrehozott készletek alapul szolgáltak az ISO karakterkészletek sorozatához , az ISO / IEC 8859 szabványhoz, amely tizenöt készletben található. :
Ha nincs francia számítógépes billentyűzete, vagy ha egy alkalmazás nem támogatja az ékezetes karaktereket, akkor ezeket a kritikákat úgy teheti meg, hogy az ékezetes betű elé, vagy mögé, vagy akár elé és mögé egy karaktert ad. Ez adhat például:
Le garc,on ne pouvait 'e`tre l`a cet e'te'.Lásd még a példákat a diakritikus cikkekről, valamint a VIQR cikkről . Az eszperantó jelentése adott esetben ugyanaz cikke 15-1 nyilatkozat az emberi jogok felírható C- iu rajtas Havi ŝ tatanecon vagy Cx iu rajtas Havi sx tatanecon szerint a kívánt kódolás, ha a számítógép egy Levélírás gombot vagy hasonló.
Az Unicode konzorciumot , amely a számítástechnikában a nagy nevek többségét egyesíti, az 1980- as évek közepén hozták létre annak érdekében, hogy megoldják a különféle hardveres és szoftveres platformokhoz fejlesztett különféle karakterkódolások ( EBCDIC és "kódlap" rendszer IBM / Microsoft, az Apple-re jellemző játékok, HP , Unix játékok stb.) És az ISO / IEC 10646 szabvány fejlesztésével kapcsolatban .
A kezdeti cél egy olyan kódolási rendszer fejlesztése volt, amely már nem 8, hanem 16 bitet tartalmaz, amely lehetővé teszi 2 16 vagy 65 536 karakter kódolását . Jelenleg a standard kiterjesztése meghaladta a 16 bitet, mert a megjelenítendő karakterek és szimbólumok (különösen matematikai és tudományos szimbólumok) változatossága jelentősen meghaladja ezt a határt, az egyetlen kínai írás különféle változataival már meghaladja ezt a 65 536 határt.
Az elfogadott elv az volt, hogy a karakterek és szimbólumok halmazait vagy részhalmazait 256 kód vagy blokk „oldalai” szerint csoportosítsák; például a 0–3 blokk a latin ábécé négy részhalmazának felel meg, a 6. blokk a latin ábécé karaktereihez társított „kombinált diakritikusok”, a 7. blokk görög és kopt karakterek, a 11. blokk héberül, a 12–14. blokk arabul és szír ábécé, az 58. blokk valuta szimbólumokkal, a 63., 73., 77. és 78. blokk matematikai szimbólumokkal stb.
Végső változatában a 16 bites Unicode rendszer nem őrizte meg a másik szabványnak megfelelő piktogramokat.
Legalább háromféle módon ( beviteli módszer ) lehet Unicode karaktert beilleszteni a dokumentumba:
Az érték szerinti írás abból áll, hogy a 16 bites numerikus sorrendet elhelyezzük, amely megfelel egy adott karakternek a dokumentumban. A sorozatszám szerinti módszereket csak bizonyos típusú dokumentumokban használják, különösen RTF és HTML formátumú fájlokban vagy hasonló formában ( különösen XML , PHP ). Az elv minden esetben ugyanaz: előzze meg vagy vegye körbe a számot vagy az álnevet egy „menekülési szekvenciával”.
A HTML dokumentumokba az „&” (alias) vagy a „& #” (szám) szekvenciát tesszük az elejére és a „; »A sorozat végén és a kettő között a sorozatszám vagy az álnév.
Például a "  " és " & " szekvenciák lehetővé teszik az "és kereskedelmi" (más néven "ampersand" vagy "ampersand"), "&" jel ábrázolását.
Ehhez a számalapú jelöléshez (lásd fent) egyesek az alias jelölést részesítik előnyben, amely könnyebben megjegyezhető. A lista hosszú, mindegyikre csak egy példa tartozik. Ha a példát adnak a levelet egy , fel tudjuk használni a HTML kódot (és ezért a megfelelő ékezet jelzés) az összes vagy a legtöbb levél, a szabály alapján az alábbiakban. Ha a példa egy másik betűvel van megadva, akkor a HTML entitás csak néhány betűvel használható.
Ha a diakritikus jelölést a példánként megadott betűtől eltérő betűre helyezzük, elegendő az amperjelet követő betű megváltoztatása. Így a & aacute; ad egy akut hangsúlyt ( á ), az i akut akcentus ( í ) megszerzéséhez a & iacute; . Ez vonatkozik a nagybetűkre is: & Aacute; ad Á , & Iacute; Í-t ad .
nál nél | ʼn | nál nél | vs. | vs. | nál nél | ő | vs. | nál nél | nál nél |
---|---|---|---|---|---|---|---|---|---|
& aacute; | & napos; | & abreve; | & ccaron; | & ccedil; | & acirc; | & odblac; | & cdot; | & egy sír; | & amacr; |
ŀ | én | nál nél | nál nél | ø | đ | ł | nál nél | nál nél | |
& lmidot; | & inodot; | & aogon; | & egy gyűrű; | & oslash; | & dstrok; | & lstrok; | & atilde; | & auml; |
" | " | ˘ | ˇ | ¸ | ˆ | ˝ | ˙ | " | ¯ | ˛ | ˚ | ˜ | ¨ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
& akut; | & apos; | & breve; | &mert mi; | & cedil; | & circ; | & dblac; | &hozomány; | &komoly; | & macr; | & ogon; | &gyűrű; | & tilde; | & uml; |