Fordítóprogram

A számítástechnika , a fordító egy programot , amely átalakítja a forráskódot a tárgykód . Általában a forráskód programozási nyelven (a forrásnyelven ) íródott , magas szintű absztrakcióval rendelkezik , és az emberek számára könnyen érthető. Az objektumkódot általában egy alacsonyabb szintű nyelven (ún. Célnyelv ) írják , például egy összeállítási vagy gépi nyelven , egy gép által futtatható program létrehozása érdekében .

Általános előadás

A fordító a következő műveleteket hajtja végre: lexikai elemzés , előfeldolgozás ( előfeldolgozás ), szintaktikai elemzés ( elemzés ), szemantikai elemzés és optimalizált kódgenerálás . Az összeállítást gyakran egy link szerkesztési lépés követi egy futtatható fájl létrehozása érdekében. Amikor a lefordított programot (objektumkód) egy olyan számítógépen futtatják, amelynek processzora vagy operációs rendszere eltér a fordítójától, keresztkompilációnak nevezzük .

Két összeállítási lehetőség van:

Időt megelőzően (AOT), ahol az alkalmazás elindítása előtt össze kell állítania a programot: ez a hagyományos helyzet.
Összeállítás menet közben ( just-in-time , rövidítve JIT): ez a lehetőség az 1980-as években jelent meg (például a Tcl / Tk-vel ).

Az összeállítási lánc
A forrás a program a C nyelven
a megfelelő szerelési kódot
a program fordítás után - a gépi nyelv hexadecimális formában jelenik meg

Történelmi

A korai számítógépes szoftvereket összeállítási nyelven írták . A legmagasabb szintű programozási nyelveket ( absztrakciós rétegekben ) csak addig találták ki, amíg a szoftverek új típusú felhasználásának előnyei a különféle típusú processzorokon nem lettek fontosabbak, mint a fordítónak való írás költségei. A korai számítógépek nagyon korlátozott memóriakapacitása számos technikai problémát vetett fel a fordítók fejlesztésében is.

Az ötvenes évek végén először jelentek meg a gépfüggetlen programozási nyelvek. Ezt követően számos kísérleti fordítót fejlesztenek ki. Az első fordító, A-0 rendszer (az A-0 nyelv) írta Grace Hopper 1952 FORTRAN csapat által vezetett John Backus az IBM úgy vélik, hogy kifejlesztette az első teljes fordítóprogram 1957 COBOL kifejlesztett 1959 és nagyrészt Grace Hopper elképzelésein alapul, ez az első nyelv, amelyet több architektúrán állítottak össze.

Számos alkalmazási területen Gyorsan elterjedt az a gondolat, hogy magasabb szintű absztrakcióval rendelkező nyelvet kell használni. Az újabb programozási nyelvek által támogatott funkcionalitás növekedésével és a számítógépes architektúra egyre összetettebbé válásával a fordítók egyre összetettebbé váltak.

1962 -ben Tim Hart és Mike Levin hozta létre a Massachusettsi Műszaki Intézetben (MIT) az első " önállóan üzemeltetett " fordítót - amely objektumkódokká, a saját forráskódját magas szintű nyelven kifejezve - össze tudja állítani . Kezdve az 1970-es vált, nagyon gyakori, hogy dolgozzon ki egy fordítóprogram a nyelvet úgy tervezték, hogy lefordítani, hogy Pascal és C nagyon népszerű fejlesztési nyelveket.

Használhatunk a fordítók fejlesztésére szakosodott nyelvet vagy környezetet is: meta-fordító eszközök alatt beszélünk, és például fordító fordítót használunk . Ez a módszer különösen hasznos egy új nyelv első fordítójának elkészítéséhez; az adaptált és szigorú nyelv megkönnyíti a fejlődést és az evolúciót.

Felépítés és működés

A fordító fő feladata a számítógépen futó helyes objektumkód előállítása. A legtöbb fordító lehetővé teszi a kód optimalizálását, vagyis megpróbálja javítani a végrehajtás sebességét, vagy csökkenteni fogja a program memóriafoglalását.

A forrásnyelv általában "magasabb szintű", mint a célnyelv, vagyis magasabb szintű absztrakciót mutat be. Ezenkívül a program forráskódját általában több fájlban terjesztik.

A fordító elemzés-szintézis útján működik: ahelyett, hogy a forrásnyelv minden egyes konstrukcióját a célnyelvi konstrukciók egyenértékű sorozatával helyettesítené, a forrásszöveg elemzésével kezdi, hogy felépítsen egy köztes ábrázolást , amelyet viszont lefordít a célnyelven. .

A fordító legalább két részre oszlik: egy elülső (vagy elülső) részre, amelyet néha „csonknak” is neveznek, amely elolvassa a forrásszöveget, és előállítja a köztes ábrázolást; és egy hátsó (vagy végi) részt, amely ezen az ábrázoláson halad át a célszöveg előállításához. Egy ideális fordítóban az elülső rész független a célnyelvtől, míg a hátsó rész független a forrásnyelvtől. Egyes fordítók jelentős feldolgozást végeznek a köztes részen, önmagában központi részsé válva, függetlenül a forrásnyelvtől és a célgéptől is. Így fordítókat írhatunk a nyelvek és architektúrák egész sorára a központi rész megosztásával, amelyhez nyelvenként egy elülső részt, architektúránként pedig egy hátsó részt csatolunk.

Az összeállítás szakaszai a következők:

előfeldolgozás, amely szükséges néhány nyelvhez, például a C-hez , amely támogatja a makrópótlást és a feltételes összeállítást.

Az előfeldolgozási szakasz általában az elemzés vagy a szemantika előtt következik be; például a C esetében az előfeldolgozó a lexikai szimbólumokat kezeli a szintaktikai formák helyett.

a lexikai elemzés , amely a forráskódot apró darabokra vágja, amelyeket tokeneknek ( tokeneknek ) neveznek .

Minden token a nyelv egyedi atomi egysége (lexikai egységek vagy lexémák), például kulcsszó, azonosító vagy szimbólum. A token szintaxis általában szabályos nyelv , ezért véges állapotgéppel felismerhető. Ezt a fázist pásztázásnak vagy lexingnek is nevezik ; a lexikai elemzést végző szoftvert lexikai elemzőnek vagy szkennernek nevezzük. A normál nyelv lexikális elemzője számítógépes programmal állítható elő, a nyelv szabályos kifejezésekkel történő leírásából. Két klasszikus generátor a lex és a flex .

a szintaktikai elemzés magában foglalja a chip szekvencia elemzését a program szintaktikai felépítésének azonosítása érdekében.

Ez a szakasz általában egy elemző fa felépítésén alapul; a zsetonok lineáris szekvenciáját a formai nyelvtannak megfelelően felépített fa szerkezet váltja fel, amely meghatározza a nyelv szintaxisát. Például egy feltételt mindig logikai teszt követ (egyenlőség, összehasonlítás stb.). Az elemzési fát az összeállítás során gyakran módosítják és fejlesztik. A Yacc és a GNU Bison a legelterjedtebb értelmező.

a szemantikai elemzés az a fázis, amelynek során a fordító szemantikai információkat ad hozzá az elemző fához, és felépíti a szimbólumtáblát .

Ez a fázis ellenőrzi a típust (típushibák ellenőrzése), vagy a kötési objektumot (változók és függvény hivatkozások társítása a definícióikkal), vagy egy meghatározott feladatot (az összes helyi változót inicializálni kell használat előtt), figyelmeztetéseket adhat ki, vagy elutasíthatja a helytelen programokat . A szemantikai elemzéshez általában teljes elemzési fa szükséges, ami azt jelenti, hogy ez a szakasz az elemzési fázist követi, és logikusan megelőzi a kódgenerálási fázist; de lehetséges ezeket a fázisokat egyetlen menetben összehajtani.

a forráskód átalakítása köztes kódgá;
optimalizálási technikák alkalmazása a köztes kódon: vagyis a program "jobbá" tétele használatának megfelelően ( lásd alább );
A generációs kódot a elosztását regiszterek és a fordítást a közbenső kódot tárgykód, esetleg a beiktatása hibakeresés és elemzési adatok a végrehajtás;
és végül a linkek szerkesztése .

A lexikai, a szintaktikai és a szemantikai elemzés, a közbenső nyelveken való áthaladás és az optimalizálás alkotják az elülső részt. A kódgenerálás és a linkelés az utolsó rész.

Ezek a különböző lépések azt jelentik, hogy a fordítók még mindig a kutatás tárgyát képezik.

Kapcsolat tolmácsokkal

A programozási nyelv megvalósítása (konkrét megvalósítása) értelmezhető vagy összeállítható. Ez a megvalósítás fordító vagy tolmács , és egy programozási nyelv lefordíthatja az egyik megvalósítást, a másik pedig értelmezhető.

Összeállításról beszélünk, ha a fordítás a végrehajtás előtt történik (a hurok elvét ezután egyszer lefordítják), és az értelmezésről, ha a fordítás lépésről lépésre befejeződik a végrehajtás során (a ciklus elemeit ezután minden felhasználásnál megvizsgáljuk) .

Az értelmezés hasznos a hibakereséshez, vagy ha az erőforrások korlátozottak. Az összeállítás előnyösebb a működés során.

Alapozási probléma ( bootstrap )

Az első fordítókat közvetlenül összeállítási nyelven írták , egy elemi szimbolikus nyelvet, amely megfelel a célprocesszor utasításainak és néhány kissé fejlettebb vezérlő struktúrának. Ezt a szimbolikus nyelvet össze kell állítani (nem össze kell állítani) és össze kell kapcsolni, hogy futtatható verziót kapjon. Az egyszerűsége miatt elég egy egyszerű program, hogy gépi utasításokká alakítsa át.

A jelenlegi fordítók általában azon a nyelven íródnak, amelyet össze akarnak állítani; például egy C fordítót írunk C-ben, SmallTalk-ot a SmallTalk-ban, Lisp-t Lisp-ben stb. A fordító megvalósításakor döntő lépés történik, amikor az X nyelv fordítója eléggé teljes ahhoz, hogy össze tudja állítani önmagát: akkor ez már nem függ egy másik gyártandó nyelvtől (még az összeállítótól sem).

Nehéz észrevenni a fordító hibáját. Például, ha egy C fordítónak van hibája, a C programozók természetesen inkább a saját forráskódjukat fogják megkérdőjelezni, nem pedig a fordítót. Rosszabb esetben, ha ez a hibás fordító (V1 verzió) nem hibás fordítót (V2 verzió) fordít, akkor a V2 fordító lefordított (V1 által) lefuttatható hibája lehet. Mégis jó a forráskódja. A bootstrap ezért megköveteli, hogy a fordítók programozói megkerüljék a meglévő fordítók hibáit.

Egy- és többutas fordító

A fordítók besorolását az átmenetek száma alapján a számítógépek hardveres erőforrásainak hiánya okozza. Az összeállítás drága folyamat, és a korai számítógépek nem rendelkeztek elegendő memóriával egy olyan program megtartásához, amelynek ezt a munkát el kellett végeznie. A fordítókat így olyan alprogramokra osztották, amelyek mindegyike a forrásból olvasott a lexikai elemzés , az elemzés és a szemantikai elemzés különféle fázisainak befejezéséhez .

Előnynek tekintették azt a képességet, hogy mindent egyetlen lépésben egyesítsenek, mivel leegyszerűsíti a fordító írását, amely általában gyorsabban fut, mint egy többutas fordító. Így a korai rendszerek korlátozott erőforrásai miatt sok nyelvet kifejezetten úgy terveztek, hogy egyetlen menetben összeállíthatók legyenek (pl. A Pascal nyelv ).

A program nemlineáris felépítése

Bizonyos esetekben a nyelvnek ez vagy az a tulajdonsága megköveteli, hogy a fordító egynél több menetet hajtson végre. Vegyünk például egy olyan állítást a forrás 20. sorában , amely befolyásolja egy állítás fordítását a 10. soron . Ebben az esetben az első lépésnek információkat kell gyűjtenie a nyilatkozatokról, míg a tényleges fordításra csak egy későbbi átadás során kerül sor.

Optimalizálás

A fordítók kis programokra bontása a hatékony fordítók gyártásában érdekelt kutatók által alkalmazott technika. Az egyutas fordítás hátránya ugyanis az, hogy nem teszi lehetővé a jó minőségű kód létrehozásához szükséges kifinomult optimalizálások nagy részét. Ezután nehéz lesz pontosan megszámolni az optimalizáló fordító által elvégzett menetszámot.

A korrekciós demonstráció felosztása

A kis programok sorozatának helyességének bemutatása gyakran kevesebb erőfeszítést igényel, mint egy ezzel egyenértékű, nagyobb egyedi program helyességének bemutatása.

Fordító fordító

A fordító fordító olyan program, amely a fordító bármely részét vagy egészét képes létrehozni. Összeállíthatja például egy nyelv alapjait, majd a többit összeállíthatja a nyelv alapjaival.

Minőség

A felhasználástól és a programot futtató géptől függően érdemes optimalizálnia a végrehajtás sebességét, a memória elfoglalását, az energiafogyasztást, a más architektúrákba való hordozhatóságot vagy a fordítási időt.

Összeállítási lánc

Kereszt-összeállítás

A keresztkompiláció olyan fordítási láncokra utal, amelyek képesek a forráskódot olyan objektumkódra fordítani, amelynek processzorarchitektúrája eltér a fordítás végrehajtásától. Ezeket a láncokat főleg ipari informatikában és beágyazott rendszerekben használják .

Egyéb összeállítások

Bájtkód vagy bájtkód

Egyes fordítók egy forrásnyelvet lefordítanak virtuális gép nyelvére (úgynevezett köztes nyelvre), vagyis a virtuális gép által végrehajtott kódra (általában bináris) : a számítógép fő funkcióit utánzó programra. Az ilyen nyelveket állítólag félig összeállítják. A program portálása tehát csak a virtuális gép portolását igényli, amely valójában akár tolmács, akár második fordító lesz (többcélú fordítók számára). Így fordítóprogramok lefordítani Pascal be P-kód, Modula 2 be M-kód, Simula az S-kódot, vagy újabban a Java kódot a Java bytecode (object code).

Rövid program Scalában.
A kapott Java bájtkód, futtatható a virtuális gépen.

Példák

Amikor az összeállítás bájtkódra épül, menet közben beszélünk a fordításról . Ezután virtuális gépeket használnak, például a Java virtuális gépet , amellyel a Scalát nevezetesen össze tudjuk fordítani . Bizonyos nyelveken lehetséges olyan könyvtár használata, amely lehetővé teszi a felhasználó által beírt kód on-the-fly összeállítását, például C-ben libtcc-vel.

Más fordítók lefordítják a kódokat egyik programozási nyelvről a másikra. Transzkompilátoroknak , vagy akár az anglikizmusnak nevezik őket , transzpilereknek vagy transzpilátoroknak. Például a LaTeX szoftver lehetővé teszi, hogy a LaTeX forráskódjából PDF- fájlokat (például Ubuntu alatt a pdflatex parancsot ) vagy HTML- fájlokat nyerjen . Egy másik példa: az LLVM egy fordítóprogramok létrehozását segítő könyvtár, amelyet az AMD is használ a "HIP" kifejlesztésére, egy CUDA kód transzkompilátorra (NVIDIA-specifikus nyelv és széles körben használatos), hogy az AMD grafikus processzorokon fusson.

A forráskód.
Az összeállítás után kapott kód.
A pdf dokumentum előnézete.

Néhány fordító inkrementálisan vagy interaktív módon fordítja a forrásprogramot (amelyet a felhasználó ad meg) gépi kódra. Példaként említhetjük a Common Lisp néhány megvalósítását (például az SBCL (en) ).

Függelékek

Bibliográfia

Alfred Aho , Monica Lam , Ravi Sethi és Jeffrey Ullman ( angolról fordította : Philippe Deschamp, Bernard Lorho, Benoît Sagot és François Thomasset), Összeállítók : Alapelvek, technikák és eszközök [„ Összeállítók: Alapelvek, technikák és eszközök ”], Franciaország , Pearson Oktatás,2007. november, 2 nd ed. ( 1 st ed. 1977), 901 p. ( ISBN 978-2-7440-7037-2 , online előadás )

Más néven Sárkánykönyv

Kapcsolódó cikkek

Tolmács
Alacsony szintű virtuális gép
On-the-fly összeállítás
Növekményes összeállítás
Várható összeállítás
Dekompilátor , program, amely egy alacsony szintű nyelvet lefordít egy magasabb szintű nyelvre
A GCC egy különösen jól ismert fordítócsomag, amelyet széles körben használnak a C és C ++ nyelvekhez , de a Java vagy az Ada is .
Csengés egy front-end a C család nyelven, a LLVM back-end
Javac , a legnépszerűbb Java fordító
GHC , a Haskell fordítója
Sok más , Ugyanazokra a nyelvekre és mások

Külső linkek

en) Ingyenes és / vagy nyílt forráskódú fordítók listája
A tanfolyam meglehetősen teljes és példákat tartalmaz a C / ASM-ben.

Megjegyzések és hivatkozások

A fordító kijelöl egy szerzőt is, aki különféle írásokból kivonatokat állít össze egy mű elkészítéséhez; lásd a fordító szó 1. jelentését a Wikiszótárban .
Jacques Menu, fordítók C ++ -val , Addison-Wesley,1994o. 30
Például az EDSAC-ról , amint azt Alan Turing a megnyitón tartott előadásában leírta, (in) AM Turing, "Nagy rutin ellenőrzése" a nagysebességű automatikus számológépekről szóló konferencia jelentésében , Univ. Math. Labor. , Cambridge, p. 67-69 (1949), Morris, FL és CB Jones, " Alan Turing korai programbizonyítása ", Ann. Hist. Comp. , vol. 6, n o 21984. április, P. 139–143 ( online olvasás ).
Lásd Jérôme Feldman és Marcel Berger ( szerk. ), The progress of mathematics , Paris, Belin editions, coll. "A tudományért",tizenkilenc nyolcvan egy, 167 o. ( ISBN 2-902918-14-3 ) , „Programozási nyelvek”, p. 102-113.
(in) Susan Ware ( szerk. ), Stacy Braukman et al. , Nevezetes amerikai nők: Életrajzi szótár: A XX. Század befejezése , vol. 5, Harvard University Press,2005, 729 p. ( ISBN 978-0-674-01488-6 , online előadás ) , p. 309-311.
Vicki Porter Adams , „ Grace M. Hopper kapitány: A COBOL anyja ”, InfoWorld , Vol. 3, n o 20,1981. október 5, P. 33 ( ISSN 0199-6649 , online olvasás ).
Mitch Betts , „ Grace Hopper, Cobol édesanyja meghal ”, Computerworld , vol. 26, n o 1,1992. január 6, P. 14 ( ISSN 0010-4841 , online olvasás ).
" Check out során 'összeállítása menet közben libtcc' at @OpenClassrooms " on OpenClassrooms (elérhető november 21, 2016 ) .
" tranpiler " a wiktionary.org oldalon ,2017. november 16(megtekintve 2018. április 24-én )
(in) " LaTeX - A dokumentum-előkészítő rendszer " a www.latex-project.org webhelyen (hozzáférés: 2016. november 21. ) .
(in) " SBCL User Manual " a www.sbcl.org oldalon (hozzáférés: 2016. november 21. ) .