A természetes nyelv vagy a hétköznapi nyelv egy "normális" nyelv, amelyet emberi lény beszél. Ez szemben áll a hivatalos nyelv , mint például a számítógépes nyelv , valamint a kreatív nyelv A mesterséges nyelvek .
Természetes nyelv szerint jelöljük meg az emberek által beszélt nyelvet, amely korszakunk előtt 200 000 és 50 000 évvel jelent meg. A nyelvtörténet részletezi . Homo erectus kétmillió éves vemhessége után , amely átvette a Homo habilis-t , a modern ember, az úgynevezett Homo sapiens , számos tényező együttesen jelent meg:
A Homo sapiens megjelenésének két forgatókönyve van : az „ Out of Africa ” és a pluri-centripetal (poligenesis) forgatókönyv. A paleo-nyelvészet legújabb kutatása a XXI E. Század elején azonosította a 27 szóból álló alapot, amely az összes földi írásbeli nyelv gyökerénél általános, ami az „ Afrikán kívül ” (monogenezis) forgatókönyv előmozdítását ösztönzi. Valójában több forrásnak nem lett volna oka arra, hogy ugyanazt a kiinduló protoként használjon.
Ezt követően a Homo sapiens rátette magát az emberi fajra, akár a produktivista hipotézis, akár a szociológiai hipotézis miatt.
Körülbelül 7000 évig ez a nyelv több nyelven írott formát öltött, amelyek aztán meghatározó nyelvekké váltak. Főleg emiatt ma 6000 nyelvet fenyeget a kihalás veszélye.
A számítástechnikában a természetes nyelv ellentétben áll a számítógép nyelvével :
A keresőmotor-kiadók számára az a kihívás, hogy képesek legyenek releváns eredményeket megadni egy természetes nyelven megfogalmazott lekérdezéshez.
Alan Turing , a XX . Század első felének brit matematikusa azt is sejtette, hogy a mesterséges intelligencia olyannyira képes "beszéd" benyomást kelteni, hogy nehéz megkülönböztetni az embert. A mesterséges intelligencia teszteket, amelyek képesek utánozni az emberi beszélgetést , Turing- teszteknek nevezzük .
Ha a szöveg konzisztenciája egy olyan szöveg tulajdonsága, amely nem igényel levonást az egyik dokumentumelemről a másikra való elmozduláshoz, akkor Florian Wolf és munkatársai példáját használjuk . ennek a tulajdonságnak a szemléltetésére:
A szöveg megértése érdekében levonható következtetések itt triviálisak, tiszteletben tartva az információk továbbításakor a relevancia elvét. Haladóak. A rakéta kilövéséhez jó időre van szükség, az Ariane hordozórakéta pedig két műholdat képes elindítani. Még mindig jellemeznünk kell ezeket a következtetéseket: "az időjárás rendben volt, ezért" az első következtetés egyértelművé válik, és "az Ariane hordozórakéta […] két műholdat állított pályára" egyértelművé teszi a második következtetést. Nem ismert, hogy a hordozórakéta képes-e négy műholdat elindítani, de nem ez a lényeg. Tudatában kell lennünk a szövegben szereplő összes szó szükségességének.
Ezenkívül tiszteletben tartják a haladást: beszélünk az időjárásról, majd a rakéta kilövéséről és végül arról, hogy mit indítanak.
Vegyük le ezt a szöveget a helyet jelző kapcsolódik a főnév központ, és már nem tudja, hogyan kell indokolni összhang. Ezután kevésbé egyértelmű következtetést kell levonnunk: a Kourou központ egy térbeli központ. Ehhez meg kell vizsgálnunk a pragmatika elméletét, hogy felmérjük ennek a következtetésnek a költségeit. Meg kell jegyezni, hogy a relevancia elve erőteljesen fejlődik, függetlenül attól, hogy írott nyelven vagyunk-e, ahol az előre kialakítottak gyengék, vagy a szóbeli nyelven, ahol az előre kialakított fontos, tudva, hogy a szerző ismeri hallgatói tudásának egy részét.
El kell ismerni, hogy sok szöveg nem felel meg ennek a tulajdonságnak: így Michel Charolles sok dokumentumot szentel e kétértelműség szituációinak felsorolására a szövegekben:
Ezek a példák kiemelik az implicit kezelés mélységének fogalmát, amelyet ezek a szövegek megkövetelnek az összhang elérése érdekében.
A tipográfiai konformitás a szövegek azon tulajdonsága, hogy tiszteletben tartja a helyesírást és a tipográfiát. Ha elfogadhatónak tekinthető, hogy a "Lift-Gate" nevezett entitás, és hogy a "lift-gate" egy közönséges név, akkor a "Lift-Gate" szó szó szerinti fordítása megnevezett entitásként felesleges zajt okoz a szemantikai feldolgozásban .. Ezeket a megnyilvánulásokat kívánatos leszűrni a morfológiai kezelések során.
A lexikai konformitás abból áll, hogy a fogalomnak megfelelő kifejezést választanak: így a „Tailgate” kifejezett összetett szó, a „farok kaput” franciául fordítják a „tailgate” kifejezéssel, még ha franciául is, ez a kifejezés felesleges, mert a „tailgate” elég.
A szótár használata kielégítő mindaddig, amíg az ember nemcsak a felmerült szavakat, hanem a szavakat valószínűleg alkotó szavak (lexémák) után kutat.
Így a korpusz első két dokumentumában azt a döntést vezették be, hogy a „decklid” kifejezés helyébe a „csomagtartó fedele” lépjen, ami „csomagtartó fedelet” jelent. Ezt a hibatípust az összetett szavak elemzésével kapcsolatos lexikai hibával jelöljük ki.
Ezen túlmenően a kifejezések kétértelműségének feloldására kell törekednünk. Nem szabad megállnunk az összetett szavak gyökérmemáinál.
Azok a stilisztikai tulajdonságok, amelyek hozzájárulnak a jobb koherenciához. Az általános dokumentumok számára előnyös, ha a jelenlegi általánosban íródnak, a negatív formák lehető legnagyobb mértékű egységesítésével. Így egy követelmény elfogadja az aktív formát, és a jelenlegi generikusba van írva, és a passzív formák aktív formává történő átalakítása elegendő az igény kielégítéséhez. Hasznos lehet egy transzformáció használata a negatív szövegek feldolgozásához is.
A dokumentumok minőségét főként a koherencia lényegének összetevői alapján minősítik:
A hivatkozások többek között az Aux Origines des Langues et du Langue című műből származnak, szerkesztette: Jean-Marie Hombert, Fayard , 2005