Szemantika

A szemantika a nyelvészet egy olyan ága, amely a jelzetteket tanulmányozza , miről beszélünk, mit akarunk közölni egy állítással . A támogatás a szemantikai, szintaktikai , aggodalmak a maga részéről a jelölő , annak formáját, annak nyelvét, annak helyesírás , a nyelvtan , stb ; ez az állítás formája.

Különösen a szemantikának van több tanulmányi tárgya:

az egyszerű vagy összetett szavak jelentése ;
viszonyait azaz a szavak között (kapcsolatait homonímia , szinonima , antonymy , többjelentésűségtől , hyperonymy , hyponymy , stb );
aktánsok megoszlása egy nyilatkozaton belül;
Az igazság feltételeit nyilatkozatot;
a kritikus diskurzuselemzés ;
a gyakorlati , mivel a szemantika egyik ágának tekintik.
leírások.

A szemantika kifejezést a szintaxissal ellentétben használják a számítógépes nyelvek tanulmányozása során , amelyre formálisan kifejlesztették (lásd a programozási nyelvek szemantikáját ). A szemantika és a szintaxis között ugyanaz a kapcsolat, mint a tartalom és a forma között.

Etimológia

A szemantikai szó a görög σημαντικός ( sêmantikos ) szóból származik , " jelzett ", amely maga a σημαίνω ( sêmainô ) szóból , a "jelölés, jelzés" vagy a σῆμα ( sêma ), "jel, jel" kifejezésből áll. A XIX . Század végén Michel Breal francia nyelvész , az első szerződési szemantika szerzője készítette, a szemantikai teszt 1897-ben jelent meg.

A szemantikai elemzés és az elemzés közötti különbség

A szintaktikai elemzés , valamint a nyelvészet szemantikai elemzésének célja a kimondás egészének jellemzése, elsősorban a kimondás struktúráinak meghatározásával. Mindkét esetben a struktúrák meghatározása alapelemeinek, a szavaknak és saját alkotóelemeiknek a jellemzésén alapul, de e két megközelítés szerint másképp.

A szintaktikai elemzés a mondatokkal foglalkozik a kifejezésekkel . A "kicsi" szó szintaktikai elemzését nem lehet elvégezni, például ha nem szerepel egy mondatban, más szavakkal vagy csoportvezetőkkel kapcsolatban.

Az elemzés tehát a funkcionális struktúrák elemzéseként azonosítható, amelyek a nyelvtani szabályok gyakorlása révén megszerezhetők.

A szemantikai elemzés a maga részéről érdekli ezeket a struktúrákat azáltal, hogy megfigyeli a jelentés felépítésére jellemző mechanizmusokat. A mag a legkisebb jelentésegység.

A szemantika szóról szóra foglalkozhat.

Példa:

A "kicsi" szót a következőképpen elemezzük:

PETIT (melléknév ⇒, amely nem nagy) + E (nőnemű védjegy) + S (többes számú jel) [PETIT - a szó alapja vagy gyöke (lexikális jel), E + S - nyelvtani jelek].

A "kicsi" szóhoz tehát három szemem tartozik.

Ebből a szóból más elemzések is lehetségesek anélkül, hogy feltétlenül egy teljes állítást hoznának napvilágra (vö. Bevezető).

A szintaktikai elemzés és a szemantikai elemzés közötti megkülönböztetés itt megegyezik a kortárs nyelvészet legelterjedtebb megközelítésével, amely a Ferdinand de Saussure által bevezetett strukturalizmusból származik . Találkozni fogunk az egyenértékűséggel használt strukturális elemzés vagy komponensanalízis kifejezésekkel, hogy közvetlenebbül értelmezzük a szemantikai elemzés ezen elmélet szerinti elvégzéséhez használt megközelítést. A szerkezetet a mondat közvetlenül mögöttesnek érzékeljük, ez utóbbi szerkezet, amelyet a szintaxis vagy a nyelvtan bizonyít, és a szót szemantikai jellemzőivel társítottnak tekintik . Más megközelítések, mint például Lucien Tesnière függőségi nyelvtana a strukturalizmus előtt, szintaktikailag fenntartják a minősítési struktúrát. Tesnière esetében a szintaktikai szintet strukturális síknak nevezik, míg a szemantikai síkot a pszichológiához és a logikához kapcsolódónak tekintik .

Adatbányászati alkalmazások

Az adatfeltárási módszerek lehetővé teszik egy olyan adatsor értelmezését, amely a priori eltérésnek tűnik (lásd még a mesterséges intelligenciát ), és ezért szemantikát hoz létre . A kiadott szemantika általában három formát ölt (a hivatalos jelölők fordítása), amelyek a mesterséges intelligenciából származnak:

az asztal ;
a grafikon : szemantikus hálózat, tárgyak hálója, fogalmak stb.
a fa: a gráf sajátos esete és felhasználása.

Jelölők, abban az értelemben, hogy képviselik a tudást. Az ilyen struktúrákat ezután feljegyzik a kiindulási adatokban, minden adatot ezután a fa ágához, a táblázat mezőjéhez stb. Az elemzés ezután a megértés bonyolultabb szintjén folytatódik.

Tudás felfedezése adatbázisokban

Mivel azonban a gép csak a jelzőket manipulálja, elengedhetetlen, hogy az adatbányászati folyamatba a terület humán szakértőjét is bevonják. Ez visszaállítja a kinyert szemantikát, és értelmet és értéket ad neki. Három kritériumot mutatnak be erre a célra:

Vajon ismert ?
Meg lehet magyarázni ?
Ez hasznos ?

Az ideális az, ha hármas NEM / IGEN / IGEN .

Egy ilyen projekt az úgynevezett "tudásfelfedezés adatbázisokban", angolul KDD, Knowledge Discovery in Databases .

Végül a kinyert szemantika az információ-leképezés szerepét tölti be, lehetővé teszi az információk egymáshoz viszonyított elhelyezkedését. Ez a „kartográfiai” szerep lehetővé teszi az információk tárolását, rendszerezését és későbbi megkeresését. Bármely modell, kategóriák halmaza, a freudi topográfia ezután tényleges információ-térképészet, vagyis formalizált kontextus.

Valójában adatok adatokról, metaadatokról . Adott architektúrán kezelni a metaadatokat , ez az úgynevezett ügyfél vagy kiszolgáló a metaadatok . Az egyik ismert rendszer a Dublin Core Metadata Initiative (DCMI).

A Szemantikus Web a DCMI-vel megegyező típusú projekt, amelynek célja az egyes weboldalak szisztematikus metaadatainak létrehozása, kezelése és kihasználása . Így, ha az egyes weboldalak tartalmát elmagyarázzák a jelölőknek, a gép képes lesz a tartalom relevanciájára, és nem a lexikális statisztikákra hivatkozni. Ennek drámai következményei lehetnek az információ-visszakeresési technológiákra , valamint a keresők megjelenésére és működésére .

A szöveges feltárás speciális esete

A szöveges bányászat abból áll, hogy egy „szöveges” objektumot szemantikai vagy szintaktikai feldolgozással átalakítunk „tábla”, „fa” vagy „grafikon” objektummá, majd szöveges bányászati technikákat alkalmazunk erre a formalizált objektumra. A várható eredmények általában:

Az automatikus összefoglaló ;
Az automatikus indexelés ;
Könyvmutatók (címsorok és alcímek) generálása;
Koncepció kivonása és feltérképezése;
Automatikus besorolás;
A szövegek közötti egyeztetés.

A szemantikai megközelítés termékenyebb szakirodalommal rendelkezik, mint a szintaktikai megközelítés: még ha az utóbbinak is kiváló eredményei vannak, a szükséges számítási erőforrások gyakran a szemantikai elemzés mellett döntenek.

A szemantikai elemzés egy szövegcsoportot lexikális mátrixgá alakít :

Online, minden szöveg;
Az oszlopban minden kulcsszó legalább egyszer megjelenik az egyik szövegben;
A mezőkben egy numerikus arány, amely egy kulcsszó szövegben való megjelenésének gyakoriságát és a kulcsszó korpuszban való megjelenésének gyakoriságát is méri.

Az ontológiák speciális esete

Az " ontológia " kifejezésnek filozófiai jelentése van, de a tudásmenedzsmentben a tudás szemantikai ábrázolásának talán legfejlettebb formáját képviseli.
Ez egyfajta "szupertezaurus", amelynek célja az összes társadalmi dokumentum, általában egy vállalat tárolt, bejövő vagy kimenő dokumentumfilmjének indexelése. Így egy e-mailt, egy referenciamunkát, egy azonos témákat megosztó munkadokumentumot automatikusan összekapcsolunk, ezért kontextusba helyezzük, ezáltal szemantikai ismereteket szabadít fel.
Az ontológia felépítése gyakorlatilag önmagában egy szakma, mint például a könyvtári tezauruszok megtervezése és karbantartása. Az építkezés mindig kollektív és a kompetencia területek összesítése által történik.

Az ontológia alapvető megfogalmazása a következő:

Ez egy szemantikus fa;
Minden kulcsszó lexikonokkal van ellátva : szinonimák , homonimák , hiperonimák , homofóniák fordítása más nyelvekre stb. Ezt a kulcsszó körüli mikrohálózatot koncepciónak vagy osztálynak hívják ;
Minden fogalmat tezaurusz- kategóriának kell tekinteni , ezért tágabb vagy szűkebb kategóriákkal. Ezt a tagsági linket logikai kapcsolatként értelmezik;
Minden fogalomnak lehetnek példányai vagy elemei, amelyek ebbe a kategóriába tartoznak.

Példa: BIRD> AIGLE {aigle royal}. A gép ekkor arra következtethet, hogy az arany sas madár.

A fogalmak közötti kapcsolatok sokkal összetettebbek lehetnek, mint az egyszerű alárendeltség, így túllépve a tezaurusz keretein. Ha a fogalmak asszimilálhatók nominális csoportokba, akkor a linkek asszimilálhatók verbális csoportokba: ezek a linkek linkek kategóriáiba vannak csoportosítva . A hálózati struktúrát néha témakörnek is nevezik .

A gyakorlatban így automatikusan lefordíthatnánk a történelem tankönyvet ontológiává, ötféle fogalomtípus (dátum, hely, esemény, fizikai személy, jogi személy) és mintegy harminc verbális link kategóriájának figyelembevételével.

A lexikonokon kívül a példányok erőforrásokra vagy URI-kra is utalhatnak . Általában ezek azok a dokumentumok, amelyeket indexelni kíván.

A gép számára az így képviselt tudásról való érvelés a fogalmak hálózatában, úthálózat módjára való „járást” jelenti. Vannak specifikus algoritmusok, például az útkeresők (Pathfinder) , amelyek a legrövidebb utat keresik egyik fogalomból a másikba, miközben tiszteletben tartják a gazdaságosság kritériumát: "kevesebb fogalom", "több nyelv", "nagyobb számú szinonimák ”stb. Az eredmények látványosak lehetnek, különösen, ha szem előtt tartjuk, hogy a kiindulási és a végpont nem fogalmak, hanem index URI-k (vállalati dokumentumok).

Lásd is

Bibliográfia

: a cikk forrásaként használt dokumentum.

John Langshaw Austin , Mikor kell mondani , hogy mit kell tennie (Küszöb, 1991, ( ISBN 978-2-02-012569-7 ) )
Marc Baratin és Claude Moussy, Conceptions latines du sens et de la signification , Center Alfred Ernout, 1999.
Michel Bréal , Esszé a szemantikáról: a jelentések tudománya , Párizs, Hachette ,1897, 349 p. ( online olvasás )
Rudolf Carnap , A felülmúlva a metafizika által a logikai elemzés nyelv (1931), az Antonia Sgez, Kiáltvány a kör bécsi és egyéb írások , PUF, 1985, ( ISBN 978-2-13-038852-4 ) )
Noam Chomsky , A szemantika kérdései (Küszöb, 1975, ( ISBN 978-2-02-002748-9 ) )
Paul Grice , jelentése : The Philosophical Review 66: 377-88. (1957)
Roland Grossmann, " Michel Bréal (1832-1915): a felvonulások embere ", Mémoires de l'Académie nationale de Metz ,2008, P. 221–241 ( online olvasás )
John Lyons , elemei szemantika (Larousse, 1978, ( ISBN 978-2-03-070344-1 ) )
Bernard Normier, A nyelvi technológiák hozzájárulása a szöveges információk feldolgozásához és javításához , Éditions ADBS, 2007 ( ISBN 978-2-84365-092-5 ) ;
François Rastier , értelmező Szemantika (Presses Universitaires de France 1987, 2 nd ed. Átdolgozott és kibővített 1996)
Gérard Sabah , Mesterséges intelligencia és nyelv , Hermès, 1988, 1989, ( ISBN 978-2-86601-134-5 ) ( ISBN 978-2-86601-187-1 )
Alfred Tarski in Gilles-Gaston Granger 'et al. , Logika, szemantika, metamatematika, 1923-1944 (Armand Colin, 1974)
Irène Tamba , szemantika (PUF, Que sais-je ?, 2005, ( ISBN 978-2-13-054856-0 ) )
(en) Anna Wierzbicka , Semantics: Primes and Universals , Oxford University Press, 1996 ( ISBN 978-0-19-870003-6 )

Kapcsolódó cikkek

Szemantikai elemzés , Kombinatorika szemantika , Koca , szemantikai osztály , Jellemző szemantika
Denotáció és konnotáció , Jelentés és denotáció
Szemantikai musical , szemantikai Általános
Szemiotika , Vizuális szemiotika
Jelentés , Jelentés (filozófia) , Jelentőség (a jelentés szintaktikai dimenziója)
A nyelv filozófiája
Ábrázolás (nyelvtan)
Szemantikus web : a web kiterjesztése, amely a tartalom jelentésének formalizálásával (az oldalak jelentésének leírása egy gép számára érthető nyelven) lehetővé teszi például hozzáférhetővé tételét az automatizált folyamatok számára,
Generatív szemantika
Teleosemantika , Biosemantika
Lexikológia , lexikográfia , szótár
Természetes szemantikai metanyelv (NSM): szemantikus primitívek keresése Anna Wierzbicka mellett
Lexikai jelölési keretrendszer : LMF, ISO szabványosítási munka az NLP lexikonokon
Jelentés-szövegelmélet ( Igor Mel'čuk )
Halina Lewicka (de) (1906-1983), Krzysztof Bogacki és Wojcik, A francia igék szemantikai és szintaxisszótára (DSSVF, Varsó, 1983)

Listák

Nyelvészek listája
Roger Schank , Robert Abelson , Richard Montague , Ghil'ad Zuckermann , François Rastier , Eugen Coșeriu , Juri Apresjan , Igor Mel'čuk ,

Külső linkek

Megjegyzések és hivatkozások

Dominique Maingueneau és Ruth Amossy , „ 9 | 2012 A kritika és az érvelés közötti diskurzus elemzése ” , a journals.openedition.org oldalon (hozzáférés : 2020. május 28. )
Grossmann 2008 , p. 222.
Bréal 1897 .
Clive Perdue és José Deulofeu , „ Az állítás strukturálása: longitudinális tanulmány ”, Nyelvek , vol. 21, n o 84,1986, P. 43–63 ( DOI 10.3406 / lgge.1986.1519 , online olvasás , hozzáférés : 2020. május 28. )
http://www.unil.ch/webdav/site/ling/shared/IntroductionLing/Serra/Intr.a_la_ling.Cours_n_8.pdf .
M. Arrivé, A szerkezeti szintaxis elemei, Lucien Tesnière , francia nyelv , 1969, p. 36–40.