A szemantika a nyelvészet egy olyan ága, amely a jelzetteket tanulmányozza , miről beszélünk, mit akarunk közölni egy állítással . A támogatás a szemantikai, szintaktikai , aggodalmak a maga részéről a jelölő , annak formáját, annak nyelvét, annak helyesírás , a nyelvtan , stb ; ez az állítás formája.
Különösen a szemantikának van több tanulmányi tárgya:
A szemantika kifejezést a szintaxissal ellentétben használják a számítógépes nyelvek tanulmányozása során , amelyre formálisan kifejlesztették (lásd a programozási nyelvek szemantikáját ). A szemantika és a szintaxis között ugyanaz a kapcsolat, mint a tartalom és a forma között.
A szemantikai szó a görög σημαντικός ( sêmantikos ) szóból származik , " jelzett ", amely maga a σημαίνω ( sêmainô ) szóból , a "jelölés, jelzés" vagy a σῆμα ( sêma ), "jel, jel" kifejezésből áll. A XIX . Század végén Michel Breal francia nyelvész , az első szerződési szemantika szerzője készítette, a szemantikai teszt 1897-ben jelent meg.
A szintaktikai elemzés , valamint a nyelvészet szemantikai elemzésének célja a kimondás egészének jellemzése, elsősorban a kimondás struktúráinak meghatározásával. Mindkét esetben a struktúrák meghatározása alapelemeinek, a szavaknak és saját alkotóelemeiknek a jellemzésén alapul, de e két megközelítés szerint másképp.
A szintaktikai elemzés a mondatokkal foglalkozik a kifejezésekkel . A "kicsi" szó szintaktikai elemzését nem lehet elvégezni, például ha nem szerepel egy mondatban, más szavakkal vagy csoportvezetőkkel kapcsolatban.
Az elemzés tehát a funkcionális struktúrák elemzéseként azonosítható, amelyek a nyelvtani szabályok gyakorlása révén megszerezhetők.
A szemantikai elemzés a maga részéről érdekli ezeket a struktúrákat azáltal, hogy megfigyeli a jelentés felépítésére jellemző mechanizmusokat. A mag a legkisebb jelentésegység.
A szemantika szóról szóra foglalkozhat.
Példa:A "kicsi" szót a következőképpen elemezzük:
PETIT (melléknév ⇒, amely nem nagy) + E (nőnemű védjegy) + S (többes számú jel) [PETIT - a szó alapja vagy gyöke (lexikális jel), E + S - nyelvtani jelek].
A "kicsi" szóhoz tehát három szemem tartozik.
Ebből a szóból más elemzések is lehetségesek anélkül, hogy feltétlenül egy teljes állítást hoznának napvilágra (vö. Bevezető).
A szintaktikai elemzés és a szemantikai elemzés közötti megkülönböztetés itt megegyezik a kortárs nyelvészet legelterjedtebb megközelítésével, amely a Ferdinand de Saussure által bevezetett strukturalizmusból származik . Találkozni fogunk az egyenértékűséggel használt strukturális elemzés vagy komponensanalízis kifejezésekkel, hogy közvetlenebbül értelmezzük a szemantikai elemzés ezen elmélet szerinti elvégzéséhez használt megközelítést. A szerkezetet a mondat közvetlenül mögöttesnek érzékeljük, ez utóbbi szerkezet, amelyet a szintaxis vagy a nyelvtan bizonyít, és a szót szemantikai jellemzőivel társítottnak tekintik . Más megközelítések, mint például Lucien Tesnière függőségi nyelvtana a strukturalizmus előtt, szintaktikailag fenntartják a minősítési struktúrát. Tesnière esetében a szintaktikai szintet strukturális síknak nevezik, míg a szemantikai síkot a pszichológiához és a logikához kapcsolódónak tekintik .
Az adatfeltárási módszerek lehetővé teszik egy olyan adatsor értelmezését, amely a priori eltérésnek tűnik (lásd még a mesterséges intelligenciát ), és ezért szemantikát hoz létre . A kiadott szemantika általában három formát ölt (a hivatalos jelölők fordítása), amelyek a mesterséges intelligenciából származnak:
Jelölők, abban az értelemben, hogy képviselik a tudást. Az ilyen struktúrákat ezután feljegyzik a kiindulási adatokban, minden adatot ezután a fa ágához, a táblázat mezőjéhez stb. Az elemzés ezután a megértés bonyolultabb szintjén folytatódik.
Mivel azonban a gép csak a jelzőket manipulálja, elengedhetetlen, hogy az adatbányászati folyamatba a terület humán szakértőjét is bevonják. Ez visszaállítja a kinyert szemantikát, és értelmet és értéket ad neki. Három kritériumot mutatnak be erre a célra:
Az ideális az, ha hármas NEM / IGEN / IGEN .
Egy ilyen projekt az úgynevezett "tudásfelfedezés adatbázisokban", angolul KDD, Knowledge Discovery in Databases .
Végül a kinyert szemantika az információ-leképezés szerepét tölti be, lehetővé teszi az információk egymáshoz viszonyított elhelyezkedését. Ez a „kartográfiai” szerep lehetővé teszi az információk tárolását, rendszerezését és későbbi megkeresését. Bármely modell, kategóriák halmaza, a freudi topográfia ezután tényleges információ-térképészet, vagyis formalizált kontextus.
Valójában adatok adatokról, metaadatokról . Adott architektúrán kezelni a metaadatokat , ez az úgynevezett ügyfél vagy kiszolgáló a metaadatok . Az egyik ismert rendszer a Dublin Core Metadata Initiative (DCMI).
A Szemantikus Web a DCMI-vel megegyező típusú projekt, amelynek célja az egyes weboldalak szisztematikus metaadatainak létrehozása, kezelése és kihasználása . Így, ha az egyes weboldalak tartalmát elmagyarázzák a jelölőknek, a gép képes lesz a tartalom relevanciájára, és nem a lexikális statisztikákra hivatkozni. Ennek drámai következményei lehetnek az információ-visszakeresési technológiákra , valamint a keresők megjelenésére és működésére .
A szöveges bányászat abból áll, hogy egy „szöveges” objektumot szemantikai vagy szintaktikai feldolgozással átalakítunk „tábla”, „fa” vagy „grafikon” objektummá, majd szöveges bányászati technikákat alkalmazunk erre a formalizált objektumra. A várható eredmények általában:
A szemantikai megközelítés termékenyebb szakirodalommal rendelkezik, mint a szintaktikai megközelítés: még ha az utóbbinak is kiváló eredményei vannak, a szükséges számítási erőforrások gyakran a szemantikai elemzés mellett döntenek.
A szemantikai elemzés egy szövegcsoportot lexikális mátrixgá alakít :
Az " ontológia " kifejezésnek filozófiai jelentése van, de a tudásmenedzsmentben a tudás szemantikai ábrázolásának talán legfejlettebb formáját képviseli.
Ez egyfajta "szupertezaurus", amelynek célja az összes társadalmi dokumentum, általában egy vállalat tárolt, bejövő vagy kimenő dokumentumfilmjének indexelése. Így egy e-mailt, egy referenciamunkát, egy azonos témákat megosztó munkadokumentumot automatikusan összekapcsolunk, ezért kontextusba helyezzük, ezáltal szemantikai ismereteket szabadít fel.
Az ontológia felépítése gyakorlatilag önmagában egy szakma, mint például a könyvtári tezauruszok megtervezése és karbantartása. Az építkezés mindig kollektív és a kompetencia területek összesítése által történik.
Az ontológia alapvető megfogalmazása a következő:
Példa: BIRD> AIGLE {aigle royal}. A gép ekkor arra következtethet, hogy az arany sas madár.
A gyakorlatban így automatikusan lefordíthatnánk a történelem tankönyvet ontológiává, ötféle fogalomtípus (dátum, hely, esemény, fizikai személy, jogi személy) és mintegy harminc verbális link kategóriájának figyelembevételével.
A gép számára az így képviselt tudásról való érvelés a fogalmak hálózatában, úthálózat módjára való „járást” jelenti. Vannak specifikus algoritmusok, például az útkeresők (Pathfinder) , amelyek a legrövidebb utat keresik egyik fogalomból a másikba, miközben tiszteletben tartják a gazdaságosság kritériumát: "kevesebb fogalom", "több nyelv", "nagyobb számú szinonimák ”stb. Az eredmények látványosak lehetnek, különösen, ha szem előtt tartjuk, hogy a kiindulási és a végpont nem fogalmak, hanem index URI-k (vállalati dokumentumok).
: a cikk forrásaként használt dokumentum.