Tudáskitermelés

Az ismeretek kinyerése a tudás létrehozásának folyamata strukturált adatokból ( relációs adatbázisok , XML ) és strukturálatlanokból (szöveg, dokumentumok, képek). A kimenetnek a számítógépek által olvasható formátumban kell lennie.

Az RDB2RDF W3C csoport folyamatban van az ismeretek kibontásának nyelvének szabványosítása RDF formátumban az adatbázisokból.

A francia nyelven "tudáskitermelés az adatokból" (ECD) beszélünk.

Leírás

Az ismeretek kinyerése több szakaszban zajlik, még maga az "  adatbányászat  " ( Data Mining ) előtt.

Az előfeldolgozás abból áll, hogy meghatározott adatkorpust építenek, és az adatokat típusuk (szövegek, képek, hangok stb.) Szerint formázzák . Az adatok tisztításának és a hiányzó adatok feldolgozásának szakasza következik.

Eszközök

Bibliográfia

Lásd is

Megjegyzések és hivatkozások

  1. https://www.w3.org/2001/sw/rdb2rdf/
  2. https://www.cairn.info/revue-francaise-de-gestion-2003-5-page-59.htm
  3. "  Ismeretek kinyerése adatokból (ECD)  " , az ingenieur.fr webhelyen ,2002. november 10(megtekintés : 2020. augusztus 17. ) .

Külső linkek