A Szemantikus Web vagy webes szemantika a Web kiterjesztése, amelyet a World Wide Web Consortium (W3C) szabványosított . Ezek a szabványok szabványosított adatformátumok és protokollok cseréjét ösztönzik az interneten, az erőforrás-leíró keret (RDF) modell alapján.
A szemantikus webet egyesek Web 3.0-ként emlegetik.
A W3C szerint "a szemantikus web olyan modellt kínál, amely lehetővé teszi az adatok megosztását és újrafelhasználását több alkalmazás, vállalat és felhasználói csoport között . " A kifejezést Tim Berners-Lee (a web feltalálója és a W3C igazgatója) találta ki, aki felügyeli a közös szemantikus webes technológiák fejlesztését. Meghatározza, hogy „az adatok hálója, amelyet a gépek közvetlenül és közvetve feldolgozhatnak, hogy segítsék felhasználóikat új ismeretek létrehozásában” . Ennek elérése érdekében a szemantikus web megvalósítja az adatok hálóját amely az információk összekapcsolását és strukturálását tartalmazza az interneten annak érdekében, hogy egyszerűen hozzáférhessenek a már meglévő ismeretekhez.
Míg rontói megkérdőjelezték megvalósíthatóságát, promóterei azzal érvelnek, hogy az ipar , a biológia és a humán tudományok kutatóinak alkalmazásai már bebizonyították ezen új koncepció érvényességét. Tim Berners-Lee eredeti, 2001-ben megjelent Scientific American cikke leírta a várható evolúciót a meglévő hálóból szemantikus hálóvá, de ennek még nem kellett megtörténnie. Tim Berners-Lee és munkatársai 2006-ban azt mondták: „Ez az egyszerű ötlet ... nagyrészt kiaknázatlanul marad. "
A " szemantikai hálózat " fogalmát az 1960-as években alkotta meg Allan Collins kognitív tudós , Ross Quillian (in) nyelvész és Elizabeth Loftus pszichológus, és különféle publikációkban tárták fel a strukturált tudás bemutatásának módjaként. Az internet kontextusában alkalmazva, ez a modell kibővíti az ember által olvasható weboldalak hiperhivatkozási hálózatát azáltal, hogy géppel olvasható metaadatokat illeszt be az oldalakra. Ez a metaadat összekapcsolódik egymással, lehetővé téve az ügynökök számára, hogy intelligensebben férjenek hozzá az internethez , és a felhasználók nevében végezhessenek feladatokat. A szemantikus webet átjáróként tekintik az adatok elérésére a különböző alkalmazások és rendszerek között. Alkalmazásai számtalan kiadványban, blogban és számos más területen találhatók.
Tim Berners-Lee eredetileg a következőképpen fejezte ki a szemantikus web véleményét:
Van egy álmom a webről [amelyben a számítógépek] képesek lesznek elemezni a weben található összes adatot - az emberek és a számítógépek közötti tartalmat, linkeket és tranzakciókat. A „szemantikus háló”, amelynek ezt lehetővé kell tennie, még nem jött létre, de amikor ez megtörténik, a kereskedelem, a bürokrácia és a mindennapi élet mindennapi mechanizmusait a gépekkel beszélgető gépek kezelik. Az „intelligens ügynökök”, akiket az emberek már régóta reklámoznak, végre megvalósulnak.
„Olyan webről álmodom, amelyben [a számítógépek] képesek lesznek elemezni a weben található összes adatot: a tartalmat, a linkeket és az emberek és a számítógépek közötti tranzakciókat. Még nem jött létre egy "szemantikus web", amelynek ezt lehetővé kellene tennie, de amikor ez megtörténik, a kereskedelem, az adminisztráció és a mindennapi élet mindennapi működését a másokkal párbeszédet folytató gépek fogják feldolgozni. A régóta reklámozott "intelligens ügynökök" végre megvalósulnának. "
A W3C által kínált technológiák többsége már korábban is létezett. Ezeket különböző összefüggésekben használják, különösen azokban az információkban, amelyek egy korlátozott és meghatározott területet ölelnek fel, és ahol az adatmegosztás általános szükség, például tudományos kutatás vagy a szervezetek közötti adatcsere. Emellett megjelentek más hasonló célú technológiák, például a mikroformátumok .
A szemantikus web fő célja, hogy irányítsa a web fejlődését, hogy a közvetítők nélküli felhasználók könnyebben megtalálhassák, megosszák és összekapcsolják az információkat. Az emberi lények képesek az internetet olyan feladatok elvégzésére, mint például a Párizs szó megtalálása, hogy könyvet foglaljanak a könyvtárban, térképet találjanak és közlekedési jegyet foglaljanak. A gépek azonban nem képesek mindezen feladatok elvégzésére emberi irányítás nélkül, mivel a weboldalakat elsősorban emberek számára tervezték olvasni. A Szemantikus Web célja, hogy az oldalakat ember és gép is feltérképezhesse. Ez lehetővé tenné az unalmas és ismétlődő információ-visszakeresési munkát automatizált módon, miközben javítja és konszolidálja az információkat az interneten a felhasználók számára.
A szemantikus web, ahogy eredetileg szánták, egy olyan rendszer, amely lehetővé teszi a gépek számára, hogy jelentésük szerint „megértsék” és válaszoljanak az összetett emberi kérésekre. Az ilyen "megértés" megköveteli, hogy a vonatkozó információforrásokat előzetesen szemantikusan strukturálják. Ez a gépek számára elérhető struktúra sokkal nagyobb felfedezési kapacitást tesz lehetővé, mint ami egyszerűen a dokumentumok webével lehetséges. Az RDF használata ezen adatok strukturálásához lehetővé teszi a gép teljesítményének kihasználását; adatfeldolgozási képességük lehetővé teszi az ezekből az adatokból nyert információk tanulmányozását annak érdekében, hogy a meglévő ismeretekből új következtetéseket vonhassanak le. Az RDF segítségével a HTML-ben előállított dokumentumok adatokká válnak, amelyek a gépek és a felhasználók közös munkája révén új ismereteket hoznak létre.
Gyakran a " szemantika ", a " metaadatok ", az " ontológiák " és a "Szemantikus Web" kifejezéseket következetlenül használják. Különösen azokat használják mindennap kutatók és szakemberek, akiknek terminológiája a technológiák, fogalmak és alkalmazási területek széles körét öleli fel. Ezenkívül zavart a megvalósítás szempontjából fontolóra vett technológiák és a szemantikus web mozgása között. Gerber, Barnard és Van der Merwe által bemutatott cikkben megrajzolják a szemantikus háló táját, és bemutatják a kapcsolódó kifejezések és az lehetővé tevő technológiák rövid összefoglalását. A Tim Berners-Lee által javasolt építészeti modell alapul szolgál a jelenlegi és a feltörekvő technológiák állapotának bemutatásához.
A következő példában a „Paul Schuster Drezdában született” szöveget fel kell tüntetni, összekapcsolva az illetőt a születési helyével. Az alább látható HTML kódrész megmutatja, hogyan lehet leírni egy mini-grafikont RDFa szintaxissal a Schema.org szókincsével és egy Wikidata azonosítóval :
<div vocab="http://schema.org/" typeof="Person"> <span property="name">Paul Schuster</span> est né à <span property="birthPlace" typeof="Place" href="http://www.wikidata.org/entity/Q1731"> <span property="name">Dresde</span>. </span> </div>Ez a példa a következő öt hármast ( in ) határozza meg, teknős formátumban megjelenítve . Minden hármas a létrehozott gráf egy szélét jelöli: első eleme (az alany) annak a csomópontnak a neve, ahonnan az él indul, a második elem (az állítmány) jelzi az él típusát, az utolsó (az objektum) vagy a megcélzott csomópont neve, vagy szó szerinti értéke (szöveg, szám stb.).
_:a <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://schema.org/Person> . _:a <http://schema.org/name> "Paul Schuster" . _:a <http://schema.org/birthPlace> <http://www.wikidata.org/entity/Q1731> . <http://www.wikidata.org/entity/Q1731> <http://schema.org/itemtype> <http://schema.org/Place> . <http://www.wikidata.org/entity/Q1731> <http://schema.org/name> "Dresde" .A számítógépen található sok fájl nagyjából két kategóriába sorolható: ember által olvasható dokumentumok és géppel olvasható adatok . Az olyan dokumentumok, mint az e-mailek , jelentések vagy prospektusok, emberek számára olvashatók. Másrészt a naptárakban, címjegyzékekben, olvasási listákban vagy táblázatokban található adatok olvashatók, feltéve, hogy olyan alkalmazást használ, amely lehetővé teszi számukra a különböző módon történő olvasást, keresést és átalakítást.
Jelenleg a világháló elsősorban a Hypertext Markup Language (HTML) nyelven írt dokumentumokon alapul , vagyis olyan jelölési konvención, amelyet multimédiás objektumokkal, például képekkel és interaktív űrlapokkal tarkított szöveg kódolására használnak. A metaadat-címkék olyan módszert biztosítanak, amellyel a számítógépek kategorizálhatják a weboldalak tartalmát; például :
<meta name="keywords" content="computing, computer studies, computer" /> <meta name="description" content="Cheap widgets for sale" /> <meta name="author" content="John Doe" />A HTML és a megjelenítő eszköz (amely lehet webböngésző vagy más "felhasználói ügynök" ) segítségével létrehozhat és bemutathat egy oldalt, amely megjeleníti az eladásra szánt tételeket. A katalógusoldal HTML-jét egyszerűen meg lehet csinálni, az olyan utasításokat tartalmazó dokumentum, mint például "ennek a dokumentumnak a címe" Gadgets Supermarket "", de a HTML-kód nem képes egyértelműen kijelenteni, hogy például az X586172 tétel táblázat 199 dolláros árral , és nem is fogyasztási cikk. A HTML csak azt tudja mondani, hogy az "X586172" szövegtartomány olyan, amelyet a "Bútor" és a "199 € " stb. Közelében kell elhelyezni . Nem lehet azt mondani, hogy "ez egy katalógusoldal", vagy akár azt is mondhatnánk, hogy a "Bútor" egyfajta cím, vagy akár azt is tudni, hogy a "199 € " egy ár. Semmilyen módon nem lehet kifejezni, hogy ezek az információk összekapcsoltak egy különálló elem leírására , különbözve az ugyanazon az oldalon felsorolt egyéb elemektől.
A szemantikus HTML a HTML-címkék használatára utal további információk beillesztésére a dokumentumba. Például a deltörölt tartalmat jelölő HTML elem használata ahelyett, hogy strikecsak áthúzott szöveget jelenítene meg, és csak annak formázását adja meg. A szemantikus HTML a lépcsőzetes stíluslapok hozzáadásával a böngészőre bízza az elrendezést . De ez a gyakorlat eléri a határait, amikor az objektumok szemantikáját, például az eladó tárgyakat meg kell határozni.
A mikroformátumok nem hivatalos kísérletek a HTML-szintaxis kiterjesztésére is. Egy gép képes szemantikus jelöléseket olvasni egy dokumentum objektumairól, például eladó cikkekről vagy névjegyekről (pl. HCard- tal ).
A Szemantikus Web kifejezetten az adatokhoz tervezett nyelveket kínál: RDF ( Resource Description Framework ), OWL ( Ontology Web Language ) és XML ( eXtensible Markup Language ). A HTML leírja a dokumentumokat és a közöttük lévő kapcsolatokat. Az RDF, az OWL és az XML viszont olyan dolgokat is leírhat, mint emberek, találkozók vagy repülőgép alkatrészek. Tim Berners-Lee szerint: „Az RDF azt jelenti, hogy a HTML mit jelent a dokumentumok számára. Az RDF lehetővé teszi adatok összekapcsolását egy kategóriához. "
Ezeket a technológiákat olyan leírásokkal kombinálják, amelyek kiegészítik vagy helyettesítik a webes dokumentumok tartalmát. Így a tartalom megjelenhet leíró adatok formájában, amelyeket az interneten hozzáférhető adatbázisokban tárolnak, vagy a dokumentumok címkéin keresztül ( HTML vagy annak XHTML - XML HTML - változata révén ). Ezeket az adatokat azután XML-szel keresztezhetjük, vagy néha csak XML-ként tehetjük közzé, az elrendezést és az adatokat külön tárolva. A géppel olvasható leírások lehetővé teszik a tartalomkezelők számára, hogy értelmüket adják a tartalmukhoz, vagyis leírják a tudás struktúráját a tartalmon belül. Ily módon a gép:
Íme egy példa egy nem szemantikus weboldalon használt címkére :
<item>cat</item>A hasonló információk szemantikus weboldalra történő kódolása így nézhet ki:
<item rdf:about="http://dbpedia.org/resource/Cat">Cat</item>Tim Berners-Lee egy kapcsolódó adathálózat ( összekapcsolt adatok , angolul ) vagy webes adatok ( francia nyelven ) megjelenését szorgalmazza a Giant Global Graph számára , ellentétben a Web világszerte webalapú HTML-oldalakkal. Tim Berners-Lee feltételezi, hogy ha korábban dokumentumokat osztottunk meg, akkor a jövőben megosztjuk az adatokat. Válasza a "hogyan?" Kérdésre Három oszlopon alapszik. Az egyik, az URL-nek az adatokra kell mutatnia. Másodszor, bárkinek, aki hozzáfér az URL-hez, képesnek kell lennie adatok lekérésére. Harmadszor: az adatokban lévő kapcsolatoknak más URL-ekre kell mutatniuk az adatokkal.
Tim Berners-Lee a szemantikus webet a Web 3.0 összetevőjeként írta le:
Az emberek folyamatosan azt kérdezik, mi a Web 3.0. Azt gondolom, hogy talán, ha skálázható vektorgrafikát tartalmaz - minden hullámzik, összecsukható és ködösnek tűnik - a Web 2.0-n, és hozzáférést biztosít a szemantikus webhez egy hatalmas adattérbe integrálva, hozzáférhet egy hihetetlen adatforráshoz .
„Az emberek folyamatosan kérdezik, mi az a Web 3.0. Gondolom, ha van egy vektor rajzok átfedése - mind hullámokban és ködös redőkben -, amelyek leírják a Web 2.0-t és egy hatalmas adattérbe ágyazott szemantikus webhez való hozzáférést, hihetetlen adatforráshoz juthat hozzá. "
A "szemantikus webet" néha a "Web 3.0" szinonimájaként használják, bár az egyes kifejezések meghatározása eltérő. A "Web 2.0" -hoz hasonlóan a "Web 3.0" is neologizmus és divatszó . A Web 2.0 esetében a kifejezés használatáról azok vitatkoznak , akik azt gondolják, hogy ez egy valós kifejezés nélküli marketing kifejezés, és azok között, akik azt gondolják, hogy valós evolúció történt.
A szemantikus web néhány kihívása a terjedelem, homályosság, bizonytalanság, következetlenség és megtévesztés. Az automatizált érvelési rendszereknek ezeket a kérdéseket kell megválaszolniuk, hogy megfeleljenek a szemantikus web ígéretének.
Ez a kihívások felsorolása inkább szemléletes, mint teljes, mivel a szemantikus web megvalósításához szükséges „egyesítési logika” és „bizonyíték” réteg kihívásaira összpontosít. Az itt említett technikák többségének ki kell terjesztenie az OWL nyelvet ( Web Ontology Language ) , például egy információ feltételes valószínűségének megjegyzéséhez. Ez egy aktív kutatási terület.
A szemantikus web szabványosítását a W3C felügyeli .
A „szemantikus web” kifejezést gyakran konkrétabban használják olyan formátumok és technológiák kijelölésére, amelyek lehetővé teszik annak létezését. A kapcsolódó adatok gyűjtése, strukturálása és visszakeresése olyan technológiák segítségével fog működni, amelyek hivatalos fogalmakat, kifejezéseket és kapcsolatokat írnak le egy adott tudástartományon belül . Ezeket a technológiákat a W3C szabványosítja, és különösen a következőket tartalmazza:
A szemantikus webhalom szemlélteti a szemantikus web architektúráját. Az összetevők funkciói és kapcsolatai a következőképpen foglalhatók össze:
A szemantikus web megvalósításához még mindig szükséges szabványok a W3C ( World Wide Web Consortium ) munkacsoportok ajánlási folyamatán mennek keresztül . Ez azt jelenti, hogy minden új ajánlást nyilvános felülvizsgálatnak vetettek alá. Ezután a W3C ajánlásai, amelyeket széles körben elfogadnak, természetesen a „szemantikus web” szabványává válnak .
Az alábbiakban felsoroljuk a szemantikus web alapjául szolgáló szabványokat és főbb ajánlásokat:
Íme a jelenlegi aktív ajánlások:
Másrészt a „szemantikus web” megvalósításának sok lépését még elképzelni, tisztázni és meghatározni kell. Tim Berners-Lee , az ő szemantikus web Stack , összefoglalja ezeket a lépéseket a következő rétegeket:
Amíg ezeknek a rétegeknek a megvalósítását várják, a már rendelkezésre álló technológiák, mint például a SPARQL , már lehetővé teszik az interoperabilitás jobb részletességét az adatoknál, mint a webszolgáltatások (a W3C emellett visszavonta a webes szolgáltatások szabványosítását. prioritásai ).
Az adathalmaz források osztják meg adataikat szemantikus web szabványok nevezték a Web adatok (vagy angol „ Linked Open Data ”) elfogadásának megkönnyítése érdekében a nyilvánosság számára. Az Adat Web összekapcsolt adat technológiákon alapul, amelyek átfedik a szemantikus web technológiákat, amelyeket már széles körben elfogadottak. A kapcsolt adatok az egyik legfontosabb technológia az angliai " nyitott adatok " mozgalomban, amelynek célja a nyilvános adatok tömeges megosztása a kutatás és a kereskedelem felgyorsítása érdekében. A szemantikus web megjelenését egyesek a következő technológiai és ezért gazdasági áttörésnek tartják, amelyet már Web 3.0-nak hívnak .
A jövőben tehát az lesz a cél, hogy javítsuk a web és az azon keresztül összekapcsolt erőforrások hozzáférését és hasznosságát , például:
A fő kritikák a szemantikus web teljes vagy akár részleges megvalósíthatóságával kapcsolatosak. Cory Doctorow beszél „ metacrap ” (a táskát alakult szavak metaadatok és szar , akkor próbálja meg, hogy a francia hatalmi „métamerde”), a kritika, amely alapján a szarkasztikus megfigyelés az emberi viselkedés. Például az emberek beilleszthetik a parazita mikrodátumokat a weboldalakba, hogy megtévesszék a szemantikus webes motorokat, akik „naivan” megbíznak minden adat valódiságában. Ez a jelenség közismerten megtévesztő: az indexelő motorok - a Google-hez hasonlóan - igyekeznek kimutatni az ilyen típusú manipulációkat. Peter Gärdenfors és Timo Honkela (en) észrevették, hogy a szemantikus webes technológiák logikája csak azoknak a jelenségeknek a töredékét fedi le, amelyek hatással lesznek a web szemantikájára.
2001-ben Cory Doctorow összeállította a metaadatok megszerzésének állítólag legyőzhetetlen hét akadályát, amelyek elég megbízhatóak egy esetleges szemantikus web futtatásához. Szerinte :
Ez magában foglalja a metaadatok elavulásával kapcsolatos egyéb okokat is:
Cory Doctorow arra a következtetésre jutott, hogy egy ilyen rendszer kutatása csak elavult és részben vagy teljesen helytelen adatokat adhat vissza.
Az építészet, eszközök és fogalmak jelentését a szemantikus web gyakran kritizálták, hivatkozva, hogy a technológiák és folyamatok fenntartása adatok minőségét, ki az emberi lények, és ezért esendő, még nem működnek skála. Web . Ezek a korlátok mind olyan új problémák, amelyeket a kutatás a Szemantikus Web kihívásain keresztül próbál jelenleg megoldani . Az internetes tudomány (a) az a név, amelyet a "tudományágnak" adunk, amelynek célja az új tudományos problémák megoldása, amelyek kihozzák a webet. A szemantikus webes technológiákat azonban átvették az információs rendszerek megvalósítására szakosodott közösségekben, de főleg zárt rendszerekben (például: intranet ), például vállalatokban vagy könyvtárakban.
A szemantikus web iránti lelkesedést mérsékelhetik olyan szempontok, mint a cenzúra elutasítása és a magánélet védelme . Például a szövegelemzőket jelenleg egyszerűen becsaphatja más szavak, metaforák vagy képek helyett szavak helyett. A kormányok számára sokkal könnyebb az információ létrehozását online szemléltetni, és ezért ellenőrizni, ha szemantikai struktúrát használ, mert az információt akkor sokkal könnyebb értelmezni és esetleg blokkolni egy automatizált rendszer segítségével. Ezenkívül a kérdést olyan metaadatok is felvetették, mint például a FOAF vagy a Geolocation API (as) , amelyek megkérdőjelezik a világháló anonimitását . Ezek az aggodalmak a személyes adatok biztonságát a kutatás aktív témájává teszik, például a „ Policy Aware Web ” projektben.
Egy másik bíráló arról beszél, hogy a tartalom létrehozásához és közzétételéhez szükséges idő megnövekszik, mivel annak két változatát kell előállítani: az egyiket emberi, a másikat pedig a gépek számára. Számos webalkalmazás azonban már szembesül ezzel a problémával azáltal, hogy olvasható formátumot hoz létre egy webböngészőhöz, vagy RSS- olvasó , például egy blog kérésére . A mikroformátumok kifejlesztése reakció volt erre a fajta kritikára. Védekezésében a szemantikus web valószínűleg csökkenti az információ-visszakeresési feladatokkal járó erőfeszítéseket, és ezáltal ellensúlyozza a kompatibilis formátum gépekkel való biztosításának további költségeit.
Az egyik első megoldás az volt, hogy a GRDDL nyelvet alkalmazták , amely olyan mechanizmus, amely csak egy HTML oldalon már meglévő tartalmat (potenciálisan mikroformátumokkal) használ fel az RDF kinyerésére. A mikroformátumok sokasága és instabilitása, valamint az XSLT átalakító GRDDL-hez történő létrehozásának nehézségei miatt az RDFa megadására került sor, hogy az RDF egyszerűen és kifejezetten integrálódjon a HTML oldalakba . A RDFa módszer is integrálhatók közvetlenül a HTML5 szabvány keresztül mikroadatok , amely tovább egyszerűsíti a behelyezését RDF adatok egy dokumentumba.
Ez a szakasz felsorolja a szemantikus web mozgalom számos projektjét és eszközét.
A szemantikus web fejlődését az egész világon a W3C ellenőrzi a Semantic Web Advanced Deployment ( SWAD ) projekt részeként. A SWAD -Europe projektre2002. május nál nél 2004. október.
A W3C projekteket befogadó és a szemantikus web fejlődését figyelemmel kísérő európai szervezet az ERCIM ( Európai Informatikai és Matematikai Kutatási Konzorcium ).
A Francia Nemzeti Könyvtár a data.bnf.fr projektjén keresztül lép be a szemantikus webbe . Ez a projekt integrálja a különböző formátumokban, így az Intermarc, az XML-EAD és a Dublin Core adatokat a digitális könyvtár számára. Az adatokat automatikus feldolgozással modellezik és csoportosítják, és különféle RDF szabványokban teszik közzé : RDF-XML, RDF-N3 és RDF-NT. Az adatok a JSON-ban is megjelennek . A projekt a CubicWeb szemantikus fejlesztői platformot használja .
A Francia Nemzeti Könyvtár így rendelkezik:
2013-ban a projekt megosztotta a Gallica- val a kutatási könyvtárak innovációjának Stanford-díját (SPIRL).
2017 óta a data.bnf.fr adatmodell az IFLA LRM koncepcionális referenciamodellen alapul, lehetővé téve számára az entitások közötti kapcsolatok közötti navigálást.
Dbpedia az első történelmi erőfeszítést közzé strukturált adatok kivont Wikipedia : az adatok kivonjuk az oldalakat, és különösen a Wikipedia információs dobozok közzé RDF és rendelkezésre bocsátani a Web az adatok keresztül HTTP és SPARQL alatt GFDL licenc. .
A SemanticPedia egy platform a különböző Wikimedia projektek francia nyelven történő közzétételére, amelyet a Kulturális és Kommunikációs Minisztérium , az Inria és a Wikimedia France támogat . A DBpedia francia változatát a Wimmics csapata dolgozta ki Fabien Gandon felelősségével az Inria Sophia Antipolis kutatóközpontban. Ez a francia nyelvű fejezet neve DBpedia.fr, és hozzájárul a francia nyelvhez a DBpedia kezdeményezés nemzetközivé válásához, a Wikipedia különböző nyelvi fejezeteiből származó adatok kinyerésével és közzétételével . A DBpedia ezen francia fejezete számos alkalmazást támogat. Aurélie Filippetti francia kulturális miniszter bejelentette2012. november 19 hogy a következő projekt a Wikiszótárra és annak kétmillió kifejezésére vonatkozik.
A Wikidata a Wikimedia Foundation egyik projektje. Célja, hogy az alapítvány összes projektjének összes strukturált adata közvetítő nélkül, szabadon hozzáférhető legyen a közreműködők számára.
A Wikipedia a Wikidatához kapcsolódó projektek egyike. Minden Wikipedia-cikk egyedi azonosítóval rendelkezik IRI formájában, és a Wikidata közösség entitása. Minden entitás több tulajdonságból áll, egy vagy több értékkel (hármas). Ezeket az entitásokat és tulajdonságokat egyedi azonosítóval jelöltük (például: Q90 Párizs egyedi azonosítója), amely az adatbázist függetlenné teszi a használt nyelvtől. Ezeknek a tulajdonságoknak az értéke lehet egy másik entitás, de karakterlánc, szám, dátum stb. Az így strukturált adatok többféle formátumban (XML, JSON, Turtle stb.) Újrafelhasználhatók, és végül felhasználhatók a Wikipedia infoboxjainak betáplálására, így elkerülve, hogy ezeket minden nyelven manuálisan módosítsuk, mivel a Wikidata minden egyes módosításakor ., az összes infobox egyidejűleg módosul.
A Wikidata adatok CC0 licenc alatt vannak . Ezért az összes megosztott adat ingyenes, és mindenféle felhasználásra nyitva áll.
A szemantikus web szempontjából a Wikidata egyike azon kevés SPARQL végpontoknak, amelyek valós időben kapcsolódnak az adatgyártókhoz . Ez azt jelenti, hogy a Wikidata változásai azonnal hatással vannak az RDF adatbázisra, és ezáltal lehetővé teszik ezen adatok más alkalmazásokban történő újrafelhasználását a SPARQL-en keresztül. Ontológiáját tekintve a struktúra idővel konszenzusos módon épül fel a közreműködők között. Ennek az ontológiának a szerkezete tehát bármikor megváltozhat a közreműködők igényeinek megfelelően.
AKSW ( Agile Knowledge Engineering és szemantikus web ) egy kutatócsoport, amely házigazdája a Betriebliche Informationssysteme ( BIS ) elnökeaz Institut für Informatik ( IFI ) , a University of Leipzig valamint az Institute for Applied Computing ( INFAI ) . Az AKSW kutatócsoportszámos olyan projektet indított el, mint a DBpedia.
A Datalift az adatok kiaknázására szolgáló eredeti platform, amely egyetlen nyílt forráskódú megoldásba integrálja az adatok összekapcsolásához szükséges összes funkciót, a rögzítéstől a végső közzétételig. A Dataliftben a bemeneti adatok heterogén formátumokból (adatbázisok, CSV, XML, RDF, RDFa, GML, Shapefile ...) származó nyers adatok. Az előállított adatok összekapcsolt adatok. A Datalift platform aktívan részt vesz az adatok webről webre történő átalakításában .
A FOAF ( Friend Of a Friend ) egy szókincs, amely az RDF- et használja az emberek más emberekkel fennálló kapcsolatok és a körülöttük lévő „dolgok” leírására. A FOAF egy példa a szemantikus web kísérletére a kapcsolatok társadalmi kontextusban történő felhasználására.
Szemantikailag összekapcsolt online közösségek (SIOC)A SIOC szókincs a közösségi oldalakon általánosan használt objektumok és kapcsolataik leírására.
Az adatok hálója olyan új felhasználások kifejlesztését kínálja , amelyek konkrétabbá teszik a kollektív intelligencia fogalmát, mint például: