Weka (IT)

Weka A kép leírása Weka (szoftver) logo.png. A kép leírása, az alábbiakban is kommentálva Weka 3.5.5. Az explorer ablak nyitva van az irvine-i Kaliforniai Egyetem írisz-adataival . Információ
Fejlesztette Waikato Egyetem
Utolsó verzió 3.8.1 (2017. január 23)
Haladó verzió 3.9.1 (2016. december 19)
Letét svn.cms.waikato.ac.nz/svn/weka
Beírva Jáva
Operációs rendszer Microsoft Windows és több platformon
Környezet Java platform
Olvassa el a formátumokat Attribútum-reláció fájlformátum ( d )
Nyelvek Többnyelvű
típus Gépi tanulási szoftver felépítése ( d )
Engedély A GNU General Public License 3. verziója
Weboldal www.cs.waikato.ac.nz/ml/weka/

A Weka ( a Waikato- környezet rövidítése a tudáselemzéshez , franciául: " Waikato- környezet a tudáselemzéshez ") egy Java-ban írt gépi tanulási szoftvercsomag, amelyet az új-zélandi Waikato Egyetemen fejlesztettek ki . A Weka ingyenes szoftver, amely a GNU General Public License ( GPL ) alatt érhető el .

Leírás

A Weka munkaterület vizualizációs eszközök és algoritmusok gyűjteményét tartalmazza az adatok elemzéséhez és a prediktív modellezéshez , valamint grafikus felülettel kombinálva a funkcionalitás egyszerű elérését. A verzió a „nem-Java” eredeti Weka volt front-end a Tcl / Tk modellezésére algoritmusok (főleg a harmadik) megvalósított más programozási nyelvek, kiegészítve a kereskedelmi preprocessor adatok C és makefile- alapú rendszer indításának gép tanulási tapasztalatok. Ezt az eredeti verziót elsősorban a mezőgazdasági adatok elemzésének eszközeként szánták, de a legújabb, teljes egészében Java- alapú verziót (Weka 3), amelynek fejlesztése 1997-ben indult el, ma már számos különböző alkalmazási területen használják, különösen az oktatás és a kutatás területén. . Weka fő erősségei, hogy:

A Weka számos szabványos adatbányászati eszközt támogat , különös tekintettel az adat- előfeldolgozókra , az adatok klaszterezésére , a statisztikai osztályozókra , a regresszió-analizátorokra , a vizualizációs eszközökre és a diszkrimináns elemző eszközökre . A Weka összes technikája azon a feltételezésen alapul, hogy az adatok egyetlen lapos fájlban vagy bináris relációban állnak rendelkezésre , ahol az egyes adattípusokat rögzített számú attribútum írja le (hétköznapi, numerikus vagy szimbolikus attribútum, de néhány más). attribútumtípusok is támogatottak). A Weka hozzáférést biztosít az SQL adatbázisokhoz a Java Database Connectivity (JDBC) segítségével, és képes feldolgozni egy SQL lekérdezés eredményét. Nem képes multi-relációs adatbányászatra, de rendelkezésre áll egy harmadik féltől származó szoftver, amely összekapcsolja az összekapcsolt adatbázis-táblák gyűjteményét egyetlen táblává, amely alkalmas a Weka által történő feldolgozásra. Egy másik fontos terület, amelyet jelenleg nem fednek le a Weka disztribúcióban szereplő algoritmusok, a szekvencia modellezés.

A Weka fő felülete a felfedező , de nagyjából ugyanaz a funkcionalitás érhető el az egyes összetevők "tudásáramlás" felületén keresztül és a parancssorból . Van még egy kísérletező, aki lehetővé teszi a Weka gépi tanulási algoritmusainak prediktív teljesítményének szisztematikus (taxonómiai) összehasonlítását az adatkészletek gyűjteményén.

Az explorer felület több füllel rendelkezik, amelyek hozzáférést biztosítanak a munkaterület fő összetevőihez. Az előfeldolgozó fül számos funkcióval rendelkezik az adatok adatbázisokból történő importálására , egy CSV fájlra és az adatok előzetes feldolgozására egy szűrés nevű algoritmussal . Ezek a szűrők felhasználhatók adatok átalakítására (például a valós numerikus attribútumok diszkrét attribútummá alakítására), és lehetővé teszik a példányok és attribútumok törlését meghatározott kritériumok szerint. A Osztályozza fül lehetővé teszi a felhasználó számára, hogy alkalmazza osztályozási és regressziós algoritmusok (felcserélhető a „  osztályozók  ” a Weka) a kapott adathalmaz , hogy megbecsüljük a pontosság , a prediktív modell, és megtekintheti a hibás előrejelzéseket, ROC görbék ,  stb vagy maga a modell (ha a modell láthatóvá válik, például egy döntési fa ). A Társítás lap társítási szabályok alapján nyújt hozzáférést a tanulásokhoz, amelyek megkísérlik azonosítani az adatokban az attribútumok közötti összes fontos kapcsolatot. A Fürt fül hozzáférést biztosít a Weka klaszterezési technikáihoz , például a k-mean algoritmushoz . A normál eloszlások keverékének kiképzésére szolgáló várakozás-maximalizáló algoritmus megvalósítása is megtörtént . Az „ Attribútumok kiválasztása  ” fül  algoritmusokat tartalmaz az adatkészlet leginkább prediktív attribútumainak azonosítására. Az utolsó fül, a „  Megjelenítés  ” a pontfelhők mátrixát mutatja , ahol az egyes pontfelhők kiválaszthatók és nagyíthatók, és tovább elemezhetők a különböző kiválasztási operátorok segítségével.

Történelmi

Megjegyzések és hivatkozások

  1. (in) Ian H. Witten, Eibe Frank és Mark A. Hall, Data Mining: Gyakorlati Machine Learning eszközök és technológia , 3 th kiadás, Morgan Kaufmann, 2011 ( ISBN  978-0-1237-4856-0 ) , 629 oldalak [ online előadás ]
  2. (in) G. Holmes, A. Donkin és IH Witten, "  Weka: A gépi tanulási munkaasztal  " , Proc Second Australia and New Zealand Conference on Intelligent Information Systems, Brisbane, Ausztrália ,1994(hozzáférés : 2007. június 25. ) [PDF]
  3. (in) SR Garner, SJ Cunningham, G. Holmes, CG Nevill-Manning, és az IH Witten "  alkalmazása gépi tanulás munkaasztal: Tapasztalat mezőgazdasági adatbázisok  " , Proc Machine Learning in Practice Műhely, Machine Learning Konferencia, Tahoe City, CA, USA ,1995(hozzáférés : 2007. június 25. ) ,p.  14–21[PDF]
  4. (in) P. Reutemann, Pfahringer B. és E. Frank, "  Megfelelő: Eszköztár a kapcsolati adatokból való tanuláshoz a propozíciós és több példányos tanulókkal  " , ausztrál 17. mesterséges intelligencia-konferencia (AI2004) , Springer-Verlag,2004(hozzáférés : 2007. június 25 )
  5. (in) Ian H. Witten, Eibe Frank, Len Trigger, Mark Hall, Geoffrey Holmes és Sally Jo Cunningham, "  Weka: Gyakorlati Machine Learning eszközök és módszerek Java implementációja  " , Proceedings of the ICONIP / ANZIIS / ANNES'99 Workshop a feltörekvő tudástechnikáról és a kapcsolódási alapú információs rendszerekről ,1999(hozzáférés : 2007. június 26. ) ,p.  192–196[PDF]
  6. (in) nyertese SIGKDD adatbányászati és elemzési Discovery Service Award ... - Gregory Piatetsky-Shapiro, KDnuggets, június 28, 2005
(fr) Ez a cikk részben vagy egészben venni a Wikipedia cikket angolul című „  Weka (gépi tanulás)  ” ( lásd a szerzők listáját ) .

Függelékek

Kapcsolódó cikk

Külső linkek

Példák alkalmazásokra