Fejlesztette | Waikato Egyetem |
---|---|
Utolsó verzió | 3.8.1 (2017. január 23) |
Haladó verzió | 3.9.1 (2016. december 19) |
Letét | svn.cms.waikato.ac.nz/svn/weka |
Beírva | Jáva |
Operációs rendszer | Microsoft Windows és több platformon |
Környezet | Java platform |
Olvassa el a formátumokat | Attribútum-reláció fájlformátum ( d ) |
Nyelvek | Többnyelvű |
típus | Gépi tanulási szoftver felépítése ( d ) |
Engedély | A GNU General Public License 3. verziója |
Weboldal | www.cs.waikato.ac.nz/ml/weka/ |
A Weka ( a Waikato- környezet rövidítése a tudáselemzéshez , franciául: " Waikato- környezet a tudáselemzéshez ") egy Java-ban írt gépi tanulási szoftvercsomag, amelyet az új-zélandi Waikato Egyetemen fejlesztettek ki . A Weka ingyenes szoftver, amely a GNU General Public License ( GPL ) alatt érhető el .
A Weka munkaterület vizualizációs eszközök és algoritmusok gyűjteményét tartalmazza az adatok elemzéséhez és a prediktív modellezéshez , valamint grafikus felülettel kombinálva a funkcionalitás egyszerű elérését. A verzió a „nem-Java” eredeti Weka volt front-end a Tcl / Tk modellezésére algoritmusok (főleg a harmadik) megvalósított más programozási nyelvek, kiegészítve a kereskedelmi preprocessor adatok C és makefile- alapú rendszer indításának gép tanulási tapasztalatok. Ezt az eredeti verziót elsősorban a mezőgazdasági adatok elemzésének eszközeként szánták, de a legújabb, teljes egészében Java- alapú verziót (Weka 3), amelynek fejlesztése 1997-ben indult el, ma már számos különböző alkalmazási területen használják, különösen az oktatás és a kutatás területén. . Weka fő erősségei, hogy:
A Weka számos szabványos adatbányászati eszközt támogat , különös tekintettel az adat- előfeldolgozókra , az adatok klaszterezésére , a statisztikai osztályozókra , a regresszió-analizátorokra , a vizualizációs eszközökre és a diszkrimináns elemző eszközökre . A Weka összes technikája azon a feltételezésen alapul, hogy az adatok egyetlen lapos fájlban vagy bináris relációban állnak rendelkezésre , ahol az egyes adattípusokat rögzített számú attribútum írja le (hétköznapi, numerikus vagy szimbolikus attribútum, de néhány más). attribútumtípusok is támogatottak). A Weka hozzáférést biztosít az SQL adatbázisokhoz a Java Database Connectivity (JDBC) segítségével, és képes feldolgozni egy SQL lekérdezés eredményét. Nem képes multi-relációs adatbányászatra, de rendelkezésre áll egy harmadik féltől származó szoftver, amely összekapcsolja az összekapcsolt adatbázis-táblák gyűjteményét egyetlen táblává, amely alkalmas a Weka által történő feldolgozásra. Egy másik fontos terület, amelyet jelenleg nem fednek le a Weka disztribúcióban szereplő algoritmusok, a szekvencia modellezés.
A Weka fő felülete a felfedező , de nagyjából ugyanaz a funkcionalitás érhető el az egyes összetevők "tudásáramlás" felületén keresztül és a parancssorból . Van még egy kísérletező, aki lehetővé teszi a Weka gépi tanulási algoritmusainak prediktív teljesítményének szisztematikus (taxonómiai) összehasonlítását az adatkészletek gyűjteményén.
Az explorer felület több füllel rendelkezik, amelyek hozzáférést biztosítanak a munkaterület fő összetevőihez. Az előfeldolgozó fül számos funkcióval rendelkezik az adatok adatbázisokból történő importálására , egy CSV fájlra és az adatok előzetes feldolgozására egy szűrés nevű algoritmussal . Ezek a szűrők felhasználhatók adatok átalakítására (például a valós numerikus attribútumok diszkrét attribútummá alakítására), és lehetővé teszik a példányok és attribútumok törlését meghatározott kritériumok szerint. A Osztályozza fül lehetővé teszi a felhasználó számára, hogy alkalmazza osztályozási és regressziós algoritmusok (felcserélhető a „ osztályozók ” a Weka) a kapott adathalmaz , hogy megbecsüljük a pontosság , a prediktív modell, és megtekintheti a hibás előrejelzéseket, ROC görbék , stb vagy maga a modell (ha a modell láthatóvá válik, például egy döntési fa ). A Társítás lap társítási szabályok alapján nyújt hozzáférést a tanulásokhoz, amelyek megkísérlik azonosítani az adatokban az attribútumok közötti összes fontos kapcsolatot. A Fürt fül hozzáférést biztosít a Weka klaszterezési technikáihoz , például a k-mean algoritmushoz . A normál eloszlások keverékének kiképzésére szolgáló várakozás-maximalizáló algoritmus megvalósítása is megtörtént . Az „ Attribútumok kiválasztása ” fül algoritmusokat tartalmaz az adatkészlet leginkább prediktív attribútumainak azonosítására. Az utolsó fül, a „ Megjelenítés ” a pontfelhők mátrixát mutatja , ahol az egyes pontfelhők kiválaszthatók és nagyíthatók, és tovább elemezhetők a különböző kiválasztási operátorok segítségével.