Weka (IT)

Weka

A kép leírása, az alábbiakban is kommentálva

Weka 3.5.5. Az explorer ablak nyitva van az irvine-i Kaliforniai Egyetem írisz-adataival . Információ

Fejlesztette	Waikato Egyetem
Utolsó verzió	3.8.1 (2017. január 23)
Haladó verzió	3.9.1 (2016. december 19)
Letét	svn.cms.waikato.ac.nz/svn/weka
Beírva	Jáva
Operációs rendszer	Microsoft Windows és több platformon
Környezet	Java platform
Olvassa el a formátumokat	Attribútum-reláció fájlformátum ( d )
Nyelvek	Többnyelvű
típus	Gépi tanulási szoftver felépítése ( d )
Engedély	A GNU General Public License 3. verziója
Weboldal	www.cs.waikato.ac.nz/ml/weka/

A Weka ( a Waikato- környezet rövidítése a tudáselemzéshez , franciául: " Waikato- környezet a tudáselemzéshez ") egy Java-ban írt gépi tanulási szoftvercsomag, amelyet az új-zélandi Waikato Egyetemen fejlesztettek ki . A Weka ingyenes szoftver, amely a GNU General Public License ( GPL ) alatt érhető el .

Leírás

A Weka munkaterület vizualizációs eszközök és algoritmusok gyűjteményét tartalmazza az adatok elemzéséhez és a prediktív modellezéshez , valamint grafikus felülettel kombinálva a funkcionalitás egyszerű elérését. A verzió a „nem-Java” eredeti Weka volt front-end a Tcl / Tk modellezésére algoritmusok (főleg a harmadik) megvalósított más programozási nyelvek, kiegészítve a kereskedelmi preprocessor adatok C és makefile- alapú rendszer indításának gép tanulási tapasztalatok. Ezt az eredeti verziót elsősorban a mezőgazdasági adatok elemzésének eszközeként szánták, de a legújabb, teljes egészében Java- alapú verziót (Weka 3), amelynek fejlesztése 1997-ben indult el, ma már számos különböző alkalmazási területen használják, különösen az oktatás és a kutatás területén. . Weka fő erősségei, hogy:

nyílt forráskódú és ingyenes, a GNU General Public License feltételei szerint terjesztik ;
hordozható, mert teljes mértékben implementálva van a Java-ban, és ezért szinte minden modern platformon működik, és különösen szinte az összes jelenlegi operációs rendszeren;
tartalmaz egy átfogó adatprocesszor- gyűjteményt és modellezési technikákat;
egy kezdő számára könnyen használható a benne lévő grafikus felület miatt.

A Weka számos szabványos adatbányászati eszközt támogat , különös tekintettel az adat- előfeldolgozókra , az adatok klaszterezésére , a statisztikai osztályozókra , a regresszió-analizátorokra , a vizualizációs eszközökre és a diszkrimináns elemző eszközökre . A Weka összes technikája azon a feltételezésen alapul, hogy az adatok egyetlen lapos fájlban vagy bináris relációban állnak rendelkezésre , ahol az egyes adattípusokat rögzített számú attribútum írja le (hétköznapi, numerikus vagy szimbolikus attribútum, de néhány más). attribútumtípusok is támogatottak). A Weka hozzáférést biztosít az SQL adatbázisokhoz a Java Database Connectivity (JDBC) segítségével, és képes feldolgozni egy SQL lekérdezés eredményét. Nem képes multi-relációs adatbányászatra, de rendelkezésre áll egy harmadik féltől származó szoftver, amely összekapcsolja az összekapcsolt adatbázis-táblák gyűjteményét egyetlen táblává, amely alkalmas a Weka által történő feldolgozásra. Egy másik fontos terület, amelyet jelenleg nem fednek le a Weka disztribúcióban szereplő algoritmusok, a szekvencia modellezés.

A Weka fő felülete a felfedező , de nagyjából ugyanaz a funkcionalitás érhető el az egyes összetevők "tudásáramlás" felületén keresztül és a parancssorból . Van még egy kísérletező, aki lehetővé teszi a Weka gépi tanulási algoritmusainak prediktív teljesítményének szisztematikus (taxonómiai) összehasonlítását az adatkészletek gyűjteményén.

Az explorer felület több füllel rendelkezik, amelyek hozzáférést biztosítanak a munkaterület fő összetevőihez. Az előfeldolgozó fül számos funkcióval rendelkezik az adatok adatbázisokból történő importálására , egy CSV fájlra és az adatok előzetes feldolgozására egy szűrés nevű algoritmussal . Ezek a szűrők felhasználhatók adatok átalakítására (például a valós numerikus attribútumok diszkrét attribútummá alakítására), és lehetővé teszik a példányok és attribútumok törlését meghatározott kritériumok szerint. A Osztályozza fül lehetővé teszi a felhasználó számára, hogy alkalmazza osztályozási és regressziós algoritmusok (felcserélhető a „ osztályozók ” a Weka) a kapott adathalmaz , hogy megbecsüljük a pontosság , a prediktív modell, és megtekintheti a hibás előrejelzéseket, ROC görbék , stb vagy maga a modell (ha a modell láthatóvá válik, például egy döntési fa ). A Társítás lap társítási szabályok alapján nyújt hozzáférést a tanulásokhoz, amelyek megkísérlik azonosítani az adatokban az attribútumok közötti összes fontos kapcsolatot. A Fürt fül hozzáférést biztosít a Weka klaszterezési technikáihoz , például a k-mean algoritmushoz . A normál eloszlások keverékének kiképzésére szolgáló várakozás-maximalizáló algoritmus megvalósítása is megtörtént . Az „ Attribútumok kiválasztása ” fül algoritmusokat tartalmaz az adatkészlet leginkább prediktív attribútumainak azonosítására. Az utolsó fül, a „ Megjelenítés ” a pontfelhők mátrixát mutatja , ahol az egyes pontfelhők kiválaszthatók és nagyíthatók, és tovább elemezhetők a különböző kiválasztási operátorok segítségével.

Történelmi

1992-ben a University of Waikato az új-zélandi kezdődött fejlesztés az eredeti változata Weka (később keveréke Tcl / Tk, C nyelv és Makefile ).
1997-ben elhatározták, hogy a Weka-t újra fejlesztik a semmiből a Java-ban, ideértve a modellezési algoritmusok megvalósítását is.
2005-ben a Weka megkapta a SIGKDD ( Data Mining and Knowledge Discovery Service Award ) díjat .
2006-ban Pentaho kizárólagos licencet szerzett a Weka üzleti intelligencia célú felhasználására . Ez képezi a Pentaho üzleti intelligencia csomag elemző és prediktív adatbányászati elemét.

Megjegyzések és hivatkozások

(in) Ian H. Witten, Eibe Frank és Mark A. Hall, Data Mining: Gyakorlati Machine Learning eszközök és technológia , 3 th kiadás, Morgan Kaufmann, 2011 ( ISBN 978-0-1237-4856-0 ) , 629 oldalak [ online előadás ]
(in) G. Holmes, A. Donkin és IH Witten, " Weka: A gépi tanulási munkaasztal " , Proc Second Australia and New Zealand Conference on Intelligent Information Systems, Brisbane, Ausztrália ,1994(hozzáférés : 2007. június 25. ) [PDF]
(in) SR Garner, SJ Cunningham, G. Holmes, CG Nevill-Manning, és az IH Witten " alkalmazása gépi tanulás munkaasztal: Tapasztalat mezőgazdasági adatbázisok " , Proc Machine Learning in Practice Műhely, Machine Learning Konferencia, Tahoe City, CA, USA ,1995(hozzáférés : 2007. június 25. ) ,p. 14–21[PDF]
(in) P. Reutemann, Pfahringer B. és E. Frank, " Megfelelő: Eszköztár a kapcsolati adatokból való tanuláshoz a propozíciós és több példányos tanulókkal " , ausztrál 17. mesterséges intelligencia-konferencia (AI2004) , Springer-Verlag,2004(hozzáférés : 2007. június 25 )
(in) Ian H. Witten, Eibe Frank, Len Trigger, Mark Hall, Geoffrey Holmes és Sally Jo Cunningham, " Weka: Gyakorlati Machine Learning eszközök és módszerek Java implementációja " , Proceedings of the ICONIP / ANZIIS / ANNES'99 Workshop a feltörekvő tudástechnikáról és a kapcsolódási alapú információs rendszerekről ,1999(hozzáférés : 2007. június 26. ) ,p. 192–196[PDF]
(in) nyertese SIGKDD adatbányászati és elemzési Discovery Service Award ... - Gregory Piatetsky-Shapiro, KDnuggets, június 28, 2005

(fr) Ez a cikk részben vagy egészben venni a Wikipedia cikket angolul című „ Weka (gépi tanulás) ” ( lásd a szerzők listáját ) .

Függelékek

Kapcsolódó cikk

Mesterséges intelligencia

Külső linkek

(en) Hivatalos oldal
(en) " A Weka projekt otthona " , a SourceForge.net oldalon .

Példák alkalmazásokra

(en) Betűszóazonosítás
(en) Génválasztás mikrorajz adatokból a rák osztályozásához - ScienceDirect,1 st február 2005
(en) A kvantitatív struktúra lineáris és nemlineáris megközelítésének összehasonlítása - Ionoforokkal való fémkomplexum tulajdonviszonyainak vizsgálata - ACS Publications
(en) MIPS EST besorolási szerver
(en) Weka: Kapcsolódó projektek