Cím | ImageNet |
---|---|
Termelő | ImageNet |
Írta le | ImageNet: nagyméretű hierarchikus képadatbázis ( d ) |
Weboldal | www.image-net.org |
Engedély | BSD-3-záradék |
---|
Az ImageNet egy kommentált képadatbázis , amelyet az azonos nevű szervezet a számítógépes látás területén végzett kutatás céljából állított elő . 2016-ban több mint tízmillió URL- t írtak kézzel kézzel annak jelzésére, hogy mely objektumok vannak ábrázolva a képen; több mint egymillió képnek is hasznát veszi az objektumok körüli dobozok bekötése. A harmadik felek kép-URL- jeiin található annotációk adatbázisa szabadon elérhető, azonban az ImageNet nem a képek tulajdonosa. 2010 óta az ImageNet projekt éves versenyt rendezett: ImageNet nagyméretű vizuális felismerési kihívás (ILSVRC), vagy "ImageNet nagyméretű vizuális felismerési verseny". Szoftverversenyből áll, amelynek célja a természetes képeken lévő tárgyak és jelenetek pontos felismerése és osztályozása.
Fei-Fei Li kutató 2006 -ban kezdett el dolgozni az ImageNet adatkészlet ötletével. Abban az időben, amikor a kutatók modellekre és algoritmusokra összpontosítanak, Li úgy dönt, hogy növeli és fejleszti a rendelkezésre álló adatokat az adatok képzéséhez. Gépi tanulási algoritmusok . 2007-ben Fi-Fei Li találkozott Christiane Fellbaummal , a Princetoni Egyetem professzorával és a WordNet egyik alkotójával, hogy megvitassák a projektet. A találkozó eredményeként Li felépíti az ImageNet-et a WordNet-ből, sok funkcióját újból felhasználva.
Az ImageNet adatbázist először 2009-ben a floridai Computer Vision and Pattern Recognition (CVPR) konferencián mutatták be a Princeton Egyetem Számítástudományi Tanszékének kutatói .
Az IMAGEnet részvételi produkciót használ az annotációs folyamatban. A kép léptékében lévő annotáció egy objektumosztály jelenlétét vagy hiányát jelzi benne, például "ebben a képben tigrisek vannak" vagy "ezen a képen nincsenek tigrisek". Az objektumok jegyzeteléséhez ez magában foglalja az objektum vagy látható része körül egy korlátozó doboz létrehozását. Az ImageNet a finom szemantikai osztályozás bemutatása érdekében a WordNet objektum-kategorizáló struktúra egy változatát használja fel, 120 kutyafajta-kategóriával kiegészítve.
A 2010-ben indított ILSVRC egy éves verseny, ahol a kutatócsoportok kiértékelik képfeldolgozási algoritmusaikat az ImageNet adatkészleten (az érvényesítési készlet nem érhető el), és a legjobb látási feladatokért versenyeznek számítógéppel . Az ILSVRC célja, hogy kövesse a 2005-ben létrehozott kisebb méretű PASCAL VOC kihívás példáját, amely csak körülbelül 20 000 képet és mintegy húsz objektumosztályt tartalmaz. A 2010-es években látványos előrelépés történt a képfeldolgozás terén . 2011-ben az ILSVRC verseny legalacsonyabb osztályozási hibaaránya 25% körüli volt. 2012-ben a mély tanulási forradalom hirtelen 16% -ra csökkentette ezt a rekordot. A következő két évben a hibaarány drasztikusan, néhány százalékra csökken. A kutatók Becslése szerint 2015-ben az algoritmusok képesek lesznek meghaladni az emberi operátorok teljesítményét az ILSVRC kihívás feladataiban. Azonban, amint a kihívás egyik szervezője, Olga Russakovsky 2015-ben rámutatott, az algoritmusoknak csak néhány ezer nagyságrendű osztályt kell megkülönböztetniük, míg az emberek jó néhányat. Ezenkívül az emberi operátor könnyen megértheti a kép kontextusát, ami az automatizált megoldások esetében nem így van.
2014-ben több mint ötven intézmény vett részt az ILSVRC versenyen. 2015-ben a Baidu tudósait egy évre eltiltották több fiók használata miatt, hogy jelentősen túllépjék a heti két beküldés határát. Baidu később azt mondta, hogy az érintett csoport vezetőjét eltávolították hivatalából, és tudományos tanácsadó csoportot hoz létre.