Fejlesztette | OutWit Technologies |
---|---|
Utolsó verzió | 9.0 |
Operációs rendszer | Microsoft Windows , macOS és Linux |
típus | webkaparó szoftver , letöltéskezelő |
Engedély | tulajdonosi engedély |
Weboldal | www.outwit.com |
Túljárjon Hub van web kaparás szoftver , amelynek célja, hogy automatikusan kivonat és információkat gyűjtenek az online vagy a helyi erőforrásokat.
A program felismeri és összegyűjti a hivatkozásokat, képeket, dokumentumokat, névjegyeket, ismétlődő szavakat és szavak csoportjait, az RSS-hírcsatornákat és konvertálja a strukturált vagy strukturálatlan adatokat formázott táblákká, amelyeket táblázatokba vagy adatbázisokba lehet exportálni . A szoftver első verziója 2010 végén jelent meg. Azóta kiadták a 9.0 verziót2020 január.
A program tartalmaz egy webböngészőt és egy oldalsó panelt, amely hozzáférést biztosít számos nézethez, amely előre meghatározott extrakciók adatait tartalmazza. A weboldalakat és a szöveges dokumentumokat különböző alkotóelemekre bontják, és táblázatokként jelenítik meg ezeket a nézeteket. Az alkalmazás automatikusan áttekintheti a keresőmotor találati oldalainak linkjeit vagy szekvenciáit, hogy kivonja a keresett információkat, táblákba rendezze és különféle formátumban exportálja őket. Az előre definiált elszívók lehetővé teszik strukturált táblák, listák és folyamatok gyűjtését. Ha ezek az automatikus kibontások nem elegendőek, akkor a felhasználó létrehozhat speciális kaparókat is, amelyek kevésbé strukturált oldalakból vonják ki az elemeket. A rendszeres kifejezéseket lehet használni a lehúzóban, valamint az alkalmazás más részeiben is, hogy meghatározhassunk változó markereket a felismeréshez és az adatok kinyeréséhez.
A program két változatban létezik: egy futtatható alkalmazás és egy Mozilla Firefox kiegészítő , azonos funkcionalitással. Ingyenes és korlátozott verzió letölthető a kiadó webhelyéről és a letöltési oldalakról.