Internetes archívum | |
A tükör helyének kiszolgálóit a Bibliotheca Alexandrina őrzi | |
Teremtés | 1996 |
---|---|
Alapítók | Lásd: A testület |
Jogi forma | Nonprofit szervezet |
Szlogen | Egyetemes hozzáférés minden tudáshoz |
A központi iroda | 300 Funston Avenue, Richmond körzet , San Francisco , Kalifornia, USA |
Irány | Julien masanes |
Tevékenység | Web archiválás és megőrzés |
Termékek | Cover Art Archive ( d ) |
Partnerek | Amerikai Digitális Nyilvános Könyvtár |
Hatékony | 200 |
Weboldal | archive.org |
Forgalom | 14 000 000 USD (2015) |
Az Internet Archive (vagy IA ) egy webarchiválással foglalkozó nonprofit szervezet , amely digitális könyvtárként is működik. Ezek az elektronikus archívumok alkotják pillanatképek (másolatát oldalakon különböző időpontokban) weboldalak, szoftverek, filmek, könyvek és hangfelvételek.
Annak érdekében, hogy a stabilitás és a biztonság archivált adatok egy működő tükör helyén tartjuk a Bibliotheca Alexandrina az egyiptomi . Az AI ingyen bocsátja gyűjteményeit a kutatók, történészek és tudósok rendelkezésére. A San Francisco-i Presidiótól délre , a Richmond kerületben található , az American Library Association tagja, és Kalifornia állam hivatalosan könyvtárként ismeri el .
Az IA által használt webrobot a Heritrix , ingyenes szoftver . Az ingyenes könyvolvasó szoftver a Scribe.
Internet Archive -ban alakult 1996 által Brewster Kahle . Céljaik miatt - az emberi ismeretek megőrzése és a gyűjtemények mindenki számára való hozzáférhetősége miatt - az IA alapítói ezt a projektet hasonlítják össze az alexandriai könyvtár régebbi projekttel .
A Wayback Machine a Web pillanatkép része, amelyet az Internetes Archívum fejlesztett ki . A Wayback Machine- t Brewster Kahle hozta létre, hogy bármit tároljon és indexeljen az interneten. A Wayback Machine frissül az Alexa tartalmaival . Ez a szolgáltatás lehetővé teszi a felhasználók számára, hogy idővel megtekinthessék a weboldalak archivált verzióit: ez a „háromdimenziós index”.
A pillanatfelvételek a felvétel után hat-tizenkét hónappal állnak rendelkezésre. A pillanatképek gyakorisága változó, nem minden webhelyfrissítést rögzítenek, és több hét intervallumok is megfigyelhetők.
2006-ban a Wayback Machine csaknem két petabájt adatot tartalmazott. A mennyiség 20 terabájt / hó sebességgel növekszik, ami kétharmad növekedést jelent a havi tizenkét terabájthoz képest, amely 2003-ban volt növekedési ütem. Ez a növekedés nagyobb, mint a Szövetség legfontosabb könyvtáraiban található szöveg mennyisége világ, beleértve a Kongresszus Könyvtárát is . 2009-ben a Wayback Machine csaknem három petabájt adatot tartalmazott, és növekedése havonta 100 terabájt volt. Az adatokat a Capricorne Technologies, Petabox állványok által gyártott rendszerekben archiválják.
A név „ Wayback Machine ” kifejezés epizódok Rocky és Bakacsin kalandjai , ahol Mr. Peabody, egy professzori kutya és segédje Sherman (humán állat), használjon egy ideig gép úgynevezett „WABAC Machine” a közismert történelmi eseményeket.
2015-ben Oroszország tévesen blokkolta volna a Wayback Machine teljes webhelyét .
Azok a felhasználók, akik adataikat tartósan és azonnal archiválni kívánják, előfizetéssel, szolgáltatással használhatók fel Archive-It (en) IA. Az összegyűjtött adatokat a Wayback Machine rendszeresen indexeli . Ban ben2007. december, ez a szolgáltatás több mint 230 millió URL- t hozott létre 466 nyilvános gyűjtemény számára, köztük kormányzati ügynökségek, egyetemek és kulturális intézmények számára.
Példa az Archive-It-ben részt vevő szervezetekre vagy intézményekre:
A webarchívumok mellett az Internetes archívumszolgáltatások nagy mennyiségű digitális médiát tartanak fenn, amelyek vagy nyilvánosak, vagy terjesztésre engedélyezettek, például a Creative Commons licencek . A médiumokat típusok szerint (mozgóképek, hang, szöveg stb.) És algyűjteményekben rendezik különböző kritériumok szerint. Minden fő gyűjtemény tartalmaz egy közösségi részgyűjteményt , ahol a nagyközönség hozzászólásai archiválhatók.
Gyűjteményei tartalmazzák ( 2007. november 14):
A játékfilmek mellett az Internetes Archívum videokollekciója tartalmaz híreket, képregény- klasszikusokat , pro- és háborúellenes propagandát, valamint a Prelinger Archívum további efemer anyagát , például reklámokat, ismeretterjesztő és ipari filmeket, valamint amatőr filmgyűjteményeket.
Példák gyűjtésre:
Példa egy francia filmre:
A hanggyűjtemény zenékből, hangoskönyvekből, híradásokból, régi rádióműsorokból és sokféle egyéb audio fájlból áll. Az Élő Zenei Archívum algyűjteménye 40 000 felvételt tartalmaz független művészek koncertjeiről, valamint olyan megalapozottabb művészekről és zenei együttesekről, amelyeknek kevésbé szigorú szabályai vannak a koncertek felvételére, mint például a Grateful Dead .
SzövegekEz a gyűjtemény a Gutenberg Projekt szövegeit, a világ különböző könyvtárainak szövegeit, valamint az ARPANET dokumentum- és jegyzetgyűjteményét foglalja össze . Több mint 7 millió könyvével az Internet Archívum a világ második legnagyobb, nyílt hozzáférésű digitális könyvtára a Google Könyvek után. Minden dokumentumot, amelyet az internetfelhasználók vagy intézmények digitalizáltak és online hoztak létre, EPUB fájlokká alakítják át e-olvasók számára vagy MOBI a Kindle számára, és állandó archiválást élveznek a világ számos szerverén (Kalifornia, Egyiptom, Kína, Hollandia). ).
A Sainte-Geneviève Könyvtár az első francia könyvtár, amely részt vett a projektben2010. március. Franciaországban az École des Ponts ParisTech (azóta)2012. augusztus), az Országos Agrárkutatási Intézet (2005 óta) 2015. január), Sciences Po Paris (azóta 2015. június), az Egyetemközi Egészségügyi Könyvtár (2005 óta) 2018. január), az Egyetemi Nyelv- és Civilizációs Könyvtár (2019 szeptembere óta) és az École normale supérieure könyvtárai (2020 decembere óta) is részt vesznek.
Az Internetes Archívum az Open Content Alliance tagja (in), és működteti az Open Library-t, ahol több mint 200 000 digitalizált, nyilvános könyv elérhető online és nyomtatható. Ezt a célt szolgálja a Scribe Book Scanning System .
A koronavírus-járvány idején az Internetes Archívum szerzői jog által védett könyveket tesz elérhetővé az amerikaiak számára, hogy a bezárás alatt tanulhassanak. Számos kiadó nem ért egyet ezzel, és az Internetes Archívum visszavonja az érintett könyvek hozzáférését 2020. június 16. A kiadók mindennek ellenére beperelik az oldalt, és tárgyalást terveznek 2021-re.
2002 végén az Internetes Archívum törölte a Wayback Machine által azonosított, a Szcientológiát kritikus oldalakat . A hibaüzenet azt állítja, hogy "a webhely tulajdonosának kérése" következtében történt. Később tisztázták, hogy a Szcientológia Egyház ügyvédei jogi ok nélkül kérték az eltávolítást, és hogy az oldalak tulajdonosai nem akarják, hogy eltávolítsák az oldalaikat.
Ban ben 2004. október, a " Telewizja Polska SA vs Echostar Satellite " nevű ügyben egy ügyvéd valószínűleg megpróbálja a Wayback Machine archívumát elfogadható bizonyíték forrásaként felhasználni.
TVP a szolgáltató TVP Polonia és EchoStar működtető Dish Network . A tárgyalás előtt az EchoStar azt mondta, hogy a Wayback Machine pillanatképeit kívánja felhasználni a Telewizja Polska webhely korábbi tartalmának bizonyítékaként. Telewizja Polska indítványt nyújtott be a limine-be (in), hogy távolítsa el az igazolók hallomásból és hitelesítetlen forrásból készült felvételeit, de Arlander Keys bíró elutasította Telewizja Polska állításait, és a tárgyaláson nem volt hajlandó kizárni a bizonyítékokat. A tárgyalás idején azonban a kerületi bíróság bírója, Ronald Guzman első fokon megdöntötte Keys bíró megállapításait, és arra a következtetésre jutott, hogy sem az Internetes Archívum, sem az alapul szolgáló oldalak (vagyis a Telewizja Polska webhely) nem fogadhatók el bizonyítékként. Guzman bíró úgy döntött, hogy egy weboldal nyomtatása nem bizonyítja az információk hitelességét.
Healthcare Advocates, Inc.2003-ban az Healthcare Advocates, Inc. ellen védjegybitorlási pert indítottak. Az ügyészség megkísérelte használni az Archívumon keresztül elérhető archivált internetes anyagokat . A per elvesztése után a vállalat megpróbálta beperelni az Internet Archívumot a DMCA, valamint a számítógépes csalásokról és visszaélésekről szóló törvény megsértése miatt . Azt állították, hogy mivel a webhelyükre telepítettek egy robots.txt fájlt , ezt az AI botnak el kellett volna kerülnie. Az első panaszt benyújtották2003. június 26, és hozzáadták a robots.txt fájlt, a 2003. július 8, a visszahatóan visszavonandó oldalakat. A tárgyalást bíróságon kívül rendezték.
A Robots.txt a Robots Exclusion Standard részeként, az IA által alkalmazott önkéntes szabvány részeként tiltja meg a robotok számára, hogy az alkotó által megjelölt bizonyos oldalakat korlátozás nélkül indexeljék. Ennek eredményeként a mesterséges intelligencia számos olyan weboldalt eltávolított, amelyek ma már nem elérhetők a Wayback Machine segítségével. Ez néha annak köszönhető, hogy egy új tulajdonos egy robots.txt fájlt helyezett el, amely megtiltotta a webhely indexelését. Az adminisztrátorok szerint olyan rendszeren dolgoznak, amely lehetővé teszi a hozzáférést a korábbi archívumokhoz, ugyanakkor kizárja a fájl hozzáadása után létrehozott elemeket.
2006-ban az IA visszamenőlegesen alkalmazta a Robots.txt szabályt. Ha egy webhely blokkolja az IA-t, például az Healthcare Advocates, akkor az adott domainről korábban archivált oldalak is törlődnek. Letiltott helyek esetén csak a robots.txt fájlt archiválják. Ez a gyakorlat hátrányosnak tűnik a kutatók számára a múltban rendelkezésre álló információkhoz való hozzáférés szempontjából.
Az IA ugyanakkor azt is kijelenti, hogy „néha egy webhelytulajdonos közvetlenül kapcsolatba lép velünk, és arra kér bennünket, hogy hagyjuk abba a webhely indexelését vagy archiválását. Teljesítjük ezeket a kéréseket. Azt is kifejtették, hogy "az internetes archívum nem érdekelt olyan webhelyek vagy egyéb internetes anyagok megőrzésében vagy hozzáférés biztosításában, amelyek olyan emberek tulajdonában vannak, akik nem akarják, hogy anyagukat archiválják . "
Szabadalmi törvényAz Egyesült Államok Szabadalmi Hivatala, és további követelmények teljesülése esetén (pl. A levéltáros hivatalos nyilatkozatának benyújtása esetén) az Európai Szabadalmi Hivatal elfogadja az Internet Archívumból származó datálást egy weboldal közzétételének bizonyítékaként. Ezeket a dátumokat használjuk annak meghatározására, hogy elérhető-e egy weboldal, például a szabadalmi bejelentés benyújtásának dátuma előtt.
Ban ben 2005. november, a Grateful Dead koncertek ingyenes letöltését eltávolítottuk az oldalról. John Perry Barlow azonosított Bob Weir , Mickey Hart és Bill Kreutzmann mint felbujtói ez a változás. ANovember 30, egy bejegyzés a Brewster Kahle fórumán összefoglalta a zenekar tagjai közötti kompromisszumot. Élő koncerteket lehet letölteni vagy meghallgatni, a felvételek pedig csak hallgatásra lesznek elérhetőek. Azóta koncerteket adtak hozzá.
Suzanne ShellA 2005. december 12, az aktivista, Suzanne Shell (in) 100 000 dollár összeget követelt a „profane-justice.org” webhelyének archiválásáért 1999 és 2004 között.2006. január 20, Az Internet Archívum deklaratív ítéletet nyújtott be az észak-kaliforniai körzetben, és arra kérte a bíróságot, hogy állapítsa meg, hogy az IA nem sérti a Shell szerzői jogait.
A Shell válaszolt, és újabb panaszt nyújtott be az IA ellen a webhely archiválása miatt, a szolgáltatási feltételek megsértésére hivatkozva. A2007. február 13, a coloradói körzeti bíró a szerződésszegés kivételével minden keresetet elutasított.
A 2007. április 25, IA és a Shell közösen jelentették be vitájuk rendezését. IA azt mondta: „Az Internetes Archívumnak nem érdeke, hogy olyan információkat helyezzen el a Wayback Machine-be, akik nem akarják látni az archivált webtartalmukat. Tudomásul vesszük, hogy az M me Shell érvényes szerzői jogokkal rendelkezik és alkalmazható a webhelyén, és sajnáljuk, hogy webhelyének a Wayback Machine-be való regisztrációja ezt a pert eredményezte. Örülünk, hogy mögöttünk van ez az eset. " Shell azt mondta: " Tisztelem az Internet Archívum célkitűzését és történelmi értékét. Soha nem akartam beavatkozni ebbe a célba, vagy nem okozni kárt. "
Szerzői jogi helyzet EurópábanEurópában a Wayback Machine néha megsértheti a szerzői jogi törvényeket. Csak az alkotó dönthet arról, hogy tartalmát hol publikálják vagy reprodukálják, az oldalakat az alkotó kérésére el kell távolítani az archívumokból.
Európában az Európai Internet Archívum versenyző.