Internetes archívum

Internetes archívum
A Bibliotheca Alexandrina tükörhelyének kiszolgálói
A tükör helyének kiszolgálóit a Bibliotheca Alexandrina őrzi
Teremtés 1996
Alapítók Lásd: A testület
Jogi forma Nonprofit szervezet
Szlogen Egyetemes hozzáférés minden tudáshoz
A központi iroda 300 Funston Avenue, Richmond körzet , San Francisco , Kalifornia, USA
 
Irány Julien masanes
Tevékenység Web archiválás és megőrzés
Termékek Cover Art Archive ( d )
Partnerek Amerikai Digitális Nyilvános Könyvtár
Hatékony 200
Weboldal archive.org
Forgalom 14 000 000 USD (2015)

Az Internet Archive (vagy IA ) egy webarchiválással foglalkozó nonprofit szervezet , amely digitális könyvtárként is működik. Ezek az elektronikus archívumok alkotják pillanatképek (másolatát oldalakon különböző időpontokban) weboldalak, szoftverek, filmek, könyvek és hangfelvételek.

Annak érdekében, hogy a stabilitás és a biztonság archivált adatok egy működő tükör helyén tartjuk a Bibliotheca Alexandrina az egyiptomi . Az AI ingyen bocsátja gyűjteményeit a kutatók, történészek és tudósok rendelkezésére. A San Francisco-i Presidiótól délre , a Richmond kerületben található , az American Library Association tagja, és Kalifornia állam hivatalosan könyvtárként ismeri el .

Az IA által használt webrobot a Heritrix , ingyenes szoftver . Az ingyenes könyvolvasó szoftver a Scribe.

Történelem

Internet Archive -ban alakult 1996 által Brewster Kahle . Céljaik miatt - az emberi ismeretek megőrzése és a gyűjtemények mindenki számára való hozzáférhetősége miatt - az IA alapítói ezt a projektet hasonlítják össze az alexandriai könyvtár régebbi projekttel .

Internetes archív szolgáltatások

Wayback Machine

A Wayback Machine a Web pillanatkép része, amelyet az Internetes Archívum fejlesztett ki . A Wayback Machine- t Brewster Kahle hozta létre, hogy bármit tároljon és indexeljen az interneten. A Wayback Machine frissül az Alexa tartalmaival . Ez a szolgáltatás lehetővé teszi a felhasználók számára, hogy idővel megtekinthessék a weboldalak archivált verzióit: ez a „háromdimenziós index”.

A pillanatfelvételek a felvétel után hat-tizenkét hónappal állnak rendelkezésre. A pillanatképek gyakorisága változó, nem minden webhelyfrissítést rögzítenek, és több hét intervallumok is megfigyelhetők.

2006-ban a Wayback Machine csaknem két petabájt adatot tartalmazott. A mennyiség 20 terabájt / hó sebességgel növekszik, ami  kétharmad növekedést jelent a havi tizenkét terabájthoz képest, amely 2003-ban volt növekedési ütem. Ez a növekedés nagyobb, mint a Szövetség legfontosabb könyvtáraiban található szöveg mennyisége világ, beleértve a Kongresszus Könyvtárát is . 2009-ben a Wayback Machine csaknem három petabájt adatot tartalmazott, és növekedése havonta 100 terabájt volt. Az adatokat a Capricorne Technologies, Petabox állványok által gyártott rendszerekben archiválják.

A név „  Wayback Machine  ” kifejezés epizódok Rocky és Bakacsin kalandjai , ahol Mr. Peabody, egy professzori kutya és segédje Sherman (humán állat), használjon egy ideig gép úgynevezett „WABAC Machine” a közismert történelmi eseményeket.

2015-ben Oroszország tévesen blokkolta volna a Wayback Machine teljes webhelyét .

Archív-It

Azok a felhasználók, akik adataikat tartósan és azonnal archiválni kívánják, előfizetéssel, szolgáltatással használhatók fel Archive-It  (en) IA. Az összegyűjtött adatokat a Wayback Machine rendszeresen indexeli . Ban ben2007. december, ez a szolgáltatás több mint 230 millió URL- t hozott létre 466 nyilvános gyűjtemény számára, köztük kormányzati ügynökségek, egyetemek és kulturális intézmények számára.

Példa az Archive-It-ben részt vevő szervezetekre vagy intézményekre:

Gyűjtemények

A webarchívumok mellett az Internetes archívumszolgáltatások nagy mennyiségű digitális médiát tartanak fenn, amelyek vagy nyilvánosak, vagy terjesztésre engedélyezettek, például a Creative Commons licencek . A médiumokat típusok szerint (mozgóképek, hang, szöveg stb.) És algyűjteményekben rendezik különböző kritériumok szerint. Minden fő gyűjtemény tartalmaz egy közösségi részgyűjteményt , ahol a nagyközönség hozzászólásai archiválhatók.

Gyűjteményei tartalmazzák ( 2007. november 14):

Videó képek

A játékfilmek mellett az Internetes Archívum videokollekciója tartalmaz híreket, képregény- klasszikusokat , pro- és háborúellenes propagandát, valamint a Prelinger Archívum további efemer anyagát , például reklámokat, ismeretterjesztő és ipari filmeket, valamint amatőr filmgyűjteményeket.

Példák gyűjtésre:

  • Téglafilmek ( közvetlen link ): Lego- téglákkal forgatott animációs filmeket csoportosítanak , amelyek közül néhány a játékfilmek címlapváltozata.
  • 2004. évi választás  : egy nyilvános, pártok nélküli tér, amely a 2004-es amerikai elnöki választásokkal kapcsolatos videomegosztással foglalkozik .
  • Független hírek: olyan részgyűjteményeket tartalmaz, mint például a 2001-től megrendezett Internet at Archive World At War verseny . A leggyakrabban letöltött videók között vannak az Indiai-óceán 2004-es földrengésének szemtanúi által készített videók. A szeptember 11-i televíziós archívum a világ összes legnagyobb televíziós hálózatának videóit tartalmazza a szeptember 11-i támadásokkal kapcsolatban .

Példa egy francia filmre:

Hangok

A hanggyűjtemény zenékből, hangoskönyvekből, híradásokból, régi rádióműsorokból és sokféle egyéb audio fájlból áll. Az Élő Zenei Archívum algyűjteménye 40 000 felvételt tartalmaz független művészek koncertjeiről, valamint olyan megalapozottabb művészekről és zenei együttesekről, amelyeknek kevésbé szigorú szabályai vannak a koncertek felvételére, mint például a Grateful Dead .

Szövegek

Ez a gyűjtemény a Gutenberg Projekt szövegeit, a világ különböző könyvtárainak szövegeit, valamint az ARPANET dokumentum- és jegyzetgyűjteményét foglalja össze . Több mint 7 millió könyvével az Internet Archívum a világ második legnagyobb, nyílt hozzáférésű digitális könyvtára a Google Könyvek után. Minden dokumentumot, amelyet az internetfelhasználók vagy intézmények digitalizáltak és online hoztak létre, EPUB fájlokká alakítják át e-olvasók számára vagy MOBI a Kindle számára, és állandó archiválást élveznek a világ számos szerverén (Kalifornia, Egyiptom, Kína, Hollandia). ).

A Sainte-Geneviève Könyvtár az első francia könyvtár, amely részt vett a projektben2010. március. Franciaországban az École des Ponts ParisTech (azóta)2012. augusztus), az Országos Agrárkutatási Intézet (2005 óta) 2015. január), Sciences Po Paris (azóta 2015. június), az Egyetemközi Egészségügyi Könyvtár (2005 óta) 2018. január), az Egyetemi Nyelv- és Civilizációs Könyvtár (2019 szeptembere óta) és az École normale supérieure könyvtárai (2020 decembere óta) is részt vesznek.

Ingyenes könyvtár

Az Internetes Archívum az Open Content Alliance  tagja (in), és működteti az Open Library-t, ahol több mint 200 000 digitalizált, nyilvános könyv elérhető online és nyomtatható. Ezt a célt szolgálja a Scribe Book Scanning System .

A koronavírus-járvány idején az Internetes Archívum szerzői jog által védett könyveket tesz elérhetővé az amerikaiak számára, hogy a bezárás alatt tanulhassanak. Számos kiadó nem ért egyet ezzel, és az Internetes Archívum visszavonja az érintett könyvek hozzáférését 2020. június 16. A kiadók mindennek ellenére beperelik az oldalt, és tárgyalást terveznek 2021-re.

Viták

Szcientológia honlap

2002 végén az Internetes Archívum törölte a Wayback Machine által azonosított, a Szcientológiát kritikus oldalakat . A hibaüzenet azt állítja, hogy "a webhely tulajdonosának kérése" következtében történt. Később tisztázták, hogy a Szcientológia Egyház ügyvédei jogi ok nélkül kérték az eltávolítást, és hogy az oldalak tulajdonosai nem akarják, hogy eltávolítsák az oldalaikat.

Internetes archívumok bizonyítékként

Polgári perek az Egyesült Államokban Telewizja Polska

Ban ben 2004. október, a " Telewizja Polska SA vs Echostar Satellite  " nevű ügyben  egy ügyvéd valószínűleg megpróbálja a Wayback Machine archívumát elfogadható bizonyíték forrásaként felhasználni.

TVP a szolgáltató TVP Polonia és EchoStar működtető Dish Network . A tárgyalás előtt az EchoStar azt mondta, hogy a Wayback Machine pillanatképeit kívánja felhasználni a Telewizja Polska webhely korábbi tartalmának bizonyítékaként. Telewizja Polska indítványt nyújtott be a limine-be  (in), hogy távolítsa el az igazolók hallomásból és hitelesítetlen forrásból készült felvételeit, de Arlander Keys bíró elutasította Telewizja Polska állításait, és a tárgyaláson nem volt hajlandó kizárni a bizonyítékokat. A tárgyalás idején azonban a kerületi bíróság bírója, Ronald Guzman első fokon megdöntötte Keys bíró megállapításait, és arra a következtetésre jutott, hogy sem az Internetes Archívum, sem az alapul szolgáló oldalak (vagyis a Telewizja Polska webhely) nem fogadhatók el bizonyítékként. Guzman bíró úgy döntött, hogy egy weboldal nyomtatása nem bizonyítja az információk hitelességét.

Healthcare Advocates, Inc.

2003-ban az Healthcare Advocates, Inc. ellen védjegybitorlási pert indítottak. Az ügyészség megkísérelte használni az Archívumon keresztül elérhető archivált internetes anyagokat . A per elvesztése után a vállalat megpróbálta beperelni az Internet Archívumot a DMCA, valamint a számítógépes csalásokról és visszaélésekről szóló törvény megsértése miatt . Azt állították, hogy mivel a webhelyükre telepítettek egy robots.txt fájlt , ezt az AI botnak el kellett volna kerülnie. Az első panaszt benyújtották2003. június 26, és hozzáadták a robots.txt fájlt, a 2003. július 8, a visszahatóan visszavonandó oldalakat. A tárgyalást bíróságon kívül rendezték.

A Robots.txt a Robots Exclusion Standard részeként, az IA által alkalmazott önkéntes szabvány részeként tiltja meg a robotok számára, hogy az alkotó által megjelölt bizonyos oldalakat korlátozás nélkül indexeljék. Ennek eredményeként a mesterséges intelligencia számos olyan weboldalt eltávolított, amelyek ma már nem elérhetők a Wayback Machine segítségével. Ez néha annak köszönhető, hogy egy új tulajdonos egy robots.txt fájlt helyezett el, amely megtiltotta a webhely indexelését. Az adminisztrátorok szerint olyan rendszeren dolgoznak, amely lehetővé teszi a hozzáférést a korábbi archívumokhoz, ugyanakkor kizárja a fájl hozzáadása után létrehozott elemeket.

2006-ban az IA visszamenőlegesen alkalmazta a Robots.txt szabályt. Ha egy webhely blokkolja az IA-t, például az Healthcare Advocates, akkor az adott domainről korábban archivált oldalak is törlődnek. Letiltott helyek esetén csak a robots.txt fájlt archiválják. Ez a gyakorlat hátrányosnak tűnik a kutatók számára a múltban rendelkezésre álló információkhoz való hozzáférés szempontjából.

Az IA ugyanakkor azt is kijelenti, hogy „néha egy webhelytulajdonos közvetlenül kapcsolatba lép velünk, és arra kér bennünket, hogy hagyjuk abba a webhely indexelését vagy archiválását. Teljesítjük ezeket a kéréseket. Azt is kifejtették, hogy "az internetes archívum nem érdekelt olyan webhelyek vagy egyéb internetes anyagok megőrzésében vagy hozzáférés biztosításában, amelyek olyan emberek tulajdonában vannak, akik nem akarják, hogy anyagukat archiválják . "

Szabadalmi törvény

Az Egyesült Államok Szabadalmi Hivatala, és további követelmények teljesülése esetén (pl. A levéltáros hivatalos nyilatkozatának benyújtása esetén) az Európai Szabadalmi Hivatal elfogadja az Internet Archívumból származó datálást egy weboldal közzétételének bizonyítékaként. Ezeket a dátumokat használjuk annak meghatározására, hogy elérhető-e egy weboldal, például a szabadalmi bejelentés benyújtásának dátuma előtt.

szerzői jog

Kegyes halál

Ban ben 2005. november, a Grateful Dead koncertek ingyenes letöltését eltávolítottuk az oldalról. John Perry Barlow azonosított Bob Weir , Mickey Hart és Bill Kreutzmann mint felbujtói ez a változás. ANovember 30, egy bejegyzés a Brewster Kahle fórumán összefoglalta a zenekar tagjai közötti kompromisszumot. Élő koncerteket lehet letölteni vagy meghallgatni, a felvételek pedig csak hallgatásra lesznek elérhetőek. Azóta koncerteket adtak hozzá.

Suzanne Shell

A 2005. december 12, az aktivista, Suzanne Shell  (in) 100 000 dollár összeget követelt a  „profane-justice.org” webhelyének archiválásáért 1999 és 2004 között.2006. január 20, Az Internet Archívum deklaratív ítéletet nyújtott be az észak-kaliforniai körzetben, és arra kérte a bíróságot, hogy állapítsa meg, hogy az IA nem sérti a Shell szerzői jogait.

A Shell válaszolt, és újabb panaszt nyújtott be az IA ellen a webhely archiválása miatt, a szolgáltatási feltételek megsértésére hivatkozva. A2007. február 13, a coloradói körzeti bíró a szerződésszegés kivételével minden keresetet elutasított.

A 2007. április 25, IA és a Shell közösen jelentették be vitájuk rendezését. IA azt mondta: „Az Internetes Archívumnak nem érdeke, hogy olyan információkat helyezzen el a Wayback Machine-be, akik nem akarják látni az archivált webtartalmukat. Tudomásul vesszük, hogy az M me Shell érvényes szerzői jogokkal rendelkezik és alkalmazható a webhelyén, és sajnáljuk, hogy webhelyének a Wayback Machine-be való regisztrációja ezt a pert eredményezte. Örülünk, hogy mögöttünk van ez az eset. " Shell azt mondta: " Tisztelem az Internet Archívum célkitűzését és történelmi értékét. Soha nem akartam beavatkozni ebbe a célba, vagy nem okozni kárt. "

Szerzői jogi helyzet Európában

Európában a Wayback Machine néha megsértheti a szerzői jogi törvényeket. Csak az alkotó dönthet arról, hogy tartalmát hol publikálják vagy reprodukálják, az oldalakat az alkotó kérésére el kell távolítani az archívumokból.

Versenyzők

Európában az Európai Internet Archívum versenyző.

Megjegyzések és hivatkozások

  1. "  https://projects.propublica.org/nonprofits/organizations/943242767  "
  2. Internetes archívum az alexandriai Új Könyvtárban .
  3. (in) Internet Archive officiellement a library , 2007. május 2
  4. (en) Scribe szoftver
  5. Judy Tong, „  Felelős párt - Brewster Kahle; Webtár, az interneten  ” , The New York Times ,2002. szeptember 8
  6. (in) Egy akkora könyvtár, mint a világ - Heather Green, BusinessWeek , 2002. február 28
  7. "  The Wayback Machine, over-blocking Russia áldozata  " , ZDNet (hozzáférés: 2015. június 30. )
  8. (in) megőrzése Web egyik csoport egy időben - Stefanie Olsen, CNET , 1 st május 2006
  9. A web memóriája az Archive.org oldalon található, amely mintegy 65 millió webhelyet sorol fel - Le Monde , 2007. november 14.
  10. Mathieu Andro, Emmanuelle Asselin, Marc Maisonneuve (2012), Digitális könyvtárak: szoftverek és platformok , Párizs, ADBS.
  11. https://archive.org/details/bibliothequesaintegenevieve
  12. https://archive.org/details/ecole-des-ponts
  13. https://archive.org/details/inra
  14. https://archive.org/details/sciencespo
  15. https://archive.org/details/bibliothequeinteruniversitairedesante
  16. https://archive.org/details/bulac?tab=about
  17. https://archive.org/details/bibliotheques-ecole-normale-superieure-images?tab=about
  18. (in) Internetes archívum igényeinek előrehaladása a Google Library Initiative ellen - Antone Gonsalves, InformationWeek , 2006. december 20.
  19. (in) A nyílt könyvtár online debütál - A felsőoktatás krónikája , A vezetékes campus , 2007. július 9.
  20. (in) Stefanie Olsen, nyílt forráskódú Egy rivális Google könyvhöz - CNET , október 26, 2005
  21. (en) Maria Bustillos, "A  kiadók az internetet bíróság elé viszik  " ,2020. szeptember 10.
  22. (in) A net archívum elhallgattatja a szcientológia kritikusát - Lisa M. Bowman, CNET 2002. szeptember 24
  23. (in) Kizárások a Wayback Machine-ből - 2002. szeptember 23
  24. (a) Sherman, állítsa A visszaút gép Szcientológia [{} archiveurl Archive] szóló WebCite a 2018. július 22 - Ernest Miller, szeptember 24
  25. (in) az Internet Archívum weblapjának pillanatképei, amelyeket bizonyítékként elfogadhatónak tartanak - Lauren Gelman, 2. csomag (3) 2004. november 17.
  26. (in) Proving Internetes előzmények: Hogyan kell használni az Internet Archive - Beryl A. Howell, Journal of Internet Law 3-9 , február 2006 [PDF]
  27. (in) Jessica Dye honlap beperelték Ellentmondásos utazás az Internet Past , EContent , 28 (11): 8-9, 2005
  28. (in) Internetes archívum rendezi az öltönyt a Wayback Machine felett - Eric Bangeman, Ars Technica , 2006. augusztus 31.
  29. (in) Wrath of Deadheads standokon Web rajtaütés - Jeff Leeds és Jesse Fox Mayshark, International Herald Tribune , 1 st december 2005
  30. (in) Good News év Bocsánatkérés: GD az Internet Archive - Brewster Kahle és Matt Vernon, Élő zene Archive Forum, 1 st december 2005
  31. (in) Internet Archívum v. Shell - Lewis T. Babcock, polgári per: 06cv01726LTBCBS, 2007. február 13. [PDF]
  32. (in) Colorado nő beperli Hold Keresőrobotjai szerződésekre - Thomas Claburn, InformationWeek , március 16, 2007
  33. (in) "  Internetes archívum v. Suzanne Shell  ” ( ArchívumWikiwixArchive.isGoogle • Mi a teendő? ) - Martin Samson, a Phillips Nizer LLP-n keresztül
  34. (in) internetes archívum és Suzanne Shell egyezségi per , 2007. április 25
  35. (de) A Wayback Machine és a Google gyorsítótár - eine Verletzung deutschen Sportberrechts? , Martin Bahr, 2002. január 14, Internet-Zeitschrift für Rechtsinformatik und Informationsrecht: JurPC
  36. https://www.nextinpact.com/lebrief/46192/european-internet-archive-se-lance

Lásd is

Bibliográfia

  • (en) S. Aya, WYArms, L. Walle, B. Kot, R. Mitchell és P. Dmitriev, „Az Internet Archívum történelmi gyűjteményein alapuló kutatókönyvtár”, D-Lib magazin, 12 (2) , 4, 2006
  • (en) S. Hackett, B. Parmanto és X. Zeng, „Internetes weboldalak hozzáférhetősége idővel”, In ACM SIGACCESS Accessibility and Computing n o  77–78, ACM, 2004, pp.  32-39
  • (en) E. Jaffe, E. és S. Kirkpatrick, „Az internetes archívum architektúrája”, In Proceedings of SYSTOR 2009: The Israeli Experimental Systems Conference , ACM, 2009, p.  11.
  • (en) B. Kahle, Internetes archívum , 2012
  • (en) C. McKay, mulandó: tartós: az internetes archívum és szerepe a digitális média megőrzésében , információs technológia és könyvtárak, 23. (1), 2004., 3.
  • (en) T. Schwarz, M. Baker, S. Bassi, B. Baumgart, W. Flagg, C. van Ingen, ... és M. Shah, "Lemezhiba-vizsgálatok az internetes archívumban", In- Work-in -Progess ülés , NASA / IEEE Konferencia a tömegtárolási rendszerekről és technológiákról (MSST2006), 2006

Külső linkek