A szkennelés az átalakítása információk a tartó (szöveg, kép, hang, videó), vagy egy elektromos jel az adatok digitális eszközökként számítógép vagy digitális elektronika lehet kezelni. A numerikus adatok meghatározása az információkat ábrázoló karakterek és számok sorozataként történik . Néha használja a francia kifejezést digitalizálás ( digit értelmében ábra az angol ).
A szkennelés az archívum adminisztrációja keretében a számítógépes fájlok tömeges konvertálása.
A digitalizálás egy tárgy diszkrét ábrázolását hozza létre, véges számú jel gyűjteményeként, amelyek az érvényes jelek megszámlálható halmazából származnak .
szövegek digitalizálása:A szöveg digitalizálása az írásbeli nyelven létező karakterek listájából átvett karakterek sorozatává alakítása, mivel egy diktátum a beszéd hangjait az írott nyelv szótárában létező szavak sorozatává alakítja.
képek beolvasása:A kép digitalizálása utasítássorozattá alakítja, amely lehetővé teszi rekonstrukcióját. Ezek az utasítások tartalmazhatják az egyes elemek ( pixelek ) vizuális érzékelésének tömbjét, vagy bonyolultabb felépítésűek lehetnek ( tömörített kép , vektorgrafika ).
Hacsak a digitális adatokat nem közvetlenül az emberek állítják elő (ezt nevezik adatbevitelnek ), a digitalizálás általában legalább három fázist foglal magában:
Ez a három szakasz gyakran bonyolultabb műveleteket követ, lehetővé téve a hatékonyabb kódolást. Különösen érvényes ez a képek digitális fényképezőgépekben történő digitalizálására és a szövegek digitalizálására ( Djvu formátum , optikai karakterfelismerés ).
Néha a digitalizálás más formákat ölthet.
a hőmérséklet beolvasása adatgyűjtővel ( adatgyűjtő ):A hőmérséklet az idő múlásával lassan változik . A digitalizálás naplót hoz létre evolúciójáról:
A hőmérséklet-kerekítés minden változásakor rögzítik az új hőmérsékletet, valamint a dátumot és az időt.
Az adatgyűjtő automatikusan elvégzi ezeket a műveleteket, először átalakítva a két dimenziót, a hőmérsékletet és az időt elektromos jelekké . Az eredményt egy kódba rögzíti, amelyet más számítástechnikai eszközök kihasználhatnak.
A legtöbb esetben azonban rendszeres lépéseket alkalmaznak, és az objektumot leíró mennyiségek egyikét a többiek növekedésével mérik . Így véges számú adatot kapunk.
Mintavételnek nevezzük azt a műveletet, hogy egy mennyiség minden egyes növekményéhez értéket veszünk fel . A térbeli mintavétel során az ember egy hossz mentén diszkretizál , például úgy, hogy milliméterenként tized milliméterenként megkap egy fényességi értéket minden térbeli tengelyen . Időbeli mintavétel során diszkretizálni fogjuk az idő lefolyását, például úgy, hogy minden egyes mikroszekundumon veszünk egy értéket.
Az egyik érték kerekítésének műveletét, amelyet egy véges listából vettünk, kvantálásnak nevezzük .
Ennek eredménye a digitalizálás sorozata értékek mennyiségét képviselő mentén mért választott tengelyek, a szokásos sorrendben, amely lehetővé teszi, hogy helyreállítsa az összes méreteit minden egyes eleme a tárgy.
Annak érdekében, hogy a digitalizált adatok hűen képviseljék a kezdeti mennyiségeket, mindig feltételeznünk kell az ábrázolandó jelet.
Ha csak a sávszélessége és a jel-zaj arány ismert , az információelmélet meghatározza a digitális átvitelt . A mintavételi tétel javasol egy minimális mintavételi frekvenciát olyan kvantálással , hogy a kvantálási zaj a háttérzajjal összehasonlítható szintű legyen. A zaj független a jeltől dekorrelációval ( dithering ) . A frekvencia és a kvantálási skála több kombinációja képes megfelelően leírni ugyanazt a jelet.
A reprezentálandó mennyiségek pontosabb ismeretében kevesebb mintát lehet felhasználni a tömörített felvételi módszereknek köszönhetően .
A digitalizálás alapelve azt jelenti, hogy a felhasználó (általában egy gép) ismeri azokat a konvenciókat, amelyek lehetővé teszik a képviselt tárgy helyreállítását. Ezeket a konvenciókat adatformátumnak nevezzük . Az információk digitalizálása elválaszthatatlanul magában foglalja
Az objektum csak akkor rekonstruálható, ha a számítógép gépének mindkét összetevője van a memóriában. Ha hiányzik a fájlból vagy adatfolyamból álló algoritmus a gépből, akkor nem tudjuk felhasználni az adatokat, és kompatibilitási problémáról beszélünk .
A formátumok nagyon egyszerűek lehetnek, mint például az egydimenziós jel digitalizálásának nyers folyama esetén, ahol a minták megszakítás nélkül követik egymást, és ahol elegendő tudni a méretüket, a numerikus kódolást és a sebességet. a jel rekonstrukciójához, vagy bonyolultabb, mint a dokumentumok vektorleíró formátumai esetében.
Az adattömörítési technikák lehetővé teszik a fájlok méretének vagy az adatfolyamok sebességének csökkentését. Ebben az esetben az információ változatlan része (a formátum) növekszik és bonyolultabbá válik. Ha az ezen fájlok vagy adatfolyamok által ábrázolt dokumentumot terjeszteni kívánják, akkor olyan formátumra törekednek, hogy az egyes állomásokon végrehajtott dekódolás kevésbé bonyolult legyen, mint a kódolás, amelyet csak egyszer hajtanak végre.
A digitalizálási folyamatok a digitalizálandó információk fizikai jellegétől függően különböznek:
Idővel változó mennyiség, például hang digitalizálása :
A kép digitalizálásához a magasság és a szélesség diszkretizálásra kerül, és a fényszinteket minden pontra konvertálják, globálisan vagy minden egyes alapszínre. Az űrmintavételezés három különböző módon történik:
Ezek az eljárások a fekete-fehér reprodukcióra vonatkoznak. A színvisszaadáshoz a három alapszín mindegyikéhez meg kell adni az értékeket. Vagy felosztjuk a kép fénysugarát a három alapszínnek megfelelő három részre, vagy szűrőket helyezünk az egyes érzékelők elé a színek váltakozásával, és a digitális átalakítás után interpolációval haladunk a szín kiértékeléséhez pixel. Általában más folyamatok kompenzálják a nyers kép hiányosságait.
Egy idővel változó kép digitalizálása egyesíti a két folyamatcsaládot. Mozgó kép ( videó ), digitális fényképezőgép , digitális videokamera , webkamera beolvasása , mintaidő és kép digitalizálása minden alkalommal (például 40 milliszekundumonként képpel). Ezután az adatfolyam sebességcsökkentési folyamaton megy keresztül.
Digitálható egy analóg videojel, akár ennek az elektromos jelnek a nyers átalakításával, akár az idő diszkretizálási információinak részben vagy egészben történő rekonstruálásával a függőleges szinkronjelekből (keretekből) és a térből a vízszintes szinkronizációs jelekből ( vonalak).
A szöveg digitalizálásához vagy emberi kezelő írja be a szöveget , vagy a dokumentumot képpé digitalizálják azáltal, hogy erre az első adatsorra optikai karakterfelismerő programot alkalmaznak, amelyet esetleg automatikus vagy kézi ellenőrzések egészítenek ki.
A számítógépes rendszerek lehetővé teszik:
A rendelkezésre álló spektrum maximális kihasználtsága érdekében feldolgozott digitális adatok továbbítása kevesebb sávszélességet igényel az átviteli csatornákon, mint analóg megfelelőjük.
Cserébe a digitalizálás, a számítások vagy az újrakódolás során elhanyagolt vagy elveszett információk elvesznek a későbbi felhasználók számára.
Speciális alkatrészek biztosítják az átalakítók által eredetileg előállított analóg jel ( fényérzékeny cella , hőmérő , mikrofon , rádióvevő stb.) Digitális rendszerré történő átalakítását .
Az A / D átalakítás lánc ( analóg a digitális ) lehet bontani funkciók és áramkörök be elemek:
A digitalizálás pontossága a jel kvantálásának minőségétől és az óra stabilitásától függ.
A multiplexer (MuX) átalakulhat diszkrét, analóg vagy digitális jelek sorozatává, független jelekké, amelyek párhuzamosan érik el (több bemenet, de csak egy kimenet).
A számos digitalizálási projekt következményeként az elektronikus tartalom archiválása az elektronikus tartalmak gyűjtésére, azonosítására, kiválasztására, osztályozására és biztonságos adathordozón történő tárolására irányuló tevékenységek, eszközök és módszerek összességén alapul, felhasználásuk céljára. idővel hozzáférhetővé tegye őket. Az archiválást meg kell különböztetni a tárolástól és a biztonsági mentéstől .
A digitalizálást és az archiválást ötvöző projektek célja számos. Az elektronikus dokumentumkezelés, valamint az információ- és könyvtártudományok területén számos funkciót látnak el:
A digitalizálás az egyik szempont annak, amit néha helytelenül dematerializációnak neveznek . Tagadhatatlanul ez az egyik alapvető lépés minden olyan projektben, amelynek célja a bejövő dokumentumok és levelek kezelésének optimalizálása, amelyeket a vállalatok és a közigazgatás még mindig széles körben fogad papíron.
Az elektronikus adatok mennyiségének robbanása óhatatlanul arra késztette a szervezeteket, hogy az egész életciklusuk során fontolóra vegyék az elektronikus tartalmat, amíg archiválják vagy el is pusztítják őket.
A francia vállalatoknak és a közigazgatásoknak a próbaidős hivatás fogalmát is be kell építeniük archiválási projektjeikbe annak érdekében, hogy bizonyos elektronikus tartalmak időbeli integritását és eredetének valódiságát igazolják (az előírt követelményeknek megfelelően). például bizonyos szakmákra vagy tevékenységi ágazatokra vonatkozó rendeletek). A próbaidő céljából archiválás útján kiemelt fontosságú elektronikus dokumentumok tehát számlák, ügyfelek vagy szállítók, fizetési bizonylatok vagy elektronikus levelezés.
A 2000-es évektől számtalan műveletet indítottak a kulturális örökség különböző elemeinek digitalizálására a világ minden tájáról. Ezek között több nagyon nagyszabású projekt is létezik.
"Nyílt Tartalmi Szövetség" (OCA)Az OCA konzorcium egy amerikai egyesület, amely olyan magánvállalkozásokat tömörít, mint a Yahoo! , Adobe , HP , Internetes archívum , könyvtárak (BU California, BU Toronto), archívumok és kiadók. A2005. október 25, A Microsoft csatlakozott ehhez a csoporthoz.
Az OCA célja egy mindenki számára elérhető, évelő és többnyelvű adatbázis digitalizálása és online elérhetővé tétele (multimédiás dokumentumokból álló adatbázis). A Google Könyvkeresővel ellentétben azonban csak a szerzői jogoktól mentes örökségi alapokat veszi figyelembe . A digitalizálás nem történik a jogtulajdonosok engedélye nélkül . Ez utóbbi hozzájárulhat a projekthez azáltal, hogy meghatározza a terjesztés körét a lehetséges korlátozásokkal.
Google KönyvkeresőBejelentve 2004. december 14a Google társaság társalapítói által a " Google Print " program felelős 15 millió könyv digitalizálásáért, ami Jean-Noël Jeanneney , a Francia Nemzeti Könyvtár akkori elnöke szerint 6 év alatt 4,5 milliárd oldalt jelent . Öt könyvtárak megállapodtak abban, hogy digitalizálja alapok: a könyvtárak a Harvard Egyetem , a University of Michigan és a Stanford Egyetem , a New York Public Library és a Bodleian Library of Oxford University . A Google Print hivatalosan 2005 novemberében indult a nyilvánosság számára hozzáférhető digitalizált könyvek gyűjteményével és a projekt partnereitől. November közepén a „Google Könyvkereső” (francia nyelven „Google Könyvkereső”) nevet kapta. Új megállapodásokat kötöttek a Google és más egyetemek e digitális könyvtár gazdagítása érdekében.
Az Európai Digitális KönyvtárA 2005. január 22, a Francia Nemzeti Könyvtár elnöke , Jean-Noël Jeanneney a Le Monde című napilapban felhívást intéz a Google kezdeményezésére. 2005. április végén 19 ország, majd hat európai állam- és kormányfő nemzeti könyvtára európai együttműködést szorgalmazott egy európai digitális könyvtár ( Europeana ) létrehozása érdekében. Egy évvel később megnyílik az Európai Könyvtár , a BNE többnyelvű portálja.
2016-ban az Europeana 5300 digitalizált dokumentumhoz nyújt hozzáférést 3300 európai intézménytől. A következő évben az Európai Bizottság megbízásából készült tanulmány azt mutatja, hogy az Europeana-val havonta 700 000 alkalommal konzultálnak.