Dither (audio)

A dithering vagy a dithering egy adatjavító technikai digitális hang, amely a zaj önkéntes alkalmazásán alapszik a bemeneti jelnél, hogy lehetővé tegye a reprodukciós szinteket a kvantifikációs küszöb alatt, és a torzítást helyettesítse a zaj háttér enyhe emelkedésével , kevésbé érzékeny a fülre .

A dithering ( érdesítés ) a sztochasztikus rezonancia elvének alkalmazása a hangra . Ez vonatkozik:

Gyakran ez az egyik utolsó lépés a hang kompakt lemezről történő előállításában .

Terminológia

A zsargonban a francia digitális audio általánosan használt dither kifejezést .

Hivatalos terminológia szervezetek nem foglalkoztak árnyalást (tétovázás, tremor), abban az értelemben, hogy használják audio jel feldolgozásra.

Mario Rossi a „Kvantálási hiba dekorrelációja” kifejezést használja . Franciaországban egyes szerzők, különösen az egyetemen, a diszperziós zajt részesítik előnyben , ami a statisztikai diszperzióra utal . A kanadai szerzők követik a Kanadai Szabadalmi Hivatalt, amely "egymás melletti jelet" használ , még akkor is, ha nem (számítógépes) szűrésről van szó , ahol a pixelek valóban egymás mellé kerülnek , míg a Grand Dictionnaire terminologique du Québec a "jel de szuperpozíciót" jelzi . Egyetlen kifejezés sem olyan egyszerű és általánosan használt, mint az angol dither .

A dither , ige és köznév, angolul határozatlan izgatottságot, vagy nyugtalan határozatlanságot vált ki. Mivel az angol kifejezés metafora , itt van néhány, amely ugyanazt a szerepet töltheti be franciául, a "rezgés" (a jel rezgése, ahogy mi betonozunk, hogy tömör legyen vagy liszt legyen a szitán) és a "remegés". vagy „remegő”  : az zavarja a jelet , vagy hozzá kell aggódás, idegesség, hogy ez (és hogy ki az improduktív csend), hogy érdesíteni azt , hogy ez egy izgalmas vagy reszketni azt, hogy adjunk egy rajzás (amely kevés információt hordoz).

Az angol dither kifejezés a bombázási számológépek mechanikai építési technikájától öröklődik, a második világháború óta . A mérnökök megállapították, hogy az eszköz pontosabb, ha az oszcillátorok és az elektromágnesek "aktiválásával" okozott rezgés gyengén elmozdult részeket kavar. Ebben a használatban a dither aktiválást eredményez .

Hangjel feldolgozása

A kvantálási hiba

Hangfájl
Requantification és anélkül gond ( árnyalás )
Egy program által generált három ping (összesen 14  s .
  1. Ping kódolva 16  bit .
  2. A pinget 4 bitre igényelték,  a jel megzavarása nélkül ( nincs dither )
  3. Ping requantified 4  bit aggodalommal ( árnyalás ) TPDF
Nehéz ezeket az adathordozókat használni?

A kvantálás a bemeneti jel minden értékét a lehetséges értékek közül kiválasztott kimeneti értékhez társítja, amely kisebb, mint a lehetséges bemeneti értékek száma. Egyfajta kerekítést alkalmaznak tehát, amelynek fennmaradó részét kvantálási hibának nevezzük . Ez a hiba legfeljebb a kimeneti kvantálási lépés fele.

A hiba effektív értéke elsősorban a kimenet felbontásától függ. A jel-zaj viszony egy digitális hangjel közötti arány hatásos teljesítmény egy teljes körű szinuszhullám (0  dBFS ), és a teljesítmény a kvantálási zaj tekinteni , hogy egyenletesen elosztott fehér zaj . A n bit, akkor

vagy decibelben 6,02  n  + 1,76

amely 16 bit esetén 98 dB- t  , bitenként pedig további felbontással 6  dB-t ad  .

De a szint a teljes skála és a nulla között változik. A hiba ekkor arányosan nagyobb, amíg a jel teljesen kicserélődik, amikor az amplitúdója kisebb, mint a kvantálási lépés.

Transmission egy gyenge jel nélkül árnyalást ( vibráció ):

Vagyis az átalakítási lépés 0,4-szeresének amplitúdójú jele, amelyet egy olyan rendszer továbbít, amely a legközelebbi egész számra kerekszik:

Amikor a szint változik, a hiba így korrelál a jelrel, ez egy olyan torzítás , amelyre az emberi hallás érzékenyebb, mint az állandó véletlenszerű zajra. Gondolhatunk erre a torzításra, mint intermodulációra a mintavételi frekvenciával. A zenei audiojelben a hangszín érzékelésében fontos harmonikusok általában sokkal alacsonyabb szinten vannak, mint az alapfrekvencia . Alacsony amplitúdók esetén a kvantálási hiba nyilvánvalóan korrelál a jellel.

Ahogy Bob Katz hangmérnök összefoglalja : „Ha egy jel kvantáláson megy keresztül, az az eredeti bemeneti jel torzulását váltja ki, amely harmonikusokat, összehajtott harmonikusokat vezethet be a hallható spektrumba , a hangot, intermodulációt vagy bármilyen torzítást, nagyon nemkívánatos hatások sora, zümmögés, durvaság, durvaság, hidegség és / vagy a hang mélységének elvesztése ” .

A kvantálási hiba dekorrelációja

Helyhez kötött zaj hozzáadásával a bemeneti jelhez

gyenge jelek jelennek meg, még akkor is, ha a szintjük alacsonyabb, mint a zajszint. Megfelelő kezeléssel hallhatók és kimutathatók.

A kvantálási hiba véletlenszerűvé válik. Az így keletkező zaj kevésbé kellemetlen a fül számára, mint az egyébként kapott torzítás.

Zaj hozzáadása a jelhez a kvantálási hibakorreláció végrehajtása érdekében, amelyet a képfeldolgozásban az 1960-as években már dithering ( vibráció ) néven ismertek, az 1980-as években már bebizonyosodott a hang számára.

A jel aggodalma ( dithering ) a jel nagyságának tartományában megfelel a sávszélesség korlátozásának az időtartomány mintavételi frekvenciájának legfeljebb a felére . Ugyanolyan lényeges, mint ez a jel digitális ábrázolásának linearitása szempontjából ( Widrow, Kollár és Liu 1996 ,  355-356 . O.).

Digitális jel linearitási feltételek
terület idő jel nagysága
Sebészet mintavétel számszerűsítés
Feltétel sávszélesség korlátozása dinamikus korlátozás
Határ a mintavételi frekvencia felénél kisebb sávszélesség a jel-zaj arány kisebb, mint a felbontás fele
ha nem aliasing ( aliasing ): a mintavételi frekvenciától és a jeltől függő átlagos frekvencia háttérzaj korreláció: frekvenciák a mintavételi frekvenciától és a jeltől függően

A zaj összeadásnak két típusa van:

Mindkét esetben továbbra is meg kell választani a csillogó zaj tulajdonságait .

Téglalap alakú valószínűségi sűrűségű zajjal

Az RPDF Rectangular Probability Density Function rövidítéssel is ismert .

A véletlenszerűen vett, egyenértékű mintavételi valószínűséggel , nulla és egy kvantálási lépés közötti értéket adunk a jelhez, csökkentve egy kvantálási félminta értékével . Azt mondjuk, hogy a valószínűségi sűrűségfüggvény téglalap alakú, mert ez a gráfja alakja. Ezzel a módszerrel a hibajel dekorrelálódik a jellel, de amplitúdója nem ( Wannamaker 1997 ,  78. o. ). Valójában annak valószínűsége, hogy a kvantált eredményt befolyásolja a keverési zaj, a jel pillanatnyi értékétől függ: nulla, ha ez pontosan a kvantálási lépés közepén van, és bizonyos, hogy pontosan a lépés határán van-e. .

Kiszámítható az átlagos zajszint emelése, amely a zaj hozzáadásából adódik. Mivel definíció szerint a kvantálási hibától független és azonos amplitúdójú jelről van szó, hozzáadódik a teljesítményük, ami 3 dB-es háttérzajszint-emelkedést eredményez  (lásd Decibel ).

Háromszög valószínűségi sűrűségű zajjal

A TPDF ( háromszög valószínűségi sűrűségfüggvény ) rövidítéssel is ismert .

A véletlenszerűen vett egyenértékű rajzolási valószínűséggel nulla és egy kvantálási lépés közötti értéket kétszer hozzáadjuk a jelhez, csökkentve egy kvantálási lépés értékével . Ez egyenértékű két egymást követő RPDF zaj alkalmazással. Az így kapott valószínűségi sűrűségfüggvény háromszög alakú  ; Így van egy nyolcas esély arra, hogy a jel 0,5-1 kvantálási lépés között csökken, annyi esély van, hogy 0,5 és 1 kvantálási lépés között növeli, és négyből három esély van arra, hogy 0,5-nél kevesebb kvantálási lépéssel növelje vagy csökkentse .

Az ilyen típusú jel általi keverés az, amely a legkevésbé növeli a zaj effektív értékét , miközben kiküszöböli a zaj torzulásait és modulációit, amelyek korrelálnak a bemeneti jellel ( Wannamaker 1997 ,  80. o. ). Mivel ez egyenértékű azzal, hogy a kvantálási hibától független jelet kétszer adunk hozzá, és ugyanolyan amplitúdóval bír, hozzáadják az erejüket, ami 4,8 dB-es háttérzajszint-emelkedést eredményez  (lásd Decibel ).

A TPDF keverést az AES javasolja a digitális mérőműszerekhez.

Gauss zajjal

A Gauss-zaj egyenértékű az RPDF-zaj sokszoros alkalmazásával. Az eredményül kapott valószínűségi sűrűségfüggvény harang alakú vagy Gauss-görbe , amely jellemző az analóg források, például a mikro előerősítői által előállított habozásra ( érdesség ) . Ha egy felvétel bitmélysége elég nagy, akkor az analóg -digitális átalakító bemenetén található analóg zaj elegendő lesz a felvétel aggasztásához ( eldobásához ). Egyébként, mivel a jelben mindenképpen van ilyen típusú zaj, a TPDF zaj hozzáadása nem adja meg a várt elméleti eredményeket. Ezért hozzáadjuk a Gauss-zajokat.

A Gauss-zaj hozzáadásával az átlagos zajszint emelkedése 6  dB . Arra lehet következtetni, hogy a forrás egy háttérzaj szintjét a -92  dBFS kiválóan alkalmas 16 bites kvantálás  . Ha az ember felveszi a háttérzajt a felvevő helyiség zajába, akkor ez a feltétel gyakorlatilag mindig teljesül. Az alacsonyabb zajszint vagy kvantálást jelent több bitrel, vagy aggodalmi zaj hozzáadását ( dither ).

Színes zajjal

Lipshitz és Vanderkooy kimutatták, hogy a spektrális sűrűségben különbözõ zajok eltérõen viselkednek, ha a jelet " csillapítják " . A hangjelek kvantálásának linearizálásához a lehető legcsendesebbnek modellezett zajt javasolták.

A színes zaj a kiszűrt fehér zaj . A dithering ( nagyolás ) algoritmusok olyan hangokat használnak, amelyek több energiát tartalmaznak a magas frekvenciákon annak érdekében, hogy csökkentse azt az audiosávban, ahol a fül a legérzékenyebb (lásd izoszonika görbe ).

Zaj alakítással ( zaj alakítás )

A zaj alakítás ( zaj alakítás  (be) ) hozzáadta a jel aggodalmának alapdiagramjához a szűrővel ellátott visszacsatolási hurok elleni zajt (és hallgatólagosan késleltetést, hogy a hiba a belépés után ne szűnjön meg azonnal) . Ily módon a feldolgozás modellezi a zaj spektrális eloszlását a kvantálási hibán. A szűrőt úgy számolják, hogy a zaj energiája főleg a kevésbé hallható frekvenciákban található meg. Az észlelt zaj négy bit további felbontással egyenértékű csökkentése érhető el a szokásos dithering mellett .

Ha önmagában a visszacsatolási hurokot használjuk (η ( t ) = 0 zajjal), akkor a kvantálási zaj korrelált marad a jelhez, még akkor is, ha spektruma kevésbé érzékeny területre tolódik. Az is lehetséges, hogy a szűrő zaj hiányában torzítást generál per ciklusonként . A zajformálás tehát lényegében kiegészíti a jel által zaj által okozott aggodalmat ( dithering ).

Az audio sávszélesség kétszeresét meghaladó mintavételi frekvenciával (88,2  kHz vagy 96  kHz ) a zajalakítás képes a kvantálási hibákból és a zajjelek keveréséből ( dithering ) eredő zajteljesítmény legnagyobb részét átvinni a hallható sávon kívül.

használat

A ditheringet ( érdesítést ) minden analóg-digitális átalakítás és bármilyen újrakvantálás előtt fel kell használni a bemeneti jel kvantálási zajának korrelációjának megszüntetésére és a ( torzulás ) miatti e folyamatban rejlő nem-linearitás kompenzálására ; kevesebb a kimeneti jel mintánként biteket tartalmaz, és a ditheringnek ( érdesítésnek ) hatékonynak kell lennie. Bármely folyamat így csökkenteni a meghatározás (bitek) a minták hozzá kell árnyalás ( borzongás ) a görbe.

Meg kell azonban jegyezni, hogy a hangminőségnek ezt az gondos gondozását "perspektívában kell hagyni ". Ha a keverék nem jó, vagy a zene nem működik, valószínűleg a jel ditherje egyáltalán nem számít. Ha a projektben minden más rendben van, és a legjobb hangminőséget szeretnénk elérni, akkor a megfelelő dither nagyon fontos ” .

Hidegrázás ( dither ) és szűrők

Az árnyalást ( aggodalom ) a jel szükséges bizonyos digitális szűrők . A digitális szűrő úgy működik, hogy a jelet impulzusválasszal konvertálja ; hogy a kellően gyors feldolgozást lehetővé tegyék, a szűrők rekurziót alkalmazhatnak , és ezáltal műveleteket érhetnek el a kvantálási lépéssel azonos nagyságrendű jelrészeken. Ezen a szinten nem tekinthetjük úgy, hogy a kvantálás lépcsője lineáris rámpa .

A zajértékkel történő keverés leküzdi ezt a nemlinearitást.

Milyen gond ( árnyalás ) használjak?

Függelékek

Bibliográfia

Kapcsolódó cikkek

Külső linkek

Megjegyzések és hivatkozások

  1. Nemzetközi Elektrotechnikai Bizottság , „  Nemzetközi Elektrotechnikai Szójegyzék 723-10-80  ” .
  2. Mario Rossi , Audio , Lausanne, Presses Polytechniques et Universitaires Romandes,2007, 1 st  ed. , P.  639.
  3. Caroline A. Traube és Olivier Bélanger , Hangok elemzése, szintézise és feldolgozása , Strasbourgi Zeneművészeti Főiskola,2011( online olvasható ) , p.  20; Analóg eszközök , „  Delta-sigma modulátor zajcsillapítással  ” ,2013(megtekintve : 2020. február 25. ) .
  4. Kanadai Szellemi Tulajdoni Hivatal: CA 2371535
    (54) igénypont angol nyelvű leírása : Módszer és készülék ditheringre
    (54) Francia cím: Folyamat és eszköz egymás mellé
    állításra A 2715393 igénypont a képre vonatkozik, de az érdekes "Stochastic juxtaposition" kifejezést használja .
  5. GDTQ: dither megtekintve: 2012. április 20.
  6. Európai Szabadalmi Hivatal, EP2425534 - Eljárás és készülék többbites sigma-delta analóg-digitális átalakítókban való dithering = Módszer és készülék analóg-digitális átalakítókba való dithering, multi-bit sigma-delta.
  7. Michel Fleutry , Angol-francia elektronika enciklopédikus szótára , A szótár háza,1991( ISBN  2-85608-043-X ) , p.  219.
  8. A jelet 8 bit kódolja  (256 lehetséges érték). A requantified változat árnyalás , a zaj, a TPDF típusát. A kvantálási hiba jelet nyolcadik rendű Butterworth szűrő dolgozza fel 20  kHz-es cutoff frekvenciával .
  9. A kvantálási zaj megbeszélését lásd (in) Bernard Widrow Kollár István , Kvantálási zaj: fordulóhiba a digitális számításban, a jelfeldolgozásban, az irányításban és a kommunikációban , Cambridge, Egyesült Királyság, Cambridge University Press,2008, 778  p. ( online olvasás ).
  10. Ez egy abszolút határ, az optimális teljesítményt nagyobb zajjal érik el; ez a cikk tárgya. Mario Rossi , Audio , Lausanne, Presses Polytechniques et Universitaires Romandes,2007, 1 st  ed. , P.  637.
  11. Ha egy jel kvantált, ez az eredeti bemeneti jelhez kapcsolódó torzítást eredményez, amely harmonikusokat, alacsonyabb frekvenciákra elcsúszott harmonikusokat (lásd 20. fejezet), intermodulációt vagy bármilyen nagyon nemkívánatos torzítás-halmazot vezethet be, amelyet zümmögés, zordság, durvaság, hidegség és / vagy a hang mélységének elvesztése. (en) Bob Katz , A hang elsajátítása: A művészet és a tudomány , New York, Focal Press,2007, 2 nd  ed. , 334  p. ( ISBN  978-0-240-80837-6 ) , p.  53.
  12. (in) John Vanderkooy és Stanley Lipshitz , "  Audio Digital árnyalás  " , Journal of Audio Engineerig Society , vol.  35,1987.
  13. (en) John Watkinson , Convergence in Broadcast and Communications Media: Az audio-, video-, adatfeldolgozási és kommunikációs technológiák alapjai , Focal Press,2001, P.  163-164.
  14. AES17-1998 (r2004) „  Az AES17-1991 AES szabványos módszerének felülvizsgálata a digitális audiotechnikához - Digitális audio berendezések mérése.  " .
  15. (in) Stanley P. Lipshitz John Vanderkooy és Robert A. Wannamaker , Minimálisan Hallható zajhatárolású  " , Journal of Audio Engineering Society , vol.  36, n o  11, 1991. november, P.  836–852 ( online olvasás ).
  16. (a) Stanley P. Lipshitz John Vanderkooy és Robert A. Wannamaker , Audio Digital árnyalás  " , Journal of Audio Engineering Society , vol.  35, n o  12, 1987. december, P.  966–975 ( online olvasás ).
  17. (in) Michael A. Gerzon Peter Craven , Robert Stuart és Rhonda Wilson , "  pszicho-Noise Shaped javítása CD Lineáris és más digitális média: Nyomdaipari 3501  " , 94. Egyezmény az Audio Engineering Society , Berlin, AES,1993. március( online olvasás ).
  18. Ha a keverék nem jó, vagy a zene nem működik, akkor a dither valószínűleg egyáltalán nem számít sokat. De ha egy projektben minden más rendben van, és meg akarjuk tartani a hangminőséget, akkor a megfelelő dithering nagyon fontos. ( Katz 2007 ,  53. o. ).