Akusztikus lábnyom
Az akusztikus ujjlenyomat egy audiojelből létrehozott digitális összefoglaló . Ez az ujjlenyomat lehetővé teszi egy hangminta azonosítását, vagy egy hangsorrend felkutatását egy audio adatbázisban.
A gyakorlati felhasználás sokrétű, például dalok, felvételek, dallamok, reklámok, rádióadások, hanghatások vagy videofelvételek azonosítása.
Jellemzők
Az akusztikus lábnyomnak több feltételnek kell megfelelnie.
Sajátosság
A lenyomatnak elég pontosnak kell lennie, hogy két nagyon különböző hang ne legyen azonos.
Robusztus a torzításokhoz
Az akusztikus ujjlenyomat-algoritmusnak figyelembe kell vennie a hang hallható tulajdonságait. Ha az emberi fül két mintát azonosnak érzékel, akkor a lábnyomuknak egyenlőnek vagy nagyon közelinek kell lennie, még akkor is, ha numerikus ábrázolásuk nagyon eltérő. Mint ilyen, az akusztikus ujjlenyomatok a fogalom szokásos értelmében nem ujjlenyomatok. A legtöbb hangtömörítési technika ( MP3 , WMA , OGG ) jelentős változásokat eredményez az audiofájl bináris kódolásában, anélkül, hogy befolyásolná annak megtekintését. A jó akusztikus ujjlenyomat-algoritmus lehetővé teszi a felvétel azonosítását még azután is, hogy ilyen tömörítésen esett át. A sebesség enyhe változása vagy enyhe zaj szintén nem változtathatja meg túlságosan a lábnyomot.
Hatékonyság
A felhasználáshoz a lábnyomnak könnyen kiszámíthatónak kell lennie, azaz kicsi az idő bonyolultsága és könnyen tárolható, azaz kompakt, rövid.
Végrehajtások
-
Az AMG LASSO egy kereskedelmi elismerési szolgáltatás, amelyet az All Media Guide indított el 2004-ben.
-
Az Audible Magic Corporation egy kereskedelmi szerzői jogi azonosító és -kezelő szolgáltatás.
- Az AudioID a Fraunhofer kereskedelmi technológiája az automatikus akusztikai felismeréshez.
-
A LazyTune egy olyan keresőmotor, amely akusztikus ujjlenyomatokat használ fel az audiofájlok felismerésére.
-
A Gracenote MusicID egy olyan kereskedelmi termék, amely akusztikus ujjlenyomat-technikákat alkalmaz a dalok azonosítására (többek között).
-
A Winamp 5.5-ös verziója a Gracenote-ot használja a "Nullsoft Playlist Generator" pluginnel.
-
A Foosic egy ingyenes nyílt forráskódú projekt, amely saját ujjlenyomat-technológiáját használja.
-
A SoundHound ( korábban Midomi ) egy online kereskedelmi szolgáltatás, amely képes felismerni két zenei minta egyenértékűségét, vagy azonosítani tud egy dalt, amelyet a felhasználó a számítógépének mikrofonjába énekel vagy suttog.
-
A MusicBrainz egy ingyenes nyílt forráskódú zenei adatbázis-projekt.
-
Shazam egy akusztikus ujjlenyomat-szolgáltatás a dalok mobiltelefonon történő azonosításához.
Lásd is
Megjegyzések és hivatkozások
-
Pedro Cano, Eloi Batlle, Ton Kalker és Jaap Haitsma, „Az audio ujjlenyomat-készítés algoritmusainak áttekintése” , a multimédia jelfeldolgozás nemzetközi műhelyében, az Egyesült Államok Virgin-szigetei , 2002. december) ( online olvasható )
.