Mozgásbecslés

A mozgásbecslés vagy a mozgásbecslés (in) egy olyan folyamat, amelynek során az objektumok elmozdulását tanulmányozzuk egy videoszekvenciában, és két egymást követő kép összefüggését keressük a tartalmi helyzet változásának előrejelzésére. A mozgás rosszul felvetett probléma a videóban, mivel háromdimenziós kontextust ír le, míg a képek 3D jelenetek vetületét jelentik 2D síkban. Általában egy mozgásvektor képviseli, amely leírja az egyik kétdimenziós képből a másikba történő átalakulást. A mozgásvektorok két blokkot kapcsolnak össze azzal, hogy a blokkokat ugyanarra a képre vetítik, vagyis a vektor koordinátáit csak térbeli korlátok nélkül határozzák meg. A szóban forgó blokkok algoritmustól függően különböznek: az egész kép összekapcsolható a vektorral, ahogyan ez a globális mozgásbecslés esetében történik, vagy csak a kép bizonyos részei, például téglalap alakú blokkok, tetszőleges alakzatok vagy akár pixelenként . A vektorokat hagyományos modell vagy sok más modell képviselheti, amelyek közelíthetik a valódi videokamera mozgását , például a forgatást és a fordítást három dimenzióban, a zoom elfelejtése nélkül . Ezt az előrejelzési technikát főleg a videotömörítésben , a robotikában és a képfeldolgozásban használják . A mozgásbecslésnek számos módszere létezik, a legismertebbek a Block-Matching és az Optical Flow .

Alkalmazási területek

A videotömörítésben a mozgásbecslés része az előrejelzési folyamatnak, amely megpróbálja kihasználni a korábban kódolt képek időbeli redundanciáját a mozgás előrejelzésére, és ezáltal az adatok hatékonyabb tömörítésére, mint a térbeli előrejelzésre . Technikailag az algoritmus úgynevezett referenciaképben keresi a forráskép blokkjához hasonló blokkot, és rögzíti az őket összekötő mozgásvektort annak kódolása érdekében. A mozgás becslés követi mozgás kompenzáció , amely célja, hogy a mozgás a vektorok a képet annak érdekében, hogy szintetizálja az átalakulás a következő képet. Más szavakkal, a vektorok által megcélzott blokkok által meghatározott kép általában nem azonos a forrásképpel. Kép dekódolásához meg kell állapítani a megcélzott blokkok és a forrás blokkok közötti különbséget, és kódolni kell. Számos videostandardban van jelen, beleértve az MPEG-1 , MPEG-2 és MPEG-4, valamint számos videokodekben .

A mozgásbecslést képfeldolgozásra is használják, hogy megcélozzák az objektumokat és pontosabban meghatározzák azok körvonalát. Ez főleg a kép szegmentálási és szűrési technikáihoz kapcsolódik .

A robotikában ez a folyamat lehetővé teszi az objektumok elmozdulásának vagy helyzetének megjóslását annak érdekében, hogy javuljon a modell és a külső környezet közötti kölcsönhatás.

Meglévő algoritmusok

A mozgásvektorok keresésének algoritmusai két kategóriában határozhatók meg: az úgynevezett direkt pixel alapú és az úgynevezett közvetett tartalom alapú módszerek .

Közvetlen módszerek

Optikai áramlás

A mozgásbecsléshez legközelebb álló technikát optikai áramlásnak nevezzük , amelynek vektorai megfelelnek a pixel szinten észlelt mozgásnak. A mozgásbecslés során nem szükséges a képpontok helyzetének pontos megfeleltetése az egyes képekben.

Blokkillesztés

A Block-Matching algoritmus egy olyan korrelációs módszer, amely azt a blokkot keresi, amely a referenciaképben leginkább hasonlít az aktuális blokkra. Az aktuális kép nem átfedő, azonos méretű blokkokra van felosztva, amelyek független blokkoknak tekinthetők, ahol az egyes blokkokat alkotó pixelek azonos mozgási üteműek. Az alkalmazás általában a keresési ablakra korlátozódik, amely az aktuális blokk körül húzódik, a hardver teljesítménye miatt. A hasonló blokkok közül a legjobb meghatározásához az algoritmus összehasonlítja a forrásblokk és a többi blokk közötti különbséget olyan minőségi kritérium alapján, mint az SAD, és megtartja a célzott blokkot, amely minimalizálja ezt a szabályt.

Egyéb technikák Értékelési intézkedések

A blokk legjobb mozgásvektorának értékeléséhez számos értékelési kritérium létezik a közvetlen módszerekhez:

Közvetett módszerek

A közvetett módszerek olyan tartalmat használnak, mint a Harris detektor, és hasonló tartalmat találnak az egyes képkockák között, gyakran statisztikai funkcióval, amelyet globális vagy lokális területen alkalmaznak. Ennek a funkciónak az a célja, hogy eltávolítsa azokat a zónákat, amelyek nem felelnek meg az aktuális mozgásnak. A RANSAC módszerekben statisztikai függvényeket is használnak .

Megjegyzések és hivatkozások

  1. (in) PHS Torr és A. Zisserman , "  Feature Based Methods for Structure and Motion Estimation  " [PDF] az ox.ac.uk webhelyen (hozzáférés: 2011. január 26. )
  2. (in) Mr. Irani és P. Anandan, "  All About Direct Methods  " [PDF] a wisc.edu webhelyen (hozzáférés: 2011. január 26. )

Függelékek

Források

  • (en) EG Richardson, H.264 és MPEG-4 videotömörítés: Videokódolás a következő generációs multimédiához , Chichester, John Wiley & Sons Ltd.,2003. szeptember( ISBN  0-470-84837-5 )

Kapcsolódó cikkek