Részecske szűrő

A részecske szűrők , más néven a módszerek Monte Carlo szekvenciális , kifinomult technikák becslésére a modellek alapján szimuláció .

A részecskeszűrőket általában a bayesi hálózatok becslésére használják, és ezek olyan on-line módszereket alkotnak, amelyek analógak a Markov-láncok Monte-Carlo módszereivel, amelyek „off-line” módszerek (tehát a posteriori ) és gyakran hasonlóak a preferenciális mintavételi módszerekhez .

Helyes tervezés esetén a részecskeszűrők gyorsabbak lehetnek, mint a Monte Carlo Markov lánc módszerek. Gyakran alternatívát jelentenek a kiterjesztett Kalman-szűrőknek azzal az előnnyel, hogy elegendő mintával megközelítik az optimális Bayes-becslést. Ezért pontosabbak lehetnek, mint a Kalman-szűrők. A megközelítések Kalman-szűrővel is kombinálhatók, mint eloszlási javaslat a részecskeszűrőhöz.

Cél

A cél a részecske szűrő felbecsülni a hátsó sűrűsége az állapotváltozók figyelembe véve a megfigyelési változók. A részecskeszűrőt egy rejtett Markov-modellhez tervezték , ahol a rendszer rejtett és megfigyelhető változókból áll. A megfigyelhető változókat (megfigyelési folyamat) egy ismert funkcionális forma kapcsolja össze a rejtett változókkal (állapot-folyamat). Hasonlóképpen, az állapotváltozók evolúcióját leíró dinamikus rendszer is valószínűségi módon ismert.

Egy általános részecskeszűrő megbecsüli a rejtett állapotok hátsó eloszlását a megfigyelési mérési módszer segítségével. Vegyünk egy állapotteret, amelyet az alábbi ábra mutat

${\ displaystyle {\ begin {mátrix} X_ {0} & \ longrightarrow & X_ {1} & \ longrightarrow & X_ {2} & \ longrightarrow & X_ {3} & \ longrightarrow & ... & signal \\\ downarrow && \ downarrow && \ downarrow && ... \\ Y_ {0} && Y_ {1} && Y_ {2} && Y_ {3} && ... & megfigyelés \ end {mátrix}}}$

A szűrési probléma abból áll, hogy a rejtett állapotok értékeit bármely szakaszban egymás után becsüljük meg , figyelembe véve a megfigyelési folyamat értékeit . $X_ {k}$ ${\ displaystyle Y_ {0}, ..., Y_ {k}}$ $k$

A hátsó sűrűség összes bayesi becslése következik . A részecskeszűrő módszertan ezen feltételes valószínűségek közelítését biztosítja egy genetikai típusú algoritmushoz kapcsolódó empirikus mérés segítségével. Másrészt Markov vagy a fontossági láncok által végzett Monte-Carlo módszer mintavételi megközelítés modellezné a teljes hátulról . $X_ {k}$ ${\ displaystyle p (x_ {k} \ y y {0}, y_ {1}, ..., y_ {k})}$ ${\ displaystyle p (x_ {0}, x_ {1}, ..., x_ {k} \ y y {0}, y_ {1}, ..., y_ {k})}$

A jelmegfigyelési modell

A részecskemódszerek gyakran feltételezik, hogy a megfigyelések ebben a formában modellezhetők: $X_ {k}$ ${\ displaystyle Y_ {k}}$

${\ displaystyle X_ {0}, X_ {1}, ...}$ egy Markov-folyamat a (néhány ), amely fejlődik szerint sűrűsége átmeneti valószínűség . Ezt a modellt gyakran szintetikusan is írják ${\ displaystyle \ mathbb {R} ^ {d_ {x}}}$ ${\ displaystyle d_ {x} \ geqslant 1}$ ${\ displaystyle p (x_ {k} | x_ {k-1})}$ ${\ displaystyle X_ {k} | X_ {k-1} = x_ {k} \ sim p (x_ {k} | x_ {k-1})}$ Kezdeti valószínűségi sűrűséggel . ${\ displaystyle p (x_ {0})}$
A megfigyelések egy bizonyos állapottérben (egyesek számára ) értékeket feltételesen függetlenek, feltéve, hogy ismertek. Más szavakkal, mindegyik csak attól függ . Feltételezzük továbbá, hogy egy adott feltételes eloszlás abszolút folyamatos, és szintetikusan meg is van ${\ displaystyle Y_ {0}, Y_ {1}, \ cdots}$ ${\ displaystyle \ mathbb {R} ^ {d_ {y}}}$ ${\ displaystyle d_ {y} \ geqslant 1}$ ${\ displaystyle X_ {0}, X_ {1}, \ cdots}$ ${\ displaystyle Y_ {k}}$ ${\ displaystyle X_ {k}}$ ${\ displaystyle Y_ {k}}$ ${\ displaystyle X_ {k} = x_ {k}}$ ${\ displaystyle Y_ {k} | X_ {k} = y_ {k} \ sim p (y_ {k} | x_ {k})}$

Az ilyen tulajdonságokkal rendelkező rendszerre példa:

{\ displaystyle X_ {k} = g (X_ {k-1}) + W_ {k}}

{\ displaystyle Y_ {k} = h (X_ {k}) + V_ {k}}

Ahol a kettő és egymástól független szekvencia az s valószínűségi sűrűségfüggvénnyel és az ismert ismert funkciók. Ez a két egyenlet állapottéregyenletnek tekinthető, és hasonlít a Kalman-szűrő állapottéregyenleteire. Ha a funkciók g és h a fenti példában lineáris, és mindkét és a Gauss , a Kalman-féle szűrő úgy találja, a pontos Bayes szűrő eloszlása. Egyébként a Kalman-szűrőn alapuló módszerek elsőrendű közelítés (EKF) vagy másodrendű közelítés (általában UKF, de ha a valószínűségeloszlás Gauss-féle, akkor harmadrendű közelítés lehetséges). ${\ displaystyle W_ {k}}$ ${\ displaystyle V_ {k}}$ $g$ $h$ ${\ displaystyle W_ {k}}$ ${\ displaystyle V_ {k}}$

Könnyebb lehet feltételezni, hogy a kezdeti eloszlás és a Markov-lánc átmenetei abszolút folytonosak a Lebesgue-mértékhez képest. A részecskeszűrő megtervezéséhez csak azt kell feltételeznünk, hogy mintavételezhetjük a Markov-lánc átmeneteit, és kiszámíthatjuk a Funkció valószínűségét (lásd például a részecskeszűrő genetikai szelekciójának alább ismertetett leírását). A Markov-átmenetekkel kapcsolatos abszolút folyamatos hipotézis csak arra szolgál, hogy informálisan (és inkább visszaélésszerűen) különböző képleteket nyújtson a hátsó eloszlások között, Bayes-féle feltételes sűrűségre vonatkozó szabályát alkalmazva. ${\ displaystyle X_ {k-1} \ rightarrow X_ {k}}$ ${\ displaystyle X_ {k},}$ ${\ displaystyle x_ {k} \ mapsto p (y_ {k} | x_ {k})}$ ${\ displaystyle X_ {k}}$

Modellezés

A részecskeszűrők feltételezik, hogy az állapotok és a megfigyelések a következő formában modellezhetők: $x_k$ $y_ {k}$

A paraméterek sorrendje egy elsőrendű Markov-láncot alkot , olyannak és kezdeti eloszlású . $x_0, x_1, \ pont$ $x_k | x_ {k-1} \ sim p_ {x_k | x_ {k-1}} (x | x_ {k-1})$ $p (x_0)$
A megfigyelések feltételektől függetlenek, amennyiben ismeretesek. Más szavakkal, minden megfigyelés csak a paramétertől függ : $y_0, y_1, \ pont$ $x_0, x_1, \ pont$ $y_ {k}$ $x_k$ $y_ {k} | x_ {k} \ sim p_ {y | x _ {}} (y | x_ {k})$

Példa erre a forgatókönyvre $\ left \ {\ begin {mátrix} x_k = f (x_ {k-1}) + v_k \\ y_k = h (x_k) + w_k \ end {mátrix} \ right.$

ahol mindkét és kölcsönösen független és azonos eloszlású szekvenciákat ismert sűrűségfüggvényeket , és ahol , és ismert funkciók. Ez a két egyenlet állapottéregyenletnek tekinthető, és hasonlít a Kalman-szűrőre . $v_ {k}$ $w_k$ $f (\ cdot)$ $h (\ cdot)$

Ha a funkciók és a lineáris volt, és ha mind , és voltak Gauss , a Kalman-szűrő találja a pontos Bayes- szűrés forgalmazás . Ellenkező esetben a Kalman szűrőalapú módszerek adnak első rendű becslést. A részecskeszűrők is adnak közelítéseket, de elegendő részecske mellett az eredmények még pontosabbak lehetnek. $f (\ cdot)$ $h (\ cdot)$ $v_ {k}$ $w_k$

Monte-Carlo közelítés

A részecskemódszerek, mint minden mintavételen alapuló módszer (például az MCMC ), minták készítését hozzák létre, amelyek közelítik a szűrési eloszlást . Így a mintáknál a szűrési eloszlás várható értékeit a következővel közelítjük meg: hol van az (L) részecske pillanatnyilag ; és a Monte Carlo módszerek szokásos módon az eloszlás összes adatait ( momentumokat stb.) meg tudja adni egy bizonyos fokú közelítésig. $p (x_k | y_0, \ pontok, y_k)$ $P$ $\ int f (x_k) p (x_k | y_0, \ pontok, y_k) dx_k \ kb \ frac1P \ sum_ {L = 1} ^ Pf (x_k ^ {(L)})$ $x_k ^ {(L)}$ $k$ $f (\ cdot)$

Általánosságban elmondható, hogy az algoritmust ismételten ismételjük meg egy adott számú értéknél (amelyet megjegyezünk ). $k$ $NEM$

Az Inicializálás az összes részecske számára kiindulási pozíciót biztosít a létrehozáshoz , amely felhasználható létrehozásra , felhasználható létrehozásra stb . $x_k = 0 | _ {k = 0}$ $x_ {1}$ $x_ {2}$ $x_ {3}$ $k = N$

Ha ez megtörtént, az átlagos az egész részecske (vagy ) megközelítőleg a valós értékét . $x_k$ $\ frac {1} {P} \ sum_ {L = 1} ^ P x_k ^ {(L)}$ $x_k$

Mintavétel fontosság szerinti újramintavétellel (SIR)

Az újramintavétel fontosságú mintavétel vagy a mintavételi fontosság újravételezése (SIR) egy nagyon gyakran használt szűrési algoritmus. Közeledik a szűrés eloszlás szerint egy súlyozott részecskék: . $p (x_k | y_0, \ ldots, y_k)$ $\ {(w ^ {(L)} _ k, x ^ {(L)} _ k) ~: ~ L = 1, \ ldots, P \}$

A fontossági súlyok a részecskék relatív hátsó valószínűségének (vagy sűrűségének) közelítői, mint pl . $w ^ {(L)} _ k$ $\ sum_ {L = 1} ^ P w ^ {(L)} _ k = 1$

A SIR algoritmus a fontossági mintavétel rekurzív változata . A fontossági mintavételhez hasonlóan a függvény várakozása súlyozott átlagként közelíthető meg: $f (\ cdot)$ $\ int f (x_k) p (x_k | y_0, \ pontok, y_k) dx_k \ kb \ sum_ {L = 1} ^ P w ^ {(L)} f (x_k ^ {(L)}).$

Az előadás az algoritmus függ a választás a disztribúció nagyságának : . $\ pi (x_k | x_ {0: k-1}, y_ {0: k})$

Az optimális fontossági eloszlás a következő: $\ pi (x_k | x_ {0: k-1}, y_ {0: k}) = p (x_k | x_ {k-1}, y_ {k}).$

Az átmenet valószínűségét azonban gyakran használják fontossági függvényként, mivel könnyebb kiszámítani, és egyszerűsíti a későbbi fontossági súlyok számítását is: $\ pi (x_k | x_ {0: k-1}, y_ {0: k}) = p (x_k | x_ {k-1}).$

A szűrők fontosság szerinti újramintavételezése (CRS) az átmenet valószínűségével, mint fontossági függvény, általában primer szűrőként ( bootstrap szűrők) vagy kondenzációs algoritmusként ismert .

Az újramintavétellel elkerülhető az algoritmus degenerációjának problémája. Ezzel elkerülhetők azok a helyzetek, amikor az összes fontossági súly kivételével az összes nullához közelít. Az algoritmus teljesítményét a megfelelő újramintavételi módszer megválasztása is befolyásolhatja. A variancia szempontjából optimális a Kitagawa (1996) által javasolt rétegzett újravétel .

A szekvenciális fontosságú újramintavétel egyetlen lépése a következő:

Mert felhívjuk a fontosság eloszlásának mintáit : $L = 1, \ ldots, P$ $x ^ {(L)} _ k \ sim \ pi (x_k | x ^ {(L)} _ {0: k-1}, y_ {0: k})$
A normalizálási állandóval értékeljük a fontossági súlyokat: $L = 1, \ ldots, P$ $\ hat {w} ^ {(L)} _ k = w ^ {(L)} _ {k-1} \ frac {p (y_k | x ^ {(L)} _ k) p (x ^ {( L)} _k | x ^ {(L)} _ {k-1})} {\ pi (x_k ^ {(L)} | x ^ {(L)} _ {0: k-1}, y_ { 0: k})}.$
A normalizált fontossági súlyok kiszámításához: $L = 1, \ ldots, P$ $w ^ {(L)} _ k = \ frac {\ hat {w} ^ {(L)} _ k} {\ sum_ {J = 1} ^ P \ hat {w} ^ {(J)} _ k }$
Kiszámítjuk a részecskék tényleges számának becslését as $\ hat {N} _ \ mathit {eff} = \ frac {1} {\ sum_ {L = 1} ^ P \ bal (w ^ {(L)} _ k \ jobb) ^ 2}$
Ha a tényleges részecskeszám kisebb, mint egy adott küszöbérték , akkor az újramintavételt: NEM^eff<NEMthr{\ displaystyle {\ hat {N}} _ {\ mathit {eff}} <N_ {thr}} $\ hat {N} _ \ mathit {eff} <N_ {thr}$
1. Rajzoljon részecskéket az aktuális részecskekészletből a súlyukkal arányos valószínűséggel, majd cserélje le az áramrészecskék halmazát erre az új halmazra. $P$
2. Az egészért . $L = 1, \ ldots, P$ $w ^ {(L)} _ k = 1 / P$

A szekvenciális fontosságú resampling (Sequential Importance Resampling) kifejezést néha használják a SIR szűrőkre is.

Szekvenciális fontosságú mintavétel (SIS)

A méret szerinti szekvenciális mintavétel vagy a szekvenciális fontosságú mintavétel (SIS) hasonló az újramintavétel fontosságú mintavételhez (SIR), de az újramintavételi lépés nélkül.

Az algoritmus közvetlen változata

Az algoritmus egyszerű verziója viszonylag egyszerű a többi részecskeszűrő algoritmushoz képest, és összetételt és elutasítást használ. Előállítani egy mintát , hogy a : $x$ $k$ $p_ {x_k | y_ {1: k}} (x | y_ {1: k})$

(1) Állítsa be a p = 1 értéket (2) Legyen egyenletesen L-ből

\ {1, ..., P \}

(3) Hozzon létre egy tesztet annak terjesztéséből

{\ hat {x}}

p_ {x_k | x_ {k-1}} (x | x_ {k-1 | k-1} ^ {(L)})

(4) létrehozása a valószínűségek alkalmazásával a , ahol a mért érték

{\ hat {y}}

{\ hat {x}}

p_ {y | x} (y_k | \ hat {x})

y_ {k}

(5) Hozzon létre egy másik egyenletesen u-t

[0, m_k]

(6) Hasonlítsa össze az u és a

{\ hat {y}}

(a) Ha u nagyobb, akkor ismételje meg a (2) lépéstől (b) Ha u kisebb, akkor mentse el a következőt: és növelje a p oldalt

{\ hat {x}}

x {k | k} ^ {(p)}

A cél P- részecskék létrehozása a lépésben , csak a lépés részecskéinek felhasználásával . Ehhez meg kell adni egy Markov-egyenletet (és kiszámítani), hogy csak ezen alapuljon . Ez az algoritmus a P részecskék összetételét használja fel a létrehozásig . $k$ $k-1$ $x_k$ $x_ {k-1}$ $k-1$ $k$

Ez könnyebben megjeleníthető, ha kétdimenziós tömbnek tekintjük. Az egyik dimenzió a másik dimenzió a részecskék száma. Például lépésben az L- es részecske lenne , ezért írható (ahogy az algoritmusban korábban tettük). $x$ $k$ $x (k, L)$ $k$ $x_k ^ {(L)}$

A (3) lépés egy véletlenszerűen kiválasztott részecske ( ) alapján egy potenciált hoz létre időben, és a (6) lépésben elutasítja vagy elfogadja ezt a részecskét. Más szavakkal, az értékeket a korábban kiszámolt felhasználásával számítják ki. $x_k$ $x_ {k-1} ^ {(L)}$ $k-1$ $x_k$ $x_ {k-1}$

Megjegyzések és hivatkozások

(in) Sanjeev Arulampalam úr, " Oktatóanyag a részecskeszűrőkről az online nemlineáris / nem-Gauss-féle Bayes- követéshez " , IEEE-TRANZAKCIÓK A JELI FELDOLGOZÁSON, VOL. 50, NO. 2 ,2002. február
(en) " Részecskeszűrők "

Lásd is

Kalman-szűrő , analitikai becslő a Gauss-eloszlásokra
Bayesi rekurzív becslés

Bibliográfia

Szekvenciális Monte Carlo módszerek a gyakorlatban , szerző: A Doucet, N de Freitas és N Gordon. Írta: Springer.
A szekvenciális Monte Carlo mintavételi módszerekről a Bayes- szűréshez, A Doucet, C Andrieu és S. Godsill, Statistics and Computing, vol. 10. sz. 3. o. 197-208 , 2000 CiteSeer link
Oktató részecskeszűrőkről on-line nemlineáris / nem-Gauss Bayes-követéshez (2001) ; S. Arulampalam, S. Maskell, N. Gordon és T. Clapp; CiteSeer link

Külső linkek

Szekvenciális Monte-Carlo módszerek (részecskeszűrés) a Cambridge-i Egyetemen
Dieter Fox MCL animációi