Markov lánc

A matematika , a Markov-lánc egy diszkrét idejű Markov-folyamat , vagy a folytonos idejű és diszkrét állapottér. A Markov-folyamat egy sztochasztikus folyamat, amely a Markov tulajdonsággal rendelkezik  : a jövő előrejelzéséhez hasznos információ teljes egészében a folyamat jelenlegi állapotában található, és nem függ a korábbi állapotoktól (a rendszernek nincs "memóriája"). A Markov-folyamatokat feltalálójukról, Andrej Markovról nevezik el .

A diszkrét idejű Markov-folyamat egy sorozata a valószínűségi változók értékek az állam teret , amely azt fogja megjegyezni a következőket. Az érték az állam a folyamat abban a pillanatban. Az alkalmazások, ahol az állapottér véges vagy megszámlálható számtalan: az egyik beszél, majd a Markov-lánc , illetve a Markov-láncok diszkrét állapottér . Az általános Markov-folyamatok alapvető tulajdonságait , például a megismétlődés és az ergodicitás tulajdonságait egyszerűbben megfogalmazzák vagy bemutatják a diszkrét állapottérbeli Markov-láncok esetében . Ez a cikk pontosan a Markov diszkrét állapottérről szól .

Andrej Markov 1906-ban publikálta az első eredményeket a véges állapotú űrbeli Markov-láncokról . A általánosítás megszámlálható végtelen állapottér tette közzé Kolmogorov a 1936 . A Markov-folyamatok összefüggenek a Brown-mozgással és az ergodikus hipotézissel , a statisztikai fizika két témájával, amelyek a XX .  Század elején nagyon fontosak voltak .

Gyenge Markov-ingatlan

Definíciók

Ez a Markov-lánc jellemző tulajdonsága: a jövőnek a jelenből való előrejelzését nem pontosítják a múltat ​​érintő további információk, mert a jövő előrejelzéséhez hasznos összes információ a jelenlegi állapotban található. a folyamat. A gyenge Markov-tulajdonságnak számos ekvivalens formája van, amelyek mind azt a megfigyelést jelentik, hogy a múlt idő ismeretének feltételes törvénye , vagyis a tudás csak a következő függvénye :

A Markov-láncok egyik gyakori változata a homogén Markov-lánc , amelynél az átmenet valószínűsége független  :

A cikk további részében csak homogén Markov-láncokat veszünk figyelembe. Egy érdekes alkalmazása nem homogén Markov-láncok a kombinatorikus optimalizálás , lásd a cikk szimulált hűtés . Van egy erős Markov-tulajdonság , amely az idő leállításának fogalmához kapcsolódik  : ez az erős Markov-tulajdonság kulcsfontosságú a fontos eredmények igazolásához (különböző megismétlődési kritériumok, a Markov-láncok nagy számának erős törvénye). A " Markov tulajdonság  " című cikkben szerepel  .

Kritérium

Alapvető kritérium  -  Legyen ugyanazon törvény független, véletlen változóinak sorozata , térbeli értékekkel , és vagy mérhető térképpel . Tegyük fel, hogy a szekvenciát a megismétlődés relációja határozza meg: és tegyük fel, hogy a szekvencia független azután Homogén Markov-lánc.

Példa: a miniatűrök gyűjtőjének problémája  :

Petit Pierre összegyűjti a labdarúgó-válogatott tizenegy játékosának portréját, amelyeket a csokoládé csomagolásának belsejében található matricákon talál; minden alkalommal, amikor tabletet vásárol, 1/11-es esélye van megtalálni a játékos (mindenre nézve ) portréját . Vegye figyelembe Pierre Petit gyűjteményének állapotát, miután kinyitotta e csokoládéjának csomagolását . egy Markov-lánc, amely indul , mivel az előző keretbe illeszkedik a választás óta ahol a véletlenszerű változók egymástól függetlenek és egységesek  : ezek a csokoládéból vett matricák egymás utáni számai. Az átlagos idő kell tölteniük a gyűjtemény (itt a tabletták számát, hogy Petit Pierre kell vásárolni átlagosan a teljes gyűjteménye) is, mert a gyűjtemény matrica összesen ahol a th harmonikus szám . Például csokoládé.

Megjegyzések:

Átmenet valószínűségei

Meghatározás

Meghatározás  -  A számot nevezzük a valószínűsége állami to- állapotátmenet egy lépésben , vagy a valószínűsége állami to- állapotátmenet ha nincs kétértelműség. Gyakran megjegyezzük ezt a számot

A családszámokat átmeneti mátrixnak , átmeneti magnak vagy a Markov-lánc átmenet-operátorának nevezzük .

A terminológia átmeneti mátrixa a leggyakrabban használt, de szigorúan véve csak akkor megfelelő, ha például egy egész szám esetén, amikor a véges, például a bíboros , mindig tetszőlegesen 1-től számozhatja az elemeket a problémát meghatározó elemekhez , de tökéletlenül mert ez az újraszámozás számos példában ellentmondásos.

Ehrenfest modell: a két kutya és bolháik:

Két kutya osztja a bolhákat az alábbiak szerint: minden pillanatban az egyik bolhát véletlenszerűen választják ki, majd egyik kutyáról a másikra ugrik. A rendszer állapotát egy olyan elem írja le, ahol

Így vannak elemei, de számozásuk 1-ről kényelmetlen lenne követni a rendszer evolúcióját, amely abból áll, hogy véletlenszerűen kiválasztjuk az egyik koordinátáját és megváltoztatjuk annak értékét. Ha kevésbé részletesen akarjuk megérteni a rendszert (mivel nem vagyunk képesek felismerni az egyik chipet a másiktól), akkor egyszerűen tanulmányozhatjuk az 1. számú kutya chipjeinek számát, ami annyit jelent, hogy újra meg kell választanunk , a megértéshez kár újraszámozni az állapotokat 1-ről Megjegyezzük, hogy ennek az új mivel például az 1. számú kutya hátulján lévő zsetonok száma k- ről k-1- re halad, ha ezek közül a k zsetonok közül az egyiket választják ugrásra, a „rendszerben” található N zseton között . Ezt a modellt gyakrabban „ Ehrenfest Urns Model  ” -nek nevezik  . 1907-ben Tatiana és Paul Ehrenfest vezette be a kialakulóban lévő statisztikai mechanika alapjaiban felmerült "paradoxonok" szemléltetésére és a rózsaszínű zaj modellezésére . Az Ehrenfest urnamodellt Mark Kac matematikus úgy vélte , hogy "valószínűleg az egyik legtanulságosabb modell az egész fizikában".

Ahelyett, hogy az állapotokat újraszámozzuk 1-ről, ezért ergonómikusabb sok esetben elfogadni azokat a véges vagy végtelen mátrixokat, amelyek sorait és oszlopait "számozzuk" a két ilyen "mátrix" szorzata segítségével , és ezt aztán nagyon természetes módon definiáljuk. által két négyzet alakú mátrix szorzatának klasszikusabb képletével analóg módon

Tulajdonságok

Állítás  -  Az átmenet mátrix van sztochasztikus  : az összege szempontjából minden sorban mindig ad 1.

Tétel  -  A törvény a Markov-lánc jellemzi a páros alkotja annak átmeneti mátrix és annak kezdeti joga (a törvény ): az összes közös törvénye adják

Demonstráció

Indukcióval, a 0. rangban,

Sorban pózolva a gyenge Markov-tulajdonság miatt, tehát ha megvan a várt kifejezés, akkor is.

Amikor egy adott Markov-láncot vizsgálunk, annak átmeneti mátrixa általában jól meghatározott és rögzített a vizsgálat során, de a kezdeti törvény a vizsgálat során megváltozhat, és a jelöléseknek tükrözniük kell a pillanatban figyelembe vett kezdeti törvényt: ha a a tanulmány a Markov kezdeti eloszlásának láncolatát veszi figyelembe, amelyet akkor meghatározunk, a valószínűségeket és az elvárásokat figyelembe vesszük. Különösen, ha azt mondjuk, hogy a Markov-lánc a valószínűségekből indul ki , és az elvárásokat megjegyezzük

Az átmeneti mátrix hatáskörei

A lépésben történő átmenet valószínűsége nem függ a következőktől  :

Tétel  -  A átmenet mátrix lépéseket , egyenlő a teljesítmény -én az átmeneti mátrix Megjegyezzük és

Demonstráció

Megismétlődéssel. Az 1. rangban ez a Markov-lánc homogenitásának következménye, amelyet a gyenge Markov-tulajdonság részben már említettünk  :

Rang vagy

Összegzésképpen felosztjuk ennek az egyenlőségsorozatnak a két szélső tagját , hacsak ez az utolsó tag nulla, ebben az esetben tetszőlegesen definiálhatjuk , ezért például egyenlő:

A teljes valószínűségi képlet egyszerű alkalmazásával levezetjük a Markov-lánc határtörvényeit.

Következmény  -  A törvény az adja

Különösen,

A mátrixírásban, ha a törvényét vonalvektornak tekintjük , akkor az a következõvé formálódik:

Az állapotok osztályozása

Mert azt mondjuk, hogy ez elérhető távolságra akkor és csak akkor létezik olyan, hogy jelöljük:

Azt mondjuk, hogy és kommunikálni akkor és csak akkor, ha létezik olyan, hogy és mi jelöljük:

A kapcsolatban közli , megjegyezte egy ekvivalencia reláció . Amikor Markov-lánc állapotairól beszélünk osztályról, akkor általában az általunk hivatkozott reláció ekvivalenciaosztályaira vonatkozik. Ha minden állam kommunikál, akkor azt mondják, hogy a Markov-lánc nem olvasható .

A hozzáférhető , megjelölt reláció kiterjed az egyenértékűségi osztályokra: két osztályra, és megvan

A reláció egy megbízás kapcsán az ekvivalencia osztályok.

Egy osztály akkor mondható véglegesnek, ha nem vezet máshoz, azaz ha az osztály minimális a relációhoz, ellenkező esetben átmenetinek mondják . A végső vagy átmeneti osztályhoz való tartozás következményekkel jár a Markov-lánc egy állapotának valószínűségi tulajdonságaira, különös tekintettel a visszatérő vagy átmeneti állapot állapotára . Az utolsó osztályok száma és jellege diktálja az álló valószínűségek halmazának felépítését , amely pontosan összefoglalja a Markov-lánc aszimptotikus viselkedését, amint az a következő szakaszban és az oldal végén részletezett két példában is látható .

Is

Az időszak az állam a legnagyobb közös osztója a készlet. Ha két állam közli, ezek ugyanabban az időszakban: tudjuk, ezért beszélünk az időszak egy osztály államok. Ha a periódus 1, akkor az osztály aperiodikusnak mondható . A Markov-lánc állapotainak aperiodicitása feltételezi a törvény konvergenciáját az álló valószínűség felé, lásd a Markov-lánc stacionárius valószínűsége című oldalt .

Az állapotok osztályozása és periódusuk könnyen olvasható a Markov-lánc grafikonon . Ha azonban az átmeneti mátrix minden eleme szigorúan pozitív, akkor a Markov-lánc nem redukálható és aperiodikus: a Markov-lánc grafikonjának megrajzolása felesleges.

Helyhez kötött törvény

Meghatározás

Egy vagy több mérés lehet az állapottérben , például: vagy akár

Az ilyen mérést helyhez kötött mérésnek nevezzük . A stacionárius mérték az átmeneti mátrix transzpozíciójának sajátfüggvénye , az 1. sajátértékhez társítva . Stacionárius valószínűségnek vagy stacionárius törvénynek nevezzük, ha megfelel a további feltételeknek:

Az "  álló  " kifejezést a következő javaslat igazolja:

Állítás  -  Ha a kezdeti törvény a Markov-lánc (azaz a törvény a ) egy helyhez kötött valószínűsége akkor minden törvénye még mindig

Demonstráció

Ez következik a tulajdonságok a hatáskörét az átmenet mátrix fent megadott: a törvény μ n az X n függvényében fejezzük a törvény μ 0 a X 0 a következőképpen: vagy maga után vonja

Általánosabban fogalmazva, a Markov-lánc akkor és csak akkor helyhez kötött folyamat, ha kezdeti törvénye statikus valószínűségű .

Létezés és egyediség

Diszkrét állapottérbeli Markov-láncok esetén a folyamat bizonyos tulajdonságai meghatározzák, hogy van-e álló valószínűség, és hogy egyedi-e vagy sem:

Ha egy Markov-láncnak van legalább egy pozitív visszatérő állapota, akkor helyhez kötött valószínűség van. Ha van olyan helyhez kötött valószínűség , hogy az állapot pozitív visszatérő, és fordítva.

Tétel  -  Ha egy Markov-láncnak csak egy végső osztálya van, akkor legfeljebb egy álló helyzet valószínűsége van. Ekkor ekvivalenciánk van a 3 javaslat között:

Megvan az egyenértékűség is

Ez a tétel különösen érvényes a redukálhatatlan Markov-láncokra, mivel ez utóbbiaknak csak egy osztálya van (ami tehát szükségszerűen végső osztály); a redukálhatatlan Markov-láncok különösen igazolják

Erős törvény a nagy számokról és az ergodicitásról

Redukálhatatlan és visszatérő pozitív Markov- lánc esetén a nagy számok erős törvénye van érvényben: a függvény átlaga a Markov-lánc eseteinél megegyezik az átlagával a helyhez kötött valószínűség szerint. Pontosabban a feltételezés alatt mi szinte biztos, hogy  :

A példányok átlagának átlaga tehát hosszú távon megegyezik az álló valószínűség szerinti várakozással. Különösen ez az egyenértékűség az eszközöket kell alkalmazni, ha az indikátor függvény egy részhalmaza az állapottér:

Ez lehetővé teszi az álló helyzet valószínűségének megközelítését az empirikus eloszlás révén (amely egy adott szekvenciából felépített hisztogram ), mint például a véletlenszerű, gáttal történő járás esetén .

Különösen akkor, ha az eljárás épül azáltal, hogy a helyhez kötött valószínűsége, mint az eredeti törvény szerint a váltás által meghatározott megőrzi a mértéket, ami a Markov-láncot mért dinamikus rendszerré teszi . A nagy számok erős törvénye azt eredményezi, hogy a Markov-lánc ergodikus dinamikus rendszer . Az ergodicitás ugyanakkor erősebb, mint a nagy számok erős törvénye, mert következtethetünk például arra, hogy majdnem egy bizonyos határig van, de gyengébb is, mert elvileg megköveteli a Markov-lánc állékonyságát, ami nem így van a nagy számok erős törvényével.

Konvergencia az álló törvény felé

Ha a Markov-lánc nem redukálható , pozitív visszatérő és aperiodikus, akkor konvergál egy olyan mátrixhoz, amelynek minden sora az egyedi álló eloszlás . Különösen a konvergencia törvénye konvergál a kezdeti törvénytől függetlenül. Kész állapotállapot esetén ez: a Perron-Frobenius-tétel bizonyítja . Ne feledje, hogy természetes, hogy a reláció által indukcióval meghatározott szekvencia korlátozhatja ennek az átalakításnak egy fix pontját , azaz az egyenlet megoldását

Véges állapottér Markov láncok

Ha egy Markov-lánc nem redukálható, és ha az állapottere véges, akkor az összes állapota pozitív visszatérő. Ekkor a nagy számok erős törvénye van érvényben.

Általánosabban véve a véges végső osztály minden eleme pozitív visszatérő, függetlenül attól, hogy az állapottér véges vagy végtelen megszámolható-e.

Egy abszorbeált Markov-lánc kvázi stacionárius eloszlása

Legyen Markov-lánc a természetes számok halmazán . Tegyük fel, hogy a 0 állapot abszorbeálja, és a lánc szinte biztosan abszorbeálódik 0-nál. Hagy az abszorpciós idő 0. Azt mondjuk, hogy egy valószínűségi on egy kvázi-stacionárius eloszlás, ha minden és mindenki számára ,

Azt mondjuk, hogy egy valószínűségi on egy Yaglom határt , ha mindent , és mindent ,

A Yaglom-határ kvázi stacionárius eloszlás . Ha létezik, akkor a Yaglom határérték egyedi. Másrészt több kvázi stacionárius eloszlás is lehet.

Ha kvázi stacionárius eloszlás van, akkor létezik olyan valós szám , amely .

Értékelés

A fenti képletekben, az elem ( ) annak a valószínűsége, a átmenet a . Egy sor elemeinek összege mindig egyenlő 1-vel, és az álló eloszlást az átmeneti mátrix bal sajátvektora adja meg.

Néha találkozunk mátrixait, amelyben a kifejezést ( ) annak a valószínűsége, átmenet a , amely esetben az átmenet mátrix egyszerűen a transzponáltja az, hogy az itt leírt. Az oszlop elemeinek összege ekkor 1-et ér. Sőt, a rendszer stacionárius eloszlását ezután az átmeneti mátrix jobb oldali sajátvektora adja meg a bal sajátvektor helyett.

Példa: Doudou a hörcsög

Doudou hörcsög csak három helyet ismer ketrecében: a forgácsot, ahol alszik, az etetőt, ahol eszik, és a kereket, ahol gyakorol. Napjai meglehetősen hasonlítanak egymásra, és tevékenységét könnyen képviseli egy Markov-lánc. Minden percben megváltoztathatja tevékenységét, vagy folytathatja azt, amit végzett. Az emlékezet nélküli névfolyamat egyáltalán nem túlzó, ha Doudou-ról beszélünk.

Diagramok

A diagramok megmutathatják az összes nyilat, mindegyik az átmenet valószínűségét képviseli. Azonban olvashatóbb, ha:

Átmeneti mátrix

Az átmenet mátrixa ez a rendszer a következő (a sorok és oszlopok megfelelnek annak érdekében, hogy a képviselt Államok a chip , feeder , kerék grafikon ):

Előrejelzések

Tegyük fel, hogy Doudou a vizsgálat első percében alszik.

Egy perc múlva megjósolhatjuk:

Így egy perc elteltével 90% az esély arra, hogy Doudou még mindig alszik, 5% -kal eszik és 5% -kal fut.

2 perc elteltével 4,5% az esély, hogy a hörcsög megeszi.

Általánosságban elmondható, hogy percekig: és

Az elmélet azt mutatja, hogy egy bizonyos idő elteltével a valószínűség törvénye független az eredeti törvénytől. Vegye figyelembe  :

A konvergenciát akkor és csak akkor érjük el, ha a lánc aperiodikus és nem redukálható . Példánkban ez a helyzet, így írhatjuk:

Ennek tudatában megkapjuk:

Doudou ezért ideje 88,4% -át alvással, 4,42% -át eszik és 7,18% -át futja.

A modell hatásának illusztrációja

Az alábbi példa a rendszer modellezésének fontosságát kívánja bemutatni. A jó modellezés lehetővé teszi az összetett kérdések megválaszolását egyszerű számításokkal.

Tanulmányozunk egy (fiktív) civilizációt, amely több társadalmi osztályból áll, és amelyben az egyének egyik osztályból a másikba mozoghatnak. Minden szakasz egy évet jelent. Az egyén helyett inkább egy vonalat fogunk figyelembe venni, hogy elkerüljük a kétszázéves állampolgárok megszerzését. Négy különböző társadalmi állapot létezik:

Ebben a társaságban:

Hogy kissé bonyolítsuk a példát, és így megmutassuk Markov-láncok alkalmazásának mértékét, figyelembe vesszük, hogy a köztisztviselőket több évre választják meg. Ezért az egyes köztisztviselők jövője attól függ, mennyi ideig volt köztisztviselő. Ezért nem homogén Markov-lánc esetében vagyunk. Szerencsére könnyen visszatérhetünk egy homogén lánchoz. Valójában elegendő egy mesterséges állapot hozzáadása a megbízatás minden évéhez. Ahelyett, hogy lenne egy 4-es állapot: Hivatalos , lesz egy államunk:

A két egymást követő mesterséges állapotot összekötő valószínűségek (például a harmadik és a negyedik év) értéke 1, mivel az ember úgy gondolja, hogy bármely megkezdett megbízás véget ér (ennek az ellenkezőjét modellezhetjük a valószínűségek értékének megváltoztatásával). Rögzítsük a megbízások időtartamát két évre, a köztisztviselők kontingensét évente felére megújítva. Ezután a következő grafikon áll rendelkezésünkre:

A nem éves választások modellezéséhez fiktív államok hozzáadására is szükség lenne (választási év, a legutóbbi választások óta eltelt egy év stb.).

Ezután a mátrixot felírják:

Amint azt fentebb kifejtettük, adja meg az átmenet valószínűségét szakaszokban. Ugyanígy annak valószínűsége, hogy évek múlva államban lehetek egy olyan vonal után , amely a társadalmi osztály része . Ahhoz, hogy tudjuk, mi lesz a rabszolgával évek múlva, elég megírnunk:

Hol van annak a valószínűsége, hogy társadalmi osztályba kerülünk évek után, ha tudjuk, hogy a vizsgált vonal elhagyta a rabszolgaság állapotát?

Ha ismerjük az egyes társadalmi osztályok számát a 0. évben, elegendő kiszámítani:

Így megkapjuk a népesség megoszlását a különböző társadalmi osztályokban ( évek után ). Ha ezt a vektort megszorozzuk a populáció teljes számával, megkapjuk az egyes osztályok számát az évek végén .

Tegyük fel magunknak a következő kérdést: "Az évek végén hány sorban lesz már egy magas tisztviselő, aki befejezte mandátumát?" "

A válasz eltér az évek során elvégzett megbízások számától, mert fennáll az újraválasztás lehetősége. A kérdés megválaszolása nehéznek tűnik (ennek még mindig lehetségesnek kell lennie). Valójában elegendő megváltoztatni a probléma modellezését. Tehát térjünk át egy új modellre, hogy megválaszoljuk ezt a kérdést. (Másrészt ez nem teszi lehetővé az előző kérdések megválaszolását, ezért a két modell bemutatása.)

Elegendő a grafikont a következőképpen módosítani:

Abszorbeáló felsőt adunk hozzá, mert ha egy sor befejezte a megbízást, akkor azt már nem veszik figyelembe.

Ha egyes olvasók kritikusak, azt mondhatják, hogy a modell téves, mert a megválasztott tisztviselővel folytatott vonalak már nem vesznek részt a választásokon. Nem így van. Valójában a megválasztott tisztviselők száma arányos a polgárok számával. A korábbi magas rangú tisztviselők visszavonása a jelöltek közé tehát nem változtatja meg annak a valószínűségét, hogy egy állampolgárt megválasztanak, mert mivel az állampolgárok száma kisebb, a felajánlott pozíciók száma is megnő. Ez a modell lehetővé teszi a feltett kérdés pontos megválaszolását.

Ezért van egy új átmeneti mátrixunk:

Az előző kérdésekkel megegyező számítások elvégzésével a megoldás vektor utolsó sorában megkapjuk a legalább egy megbízást teljesítő sorok százalékos arányát vagy számát (ha szorozzuk a populáció teljes számával). Más szavakkal, a probléma újbóli modellezése lehetővé teszi a kérdés megválaszolását, amely annyira bonyolultnak tűnt a mátrix teljesítményének egyszerű kiszámításával.

Alkalmazások

Megjegyzések és hivatkozások

Lásd is

Kapcsolódó cikkek

Bibliográfia

Külső linkek