Glivenko-Cantelli tétel
A valószínűségszámítás , a tétel Glivenko - Cantelli , úgynevezett „ alaptétele statisztikák ” kifejezi, hogy egy valószínűségi törvény mennyiben fedhető fel az említett valószínűségi törvény (nagy) mintájának ismeretében .
Jelölések
A statisztikák , az empirikus eloszlásfüggvény társított minta az eloszlásfüggvény a valószínűsége törvény, amely kijelöli a valószínűsége , hogy az egyes számok, hogy a minta .
1/nem{\ displaystyle 1 / n}nem{\ displaystyle n}
Legyen egy valós véletlen változó mintája , amelyet eloszlásfüggvényes valószínűségi térben határozunk meg . A minta empirikus eloszlásfüggvényét a következők határozzák meg:
x1,...,xnem{\ displaystyle X_ {1}, \ ldots, X_ {n}}(Ω,NÁL NÉL,P){\ displaystyle (\ Omega, {\ mathcal {A}}, \ mathbb {P})}F{\ displaystyle F}Fnem{\ displaystyle F_ {n}}x1,...,xnem{\ displaystyle X_ {1}, \ ldots, X_ {n}}
∀x∈R,∀ω∈Ω,Fnem(x,ω)=nemombre d′e"le"menemts≤xdnál nélnems l′e"vs.hnál nélnemténllonemnem=1nem∑én=1nem1xén(ω)≤x{\ displaystyle \ forall x \ in \ mathbb {R}, \ forall \ omega \ in \ Omega, F_ {n} (x, \ omega) = {\ frac {\ mathrm {{~ akut {e} száma ~ } az {\ akut {e}} ments} \, \ leq x \, \ mathrm {a ~ \ a {\ akut {e}} mintában}} {n}} = {\ frac {1} {n}} \ összeg _ {i = 1} ^ {n} \ mathbf {1} _ {X_ {i} (\ omega) \ leq x}}
amely az indikátor függvénye az esemény At . Mindegyik esetében a térkép egy lépésfüggvény, az egységes valószínűségi törvény eloszlásfüggvénye a halmaz felett , amelyet itt megjegyezünk és empirikus törvénynek nevezünk. Minden n , van egy lineáris kombinációja a Dirac eloszlások . Mindegyik a véletlen valószínűség törvénye, vagyis egy véletlen változó értéke , amelynek értéke a mérési tartományban van .
1NÁL NÉL{\ displaystyle \ mathbf {1} _ {A}} ω{\ displaystyle \ omega}x→Fnem(x,ω){\ displaystyle x \ - F_ {n} (x, \ omega)}{x1(ω),...,xnem(ω)}{\ displaystyle \ {X_ {1} (\ omega), \ dots, X_ {n} (\ omega) \}}μnem(ω){\ displaystyle \ mu _ {n} (\ omega)}μnem=1nemδx1 + 1nemδx2 + ... + 1nemδxnem,{\ displaystyle \ mu _ {n} = {\ tfrac {1} {n}} \, \ delta _ {X_ {1}} \ + \ {\ tfrac {1} {n}} \, \ delta _ { X_ {2}} \ + \ \ pontok \ + \ {\ tfrac {1} {n}} \, \ delta _ {X_ {n}},}μnem{\ displaystyle \ mu _ {n}}Ω{\ displaystyle \ Omega}R{\ displaystyle \ mathbb {R}}
A Glivenko-Cantelli tétel kimondja az empirikus eloszlásfüggvény egységes konvergenciáját ennek a valószínűségi törvénynek az elosztási függvényéhez , szinte mindenhez . A Glivenko-Cantelli-tétel tehát magában foglalja az F eloszlásfüggvénynek megfelelő valószínűségi törvény felé való törvényi konvergenciát , amely valószínűségi törvényt eloszlásfüggvénye jellemzi .
Fnem{\ displaystyle F_ {n}}F{\ displaystyle F}ω{\ displaystyle \ omega}μnem{\ displaystyle \ mu _ {n}}μ{\ displaystyle \ mu}
Államok
Glivenko-Cantelli tétel - Szinte biztos , hogy az empirikus eloszlásfüggvény egységesen konvergál az eloszlási függvénnyel , vagy pedig:
Fnem{\ displaystyle F_ {n}}F{\ displaystyle F}
P(limnem ‖Fnem-F‖∞=0)=1.{\ displaystyle \ mathbb {P} \ bal (\ lim _ {n} \ \ | F_ {n} -F \ | _ {\ infty} = 0 \ jobb) = 1.}
Az eloszlásfüggvény Bernoulli véletlen változók átlagaként írható, azaz
Fnem(x,ω)=1nem∑én=1nem1{xén(ω)≤x}.{\ displaystyle F_ {n} (x, \ omega) = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ mathbf {1} _ {\ {X_ {i} ( \ omega) \ leq x \}}.}
Mivel ezek a változók átlagok , a nagy számok erős törvénye erre utal
F(x){\ displaystyle F (x)}
∀x∈R,P(limnem |Fnem(x,ω)-F(x)|=0)=1,{\ displaystyle \ forall x \ in \ mathbb {R}, \ quad \ mathbb {P} \ bal (\ lim _ {n} \ | F_ {n} (x, \ omega) -F (x) | = 0 \ jobbra) = 1,}
de nem feltétlenül követi ezt
P(∀x∈R,limnem |Fnem(x,ω)-F(x)|=0)=1,{\ displaystyle \ mathbb {P} \ left (\ forall x \ in \ mathbb {R}, \ quad \ lim _ {n} \ | F_ {n} (x, \ omega) -F (x) | = 0 \ jobb) = 1,}
mivel az 1. valószínűség halmazainak megszámlálhatatlan metszete ( szinte biztos halmazok ) nem feltétlenül az 1. valószínűségű. Ez a kereszteződés valószínűségű lenne-e akkor, hogy a Glivenko-Cantelli-tétel által megadott egységes konvergencia helyett csak egyszerű konvergenciát bizonyítottunk volna .
A Donsker-tétel és a DKW egyenlőtlenség tisztázza a Glivenko-Cantelli-tételt azáltal, hogy jelzéseket ad a konvergencia sebességéről, amely nagyjából1/nem.{\ displaystyle 1 / {\ sqrt {n}}.}
Demonstráció
Ez a bizonyíték Dini második tételét használja . Koncentrációs egyenlőtlenségekkel járó kombinatorikus bizonyítékért lásd a Glivenko-Cantelli osztályok igazolását . A nagy számok erős törvénye biztosít minket arról, hogy mindenhez szinte biztosan közeledik, sőt mindenre nő . A tétel alkalmazásakor azonban felmerül néhány probléma:
x∈R,Fnem(x){\ displaystyle x \ in \ mathbb {R}, F_ {n} (x)}F(x){\ displaystyle F (x)}Fnem{\ displaystyle F_ {n}}nem∈NEM∗{\ displaystyle n \ in \ mathbb {N} ^ {*}}
- Az elosztási függvény nem feltétlenül folyamatos;F{\ displaystyle F}
- A konvergencia nem történik meg egy szegmensben;
- A nagy számok erős törvénye lehetővé teszi számunkra a konvergenciát, amely függ , azazx∈R{\ displaystyle x \ in \ mathbb {R}}∀x∈R,∃NÁL NÉLx∈NÁL NÉL tq P(NÁL NÉLx)=1 et ∀ω∈NÁL NÉLx,limnem→+∞Fnem(x,ω)=F(x).{\ displaystyle \ forall x \ in \ mathbb {R}, \ létezik A_ {x} \ benne {\ mathcal {A}} \ {\ textrm {tq}} \ \ mathbb {P} (A_ {x}) = 1 \ \ mathrm {és} \ \ összes \ omega \ -ban A_ {x}, \ lim _ {n \ - + \ infty} F_ {n} (x, \ omega) = F (x).} Dini második tételének alkalmazásához szükség lenne erre ∃NÁL NÉL∈NÁL NÉL t.q. P(NÁL NÉL)=1 et ∀x∈R,∀ω∈NÁL NÉL,limnem→+∞Fnem(x,ω)=Fnem(x).{\ displaystyle \ létezik A \ a {\ mathcal {A}} \ \ mathrm {tq} \ \ mathbb {P} (A) = 1 \ \ mathrm {és} \ \ forall x \ in \ mathbb {R} mezőben, \ forall \ omega \ in {\ mathcal {A}}, \ lim _ {n \ to + \ infty} F_ {n} (x, \ omega) = F_ {n} (x).}
Mi megoldjuk az első két pont a generalizált inverz eloszlásfüggvény (más néven quantile funkció ) , és a harmadik, köszönhetően a elválasztható- a (vagyis elismeri a sűrű és legfeljebb megszámlálható részhalmaza mint ).
F←{\ displaystyle F ^ {\ leftarrow}}R{\ displaystyle \ mathbb {R}}R{\ displaystyle \ mathbb {R}}Q{\ displaystyle \ mathbb {Q}}
Legyen az iid változók egyenletesek , akkor az inverz eloszlásfüggvény kielégíti a tulajdonságot . Így
U1,...,Unem{\ displaystyle U_ {1}, \ dots, U_ {n}}[0,1]{\ displaystyle [0,1]}xén =L F←(Uén){\ displaystyle X_ {i} \ {\ overset {\ mathcal {L}} {=}} \ F ^ {\ leftarrow} (U_ {i})}
supt∈R|Fnem(t)-F(t)|=supt∈R|1nem∑én=1nem1{xén≤t}-F(t)|∼supt∈R|1nem∑én=1nem1{F←(Uén)≤t}-F(t)|=supt∈R|1nem∑én=1nem1{Uén≤F(t)}-F(t)|=sups∈F(R)|1nem∑én=1nem1{Uén≤s}-s|≤sups∈[0,1]|1nem∑én=1nem1{Uén≤s}-s|{\ displaystyle {\ begin {aligned} \ sup _ {t \ in \ mathbb {R}} | F_ {n} (t) -F (t) | & = \ sup _ {t \ in \ mathbb {R} } \ balra | {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ mathbf {1} _ {\ {X_ {i} \ leq t \}} - F (t) \ right | \\ & \ sim \ sup _ {t \ in \ mathbb {R}} \ left | {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ mathbf {1 } _ {\ {F ^ {\ leftarrow} (U_ {i}) \ leq t \}} - F (t) \ right | = \ sup _ {t \ in \ mathbb {R}} \ balra | {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ mathbf {1} _ {\ {U_ {i} \ leq F (t) \}} - F (t) \ jobb | \\ & = \ sup _ {s \ in F (\ mathbb {R})} \ bal | {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ mathbf {1} _ {\ {U_ {i} \ leq s \}} - s \ jobb | \ leq \ sup _ {s \ in [0,1]} \ balra | {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ mathbf {1} _ {\ {U_ {i} \ leq s \}} - s \ jobb | \ vég {igazítva}}}
Ezért elegendő annak bemutatása, hogy a Glivenko-Cantelli tétel igaz-e az egységes véletlen változók esetén . A nagy számok erős törvényének köszönhetően megvan: [0,1]{\ displaystyle [0,1]}
∀s∈[0,1],∃NÁL NÉLs∈NÁL NÉL tq P(NÁL NÉLs)=1 és ∀ω∈NÁL NÉLs,1nem∑k=1nem1{Uk(ω)≤s}⟶nem→+∞s.{\ displaystyle \ forall s \ in [0,1], \ létezik A_ {s} \ itt: {\ mathcal {A}} \ {\ textrm {tq}} \ \ mathbb {P} (A_ {s}) = 1 \ {\ textrm {et}} \ \ forall \ omega \ in A_ {s}, {\ frac {1} {n}} \ sum _ {k = 1} ^ {n} \ mathbf {1} _ { \ {U_ {k} (\ omega) \ leq s \}} {\ aláhúzza az {n \ értéket + \ infty} {\ longrightarrow}} s értékre.}
Meg kell találnunk tehát egy teljes, mindenki számára egységes mérési készletet . Amint az megszámlálható és a teljes mérték teljes halmazának megszámlálható metszéspontja, arra következtetünk, hogy:NÁL NÉL{\ displaystyle A}s∈[0,1]{\ displaystyle s \ in [0,1]}Q{\ displaystyle \ mathbb {Q}}
∃NÁL NÉL∈NÁL NÉL tq P(NÁL NÉL)=1 és ∀s∈[0,1]∩Q,∀ω∈NÁL NÉL,1nem∑k=1nem1{Uk(ω)≤s}⟶nem→+∞s.A {\ displaystyle \ létezik A \ a {\ mathcal {A}} \ {\ textrm {tq}} \ \ mathbb {P} (A) = 1 \ {\ textrm {és}} \ \ összes s \ -ban [{0} , 1] \ cap \ mathbb {Q}, \ forall \ omega \ in A, {\ frac {1} {n}} \ sum _ {k = 1} ^ {n} \ mathbf {1} _ {\ { U_ {k} (\ omega) \ leq s \}} {\ aláhúzza az {n \ értéket + \ infty} {\ longrightarrow}} s értékre.}
Mutassuk meg, hogy a tulajdonság mindenre igaz marad : hagyjuk , majd adunk magunknak egy növekvő és csökkenő szekvenciát, amely a korlátok közé tartozik . Tehát fix és :s∈[0,1]{\ displaystyle s \ in [0,1]}s∈[0,1]{\ displaystyle s \ in [0,1]}ω∈NÁL NÉL{\ displaystyle \ omega \ in A}(snem)nem∈NEM{\ displaystyle (s_ {n}) _ {n \ in \ mathbb {N}}}(tnem)nem∈NEM{\ displaystyle (t_ {n}) _ {n \ in \ mathbb {N}}}[0,1]∩Q{\ displaystyle [0,1] \ cap \ mathbb {Q}}s{\ displaystyle s}l{\ displaystyle l}nem≥1{\ displaystyle n \ geq 1}
1nem∑k=1nem1{Uk(ω)≤sl}≤1nem∑k=1nem1{Uk(ω)≤s}≤1nem∑k=1nem1{Uk(ω)≤tl},{\ displaystyle {\ frac {1} {n}} \ sum _ {k = 1} ^ {n} \ mathbf {1} _ {\ {U_ {k} (\ omega) \ leq s_ {l} \} } \ leq {\ frac {1} {n}} \ sum _ {k = 1} ^ {n} \ mathbf {1} _ {\ {U_ {k} (\ omega) \ leq s \}} \ leq {\ frac {1} {n}} \ sum _ {k = 1} ^ {n} \ mathbf {1} _ {\ {U_ {k} (\ omega) \ leq t_ {l} \}},}
ahonnan azáltal, pályázat ,nem→+∞{\ displaystyle n \ - + \ infty}
sl≤lim infnem→+∞1nem∑k=1nem1{Uk(ω)≤s}≤lim supnem→+∞1nem∑k=1nem1{Uk(ω)≤s}≤tl{\ displaystyle s_ {l} \ leq \ liminf _ {n \ to + \ infty} {\ frac {1} {n}} \ sum _ {k = 1} ^ {n} \ mathbf {1} _ {\ {U_ {k} (\ omega) \ leq s \}} \ leq \ limsup _ {n \ to + \ infty} {\ frac {1} {n}} \ sum _ {k = 1} ^ {n} \ mathbf {1} _ {\ {U_ {k} (\ omega) \ leq s \}} \ leq t_ {l}}
és pályázati felhívással zárjuk . Ezért megmutattukl→+∞{\ displaystyle l \ to + \ infty}
∀ω∈NÁL NÉL,1nem∑k=1nem1{Uk(ω)≤s}→s{\ displaystyle \ forall \ omega \ A-ban, {\ frac {1} {n}} \ sum _ {k = 1} ^ {n} \ mathbf {1} _ {\ {U_ {k} (\ omega) \ leq s \}} \ to s}
tovább . A konvergencia Dini második tételével egyenletes.
[0,1]{\ displaystyle [0,1]}
Általánosítás
Az iid változókat értékekkel állítjuk be egy törvénytérben, és a valós értékekkel meghatározott funkciók osztályát . Az osztályt Glivenko-Cantelli osztálynak hívják, ha megfelelx1,...,xnem{\ displaystyle X_ {1}, \ pontok, X_ {n}}x{\ displaystyle {\ mathcal {X}}}P=Px{\ displaystyle P = \ mathbb {P} ^ {X}}F{\ displaystyle {\ mathcal {F}}}x{\ displaystyle {\ mathcal {X}}}F{\ displaystyle {\ mathcal {F}}}
||Pnem-P||F=supf∈F|Pnem(f)-P(f)| →nem→+∞ 0,{\ displaystyle || P_ {n} -P || _ {\ mathcal {F}} = \ sup _ {f \ in {\ mathcal {F}}} | P_ {n} (f) -P (f) | ~ {\ xrightarrow [{n \ to + \ infty}] {}} ~ 0,}
A a tapasztalati intézkedés által meghatározott és . A Glivenko-Cantelli tétel tehát azt állítja, hogy az indikátorfüggvények osztálya Glivenko-Cantelli osztály.
Pnem{\ displaystyle P_ {n}}Pnem(f)=1nem∑én=1nemf(xén){\ displaystyle P_ {n} (f) = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} f (X_ {i})}P(f)=E[f(x1)]{\ displaystyle P (f) = \ mathbb {E} [f (X_ {1})]}F={x↦1{x≤t}:t∈R}{\ displaystyle {\ mathcal {F}} = \ {x \ mapsto \ mathbf {1} _ {\ {x \ leq t \}}: t \ in \ mathbb {R} \}}
Bibliográfia
- (en) Galen R. Shorack és Jon A. Wellner , Empirikus folyamatok a statisztikai alkalmazásokkal , SIAM ,2009. szeptember, 998 p. ( ISBN 978-0-89871901-7 , online olvasás )
- en) AW van der Vaart és JA Wellner : Gyenge konvergencia és empirikus folyamatok: statisztikai alkalmazásokkal , Springer ,1996, 508 p. ( ISBN 978-0-387-94640-5 , online olvasás )
- (en) Patrick Billingsley , Valószínűség és mérték , John Wiley & Sons ,2012, 4 th ed. , 656 p. ( ISBN 978-1-118-34191-9 , Modell: Google Livers ) , p. 268
Lásd is
Hivatkozások
-
Billingsley 2012 , p. 268
-
Ivan Nourdin, aggregációra orális matematika teszt , Dunod , 2 th ed. , P. 109.
-
Philippe Barbe és Michel Ledoux, Valószínűség , EDP Sciences , koll. „Felsőoktatás”, p. 50