A Vapnik-Chervonenkis dimenziója

A matematikai cikk tartalmát ellenőrizni kell (2016. december).

Fejlessze vagy vitassa meg az ellenőrizendő dolgokat . Ha nemrég helyezte el a szalaghirdetést, kérjük, adja meg itt az ellenőrizni kívánt pontokat .

A gépi tanulás elméletében a VC dimenzió (a Vapnik-Chervonenkis dimenzióhoz a francia nyelvben gyakran használt angol átírást követve, illetve a francia átírásnál a Vapnik-Tchervonenkis dimenzióhoz ) egy osztályozási algoritmus statisztikák kapacitásának mérőszáma . A legnagyobb pontkészlet kardinálisaként definiálják, amelyet az algoritmus porítani tud . A Vapnik-Tchervonenkis-elmélet központi fogalma . Azt határozza meg Vladimir Vapnik és Alexei Tchervonenkis .

Bemutatás

Informálisan a besorolási modell kapacitása megfelel annak összetettségének. Tekintsük például osztályozási modellnek a magas fokú polinom Heaviside-függvényét : ha egy adott pontban a polinom értéke pozitív, akkor ezt a pontot pozitívnak jelöljük; különben negatívnak jelöljük. A kellően nagy fokú polinom nagyon kanyargós lehet, és jól megfelelhet a képzési pontok mintájának. De e magas szinuszitás miatt azt gondolhatjuk, hogy ez a besorolási modell hamis értékeléseket ad más pontokra. Egy ilyen polinom nagy kapacitással rendelkezik . Ha most ebben a modellben ezt a nagyfokú polinomot lineáris függvénnyel helyettesítjük, akkor a kapott modell nem biztos, hogy megfelel az edzésmintának, mert kapacitása alacsony. A kapacitás ezen fogalmát az alábbiakban szigorúbban írjuk le .

Formális meghatározás

Készletekhez

U halmazban helyezkedik el . Van H családi (véges) részhalmaza (kész) a U , és C egy részhalmazát U .

H nyomai az U C részhalmazán :

{\ displaystyle T_ {H} (C): = \ {h \ cap C \ mid h \ in H \}}

Azt mondjuk, hogy H spray C , ha a nyoma H feletti C egyenlő a készlet részei C, azaz :

${\ displaystyle P (C) = T_ {H} (C)}$ vagy a bíborosok egyenlőségével egyenértékű módon . ${\ displaystyle | H \ cap C | = 2 ^ {| C |}}$

A V V dimenzió ekkor a C halmaz kardinalitása, amely a H által permetezhető .

Edzésben

Azt mondjuk, hogy egy osztályozási modellt , figyelembe, mint a paraméter egy olyan vektor θ, porítja adathalmaz ( ), ha bármely címkézési ezen adathalmaz létezik olyan θ, hogy a modell nem tesz hibát az értékelésben ezen adatbázisba. $f$ $x_ {1}, x_ {2}, \ ldots, x_ {n}$ $f$

Ezután egy modell VC dimenzióját nevezzük a legnagyobb által porított halmaz kardinalitásának . $f$ $f$

A modell VC méretének figyelembevételével tehát: $D_f$ $f$

$D_ {f} = \ max \ {k \, | \, kártya (S) = k {\ text {és}} f {\ text {spray}} S \}$

Példa

Tekintsünk például egy egyeneset osztályozási modellnek . Megvizsgáljuk, hogy a vonal el tudja-e különíteni a pozitív adatokat (+) a negatívaktól (-). Ha 3 nem igazított pontot veszünk fel, akkor a vonal fel tudja őket porítani. A vonal azonban nem tud 4 pontot szórni. Így a vonal VC dimenziója 3. Fontos megjegyezni, hogy kiválaszthatjuk azoknak a pontoknak a helyzetét, amelyeket permetezni fogunk a vonallal, de ezeket a pozíciókat nem módosíthatjuk, amikor felcseréljük a címkézésüket. Az alábbiakban a hárompontos porlasztáshoz a 8 lehetséges címke közül csak 3 látható (1 lehetőség mindhárom pozitív címkézésére, 3 lehetőség 3 pozitívból 2 címkézésére, 3 lehetőség 3 pozitívból 1 jelölésére, 1 pozitív címkézés lehetősége).


3 pontos spray			Ha 4 pont van, a permetezés lehetetlen

Alkalmazások

A VC dimenziót a gépi tanulás elméletében használják egy osztályozási modell teszt maximális valószínű hibahatárának kiszámítására. Az osztályozási modell teszteléséhez az edzésmintából kinyert adatokon függetlenül és azonos elosztásban ezt az értéket a következő képlet szerint számítják ki:

Tanulási hiba + ${\ sqrt {h (\ log (2N / h) +1) - \ log (\ eta / 4) \ N felett}}$

annak valószínűségével , hogy hol van az osztályozási modell VC dimenziója, és a képzési minta méretével. Ez a képlet csak akkor érvényes . $1- \ eta$ $h$ $NEM$ $h <N$

Kapcsolódó cikkek

Megjegyzések és hivatkozások

(fr) Ez a cikk részben vagy egészben venni a Wikipedia cikket angolul című „ VC dimenzió ” ( lásd a szerzők listáját ) .

Olivier Gascu, A VAPNIK-CHERVONENKIS MÉRETE Alkalmazás az ideghálózatokra , p. 252

Lásd is

[PDF] Tanfolyam a statisztikai tanulás elméletéről (V. Vapnik szerint) , François Denis, a Laboratoire d'Informatique Fondamentale de Marseille adatbázisából és tanulási csoportjából
(in) során a VC dimenzió az Andrew Moore
(en) V. Vapnik és A. Chervonenkis. Az események relatív gyakoriságainak valószínűségükhöz való egységes konvergenciájáról. (Az események relatív gyakoriságainak egységes konvergenciájától a valószínűségükig) A valószínűség elmélete és alkalmazásai , 16 (2): 264–280, 1971.
(en) A. Blumer, A. Ehrenfeucht, D. Haussler és MK Warmuth . Tanulhatóság és a Vapnik-Chervonenkis dimenzió. (Tanulási képesség és Vapnik-Chervonenkis dimenzió) Az ACM folyóirata , 36 (4): 929–865, 1989.