Maximálisan rendszeresítve

A matematika , a regularizált maximális ( sima maximum ) egy halmazrendszer $x 1 , ..., x n$ számok egy sima közelítése a maximális függvény $max ( x 1 , ..., x n )$ , azaz családi paraméterezett funkciók $m α ( x 1 , ..., x n )$ olyan, hogy a funkció $m α$ szabályos bármely valós érték $α$ , és hajlamos felé a maximális funkciót $α \to \infty$ . A szabályozott minimum fogalma hasonló módon határozható meg. Számos esetben egy család használható a két funkció közelítésére, a nagyon nagy pozitív értékek maximuma, a negatív végtelen felé pedig a minimum:

{\ displaystyle m _ {\ alpha} \ to \ max \ {\ textrm {for}} \ \ alfa \ to \ infty, \ m _ {\ alpha} \ to \ min \ {\ textrm {for}} \ \ alfa \ to - \ infty.}

A kifejezés bármely olyan normalizáló funkcióra használható, amely a maximális függvényhez hasonlóan viselkedik, anélkül, hogy paraméterezné.

Példák

Az $α > 0$ paraméter nagy értéke esetén az alább definiált $S α$ függvény , amelyet néha „ $α$ -softmax” -nak nevezünk , a maximális függvény sima és differenciálható közelítése . A nagy abszolút érték negatív értéke esetén megközelíti a minimumot. Az $α$ -oftmax függvényt a következő határozza meg:

{\ displaystyle S _ {\ alpha} (x_ {1}, \ ldots, x_ {n}) = {\ frac {\ sum _ {i = 1} ^ {n} x_ {i} \ mathrm {e} ^ {\ alpha x_ {i}}} {\ sum _ {i = 1} ^ {n} \ mathrm {e} ^ {\ alpha x_ {i}}}}}

$S α$ a következő tulajdonságokkal rendelkezik:

${\ displaystyle S _ {\ alpha} {\ alul {0$
$S 0$ a számtani átlagot adja eredményül
${\ displaystyle S _ {\ alpha} {\ aláhúzás {\ alpha \ - - infty} {\ longrightarrow}} \ min}$

Az $S α$ gradiens a softmax függvényhez kapcsolódik és egyenlő

{\ displaystyle \ nabla _ {x_ {i}} S _ {\ alpha} (x_ {1}, \ ldots, x_ {n}) = {\ frac {\ mathrm {e} ^ {\ alpha x_ {i} }} {\ sum _ {j = 1} ^ {n} \ mathrm {e} ^ {\ alpha x_ {j}}}} [1+ \ alpha (x_ {i} -S _ {\ alpha} (x_ {1}, \ ldots, x_ {n}))].}

Ez teszi a softmax függvényt érdekessé a gradiens ereszkedést alkalmazó optimalizálási technikák számára .

Hölder szabványok

A legalizált maximum egy formája általánosított átlagon alapulhat . Például az $x 1 , ..., x n$ pozitív értékekhez $α > 1$ sorrendű átlagot használhatunk , vagyis

{\ displaystyle S _ {\ alpha} (x_ {1}, \ ldots, x_ {n}) = \ balra ({\ frac {1} {n}} \ sum _ {j = 1} ^ {n} x_ {j} ^ {\ alpha} \ right) ^ {\ frac {1} {\ alpha}}.}

LogSumExp

Egy másik legalizált maximum a "LogSumExp" néven ismert:

{\ displaystyle \ mathrm {LSE} (x_ {1}, \ ldots, x_ {n}) = \ ln (\ exp (x_ {1}) + \ ldots + \ exp (x_ {n}))}

A függvény normalizálható, ha az $x i$ mind pozitív, ami a $[0, + \infty [ n$ - $[0, + \infty [$ :

{\ displaystyle g (x_ {1}, \ ldots, x_ {n}) = \ ln (\ exp (x_ {1}) + \ ldots + \ exp (x_ {n}) - (n-1))}

Az $( n - 1)$ kifejezés egy korrekciós együttható annak figyelembe vételére, hogy az $exp (0) = 1$ , így biztosítva, hogy $g (0, ..., 0) = 0 legyen,$ ha az összes $x i$ nulla.

A LogSumExp funkció beállítható az artefaktumok simításának elkerülése érdekében. Ezt a formát " $α$ -quasimax" -nak hívjuk, amelyet a következők határoznak meg:

{\ displaystyle {\ mathcal {Q}} _ {\ alpha} (x_ {1}, \ ldots, x_ {n}) = {\ frac {1} {\ alpha}} \ mathrm {LSE} (\ alpha x_ {1}, \ ldots, \ alpha x_ {n}) = {\ frac {1} {\ alpha}} \ ln (\ exp (\ alpha x_ {1}) + \ ldots + \ exp (\ alpha x_ { nem}))}

Használja numerikus módszerekben

A sima maximumok érdekesek lehetnek a diszkrét adatsorok extrém kereséseiben vagy a gradiens süllyedés optimalizálási algoritmusaiban.

Lásd is

Hivatkozások

(fr) Ez a cikk részben vagy egészben venni a Wikipedia cikket angolul című „ Smooth maximum ” ( lásd a szerzők listáját ) .

(en) M. Lange, D. Zühlke, O. Holz és T. Villmann, „ Applications of l p -norms és zavartalan közelítő gradiens alapú tanulás vektor kvantálás ” , Proc. ESANN ,2014, P. 271–276 ( online olvasás )
(in) Takács Gábor " maximális Smooth algoritmusok besorolás, regresszió, és csoportos " , Acta Technica Jaurinensis , vol. 3, n o 1,2010, P. 27-63