A matematika , a módszer a lineáris algebra , hogy lebomlására szinguláris értékek (vagy SVD , a angol szinguláris érték dekompozíció ) egy mátrix fontos eszköze faktorizáció tényleges téglalap alakú vagy komplex mátrixok. Alkalmazásai a jelfeldolgozástól a statisztikákig , beleértve a meteorológiát is .
A spektrális tétel kimondja, hogy egy normális mátrixot lehet diagonalizálható egy ortonormáiis bázis a sajátvektor . Láthatjuk a szinguláris értékbontást, mint a spektrális tétel általánosítását tetszőleges mátrixokra, amelyek nem feltétlenül négyzetesek.
Legyen M olyan m × n mátrix, amelynek együtthatói a K mezőhöz tartoznak , ahol K = ℝ vagy K = ℂ . Ekkor létezik a forma faktorizálása :
,a U egy egységes mátrix m × m a K , Σ egy m × n mátrix , amelynek diagonáiis együtthatók pozitívak vagy nulla valós számok, és az összes többi nulla, és V * jelentése a szomszédos mátrix a V , egységes mátrix n × n a K . Ezt nevezzük az M szinguláris értékbontásának faktorálásával .
A mátrix λ sajátértékét az M u = λ u összefüggés jellemzi . Ha M jelentése hermitikus másik különböző jellemzése lehetséges. Legyen M valós szimmetrikus n × n mátrix . Az f : R n → R értéket úgy állítjuk be , hogy f ( x ) = x T M x . Ez a függvény folyamatos, és eléri a maximumot egy bizonyos u vektorban, amikor a zárt egységgömbre korlátozódik {|| x || ≤ 1}. Szerint a Lagrange multiplikátor-tétel , u kielégíti:
Könnyen megmutatjuk, hogy a fenti összefüggés megadja M u = λ u értéket . Így λ az M legnagyobb sajátértéke . Ugyanez a műveleteket ortogonális kiegészítője az u , így a második legnagyobb érték, és így tovább. Az esetben, ha a Hermite-komplex mátrix hasonló, a F ( x ) = x * M x , a funkciója a 2 n változók valós értékeket.
Az egyes értékek hasonlóak, mivel algebrailag vagy variációs elvek alapján írhatók le. Másrészt, a sajátértékek esetétől eltérően, az M hermiticitására és szimmetriájára már nincs szükség.
Bizonyítás algebra használatávalLegyen M komplex m × n mátrix . Ekkor M * M pozitív félhatározott, ezért remete. A spektrális tétel szerint létezik az n oldal négyzetes egységmátrixa , amelyet V-nek jelölünk , így:
,ahol D átlós, pozitív határozott , sőt r rangsorolja azt az M-et . V megfelelő megírásával :
a V 1 n × r mátrix rang R és V 2 n × mátrix (NR) .
Így V * 1 M * MV 1 = D és MV 2 = 0. Beállítottuk:
Tehát van:
Láthatjuk, hogy ez majdnem a várt eredmény, csakhogy az U 1 részleges izometriával rendelkező r × m mátrix ( U 1 U * 1 = I ). A bizonyítás kitöltéséhez az U 1- et kitöltjük, hogy egységes legyen. Az egyik olyan U 2-t választ , amely egységes. Egy számítás azt mutatja, hogy:
Valóban, az MV 2 = 0 értéket használjuk, és ezt azért látjuk, mert és ahogyan az egységes
amely megfelel a várt eredménynek, figyelembe véve az U számára a szomszédos mátrixot .
Az igazolást úgy is elkezdhettük, hogy M * M helyett diagonalizáltuk az MM * -t, és akkor közvetlenül megmutattuk volna, hogy az MM * és M * M azonos nulla nulla sajátértékekkel rendelkeznek.
Egyéb jellemzésA szinguláris értékek is jellemezhető, mint a maximális értékek a u T Mv , tekinthető függvényében u és v , mint különösen altér. Az egyes vektorok azok az u és v értékek, amelyekre ezek a maximumok elértek.
Legyen M valós m × n mátrix . Legyen S m –1 és S n –1 az R m és az R n egységvektorainak halmaza (a 2. norma szerint) . Beállítottuk a függvényt:
,az u ∈ S m –1 és v ∈ S n –1 vektorokhoz .
Úgy véljük, a funkció σ korlátozódik S m -1 × S n -1 . Mivel az S m –1 és az S n –1 is kompakt halmaz , ezért a termékük is kompakt. Sőt, mivel σ folyamatos, akkor eléri a maximumát legalább egy u ∈ S m –1 és v ∈ S n –1 vektorpár esetében . Ezt a maximumot σ 1 , a megfelelő vektorokat pedig u 1 és v 1 jelöljük . Mivel σ 1 az σ ( u , v ) legnagyobb értéke , ezért pozitív: ha negatív lenne, akkor az u 1 vagy v 1 előjelének megváltoztatásával pozitívvá tennénk - és ennélfogva nagyobbá.
A Lemma - u 1 és v 1 az σ 1-hez társított M bal és jobb oldali egyes vektora .
Bizonyítás - A sajátértékek esetében feltételezve, hogy a két vektor megfelel a Lagrange-egyenletnek :
.Megmutatjuk, hogy ez:
, és .Ha a bal oldali első egyenletet megszorozzuk u-valT
1, a másodikat pedig balra vT
1, azáltal , hogy:
Így σ 1 = 2 λ 1 = 2 λ 2 . Tehát van:
, És hasonlóképpen ,.Más szinguláris vektorok és szinguláris értékek úgy érhetők el, hogy maximalizáljuk az σ ( u , v ) értéket u , v felett , amelyek merőlegesek u 1-re és v 1 -re.
Ugyanígy lehet kezelni a komplex mátrixok esetét is.
Hívjuk szinguláris érték az M bármely négyzetgyöke egy sajátértéke M * M , más szóval minden pozitív valós σ, hogy létezik egy egységvektor u a K m és egy egységnyi vektor v a K n kielégíti:
A vektorok u és v nevezik a bal szinguláris vektorok és a megfelelő szinguláris vektorok a σ, ill.
Bármilyen bontásban egyes számokban,
,a Σ átlós együtthatói megegyeznek az M egyes értékeivel . Az U és V oszlopai a megfelelő egyes számok bal és jobb oldali vektorai.
Ezért a fenti tétel kimondja, hogy:
Degeneráltnak mondjuk azt az egyes értéket, amelynek bal oldalán (illetve a jobb oldalon) két szinguláris vektort találhatunk .
A nem degenerált szinguláris értékeknek bal és jobb oldalon mindig van egyetlen szinguláris vektoruk, fáziseltolódásig, azaz az e i φ alak tényezőjével való szorzásig (valós számok esetén közeli előjelig) ). Következésképpen, ha az M összes szinguláris értéke nem degenerált és nem nulla, akkor szinguláris értékekre bomlása egyedülálló az U oszlop és a megfelelő V oszlop ugyanazzal a fáziseltolással való szorzásakor .
A degenerált egyes értékeknek definíció szerint több egyes vektoruk van. Továbbá, ha u 1 és u 2 két bal szinguláris vektorok, amelyek megfelelnek az azonos szinguláris érték σ, akkor minden egység kapott vektorból lineáris kombinációja a két vektor is egy bal szinguláris vektort σ. Ugyanez vonatkozik a jobb oldali egyes vektorokra is. Tehát, ha M- nek degenerált szinguláris értékei vannak, akkor szinguláris értékekre bomlása nem egyedi.
Legyen a mátrix:
Az M szinguláris értékbontása ekkor:
(a nem egész értékek valójában közelítések 10–3-on belül : és )
Így:
Ellenőrizzük, hogy a Σ csak átlóján van-e nulla érték. Továbbá, amint azt az alábbiakban, megszorozzuk az U és V * mátrixok által átültetett , megkapjuk az identitás mátrix:
És hasonlóképpen:
Az egyes értékbontás nagyon általános, abban az értelemben, hogy bármely m × n téglalap alakú mátrixra vonatkozik . A sajátérték-bontás viszont csak bizonyos négyzetmátrixok esetén működik . Ha azonban mindkettő meghatározva van, akkor kapcsolatban állnak egymással.
Pozitív félhatározott M hermitikus mátrix esetén, vagyis az összes sajátérték pozitív valós, akkor az egyes értékek és az egyes vektorok megfelelnek az M sajátértékeinek és sajátvektorainak :
Általánosságban elmondható, hogy az M egyedi értékbontása esetén :
ésE kapcsolatok jobb oldala a bal oldal sajátérték-bontását írja le. Tehát az egyes M- értékek, amelyek nem nulla értékek, modulusának négyzete megegyezik az M * M és az MM * megfelelő nulla érték nélküli sajátértékének modulusával . Ezenkívül az U oszlopok (a szinguláris vektorok balra) a sajátvektorai , a V oszlopai pedig (a jobb oldali szinguláris vektorok) a tiszta M * M vektorok .
Mivel U és V egységesek, tudjuk, hogy az oszlopok u 1 , ..., u m a U képezik ortonormális alapján K m , és az oszlopok v 1 , ..., v n a V alkotnak ortonormált alapján K n (ezeken a tereken lévő skaláris szorzathoz képest).
A T : K n → K m lineáris transzformáció , amely minden egyes x vektorhoz társítja Mx-et , viszonylag egyszerű kifejezéssel rendelkezik ezekben az ortonormális bázisokban: T ( v i ) = σ i u i , i = 1, ..., min ( m , n ), ahol σ i a i i- edik átlós együtthatója, és T ( v i ) = 0 i > min ( m , n ) esetén.
A szinguláris értékbontási tétel geometriai tartalma a következőképpen foglalható össze: bármely lineáris T térképhez : K n → K m , találhatunk K n számára ortonormális és K m ortonormális alapot úgy, hogy T asszociáljon az i - th alapján vektor a K n pozitív többszöröse a i -edik alapján vektor K m , a fennmaradó vektorokat, amelyek a keret 0. ezekben az alapanyagokban, az alkalmazás T így képviseli egy diagonális mátrix , amelynek együtthatók valósak pozitív.
Ez a bontás értelmezhető egy adatsor statisztikai vizsgálatának szellemében is . Ezután az U fő oszlopai a vizsgálati halmaz trendjeit képviselik (az U vektorai a halmaz „legnagyobb variációs irányait” képviselik). A Σ átlós értékei ekkor analógak az „ energiával ” vagy „reprezentativitással”, amelyek súlyozzák ezeket a viselkedéseket; a statisztikai halmaz rendezésével annál gyorsabban csökkennek.
Megfontolhatjuk például adatbányászat szempontjából , hogy az egész „fontos” információja az, amely markánsabb szerkezetet mutat. Ezután a Σ átlójának egy bizonyos indexen kívüli törlésével , majd a kezdő mátrix rekonstruálásával szűrt adatokat kapunk, amelyek a kezdő halmaz domináns információját képviselik. Ezzel egyenértékűnek tekinthető egy bizonyos küszöbértéknél alacsonyabb energia nulladat.
Így az SVD lehetővé teszi egy empirikus modell felépítését , anélkül, hogy elméletet alapozna meg , annál pontosabban, ahogy a kifejezéseket beillesztik.
Az is lehetséges, hogy az első adatsor egyes vektorainak bázisát felhasználva rekonstruáljunk egy másik adathalmazt kisebb-nagyobb pontossággal, a kettő közötti hasonlóság meghatározása érdekében. Ennek az elvnek megfelelően alakultak ki arcbontási, felismerési és rekonstrukciós rendszerek.
A módszer hatékonysága különösen attól függ, hogy az információt hogyan mutatják be neki. Egy arc példájánál , ha egy fénykép különféle képpontjainak fényességét naivan használjuk az egyes vektorok bázisának felépítésére, akkor nehéz lesz ugyanazt az arcot kissé eltérő pózban rekonstruálni (vagy ha a arc változott): a pixelek változtak - néha nagyon -, de az implicit információk (azaz az arc) nem. Ezekben az alkalmazási területeken előnyös az adatok térbeli feldolgozása, ezért hozzáadunk egy 3D-s felismerési rendszert, amely lehetővé teszi a megfigyelt variációk "magyarázatát" az összekapcsolásukkal és az ismert adatokkal való összekapcsolását.
A szinguláris értékbontást eredetileg a differenciálgeometriát tanulmányozó matematikusok fejlesztették ki , és meg akarták állapítani, hogy az egyik valós bilináris forma megegyezhet-e a másikkal a két érintett tér független ortogonális transzformációival.
Eugenio Beltrami és Camille Jordan 1873-ban, illetve 1874-ben egymástól függetlenül fedezték fel, hogy a mátrix formában ábrázolt bilinear formák egyes értékei az inverziók teljes készletét alkotják az ortogonális szubsztitúciót végző bilinear formák számára.
James Joseph Sylvestert is érdekelte a négyzet alakú valós mátrixok 1889-es egyedi értékbontása, nyilvánvalóan Beltrami és Jordan munkájától függetlenül. Sylvester az egyes értékeknek egy A- mátrix "kanonikus szorzóinak" nevét adta .
A bomlás felfedezésének eredete a negyedik matematikus, Autonne, 1915-ben . Ezt az eredményt poláris bomlás útján éri el.
A négyszögletes és összetett mátrixok egyedi értékbontásának első bizonyítékát Eckart és Young tulajdonítja, 1936-ban.
1907-ben Erhard Schmidt meghatározta az integrált operátorok egyes értékeinek analógját (amelyek bizonyos körülmények között kompaktak ); úgy tűnik, hogy nem ismerte a véges dimenziós mátrixok egyesértékeinek párhuzamos munkáját . Ezt az elméletet Émile Picard francia matematikus fejlesztette tovább 1910-ben, aki az általa megjegyzett modern "egyes értékek" kifejezés eredete .
1965 előtt nem volt ismert hatékony módszer a bomlás kiszámítására. Gene H. Golub és William Kahan abban az évben javaslatot tett egy első algoritmusra, majd 1970-ben Golub és Christian Reinsch közzétette a Golub-Kahan algoritmus egy változatát, amely a mai napig a legszélesebb körben használatos.
Ennek a bontásnak a két, három vagy N dimenzióra történő általánosítása továbbra is aktív kutatás tárgya, mivel számos területen kiemelkedő érdeklődésnek bizonyul.
Általános gyakorlat, hogy a szinguláris értékbontás eredményeit összekapcsolják a független komponenselemzés (vagy ICA) eredményeivel. A kettő kombinációját használó algoritmusokat általában SVD / ICA- nak hívják . Valójában a független komponensekben végzett elemzés figyelembe veszi azokat a sorrendeket, amelyek nagyobbak vagy egyenlőek mint 2, és amelyeket az egyes számok bomlása elhanyagol.
A módszer a generalizált szinguláris érték felbontás , vagy GSVD , kiterjeszti a koncepció a szinguláris érték dekompozíció alkalmazásával kvadratikus félig szabványok és alkalmazza a lineáris rendszerek .
Ha egy m × n méretű A mátrixot és egy valós vagy komplex p × n méretű B mátrixot adunk meg, általános bomlásuk:
és
a U , V és Q a egységes mátrixok és R egy felső háromszög mátrix, nonsingular, négyzet r × r , kiválasztásával r ≤ n a rangot az [ A * , B * ] .
Ezenkívül Σ 1 és Σ 2 m × r, illetve p × r mátrix , nulla mindenhol, kivéve főátlójukat, amely az α i és β i valósokat tartalmazza , így:
.A kapcsolatok analógak az egyes értékekkel. A konkrét, de fontos esetben, ha B jelentése tér és invertálható, ezek azok a szinguláris értékek, U és V ezután a szinguláris vektorok a mátrix AB -1 .
Lehetséges kiterjeszteni a szinguláris értékbontás fogalmát komplex mátrixokra, vagy ezzel egyenértékű módon a 2D vektorokból álló mátrixokra. A számítás közel áll az egyszerű szinguláris értékbontáshoz. A bomlásról egyes számokban 2D vagy 2DSVD beszélünk .
Ami az egyszerű esetet illeti, vannak speciális algoritmusok, amelyek közelítik az alacsony rangú mátrixok halmazát, például időjárási képek vagy térképek.
Legyen X = ( x 1 , ..., x n ) valós számok halmaza (azaz 1D vektorok). A szinguláris értékbontáshoz megalkotjuk a kovariancia mátrixot és a Gram mátrixot:
.Ezután kiszámítjuk sajátvektoraikat U = ( u 1 , ..., u n ) és V = ( v 1 , ..., v n ) . Mivel :
.Az U és V csak a K fő sajátvektorainak megtartásával , ezáltal az X mátrix alacsony sorrendű közelítésének megszerzésével . A 2DSVD algoritmusokhoz 2D mátrixokkal dolgozunk, vagyis mátrixok halmazával ( X 1 , ..., X n ) . Megalkotjuk a sor-és oszlop-oszlop kovariancia mátrixokat :
.Ehhez ugyanúgy jár el, mint a vektorbontás, és kiszámítja saját U és V vektorukat . Megközelítjük az X i-t :
a szinguláris értékekre történő bontással azonos módszerrel.
Így a ( X 1 , ..., X n ) közelítést kapjuk a függvény alapján :
A 2DSVD algoritmusokat főleg a tömörítésben és a képábrázolásban használják . Az SVD használata a képtömörítéshez azonban optimálisnak bizonyult a DCT- hez képest , különösen azért, mert a képadatok mellett maga a transzformáció továbbítása is kötelező. Szerepe a tömörítés területén valójában marginális.
A kibontott mátrixok használatának mérlegelésével kiterjeszthetjük a szinguláris értékek bontását háromdimenziós esetekre vagy 3DSVD-re . Ilyen algoritmusokat használnak a szeizmológiában , a meteorológiában és az akusztikában , ahol gyakran szükséges a 3D (vagy 2D időjárástól függő) adatok elemzése.
A felhasználások során meglehetősen ritka, hogy a szinguláris értékbontás teljes formáját kell használni, beleértve a teljes magbontást egység formában. Valójában általános, gyorsabb és memória szempontjából olcsóbb az SVD kisebb verzióinak használata. A következő bontások érvényesek az r rangú m × n mátrixokra .
SVD "rendben"Csak az n oszlop vektorok U megfelelő sorvektorait a V * számítjuk. Az U fennmaradó oszlopvektorait nem számoljuk, ami nagy mennyiségű számítást takarít meg, ha . A mátrix U n tehát m × n , Σ n jelentése diagonális n × n és V jelentése n × n .
Az első lépés a számítás egy „finom” SVD a QR bomlása M , amely lehet optimalizálni az .
"Kompakt" SVDCsak az R oszlop vektorok U és az R sorvektorait a V * megfelelő a nem zéró szinguláris értékek Σ r számítjuk. Gyorsabban kapunk eredményt, mint a „finom” SVD-vel, ha . Az U r mátrix tehát m × r , Σ r átlós r × r és V r * r × n .
SVD "csonka"Csak a T oszlop vektorok U , és a t sorvektorait a V * megfelelő t legnagyobb szinguláris értékek Σ r számítjuk. Még gyorsabb számítás, mint a "kompakt" SVD . Az U t mátrix tehát m × t , Σ t átlós t × t és V t * t × n .
Ez a „csonka” bontás azonban már nem az eredeti M mátrix pontos lebontása , hanem a kapott mátrix ,, az M legjobb közelítése, amelyet egy t rangú mátrix hoz létre , az R euklideszi normáinak alárendelt operátor normáihoz. n és R m .
Az összeg a k legnagyobb szinguláris értékeinek H egy szabvány a vektortér mátrixok, az úgynevezett normál Ky Fan vagy szabványos k az M .
A Ky ventilátor normák közül az első, a Ky ventilátor 1. norma megegyezik az M, mint lineáris operátor operátor normájával , a K m és K n euklideszi normák szerint . Más szóval, Ky Fan norma 1 a operátornorma által indukált euklideszi belső termék szabvány L 2 . Emiatt operátor 2-nek is nevezik. Könnyen ellenőrizhető a Ky Fan 1-es norma és az egyes számok közötti kapcsolat. Ez általában igaz egy korlátozott M operátorra egy (potenciálisan végtelen) Hilbert tér felett:
Mindazonáltal, abban az esetben, mátrixok, ( M * M ) ½ egy normális mátrix , így || M * M || ½ az ( M * M ) ½ legnagyobb sajátértéke , tehát az M legnagyobb egyesértéke .
Ky Fan utolsó normája, amely megegyezik az összes egyes érték összegével, a || által meghatározott nyomnorm M || = Tr ( M * M ) ½ .
Figyelembe vesszük az n sorrendű mátrixok algebrájában meghatározott lineáris formát :
Figyelembe vesszük a mátrixok spektrális normáját , és a kettős normát az alábbiak szerint definiáljuk :
Ezután könnyen ellenőrizhető, hogy ez a kettős norma valójában X fent meghatározott nyoma normája . Sőt, ez a norma algebrai norma.
Az egyes értékek az operátorok terének másik normájához kapcsolódnak. Hilbert - Schmidt skaláris szorzatát vesszük figyelembe az n × n mátrixokon , amelyet < M , N > = Tr N * M határoz meg . Ekkor az indukált norma || M || = < M, M > ½ = (Tr M * M ) ½ . Mivel a nyom hasonlósági invariáns, ez azt jelenti, hogy:
,ahol s i H egyesértékei . Ez az úgynevezett Frobenius norma , szabványos 2 Schatten vagy szabványos Hilbert-Schmidt a M . Azt is megmutatjuk, hogy ha:
,akkor ez a norma egybeesik:
.A H = U Σ V * faktorizáció meghosszabbítható, mint korlátozott M operátor a Hilbert H téren . Általában bármely korlátozott M operátor esetében létezik U részleges izometria , V egységvektor , mérési tér (X, μ) és pozitív mérhető f , amely:
ahol a szorzás f on L 2 ( X , μ ).
Ez a mátrixesethez használt lineáris algebra argumentumon dolgozva mutatható ki . VT f V * az egyedi pozitív gyökere M * M , által adott funkcionális elemzése a Borel , az önadjungált operátorok. Az oka annak, hogy az U-nak nem kell egységesnek lennie, összefügg azzal a ténnyel, hogy a véges dimenziós esettől eltérően, ha egy U 1 izometriát egy nem triviális maggal adunk meg , akkor egy U 2 izometria létezik, amely:
egységes operátor.
Mivel a mátrixok esetében az egyedi értékbontás egyenértékű az operátorok poláris felbontásával, ezt átírhatjuk a következő formában:
és vegye észre, hogy az UV * még mindig részleges izometria, amíg a VT f V * pozitív.
Kiterjeszteni a fogalom egyes érték és egyedülálló vektorok esetében szereplők , meg kell korlátozni magunkat kompakt operátorok a Hilbert terek . Felidézünk néhány hasznos tulajdonságot:
Használata diagonalizáció, az egység kép a pozitív négyzetgyökét M , jele T F , van egy ortonormáiis család sajátvektorok { e i }, megfelelő szigorúan pozitív sajátértékei { σ i }. Minden ψ ∈ H ,
amikor a sorozat konvergál általában a H . Észrevesszük, hogy ez a kifejezés a véges dimenzió esetében közel áll ahhoz.
Az σ i- t H- nek egyes értékeinek nevezzük . Az { U e i } és a { V e i } analóg a balra és jobbra eső egyes számú vektorokkal, M-rel .
A szinguláris értékekben történő bontás lehetővé teszi egy mátrix ál-inverzének kiszámítását . Valóban, a pszeudo-inverzét mátrix M ismerve annak felbontása szinguláris értékek M = U Σ V * , adja meg:
ahol Σ + a p ál inverzje, ahol bármely nem nulla együtthatót inverzére cserélünk. Maga az ál-inverz megoldja a legkisebb négyzetek módszert .
A szinguláris értékbontás másik felhasználása a kép és az M mátrix magjának explicit ábrázolása . Jobb szinguláris vektorok megfelelő nulla szinguláris értékeinek M generál a nucleus M . A bal oldali szinguláris vektorok, amelyek az M nem nulla szinguláris értékeinek felelnek meg, létrehozzák a képét.
Ezért a rangsorban az M száma megegyezik az nem nulla szinguláris értékeinek M . Ezenkívül az M , M * M és az MM * rangja megegyezik. M * M és MM * ugyanazok a nullától eltérő sajátértékek.
A lineáris algebrában numerikusan meg lehet jósolni a mátrix tényleges rangját, mivel a kerekítési hibák egyébként kicsi, de nem nulla értékeket generálhatnak, torzítva a mátrix rangjának kiszámítását.
Néhány gyakorlati alkalmazásokat kell, hogy megoldja a problémát a közelítő mátrixok M egy mátrix , amelynek adott rangot egyenlő r . Abban az esetben, ha megpróbáljuk minimalizálni az spektrumnorma (vagy a Frobenius) értelmében vett távolságot az M között, és miközben megtartjuk , megjegyezzük, hogy a megoldás az M szinguláris értékekben való bomlása , vagyis :
A egyenlő Σ , kivéve, hogy az csupán a legnagyobb szinguláris értékek, a többi tagot helyébe 0. Itt a bizonyíték:
DemonstrációAz egyszerűség kedvéért csak négyzetmátrixokra korlátozódunk. A hármas normaszimbólum a spektrális norma képviseletére szolgál. Elsőként Eckart Young tételét igazoljuk a spektrális normára. Az általánosság elvesztése nélkül feltételezhetjük, hogy A átlós mátrix, ezért U és V az identitásmátrix. Ezért A = Σ értéket adunk meg . A diagonális feltételei A jelöljük σ i . Csökkenő sorrendbe vannak rendezve. Így van
Bármely r rangú B mátrixot figyelembe vesszük . Úgy véljük, a vektor altér E az által generált vektorokkal ( e 1 , ..., e r +1 ) , ahol minden egyes e i az a vektor, (0, ..., 0,1,0, ..., 0) nem nulla rangot i . Ennek a vektoros altérnek dimenziója r +1. Mivel a B mátrix r rangú , B magja n - r rangú . Egyszerű dimenzió-érveléssel E és B magja metszéspontja nem nulla. E kereszteződéshez tartozó normalizált x vektort tekintünk . Meghatározzuk Akkor van
Mivel az e i vektorok ortogonálisak és normalizálódnak, megkapjuk:
A spektrális norma meghatározása alapján az ember arra következtet, hogy bármi is legyen a B mátrix , van
A bizonyítást választással zárjuk le . n aztán könnyen megfigyeli azt .
Tehát B = Σ ' az a rang r mátrix, amely minimalizálja az A - B spektrális normáját .
A Frobenius-norma bizonyítását illetően ugyanazokat a jelöléseket tartjuk fenn, és ezt észrevesszük
A bizonyítás ekkor hasonló.
Így az r rang mátrixa az M legjobb közelítése a Frobenius (vagy spektrális) norma értelmében, amikor . Ezenkívül egyes értékei megegyeznek az M első legnagyobb r - jével .
A szinguláris értékbontás egyik fő alkalmazása a természetes nyelv feldolgozásában a látens szemantikai elemzés (LSA vagy, angol látens szemantikai elemzés ), a vektor-szemantika módszere . Ennek a folyamatnak az a célja, hogy elemezze a dokumentumok halmaza és az azokban található kifejezések vagy kifejezések közötti kapcsolatokat azáltal, hogy létrehozza a különböző elemek közös fogalmait.
1988-ban szabadalmaztatta, látens szemantikai indexelésnek (LSI) is nevezik. Itt van ennek az algoritmusnak az elve rövid leírása.
Először egy mátrixot állítanak össze, amely a kifejezések különböző előfordulásait (előre meghatározott szótárból vagy dokumentumrészletekből) jeleníti meg, a dokumentumok függvényében. Vegyünk például három irodalmi művet:
Ekkor az ezekhez a dokumentumokhoz társított M mátrix a következő lesz:
én | én | rajong | gyűlölt | a | Wikipédia | csokoládé | |
---|---|---|---|---|---|---|---|
1. dokumentum | 1 | 0 | 1 | 0 | 0 | 1 | 0 |
2. dokumentum | 1 | 0 | 1 | 0 | 1 | 0 | 1 |
3. dokumentum | 0 | 1 | 0 | 1 | 1 | 0 | 1 |
Végül egyes szavakat radikálisra vagy egyenértékű szóra redukálhatunk, sőt elhanyagolhatunk bizonyos kifejezéseket, amelyek túl rövidek ahhoz, hogy jelentésük legyen; a mátrix ekkor tartalmaz I , imádok , utálok , Wikipédiát , csokoládét . Az együtthatók (itt 1 vagy 0) általában nem számítanak számot, hanem a dokumentumban előforduló kifejezés előfordulásainak számával arányos értékek, a tf ( kifejezés gyakorisága ) súlyozásáról beszélünk . Más súlyozás, például az idf ( inverz dokumentum gyakorisága vagy TF-IDF ) is érintett lehet.
Ekkor M formájú lesz:
Dolgozhatunk M transzpozíciójával is , amelyet N jelöl . Ekkor az N sorvektorai megfelelnek egy adott kifejezésnek, és hozzáférést biztosítanak az egyes dokumentumokhoz tartozó "kapcsolatukhoz":
Ugyanígy az N mátrix oszlopa egy adott dokumentumot képvisel, és hozzáférést biztosít az egyes terminusokhoz való viszonyához:
Két dokumentum feltételei közötti összefüggést skaláris szorzatuk végrehajtásával érhetjük el . A szorzat kiszámításával kapott szimmetrikus mátrix mind ezeket a ponttermékeket tartalmazza. Az S ( i , p ) indexű eleme a következő terméket tartalmazza:
.Hasonlóképpen, a szimmetrikus mátrix az összes dokumentum között a ponttermékeket tartalmazza, amely megadja a korrelációt a kifejezések szerint:
.Az egyik most kiszámítja az N mátrix szinguláris bontását , amely a következő mátrixokat adja:
Ekkor a korrelációs mátrixok a következők lesznek:
A mátrix U tartalmazza sajátvektorai a S , a mátrix V tartalmazza azokat a Z . Ezután:
Ezután a szinguláris értékek kiválaszthatók a mátrix tetszőleges k rangú „közelítésének” megszerzéséhez , amely lehetővé teszi az adatok többé-kevésbé pontos elemzését.
A robotikában az inverz kinematika problémája , amely lényegében abban rejlik, hogy "hogyan kell elmozdulni egy pont eléréséig" tudható meg, szinguláris értékekre bontva.
A probléma megállapításaMondhatjuk - ez egy nagyon általános modellt - a robot álló csuklós kar, indexelt i , alkotó szög θ i közöttük, egy síkban. Jelölje X a vektor képviselő a helyzet a „vége” ez a lánc a karok, amelyek a gyakorlatban egy bilincs , egy tűt , egy mágnes ... A probléma az lesz, hogy határozza meg a vektort Θ , amely tartalmazza az összes θ i , így X egyenlő egy adott X 0 értékkel .
FelbontásAz X jakobiusát az alábbiak szerint definiáljuk :
.Ezután:
.Ha J jelentése invertálható (ami a gyakorlatban mindig ez a helyzet), akkor elérhetik a származék θ :
.Ha J nem invertálható, akkor is használhatjuk az ál-inverz fogalmat . Ennek ellenére a használata nem garantálja az algoritmus konvergenciáját, ezért szükséges, hogy a jakobiusz nulla legyen a csökkentett számú pontban. Megjegyezve ( U , Σ , V ) a szinguláris érték felbontás a J , az inverz (a pszeudo-inverz, ha J jelentése nem invertálható) a J adja meg:
(visszafordítható eset); (ál-invertálható eset).Megemlítettük Σ + a nem nulla egyes szám inverzét tartalmazó átlós mátrixot. A következőkben, a jelölést J -1 utalnak megkülönböztetés nélkül az inverz vagy pszeudo-inverzét J .
A J oszlopvektorainak kiszámítása a következőképpen hajtható végre:
Szóval .
Ezután diszkretizálhatjuk az egyenletet azáltal, hogy feltesszük:
És ha minden iterációnál hozzáadunk Δ Θ- t Θ-hez , majd Δ X és Δ Θ újraszámításával fokozatosan elérjük a kívánt megoldást.
Egyéb felbontásA Δ Θ megszerzésére egyébként J szinguláris értékbontását is lehet használni :
Ha balra egymás után szorozzuk J-vel, majd átültetjük, és végül J T J egyesérték-bontását használjuk , akkor:
Vagy zárva:
.A szinguláris értékbontás gyakori alkalmazása a jel két további altérre osztása, például egy "jel" és egy zaj altérre . Az egyes számokban történő bontást sokat használják a mátrixok inverziójának tanulmányozásában, nagyon praktikusak a szabályozás módszereiben . Széles körben használják statisztikákban , jelfeldolgozásban , minták felismerésében és a természetes nyelvek számítógépes feldolgozásában is.
A meteorológiában ezen algoritmuson keresztül nagy mátrixok vannak lebontva, például a Lanczos algoritmus esetében.
A geológiai és szeizmikus vizsgálat , amelynek gyakran köze van a zajos adatokhoz, szintén felhasználja ezt a bomlást és annak többdimenziós változatait a kapott spektrumok "tisztításához". Bizonyos számú ismert minta alapján egyes algoritmusok egyes számbontás révén dekonvolúciót hajthatnak végre egy adatkészleten.
Az egyes számokat is automatikusan használják . Lehetővé teszik az átviteli függvény erősítési elvének általánosítását egy több bemenetű, több kimeneti rendszerre . A szinguláris értékeket használjuk a számításban a norma H ∞ fejlesztésére egy érdekében H ∞ .
A mátrix egyedi értékekre történő bontásának explicit, analitikus kiszámítása általában nehéz. Speciális algoritmusokat használnak, különösen az alkalmazásokban.
A LAPACK könyvtár DGESVD eljárása jelenlegi megközelítést javasol a mátrix szinguláris értékekre történő bontásának kiszámításához. Ha a mátrixnak több sora van, mint oszlopának, akkor először QR-bontást hajtanak végre . Az R tényezőt ezután kétirányú alakúra csökkentjük . Ehhez Householder transzformációkat felváltva hajthatunk végre az oszlopokon és a mátrix sorain. Ezután a szinguláris értékeket és a szinguláris vektorokat a DBDSQR eljárással kétirányú QR típusú iteráció végrehajtásával találjuk meg.
A GNU Tudományos Könyvtára három lehetőséget kínál: a Golub-Reinsch algoritmust, a módosított Golub-Reinsch algoritmust (gyorsabb a mátrixoknál, ahol sokkal több a sor, mint az oszlop) és a Jacobi ortogonalizációt.