A strukturális egyenletek modellezése vagy a strukturális egyenletekkel történő modellezés, vagy a strukturális egyenletekkel történő modellezés (angolul: strukturális egyenlet-modellezés vagy SEM) sokféle matematikai modellt, számítógépes algoritmust és statisztikai módszert jelöl, amelyek a fogalmak hálózatának felelnek meg az adatokkal. Ezután strukturális egyenleteket használó modellekről, vagy szerkezeti egyenleteket használó modellekről, vagy akár a szerkezeti egyenletek modelljeiről beszélünk.
A SEM gyakran hasznos a társadalomtudományokban, mert lehetővé teszi a megfigyelt változók és a nem megfigyelt változók ( látens változók ) közötti kapcsolatok elemzését . Különböző szerkezeti egyenlet modellezési módszereket alkalmaztak a tudományban, az üzleti életben, az oktatásban és más területeken.
Modellezés strukturális egyenletekkel vagy modellező strukturális egyenletek vagy modell strukturális egyenletek vagy modellek strukturális egyenletek, jelenlegi fogalmai szociológia, a pszichológia és más társadalomtudományok alakult át a módszereit genetikai útvonal modellezés által Sewall Wright . A modern formákat a számítógépek jelentős megvalósítása tette lehetővé az 1960-as és 1970-es években. A SEM három különböző úton haladt:
Ennek a fejlődésnek a nagy része abban az időben történt, amikor a számításokat automatizálták, helyettesítve a számológép és az analóg számítási módszerek használatát, amelyek maguk a XIX . Század végi újítások termékei .
A két LISREL és PLS-PA szoftvert iteratív számítógépes algoritmusként tervezték, létrehozásuk óta vágyakoznak egy adatbeviteli felület, grafika és Wrigth (1921) módszerének kiterjesztésére. Korai napjaiban a Cowles Bizottság Koopman és Hood (1953) algoritmusain alapuló egyenleteken is dolgozott, amelyek a közlekedés gazdaságával és az optimális útválasztási problémákkal foglalkoztak , valamint a legnagyobb valószínűség becslésével és az algebrai számításokkal. számítógépek előtt.
Anderson és Rubin (1949, 1950) kifejlesztett egy maximális valószínűség-becslőt a korlátozott információk számára, amely közvetett módon a legkisebb négyzetek módszerének két fázisát foglalta magában (Anderson, 2005; Farebrother, 1999). A kétlépcsős legkisebb négyzetek módszerét, amelyet eredetileg egyetlen szerkezeti egyenlet paramétereinek becslésére szolgáló módszerként javasoltak az egyidejű egyenletek lineáris rendszerében, Theil (1953a, 1953b, 1961) vezeti be, és Basmann (1957 ) felett vagy kevésbé egymástól függetlenül. ) és Sargan (1958). Ezen módszerek közül a kétlépcsős legkisebb négyzet módszer volt messze a legszélesebb körben alkalmazott módszer az 1960-as években és az 1970-es évek elején.
A regressziós egyenletrendszereket az 1950-es években a Cowles Bizottság fejlesztette ki, Tjalling Koopmans transzportmodelljeinek felhasználásával azok javítására . Sewall Wright és más statisztikusok megkísérelte, hogy támogassák az úgynevezett „ út elemzése ” módszer Cowles (majd a University of Chicago ). A Chicagói Egyetemen a statisztikusok számos hibát azonosítottak ezen elemzések alkalmazásának módszereiben. Ezek a hibák nem okoztak nagy problémákat a transzmissziós gének azonosítása során a Wright összefüggésében, de a PLS-PA és a LISREL módszereket problematikussá tették a társadalomtudomány területén . Freedman (1987) összefoglalta ezeket a kifogásokat: „Az ok-feltételezések, a statisztikai vonzatok és a politikai állítások megkülönböztetésének képtelensége volt a tudományban a kvantitatív módszerekkel kapcsolatos gyanú és zavartság egyik fő oka. Társadalmi” (lásd még Wold válaszát) 1987-ben). Wright-analízist nem széles körben, majd az amerikai econometrists de sikeres volt a befolyásoló Hermann Wold és tanítványa Karl Jöreskög. Jöreskög tanítványa, Claes Fornell bemutatta a LISREL-t az Egyesült Államokban.
A számítógépek fejlődése kiterjesztette a strukturális egyenlet módszerek alkalmazását a nagy, összetett és strukturálatlan adathalmazokra. A legnépszerűbb technikai megoldások az algoritmusok három osztályába sorolhatók:
A Pearl úgy gazdagítja a SEM-eket, hogy nem parametrikus modelleket alkalmaz rájuk, és az egyenletek oksági és kontrafaktuális értelmezését javasolja. Például egy változó kizárása az egyenlet argumentumaiból annyit jelent, hogy azt mondjuk, hogy a függő változó független a kizárt változó változásaitól, a többi argumentum állandó. A nem paraméteres SEM-ek lehetővé teszik a teljes, közvetlen és közvetett hatások becslését anélkül, hogy vállalnánk az egyenletek formáját vagy a hibakifejtések eloszlását. Ez gazdagítja a kategorikus változókkal rendelkező rendszerek közvetítésének elemzését nemlineáris interakciók jelenlétében. Bollen és Pearl áttekinti a SEM kauzális értelmezésének történetét, és azt, hogy miért vált zavart és vitaforrássá.
Noha az egyes SEM technikák különböznek, itt bemutatjuk a különböző SEM módszerek közös aspektusait.
A SEM két fő komponenst különböztet meg: a strukturális modell célja az endogén és exogén változók közötti lehetséges oksági függőségek kiemelése; valamint a látens változók és mutatóik közötti kapcsolatokat bemutató mérési modell . A faktoranalízis modellek (legyenek feltáró vagy megerősítő) csak a mérési részt tartalmazzák, míg a strukturális pályadiagramok csak a szerkezeti részt tartalmazzák.
Az útvonal ( útvonal ) modell megadásakor a modellező kétféle kapcsolatot okozhat:
A modellező gyakran elméletileg elfogadható modelleket határoz meg annak értékelése érdekében, hogy a javasolt modell a legjobb-e a lehetséges modellek sorozatából. Nemcsak a modell felépítésének elméleti okait kell figyelembe vennie, hanem figyelembe kell vennie az adatpontok számát és azokat a paraméterek számát is, amelyeket a modellnek meg kell becsülnie a modell azonosításához. Azonosított minta az, ahol egy adott paraméter értéke elegendő a minta azonosításához, és más egyenértékű megfogalmazást más paraméterérték nem adhat meg. Az adatpont egy olyan változó, ahol pontszámok figyelhetők meg, például egy kérdés pontszámokat tartalmazó változó. A paraméter a modellező számára érdekes érték. Regressziós együttható lehet egy exogén változó és egy endogén változó között; lehet a tényező súlya (egy mutató és annak tényezője közötti regressziós együttható). Ha kevesebb adatpont van, mint a becsült paraméterek száma, akkor az eredményül kapott modell "azonosítatlan", mert túl kevés referenciaérték van ahhoz, hogy a modell összes varianciáját figyelembe vegyék. A megoldás az, ha az egyik utat nullára korlátozzuk, ami azt jelenti, hogy az már nem része a modellnek.
A paraméterek becslése a valódi kovariancia mátrixok összehasonlításával történik, amely megmutatja a változók és a legjobb modell által becsült kovariancia mátrixok kapcsolatát. Ezt az összehasonlítást egy kiigazítási kritérium alapján kapják meg, amelyet számos becslés alapján számolnak: a legnagyobb valószínűség becslése, a kvázi maximális valószínűség becslése, a súlyozott legkisebb négyzetek becslése vagy az aszimptotikus eloszlások és a szabad eloszlások módszerei. A számítást speciális SEM programok végzik.
Miután megbecsülték a modellt, az elemzők ezt követően szeretnék értelmezni a modellt. A becsült struktúrák (vagy útvonalak) táblázatos formában és / vagy grafikusan ábrázolhatók iteratív strukturális modell ( útmodell ) formájában. A változók hatását az útvonalkövetési szabályok segítségével értékelik .
Fontos megvizsgálni egy becsült modell alkalmasságát annak eldöntésére, hogy jól modellezi-e az adatokat. Ez a SEM modellezés alapvető feladata: dönteni a modellek elfogadásának vagy elutasításának alapjáról, és általánosabban elmondani, hogy az egyik versengő modellt elfogadják a másik felett. A SEM programok kimenetei tartalmazzák a modellben szereplő változók közötti kapcsolatok becslésének mátrixait. A jóság értékelése annak kiszámítása, hogy az előrejelzett adatok mennyire hasonlítanak a valós adatok közötti kapcsolatokat tartalmazó mátrixokhoz.
Erre a célra statisztikai teszteket és illesztési mutatókat fejlesztettek ki. Az egyes modellparamétereket a becsült modellben is megvizsgálhatjuk, hogy lássuk, a javasolt modell hogyan illeszkedik-e a modellt irányító elmélethez. A legtöbb becslési módszer lehetővé teszi ilyen becslés elkészítését.
Mint minden hipotézis tesztelésen alapuló statisztikában , a SEM modelltesztének alapja az a feltételezés, hogy a releváns, helyes és teljes adatokat használják. A SEM szakirodalomban az illesztésről folytatott beszélgetések számos ajánláshoz vezettek a különböző indexillesztések és hipotézis tesztek pontos alkalmazásával kapcsolatban.
Az illeszkedés értékelésére különböző megközelítések léteznek. A hagyományos megközelítések a nullhipotézisből indulnak ki , előnyben részesítve a parsimonikus (kevesebb szabad paraméterűek) modelleket. Mivel a különböző illeszkedési mértékek megragadják a modell illeszkedésének különböző elemeit, az eredményekben különféle illeszkedési mértékek kiválasztását kell jelenteni. Az alkalmassági intézkedések - többek között az alábbiakban felsoroltak - értelmezésének jó gyakorlata (a döntési pontszám alkalmazása, a cutoff-pontszám ) sok vitát folytat a SEM kutatói között.
A leggyakrabban alkalmazott kiigazítási intézkedések a következők:
Az illeszkedés minden egyes mértékéhez annak eldöntéséhez, hogy mi a kellően jó illeszkedés a modell és az adatok között, figyelembe kell venni más kontextusbeli tényezőket: a minta méretét, a mutatók és a tényezők arányát, valamint a modell általános összetettségét. Például nagyon nagy minták miatt a Chi-négyzet túl érzékeny, és nagyobb valószínűséggel jelzi a modellek közötti megfelelés hiányát.
Előfordulhat, hogy a modellt módosítani kell a változók közötti kapcsolatok illeszkedésének és ezáltal a legvalószínűbb becslésének javítása érdekében. Számos program olyan változtatási tippeket kínál, amelyek kisebb változtatásokat szolgálhatnak. A módosítási indexek χ 2 változását jelzik, amely felszabadítja a rögzített paramétereket. Ez általában iteráció ( útvonal ) megnyitását eredményezi egy modellben, amely nullára állítja. Azok a változások, amelyek javítják a modell illeszkedését, lehetséges változásként jelenthetők be a modellen. A modellen végrehajtott változtatások elméleti változások. Ezért ezeket a tesztelt elmélethez viszonyítva kell értelmezni, vagy el kell ismerni az elmélet határainak. A mérési modellben bekövetkezett változások (faktoranalízis) azt jelzik, hogy az elemek / adatok az elmélet által meghatározott látens változók tisztátalan mutatói.
A modelleket nem az MI vezetheti, amint azt Maccallum (1986) kimutatta: „Még ha a körülmények kedvezőek is, a kutatási specifikációkból fakadó modelleket óvatosan kell szemlélni. "
Míg a kutatók egyetértenek abban, hogy a SEM modellekben elegendő statisztikai teljesítmény és pontosság biztosításához nagy mintaméretekre van szükség, nincs általános egyetértés a minta helyes méretének meghatározására szolgáló megfelelő módszerről. Általában a mintaméret meghatározásakor figyelembe veendő tényezők magukban foglalják a paraméterenkénti megfigyelések számát, az index kiigazításának megfelelő elvégzéséhez szükséges megfigyelések számát és a megfigyelések számát az egyes szabadságfokokhoz.
A kutatók a munkatapasztalatok szimulációs tanulmányain és matematikai képleteken alapuló irányelveket javasoltak. A SEM hipotézistesztelésében a szignifikancia és a teljesítmény bizonyos fokának eléréséhez szükséges mintaméret-követelmények ugyanazon modell esetében hasonlóak, függetlenül az alkalmazott algoritmustól (PLS-PA, LISREL vagy egyenletrendszer-regresszió).
Ezután a modellkészletet úgy értelmezik, hogy a következtetések a legmegfelelőbb modell alapján vonhatók le.
Mindig ügyelni kell az ok-okozati összefüggések megtalálására. Az oksági modell kifejezést "ok-okozati feltételezések modelljeként" kell érteni, nem pedig végleges következtetéseket levonó modellként. Az adatok időbeli több ponton történő összegyűjtése és a kísérleti vagy kvázi-kísérleti felépítés segíthet kiküszöbölni a versengő hipotéziseket, de nem elegendő az oksági következtetés veszélyeinek kiküszöbölésére. Az egy kauzális feltételezéssel kompatibilis modell általi jó illeszkedés mindig ugyanolyan jó illeszkedést jelent egy ellentétes kauzális feltételezéssel kompatibilis modellnél. A kísérleti tervezés, még a legintelligensebb sem, segíthet az ilyen rivális hipotézisek megkülönböztetésében, az intervenciós kísérletek kivételével.
Mint minden tudományban, a későbbi replikáció és esetleg a modell módosítása is követi a kezdeti felfedezést.
Számos szoftverprogramot használnak az adatok feldolgozásához, hogy megbecsüljék a strukturális egyenletmodellek megfelelőségét. Az 1970-es években megjelent LISREL volt az első ilyen típusú szoftver. Egyéb önálló szoftverek: Mplus, Mx, EQS, Stata és nyílt forráskódú Onyx. Az SPSS Amos kiterjesztése a strukturális modellezésnek is elkötelezett.
Számos könyvtár is rendelkezésre áll a nyílt forráskódú R statisztikai környezet számára . A sem, lava és lavaan könyvtárak felhasználhatók a szerkezeti egyenletmodellekhez. A sparseSEM és a regsem könyvtárak rendszeresített becslési eljárásokat nyújtanak (például Lasso és Ridge). A RAMpath más rutinmodell specifikációkat és egyéb szolgáltatásokat nyújt, de a paraméterbecslést más csomagok szolgáltatják .
Az OpenMx könyvtár az Mx szoftver nyílt forráskódú és továbbfejlesztett verzióját biztosítja.
A kutatók jó tudományos gyakorlatnak tartják, hogy mindig megemlítik a SEM elemzéshez használt szoftvert, mert ezek kissé eltérő módszereket alkalmazhatnak.
Az emberi intelligencia fogalma nem mérhető közvetlenül, mivel meg lehet mérni az ember magasságát vagy súlyát. A pszichológusok kidolgozzák az intelligencia-tervező mérőeszközök hipotézisét elemekkel (kérdésekkel), amelyek célja az intelligencia hipotéziseik szerinti mérése. Ezután a SEM segítségével tesztelik hipotéziseiket: Egy SEM elemzés során az intelligencia látens változó, és a teszt pontszámok a megfigyelt változók.
A szemközti ábra egy egyszerűsített modellt kínál, amelyben az intelligencia (négy kérdéssel mérve) képes megjósolni a tanulmányi teljesítményt (a SAT, ACT és GPA tesztekkel mérve). A SEM diagramjaiban a látens változókat szokás szerint ovális formában, a mért vagy manifesztált értékeket pedig téglalapként ábrázolják. A diagram bemutatja, hogy az ( e ) hiba hogyan befolyásolja az egyes pontszámokat, de nincs hatással a látens változókra. A SEM elemzés számszerű becslést ad az egyes paraméterek (nyilak) közötti kapcsolat erősségéről. Így a SEM elemzés nemcsak az általános elmélet tesztelését teszi lehetővé, hanem a kutató számára annak diagnosztizálását is, hogy a megfigyelt változók jó indikátorok-e a látens változókra.
A SEM módszerek kritikusai leggyakrabban a matematikai megfogalmazásra, egyes elfogadott modellek külső érvényességének gyengeségére és a standard eljárásokban rejlő filozófiai elfogultságra koncentrálnak.
Terminológiai zavarokat használtak egyes módszerek gyengeségeinek elrejtésére. Különösen a PLS-PA-t (Lohmoller algoritmust) tévesztették össze a PLSR részleges legkisebb négyzetek regressziójával, amely a legkisebb négyzetek regressziójának helyettesítője, és semmi köze a strukturális elemzéshez ( útelemzés ). A PLS-PA-t hamisan népszerűsítették olyan módszerként, amely kis adathalmazokkal működik. Westland (2010) érvénytelenítette ezt a megközelítést, és kidolgozott egy algoritmust a SEM-ben szükséges mintaméretek meghatározására. Az 1970-es évek óta a kis minták lehetséges felhasználásának állításait hibásnak ismerik el (lásd például Dhrymes, 1972, 1974; Dhrymes és Erlat, 1972; Dhrymes és mtsai, 1972; Gupta, 1969; Sobel, 1982) .
Scales Management Manual , többpontos skálák gyűjteménye, amelyeket korábban egy SEM konstrukcióinak mérésére használtak