A szerkezeti egyenletek modellje

A strukturális egyenletek modellezése vagy a strukturális egyenletekkel történő modellezés, vagy a strukturális egyenletekkel történő modellezés (angolul: strukturális egyenlet-modellezés vagy SEM) sokféle matematikai modellt, számítógépes algoritmust és statisztikai módszert jelöl, amelyek a fogalmak hálózatának felelnek meg az adatokkal. Ezután strukturális egyenleteket használó modellekről, vagy szerkezeti egyenleteket használó modellekről, vagy akár a szerkezeti egyenletek modelljeiről beszélünk.

A SEM gyakran hasznos a társadalomtudományokban, mert lehetővé teszi a megfigyelt változók és a nem megfigyelt változók ( látens változók ) közötti kapcsolatok elemzését . Különböző szerkezeti egyenlet modellezési módszereket alkalmaztak a tudományban, az üzleti életben, az oktatásban és más területeken.

Történelem

Modellezés strukturális egyenletekkel vagy modellező strukturális egyenletek vagy modell strukturális egyenletek vagy modellek strukturális egyenletek, jelenlegi fogalmai szociológia, a pszichológia és más társadalomtudományok alakult át a módszereit genetikai útvonal modellezés által Sewall Wright . A modern formákat a számítógépek jelentős megvalósítása tette lehetővé az 1960-as és 1970-es években. A SEM három különböző úton haladt:

  1. A módszerek regressziós ( rendszerek egyenlet regressziós módszerekkel ) kifejlesztett főleg a Cowles Bizottság  ;
  2. iteratív algoritmusok elvei alapján maximum likelihood terén az elemzés a strukturális kapcsolatokat ( útelemzés ) alakult elsősorban Karl Gustav Jöreskog az Educational Testing Service , majd a University of Uppsala  ;
  3. iteratív algoritmusok alapján a legkisebb négyzetek módszerével is fejlesztették útelemzés az Uppsalai Egyetem által Herman Wold .

Ennek a fejlődésnek a nagy része abban az időben történt, amikor a számításokat automatizálták, helyettesítve a számológép és az analóg számítási módszerek használatát, amelyek maguk a XIX .  Század végi újítások termékei .

A két LISREL és PLS-PA szoftvert iteratív számítógépes algoritmusként tervezték, létrehozásuk óta vágyakoznak egy adatbeviteli felület, grafika és Wrigth (1921) módszerének kiterjesztésére. Korai napjaiban a Cowles Bizottság Koopman és Hood (1953) algoritmusain alapuló egyenleteken is dolgozott, amelyek a közlekedés gazdaságával és az optimális útválasztási problémákkal foglalkoztak  , valamint a legnagyobb valószínűség becslésével és az algebrai számításokkal. számítógépek előtt.

Anderson és Rubin (1949, 1950) kifejlesztett egy maximális valószínűség-becslőt a korlátozott információk számára, amely közvetett módon a legkisebb négyzetek módszerének két fázisát foglalta magában (Anderson, 2005; Farebrother, 1999). A kétlépcsős legkisebb négyzetek módszerét, amelyet eredetileg egyetlen szerkezeti egyenlet paramétereinek becslésére szolgáló módszerként javasoltak az egyidejű egyenletek lineáris rendszerében, Theil (1953a, 1953b, 1961) vezeti be, és Basmann (1957 ) felett vagy kevésbé egymástól függetlenül. ) és Sargan (1958). Ezen módszerek közül a kétlépcsős legkisebb négyzet módszer volt messze a legszélesebb körben alkalmazott módszer az 1960-as években és az 1970-es évek elején.

A regressziós egyenletrendszereket az 1950-es években a Cowles Bizottság fejlesztette ki, Tjalling Koopmans transzportmodelljeinek felhasználásával azok javítására . Sewall Wright és más statisztikusok megkísérelte, hogy támogassák az úgynevezett „  út elemzése  ” módszer Cowles (majd a University of Chicago ). A Chicagói Egyetemen a statisztikusok számos hibát azonosítottak ezen elemzések alkalmazásának módszereiben. Ezek a hibák nem okoztak nagy problémákat a transzmissziós gének azonosítása során a Wright összefüggésében, de a PLS-PA és a LISREL módszereket problematikussá tették a társadalomtudomány területén . Freedman (1987) összefoglalta ezeket a kifogásokat: „Az ok-feltételezések, a statisztikai vonzatok és a politikai állítások megkülönböztetésének képtelensége volt a tudományban a kvantitatív módszerekkel kapcsolatos gyanú és zavartság egyik fő oka. Társadalmi” (lásd még Wold válaszát) 1987-ben). Wright-analízist nem széles körben, majd az amerikai econometrists de sikeres volt a befolyásoló Hermann Wold és tanítványa Karl Jöreskög. Jöreskög tanítványa, Claes Fornell bemutatta a LISREL-t az Egyesült Államokban.

A számítógépek fejlődése kiterjesztette a strukturális egyenlet módszerek alkalmazását a nagy, összetett és strukturálatlan adathalmazokra. A legnépszerűbb technikai megoldások az algoritmusok három osztályába sorolhatók:

  1. az egyes iterációkhoz függetlenül alkalmazott szokásos legkisebb négyzetek (PLS szoftver);
  2. kovariancia-elemzés , amelyet Wold és Jöreskog munkája inspirált (LISREL, AMOS és EQS szoftver);
  3. egyidejű regresszió, amelyet Tjalling Koopmans fejlesztett ki a Cowles Bizottságnál.

A Pearl úgy gazdagítja a SEM-eket, hogy nem parametrikus modelleket alkalmaz rájuk, és az egyenletek oksági és kontrafaktuális értelmezését javasolja. Például egy változó kizárása az egyenlet argumentumaiból annyit jelent, hogy azt mondjuk, hogy a függő változó független a kizárt változó változásaitól, a többi argumentum állandó. A nem paraméteres SEM-ek lehetővé teszik a teljes, közvetlen és közvetett hatások becslését anélkül, hogy vállalnánk az egyenletek formáját vagy a hibakifejtések eloszlását. Ez gazdagítja a kategorikus változókkal rendelkező rendszerek közvetítésének elemzését nemlineáris interakciók jelenlétében. Bollen és Pearl áttekinti a SEM kauzális értelmezésének történetét, és azt, hogy miért vált zavart és vitaforrássá.

A SEM általános megközelítése

Noha az egyes SEM technikák különböznek, itt bemutatjuk a különböző SEM módszerek közös aspektusait.

Modellösszetétel

A SEM két fő komponenst különböztet meg: a strukturális modell célja az endogén és exogén változók közötti lehetséges oksági függőségek kiemelése; valamint a látens változók és mutatóik közötti kapcsolatokat bemutató mérési modell . A faktoranalízis modellek (legyenek feltáró vagy megerősítő) csak a mérési részt tartalmazzák, míg a strukturális pályadiagramok csak a szerkezeti részt tartalmazzák.

Az útvonal ( útvonal ) modell megadásakor a modellező kétféle kapcsolatot okozhat:

A modellező gyakran elméletileg elfogadható modelleket határoz meg annak értékelése érdekében, hogy a javasolt modell a legjobb-e a lehetséges modellek sorozatából. Nemcsak a modell felépítésének elméleti okait kell figyelembe vennie, hanem figyelembe kell vennie az adatpontok számát és azokat a paraméterek számát is, amelyeket a modellnek meg kell becsülnie a modell azonosításához. Azonosított minta az, ahol egy adott paraméter értéke elegendő a minta azonosításához, és más egyenértékű megfogalmazást más paraméterérték nem adhat meg. Az adatpont egy olyan változó, ahol pontszámok figyelhetők meg, például egy kérdés pontszámokat tartalmazó változó. A paraméter a modellező számára érdekes érték. Regressziós együttható lehet egy exogén változó és egy endogén változó között; lehet a tényező súlya (egy mutató és annak tényezője közötti regressziós együttható). Ha kevesebb adatpont van, mint a becsült paraméterek száma, akkor az eredményül kapott modell "azonosítatlan", mert túl kevés referenciaérték van ahhoz, hogy a modell összes varianciáját figyelembe vegyék. A megoldás az, ha az egyik utat nullára korlátozzuk, ami azt jelenti, hogy az már nem része a modellnek.

Ingyenes paraméterbecslés

A paraméterek becslése a valódi kovariancia mátrixok összehasonlításával történik, amely megmutatja a változók és a legjobb modell által becsült kovariancia mátrixok kapcsolatát. Ezt az összehasonlítást egy kiigazítási kritérium alapján kapják meg, amelyet számos becslés alapján számolnak: a legnagyobb valószínűség becslése, a kvázi maximális valószínűség becslése, a súlyozott legkisebb négyzetek becslése vagy az aszimptotikus eloszlások és a szabad eloszlások módszerei. A számítást speciális SEM programok végzik.

Modell és modellillesztés

Miután megbecsülték a modellt, az elemzők ezt követően szeretnék értelmezni a modellt. A becsült struktúrák (vagy útvonalak) táblázatos formában és / vagy grafikusan ábrázolhatók iteratív strukturális modell ( útmodell ) formájában. A változók hatását az útvonalkövetési szabályok segítségével értékelik .

Fontos megvizsgálni egy becsült modell alkalmasságát annak eldöntésére, hogy jól modellezi-e az adatokat. Ez a SEM modellezés alapvető feladata: dönteni a modellek elfogadásának vagy elutasításának alapjáról, és általánosabban elmondani, hogy az egyik versengő modellt elfogadják a másik felett. A SEM programok kimenetei tartalmazzák a modellben szereplő változók közötti kapcsolatok becslésének mátrixait. A jóság értékelése annak kiszámítása, hogy az előrejelzett adatok mennyire hasonlítanak a valós adatok közötti kapcsolatokat tartalmazó mátrixokhoz.

Erre a célra statisztikai teszteket és illesztési mutatókat fejlesztettek ki. Az egyes modellparamétereket a becsült modellben is megvizsgálhatjuk, hogy lássuk, a javasolt modell hogyan illeszkedik-e a modellt irányító elmélethez. A legtöbb becslési módszer lehetővé teszi ilyen becslés elkészítését.

Mint minden hipotézis tesztelésen alapuló statisztikában , a SEM modelltesztének alapja az a feltételezés, hogy a releváns, helyes és teljes adatokat használják. A SEM szakirodalomban az illesztésről folytatott beszélgetések számos ajánláshoz vezettek a különböző indexillesztések és hipotézis tesztek pontos alkalmazásával kapcsolatban.

Az illeszkedés értékelésére különböző megközelítések léteznek. A hagyományos megközelítések a nullhipotézisből indulnak ki , előnyben részesítve a parsimonikus (kevesebb szabad paraméterűek) modelleket. Mivel a különböző illeszkedési mértékek megragadják a modell illeszkedésének különböző elemeit, az eredményekben különféle illeszkedési mértékek kiválasztását kell jelenteni. Az alkalmassági intézkedések - többek között az alábbiakban felsoroltak - értelmezésének jó gyakorlata (a döntési pontszám alkalmazása, a cutoff-pontszám ) sok vitát folytat a SEM kutatói között.

A leggyakrabban alkalmazott kiigazítási intézkedések a következők:

Az illeszkedés minden egyes mértékéhez annak eldöntéséhez, hogy mi a kellően jó illeszkedés a modell és az adatok között, figyelembe kell venni más kontextusbeli tényezőket: a minta méretét, a mutatók és a tényezők arányát, valamint a modell általános összetettségét. Például nagyon nagy minták miatt a Chi-négyzet túl érzékeny, és nagyobb valószínűséggel jelzi a modellek közötti megfelelés hiányát.

Modellmódosítás

Előfordulhat, hogy a modellt módosítani kell a változók közötti kapcsolatok illeszkedésének és ezáltal a legvalószínűbb becslésének javítása érdekében. Számos program olyan változtatási tippeket kínál, amelyek kisebb változtatásokat szolgálhatnak. A módosítási indexek χ 2 változását jelzik, amely felszabadítja a rögzített paramétereket. Ez általában iteráció ( útvonal ) megnyitását eredményezi egy modellben, amely nullára állítja. Azok a változások, amelyek javítják a modell illeszkedését, lehetséges változásként jelenthetők be a modellen. A modellen végrehajtott változtatások elméleti változások. Ezért ezeket a tesztelt elmélethez viszonyítva kell értelmezni, vagy el kell ismerni az elmélet határainak. A mérési modellben bekövetkezett változások (faktoranalízis) azt jelzik, hogy az elemek / adatok az elmélet által meghatározott látens változók tisztátalan mutatói.

A modelleket nem az MI vezetheti, amint azt Maccallum (1986) kimutatta: „Még ha a körülmények kedvezőek is, a kutatási specifikációkból fakadó modelleket óvatosan kell szemlélni. "

A minta mérete és teljesítménye

Míg a kutatók egyetértenek abban, hogy a SEM modellekben elegendő statisztikai teljesítmény és pontosság biztosításához nagy mintaméretekre van szükség, nincs általános egyetértés a minta helyes méretének meghatározására szolgáló megfelelő módszerről. Általában a mintaméret meghatározásakor figyelembe veendő tényezők magukban foglalják a paraméterenkénti megfigyelések számát, az index kiigazításának megfelelő elvégzéséhez szükséges megfigyelések számát és a megfigyelések számát az egyes szabadságfokokhoz.

A kutatók a munkatapasztalatok szimulációs tanulmányain és matematikai képleteken alapuló irányelveket javasoltak. A SEM hipotézistesztelésében a szignifikancia és a teljesítmény bizonyos fokának eléréséhez szükséges mintaméret-követelmények ugyanazon modell esetében hasonlóak, függetlenül az alkalmazott algoritmustól (PLS-PA, LISREL vagy egyenletrendszer-regresszió).

Az eredmények értelmezése és közlése

Ezután a modellkészletet úgy értelmezik, hogy a következtetések a legmegfelelőbb modell alapján vonhatók le.

Mindig ügyelni kell az ok-okozati összefüggések megtalálására. Az oksági modell kifejezést "ok-okozati feltételezések modelljeként" kell érteni, nem pedig végleges következtetéseket levonó modellként. Az adatok időbeli több ponton történő összegyűjtése és a kísérleti vagy kvázi-kísérleti felépítés segíthet kiküszöbölni a versengő hipotéziseket, de nem elegendő az oksági következtetés veszélyeinek kiküszöbölésére. Az egy kauzális feltételezéssel kompatibilis modell általi jó illeszkedés mindig ugyanolyan jó illeszkedést jelent egy ellentétes kauzális feltételezéssel kompatibilis modellnél. A kísérleti tervezés, még a legintelligensebb sem, segíthet az ilyen rivális hipotézisek megkülönböztetésében, az intervenciós kísérletek kivételével.

Mint minden tudományban, a későbbi replikáció és esetleg a modell módosítása is követi a kezdeti felfedezést.

Haladó felhasználások

Szoftver

Számos szoftverprogramot használnak az adatok feldolgozásához, hogy megbecsüljék a strukturális egyenletmodellek megfelelőségét. Az 1970-es években megjelent LISREL volt az első ilyen típusú szoftver. Egyéb önálló szoftverek: Mplus, Mx, EQS, Stata és nyílt forráskódú Onyx. Az SPSS Amos kiterjesztése a strukturális modellezésnek is elkötelezett.

Számos könyvtár is rendelkezésre áll a nyílt forráskódú R statisztikai környezet számára . A sem, lava és lavaan könyvtárak felhasználhatók a szerkezeti egyenletmodellekhez. A sparseSEM és a regsem könyvtárak rendszeresített becslési eljárásokat nyújtanak (például Lasso és Ridge). A RAMpath más rutinmodell specifikációkat és egyéb szolgáltatásokat nyújt, de a paraméterbecslést más csomagok szolgáltatják .

Az OpenMx könyvtár az Mx szoftver nyílt forráskódú és továbbfejlesztett verzióját biztosítja.

A kutatók jó tudományos gyakorlatnak tartják, hogy mindig megemlítik a SEM elemzéshez használt szoftvert, mert ezek kissé eltérő módszereket alkalmazhatnak.

Alkalmazások

A pszichometriában

Az emberi intelligencia fogalma nem mérhető közvetlenül, mivel meg lehet mérni az ember magasságát vagy súlyát. A pszichológusok kidolgozzák az intelligencia-tervező mérőeszközök hipotézisét elemekkel (kérdésekkel), amelyek célja az intelligencia hipotéziseik szerinti mérése. Ezután a SEM segítségével tesztelik hipotéziseiket: Egy SEM elemzés során az intelligencia látens változó, és a teszt pontszámok a megfigyelt változók.

A szemközti ábra egy egyszerűsített modellt kínál, amelyben az intelligencia (négy kérdéssel mérve) képes megjósolni a tanulmányi teljesítményt (a SAT, ACT és GPA tesztekkel mérve). A SEM diagramjaiban a látens változókat szokás szerint ovális formában, a mért vagy manifesztált értékeket pedig téglalapként ábrázolják. A diagram bemutatja, hogy az ( e ) hiba hogyan befolyásolja az egyes pontszámokat, de nincs hatással a látens változókra. A SEM elemzés számszerű becslést ad az egyes paraméterek (nyilak) közötti kapcsolat erősségéről. Így a SEM elemzés nemcsak az általános elmélet tesztelését teszi lehetővé, hanem a kutató számára annak diagnosztizálását is, hogy a megfigyelt változók jó indikátorok-e a látens változókra.

Viták és viták

A módszer korlátai

A SEM módszerek kritikusai leggyakrabban a matematikai megfogalmazásra, egyes elfogadott modellek külső érvényességének gyengeségére és a standard eljárásokban rejlő filozófiai elfogultságra koncentrálnak.

Terminológiai zavar

Terminológiai zavarokat használtak egyes módszerek gyengeségeinek elrejtésére. Különösen a PLS-PA-t (Lohmoller algoritmust) tévesztették össze a PLSR részleges legkisebb négyzetek regressziójával, amely a legkisebb négyzetek regressziójának helyettesítője, és semmi köze a strukturális elemzéshez ( útelemzés ). A PLS-PA-t hamisan népszerűsítették olyan módszerként, amely kis adathalmazokkal működik. Westland (2010) érvénytelenítette ezt a megközelítést, és kidolgozott egy algoritmust a SEM-ben szükséges mintaméretek meghatározására. Az 1970-es évek óta a kis minták lehetséges felhasználásának állításait hibásnak ismerik el (lásd például Dhrymes, 1972, 1974; Dhrymes és Erlat, 1972; Dhrymes és mtsai, 1972; Gupta, 1969; Sobel, 1982) .

Megjegyzések és hivatkozások

  1. Kaplan 2007 , p.  79-88.
  2. Pearl, Júdea. "Okozati viszony: modellek, érvelés és következtetés." Econometric Theory 19.675-685 (2003): 46.
  3. Bollen, KA és Pearl, J., A társadalmi kutatás ok-elemzésének kézikönyve , Dordrecht, Springer,2013, 301–328  o. , "Nyolc mítosz az okozati összefüggésről és a szerkezeti egyenlet modellekről"
  4. ( MacCallum és Austin 2000 ,  218–219 . O.)
  5. ( Kline 2011 ,  205. o. )
  6. Kline 2011 , p.  206.
  7. MW Browne és R. Cudeck , Strukturális egyenletmodellek tesztelése , Newbury Park, Kalifornia, Sage,1993, "A modell illesztésének alternatív módjai"
  8. ( Hu és Bentler 1999 ,  27. o. )
  9. ( Kline 2011 ,  201. o. )
  10. (in) JC Loehlin, Látens változós modellek: An Introduction to Factor, Path, és a strukturális egyenlet Elemzés , Pszichológia Press,2004.
  11. (in) R. MacCallum, "  Specifikációs keresések a kovariancia struktúra modellezésében  " , Pszichológiai Értesítő , n o  100,1986, P.  107–120 ( DOI  10.1037 / 0033-2909.100.1.107 )
  12. (in) Stephen M. Quintana és Scott E. Maxwell , "  A strukturális egyenletmodellezés legújabb fejleményeinek következményei a tanácsadó pszichológiában  " , The Counselling Psychologist , Vol.  27, n o  4,1 st július 1999, P.  485-527 ( ISSN  0011-0000 , DOI  10.1177 / 0011000099274002 , online olvasás , hozzáférés : 2017. december 2. )
  13. CP Chou és Peter Bentler , Strukturális egyenlet modellezés: Fogalmak, kérdések és alkalmazások , Thousand Oaks, Kalifornia, Sage,1995, 37–55  p. , "Becslések és tesztek a szerkezeti egyenlet modellezésében"
  14. Peter Bentler és C.-P. Chou , „A  strukturális egyenlet modellezésének gyakorlati kérdései  ”, Szociológiai módszerek és kutatás , 1. évf.  16,1987, P.  78–117
  15. RC MacCallum , M. Browne és H. Sugawara , „  Teljesítményelemzés és a minta méretének meghatározása a kovariancia strukturális modellezéséhez  ”, Psychological Methods , vol.  1, n o  21996, P.  130–149 ( DOI  10.1037 / 1082-989X.1.2.130 , online olvasás , hozzáférés : 2015. január 24. )
  16. Judea Pearl , Okozati viszony: modellek, érvelés és következtetés , Cambridge University Press ,2000, 384  p. ( ISBN  0-521-77362-8 , online olvasás )
  17. (in) Thuy Nguyen , "  Muthén & Muthén Mplus home  " a www.statmodel.com címen (elérhető: 2017. december 2. )
  18. "  About Mx  " , mx.vcu.edu címen (megtekintve 2017. december 2-án )
  19. "  Multivariate Software, Inc.  " a www.mvsoft.com címen (elérhető : 2017. december 2. )
  20. Stata: Strukturális egyenlet modellezés (SEM)
  21. (hu-USA) „  Ωnyx - Onyx: A grafikus felület a strukturális egyenletmodellezéshez  ” , Ωnyx-en (hozzáférés : 2017. december 2. )
  22. (hu-USA) „  IBM SPSS Amos - Áttekintés - Egyesült Államok  ” , www.ibm.com ,1 st december 2017(megtekintve 2017. december 2-án )
  23. John Fox , Zhenghua Nie , Jarrett Byrnes és Michael Culbertson , Sem: strukturális egyenletek modell ,2017. április 24( online olvasás )
  24. Klaus K. Holst , Brice Ozenne és Thomas Gerds , Lava: látens változó modellek ,2017. szeptember 27( online olvasás )
  25. (in) Yves Rosseel , "  The lavaan Project  " a lavaan.ugent.be webhelyen (megtekintve 2017. december 2. )
  26. "  lavaan: Egy R csomag strukturális egyenlet modellezés | Rosseel | Journal of Statistics Software  ”, Journal of Statistics Software ,2012( DOI  10.18637 / jss.v048.i02 , online olvasás , hozzáférés : 2017. december 2. )
  27. Kamel Gana és Guillaume Broc, Bevezetés a strukturális egyenletek szerinti modellezésbe. Gyakorlati kézikönyv lavaannal. , London, ISTE Editions,2018, 304  p. ( ISBN  978-1-78405-462-5 , online olvasás )
  28. "  CRAN - Package sparseSEM  " , a cran.r-project.org oldalon (elérhető : 2017. december 2. )
  29. Ross Jacobucci , Kevin J. Grimm , Andreas M. Brandmaier és Sarfaraz Serang , Regsem: Rendszeres strukturális egyenlet modellezés ,2017. szeptember 8( online olvasás )
  30. Zhiyong Zhang , Jack McArdle , Aki Hamagami és & Kevin Grimm , RAMpath: Strukturális egyenlet modellezése a retikuláris cselekvési modell (RAM) jelölésével ,2016. október 5( online olvasás )
  31. "  OpenMx  " , az openmx.ssri.psu.edu címen (hozzáférés : 2017. december 2. )
  32. Kline 2011 , p.  79-88

Bibliográfia

Lásd is

Kapcsolódó cikkek

Külső linkek angol nyelven

Scales Management Manual , többpontos skálák gyűjteménye, amelyeket korábban egy SEM konstrukcióinak mérésére használtak