驗(yàn)證性因子分析(什么數(shù)據(jù)適合因子分析)創(chuàng)2021-06-09 11:07·Codewar
快一個(gè)月沒(méi)更新文章啦,今天收到好幾個(gè)粉絲的催更私信,好的吧,實(shí)在對(duì)不住大家期待的眼神,看樣子不能再拖啦,想想寫(xiě)啥好呢,大家咨詢比較多的,混合模型算一個(gè),今天就繼續(xù)給大家寫(xiě)寫(xiě)混合模型如何做吧。
(資料圖)
混合模型一般都可以用lme4這個(gè)包解決,lme4既可以做線性混合模型,也可以做廣義線性混合模型還可以做非線性混合模型,大家有需要可以只研究這一個(gè)包就行。
所謂混合模型就是既有固定效應(yīng)又有隨機(jī)效應(yīng)的模型:
“mixedeffects”, denotes a model that incorporates both fixed- and random-effects terms in a linear predictor expression from which the conditional mean of the response can be evaluated
第一部分 線性混合模型直接上例子,數(shù)據(jù)是來(lái)自一篇研究睡眠剝奪的文獻(xiàn),整個(gè)數(shù)據(jù)大概長(zhǎng)下圖這樣,其中我們的受試者在day0的時(shí)候可以睡到自然醒,在之后的日子里所有的受試者就只能睡3個(gè)小時(shí)了,我們的響應(yīng)變量是Reaction,就是對(duì)受試者做的測(cè)驗(yàn)的響應(yīng)時(shí)間,我現(xiàn)在關(guān)心睡眠剝奪后,響應(yīng)時(shí)間的變化情況:
對(duì)于這么一個(gè)縱向數(shù)據(jù),
我們來(lái)捋一捋:我們只有18個(gè)人受試者,每個(gè)受試者隨訪10次,我們需要明白的是,此時(shí)我們的每一次測(cè)量是嵌套在人的水平上的,我們可以認(rèn)為,不同人自己的10次測(cè)量是有強(qiáng)烈的相關(guān)性的,而不同人之間的這種關(guān)系又不一定是相同的。
直觀一點(diǎn),我們可以畫(huà)出來(lái)每一天所有人響應(yīng)時(shí)間和睡眠剝奪的變化,畫(huà)出來(lái)就是下圖:
可以看到我們上面的這個(gè)大圖是由很多個(gè)小圖組成的,每一個(gè)小圖中橫軸就是睡眠剝奪的時(shí)間,縱軸是反應(yīng)時(shí)間。每個(gè)小圖就代表著我們要研究的睡眠剝奪和反應(yīng)時(shí)間的關(guān)系(具體到人),但是我們也應(yīng)該注意到這種關(guān)系在不同的人上是不同的,體現(xiàn)在:關(guān)系的斜率不同和截距不同。(這個(gè)關(guān)系的不同可以很明顯的在圖中看出來(lái))
所以我們就可以擬合一個(gè)帶有隨機(jī)效應(yīng)的混合模型:
fm1<-lmer(Reaction~Days+(Days|Subject),sleepstudy)
運(yùn)行代碼后得到下面的結(jié)果:
結(jié)果中有隨機(jī)效應(yīng)的標(biāo)準(zhǔn)差和固定效應(yīng)的β估計(jì),我得到的截距是251.4,斜率是10.5,這兩個(gè)系數(shù)就是我們研究的總體關(guān)系的表示,通常需要在文獻(xiàn)中匯報(bào),就意味著睡眠不剝奪的時(shí)候人的反應(yīng)時(shí)間是251.4,而睡眠每剝奪多一天反應(yīng)時(shí)間增長(zhǎng)10.5。
上面這個(gè)是最簡(jiǎn)單的混合模型。我們繼續(xù)看:
lme4包高水平設(shè)置介紹混合模型公式
對(duì)于一個(gè)常見(jiàn)的混合模型,我們可以在lme4包中寫(xiě)出來(lái)如下差不多的混合模型公式:
resp~FEexpr+(REexpr1|factor1)+(REexpr2|factor2)+...
這個(gè)公式中FEexpr就是固定效應(yīng),(REexpr1 | factor1)and(REexpr2 | factor2)都是隨機(jī)效應(yīng),理論上你可以弄很多個(gè)隨機(jī)效應(yīng)但是實(shí)際操作中我們不會(huì)關(guān)心那么多。
理解混合模型公式
我們看到每一個(gè)隨機(jī)效應(yīng)在公式中的表達(dá)都是(expr | factor)這樣的。豎杠前面的expr就是一個(gè)常規(guī)的回歸公式,豎杠后面的factor就是一個(gè)常規(guī)的因子,你可以把豎杠想象成回歸公式和因子的交互:
One way to think about the vertical bar operator is as a special kind of interaction betweenthe model matrix and the grouping factor。This interaction ensures that the columns of themodel matrix have different effects for each level of the grouping factor.
這種交互的意思就是在因子的不同水平,我們的回歸是不一樣的,這也正好和我們前面的解釋相對(duì)應(yīng),就是在不同的人的水平睡眠剝奪和響應(yīng)時(shí)間的關(guān)系不一樣。
寫(xiě)到這,希望大家能記住下面這張表:
這個(gè)表就給我們展示了常見(jiàn)的隨機(jī)效應(yīng)的設(shè)置,比如(1 | g),就是說(shuō)在因子g的不同水平,我們響應(yīng)變量的截距都不一樣。表中的第二行有個(gè)offset,表示沒(méi)有固定效應(yīng)。如果我們的數(shù)據(jù)是一個(gè)三層嵌套數(shù)據(jù),我們可以用第三行的設(shè)定來(lái)表示隨機(jī)截距;如果你的數(shù)據(jù)沒(méi)有直接嵌套但是在g1和g2的不同水平上存在相關(guān),那么可以用第四行的設(shè)定,這個(gè)在項(xiàng)目反應(yīng)理論中比較常見(jiàn)。
在lme4中,默認(rèn)認(rèn)為同一個(gè)模型的截距和斜率是存在相關(guān)的,如果你確定截距和斜率無(wú)關(guān)那么設(shè)定隨機(jī)效應(yīng)的時(shí)候就可以用兩個(gè)豎杠,或者把截距和斜率分開(kāi)來(lái)寫(xiě),就是說(shuō)(x || g)和x +(1 | g) + (0 + x | g)表達(dá)的隨機(jī)效應(yīng)都是一樣的。
比如如果我認(rèn)為睡眠剝奪和反應(yīng)時(shí)間隨機(jī)效應(yīng)的截距和斜率無(wú)關(guān),我便可以做如下設(shè)定:
fm2<-lmer(Reaction~Days+(Days||Subject),sleepstudy)#截距和斜率無(wú)關(guān)的設(shè)定
有時(shí)候我們擬合一個(gè)后又想嘗試對(duì)模型進(jìn)行改變,但又不想重寫(xiě),此時(shí)就可以直接對(duì)相似的模型基礎(chǔ)上進(jìn)行更新:
模型的更新
比如我想在fm1的基礎(chǔ)上去掉隨機(jī)斜率只留隨機(jī)截距,我就可以用updata寫(xiě)出如下代碼:
fm3<-update(fm1,.~.-(Days|Subject)+(1|Subject))#模型的更新
到底哪一個(gè)模型更好呢?
可以用anova方法進(jìn)行模型間的比較:
anova(fm1,fm2,fm3)
運(yùn)行代碼會(huì)輸出比較的結(jié)果:
其中,從模型比較的結(jié)果可以看出,給模型增加一個(gè)截距和斜率無(wú)關(guān)的隨機(jī)效應(yīng)相比會(huì)使得模型的deviance變小,進(jìn)一步將隨機(jī)效應(yīng)設(shè)定為相關(guān),并不能夠顯著地減小deviance,從而我們就可以知道fm2才是對(duì)數(shù)據(jù)擬合最好的模型。
第二部分 非線性混合模型非線性混合模型就是通過(guò)一個(gè)連接函數(shù)將線性模型進(jìn)行拓展,并且同時(shí)再考慮隨機(jī)效應(yīng)的模型。
The fixed-effects parameters describe the general patterns of the data and random-effects parameters describe specific clusters. If the model is nonlinear in the parameters,it is called a nonlinear mixed-effects model (Davidian &Giltinan, 2003)
非線性混合模型常常在生物制藥領(lǐng)域的分析中會(huì)用到,因?yàn)楹芏鄤┝糠磻?yīng)并不是線性的,如果這個(gè)時(shí)候數(shù)據(jù)再有嵌套結(jié)構(gòu),那么就需要考慮非線性混合模型了。
看下面這個(gè)圖,這個(gè)圖描繪了不同人用了茶堿過(guò)后的反應(yīng),時(shí)間是橫軸,殘留是縱軸,和開(kāi)篇線性模型中睡眠剝奪和反應(yīng)時(shí)間的例子一樣,我們把每個(gè)人的關(guān)系都做了圖出來(lái),不過(guò)從圖中可以明顯看出這種關(guān)系并不是簡(jiǎn)單線性的。
其實(shí)這種不是線性的關(guān)系存在的情況很多。
比如漸進(jìn)回歸:
再比如邏輯增長(zhǎng):
此時(shí)我們要注意到像這兩非線性關(guān)系模型的參數(shù)都不是簡(jiǎn)單的一個(gè)斜率加個(gè)截距了。都有φ1,φ2,φ3三個(gè)額外參數(shù)。
這兒先給大家寫(xiě)一個(gè)邏輯增長(zhǎng)的實(shí)際例子:我現(xiàn)在有一個(gè)關(guān)于樹(shù)木周徑的數(shù)據(jù)集,每棵樹(shù)隨訪了7次,每次隨訪記錄數(shù)的年齡age,和周徑,我現(xiàn)在想研究在所有樹(shù)木中時(shí)間和周徑的關(guān)系。
很自然,我們可以想到不同的樹(shù)這個(gè)關(guān)系應(yīng)該是不一樣的,我們想探求的一定是考慮了樹(shù)水平的變異之后的總體關(guān)系,所以不妨先畫(huà)出來(lái)每個(gè)樹(shù)的關(guān)系:
從圖中可以看到我們總共有5棵樹(shù),基本關(guān)系是一致的,但存在些許變異相關(guān)(所以考慮混合模型),而且這個(gè)關(guān)系并不是線性的(時(shí)間越大周徑基本不改變了),所以我們應(yīng)該考慮非線性的混合模型。
具體地,我們可以用nlmer方法來(lái)擬合非線性混合模型,方法參數(shù)包括3部分:首先是響應(yīng)變量,然后是非線性函數(shù),然后是混合效應(yīng)公式:
The formula argument fornlmeris in three parts: the response, the nonlinear model function depending on covariates and a set of nonlinear model (nm) parameters, and the mixed-effects formula.
比如對(duì)我們的數(shù)據(jù)我就可以寫(xiě)出如下SSlogis方法的代碼:
print(nm1<-nlmer(circumference~SSlogis(age,Asym,xmid,scal)~Asym|Tree,Orange,start=c(Asym=200,xmid=770,scal=120)),corr=FALSE)
此時(shí)我們選擇的非線性函數(shù)是邏輯增長(zhǎng)函數(shù)SSlogis,剛剛給大家解釋了這個(gè)函數(shù)是有3個(gè)參數(shù)的,在上面的代碼中,age是我們的預(yù)測(cè)變量,Asym, xmid, scal分別是額外的三個(gè)參數(shù)(之前的邏輯增長(zhǎng)的式子和Asym/(1+exp((xmid-input)/scal))等同):
進(jìn)一步,擬合邏輯增長(zhǎng)是要我們給出這些參數(shù)的初始值的,然后從初始值通過(guò)梯度下降尋找各個(gè)參數(shù)的最優(yōu)解:
SSlogis has an attribute called "initial", which is a function that nls can call to compute reasonable starting values for fitting a logistic function to the input data.
所以我們看到代碼中都給出了響應(yīng)參數(shù)的初始值。
運(yùn)行上面代碼后輸出如下結(jié)果:
我們可以看到結(jié)果中的固定效應(yīng)里面有Asym,Xmid,scal參數(shù)的估計(jì)結(jié)果。
那么這些參數(shù)如何解釋呢?
留個(gè)懸念我們下期再更。關(guān)注關(guān)注關(guān)注,嘿嘿。
小結(jié)很久沒(méi)更新了,今天給大家寫(xiě)了如何用lme4做混合模型,包括線性和非線性的例子,感謝大家耐心看完,自己的文章都寫(xiě)的很細(xì),代碼都在原文中,希望大家都可以自己做一做,請(qǐng)關(guān)注后私信回復(fù)“數(shù)據(jù)鏈接”獲取所有數(shù)據(jù)和本人收集的學(xué)習(xí)資料。如果對(duì)您有用請(qǐng)先收藏,再點(diǎn)贊轉(zhuǎn)發(fā)。
也歡迎大家的意見(jiàn)和建議,大家想了解什么統(tǒng)計(jì)方法都可以在文章下留言,說(shuō)不定我看見(jiàn)了就會(huì)給你寫(xiě)教程哦,另咨詢代做請(qǐng)私信。
如果你是一個(gè)大學(xué)本科生或研究生,如果你正在因?yàn)槟愕慕y(tǒng)計(jì)作業(yè)、數(shù)據(jù)分析、論文、報(bào)告、考試等發(fā)愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何問(wèn)題,都可以聯(lián)系我。因?yàn)槲铱梢越o您提供好的,詳細(xì)和耐心的數(shù)據(jù)分析服務(wù)。
如果你對(duì)Z檢驗(yàn),t檢驗(yàn),方差分析,多元方差分析,回歸,卡方檢驗(yàn),相關(guān),多水平模型,結(jié)構(gòu)方程模型,中介調(diào)節(jié),量表信效度等等統(tǒng)計(jì)技巧有任何問(wèn)題,請(qǐng)私信我,獲取詳細(xì)和耐心的指導(dǎo)。
If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.
Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??
Then Contact Me. I will solve your Problem...
往期精彩R數(shù)據(jù)分析:有調(diào)節(jié)的中介
R數(shù)據(jù)分析:用R語(yǔ)言做meta分析
R數(shù)據(jù)分析:用R語(yǔ)言做潛類(lèi)別分析LCA
R數(shù)據(jù)分析:多分類(lèi)邏輯回歸
R數(shù)據(jù)分析:如何做聚類(lèi)分析,實(shí)操解析
R數(shù)據(jù)分析:主成分分析及可視化
R數(shù)據(jù)分析:混合效應(yīng)模型實(shí)例
R數(shù)據(jù)分析:生存分析的做法與解釋續(xù)
R數(shù)據(jù)分析:如何做潛在剖面分析Mplus
R數(shù)據(jù)分析:中介作用與調(diào)節(jié)作用的分析與解釋
R數(shù)據(jù)分析:生存分析的做法和結(jié)果解釋
R數(shù)據(jù)分析:潛在剖面分析LPA的做法與解釋
R數(shù)據(jù)分析:逐步回歸的做法和原理,案例剖析
R數(shù)據(jù)分析:著名的“三門(mén)問(wèn)題”的R語(yǔ)言模擬
R數(shù)據(jù)分析:潛變量與降維方法(主成分分析與因子分析)
R數(shù)據(jù)分析:雙分類(lèi)變量的交互作用作圖
R數(shù)據(jù)分析:傾向性評(píng)分匹配實(shí)例操作
R數(shù)據(jù)分析:ROC曲線與模型評(píng)價(jià)實(shí)例
R數(shù)據(jù)分析:如何用R語(yǔ)言做meta分析,寫(xiě)給小白
R數(shù)據(jù)分析:多水平模型詳細(xì)說(shuō)明
R數(shù)據(jù)分析:如何用R做驗(yàn)證性因子分析及畫(huà)圖,實(shí)例操練
R數(shù)據(jù)分析:多元邏輯斯蒂回歸的做法
R數(shù)據(jù)分析:嵌套數(shù)據(jù)分析為什么要用加隨機(jī)效應(yīng)?終于解釋清楚了
R數(shù)據(jù)分析:交叉滯后模型非專(zhuān)業(yè)解釋
R數(shù)據(jù)分析:再寫(xiě)潛在類(lèi)別分析LCA的做法與解釋
R數(shù)據(jù)分析:如何繪制回歸分析結(jié)果的森林圖
R數(shù)據(jù)分析:傾向性評(píng)分匹配完整實(shí)例(R實(shí)現(xiàn))
R數(shù)據(jù)分析:手把手教你畫(huà)列線圖(Nomogram)及解讀結(jié)果
R數(shù)據(jù)分析:混合效應(yīng)模型的可視化解釋?zhuān)俨欢驼鏇](méi)辦法
R數(shù)據(jù)分析:廣義估計(jì)方程式GEE的做法和解釋
R數(shù)據(jù)分析:tableone包的詳細(xì)使用介紹
關(guān)鍵詞: 驗(yàn)證性因子分析 什么數(shù)據(jù)適合因子分析
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
- 已進(jìn)行全面整改!BOSS直聘、滿幫:即日起恢復(fù)新用戶注冊(cè)
- 連續(xù)借利好拉升后 大盤(pán)終于露出了猙獰的面目
- 美國(guó)西方石油公司股價(jià)上漲4.8% 京東、阿里巴巴跌超1%
- 上交所股票交易互聯(lián)互通機(jī)制獲批
- 截至今年3月底,全國(guó)返鄉(xiāng)入鄉(xiāng)創(chuàng)業(yè)人數(shù)累計(jì)1120多萬(wàn)
- 城市競(jìng)爭(zhēng)迎百年未有之大變局 都市圈時(shí)代正在到來(lái)!
- 將啟動(dòng)股份制改制工作 三六零“0元”轉(zhuǎn)讓哪吒汽車(chē)部分股權(quán)
- 西湖生物醫(yī)藥近日獲超億元A+融資 武漢敏聲完成近6億元融資
- 上汽:對(duì)于手機(jī)和車(chē)機(jī)的融合方面也有深度思考
- 總投資額約849億元!第六屆世界智能大會(huì)在津閉幕
資訊
- 元?dú)馍滞瓿闪藢?duì)杏皮茶“最喜”的收購(gòu)
- 御供俊元接任!索尼集團(tuán)中國(guó)副總代表高橋洋已正式退休
- 火車(chē)票搜索量上漲1.5倍!通信行程卡取消“星號(hào)”標(biāo)記
- 日產(chǎn)在美召回32萬(wàn)多輛汽車(chē) 車(chē)型為2013年至2016年的322671輛Pathfinder SUV
- 高盛的內(nèi)部預(yù)測(cè)顯示:今年的消費(fèi)者業(yè)務(wù)損失將超過(guò)12億美元
- 虎牙被罰2萬(wàn)元!多位主播跳舞現(xiàn)不雅動(dòng)作
- 埃克森美孚及帝國(guó)石油以19億加元出售XTO Energy Canada
- 恒生指數(shù)夜期(6月)收?qǐng)?bào)22131點(diǎn) 跌240點(diǎn)或1.073%
- 讀書(shū)郎(02385)擬發(fā)行5200萬(wàn)股股份 于2022年6月29日至2022年7月5日招股
- QQ賬號(hào)被盜?謹(jǐn)慎掃描二維碼 做好個(gè)人保護(hù)
焦點(diǎn)
- 回應(yīng)全球通脹!瑞典將加息速度提高一倍
- 實(shí)現(xiàn)凈零排放!英國(guó)電網(wǎng)將花費(fèi)209億英鎊
- 通信行程卡取消“星號(hào)”標(biāo)記 相關(guān)酒店搜索大漲220%
- 稻田變沙灘 !意大利70年來(lái)最嚴(yán)重干旱
- 加大歐央行加息壓力 西班牙6月通脹率飆升至10%創(chuàng)歷史新高
- 通脹對(duì)家庭造成的壓力之大 英國(guó)零售商本月提價(jià)速度為2008年以來(lái)最快
- 歐盟提案2035年禁售燃油車(chē) 遭到多位成員國(guó)的反對(duì)
- 百萬(wàn)只蝗蟲(chóng)入侵意大利 將會(huì)對(duì)糧食安全造成嚴(yán)重威脅
- 燃料短缺和價(jià)格飆升!法國(guó)能源巨頭敦促民眾減少燃料和電力消費(fèi)
- 美國(guó)汽車(chē)協(xié)會(huì):美國(guó)一加侖汽油的全國(guó)平均價(jià)格接近5美元