潛在類別分析原理及實(shí)例分析
- 期刊名字:中國(guó)衛(wèi)生統(tǒng)計(jì)
- 文件大?。?49kb
- 論文作者:曾憲華,肖琳,張巖波
- 作者單位:山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)教研室,中國(guó)疾病預(yù)防控制中心
- 更新時(shí)間:2020-09-25
- 下載次數(shù):次
中國(guó)衛(wèi)生統(tǒng)計(jì)2013年12月第30卷第6期●815●潛在類別分析原理及實(shí)例分析*曾憲華'肖琳2張巖波'^|提要]目的介紹潛在類別分析的原理、方法和技術(shù),探討潛在類別分析在多個(gè)二分類反應(yīng)變量中聚類的應(yīng)用。方法采用Mplus軟件,對(duì)太原市青少年吸煙知識(shí)的調(diào)查問(wèn)卷進(jìn)行潛在類別分析。結(jié)果3804 名學(xué)生總的被分為5個(gè)潛在類別,每一類別的人數(shù)分別為2879人.367人、248人.234人和76人,各類別的概率分別為0. 757 ,0. 096、0 0655、0. 062和0.020。結(jié)論潛在類別分析用于多個(gè)二分類反應(yīng)變量的聚類 有很好的效果。(關(guān)鍵詞]潛在類別模型 潛 在聚類分析青少年吸煙潛在類別分析( latent class analysis, LCA)是通過(guò)式中πPC表示一個(gè)潛類別模型的聯(lián)合概率,πX為潛在潛在類別模型( latent class model, LCM) ,用內(nèi)在的潛類別概率,它表示當(dāng)觀察變量局部獨(dú)立時(shí),潛變量X在在類別變量來(lái)解釋外顯的類別變量之間的關(guān)系,使得第t個(gè)水平的概率,即從樣本中隨機(jī)選取的觀察對(duì)象外顯變量之間的關(guān)系經(jīng)過(guò)潛在類別變量估計(jì)后,能夠?qū)儆跐撛陬悇et的概率。比重較大的潛在類別表示在維持其局部獨(dú)立性。潛在類別分析的基本假設(shè)是,對(duì)潛變量中具有較重要的地位,類似于因子分析中解釋各外顯變量各種反應(yīng)的概率分布可以由少數(shù)互斥的潛變異百分比,各潛在類別的概率總和為1,即:在類別變量來(lái)解釋,每種類別對(duì)各外顯變量的反應(yīng)選E-x =1.00(2)擇都有特定的傾向"。潛在類別分析的統(tǒng)計(jì)原理建立在概率的多變量分πx為條件概率,表示屬于第I個(gè)潛在類別的個(gè)體析之上。一個(gè)潛在類別模型是由一個(gè)(或多個(gè))潛在對(duì)觀察變量A的第i個(gè)水平作出反應(yīng)的概率。對(duì)于各潛變量X和多個(gè)外顯變量Y組成的貝葉斯網(wǎng),分為兩種在類別,由于潛變量的各水平相互獨(dú)立,因此各外顯變類型:潛在類別模型與多層潛在類別模型(hierarchical量的條件概率總和為1,即:latent class model , HLCM)。LCM只包含一個(gè)潛在變2πx = 2m啾= EmK =1.00(3)量,HLCM包含兩個(gè)以上潛在變量。2.參數(shù)估計(jì)與模型擬合模型基本原理潛在類別模型主要采用最大似然法(maximumlikelihood ,ML)進(jìn)行參數(shù)估計(jì),其迭代過(guò)程常用的算法潛在類別模型分析過(guò)程包括模型參數(shù)化.參數(shù)估有EM( expectation- maximization)、.NR( newton Rapson)計(jì)、模型識(shí)別、擬合優(yōu)度評(píng)價(jià)、潛在分類與結(jié)果解釋等算法。其中EM算法最為常用。等12-5)。模型適配檢驗(yàn)方法主要有Pearson檢驗(yàn)、似然比卡1.概率參數(shù)化方(或稱)檢驗(yàn)以及信號(hào)評(píng)價(jià)指標(biāo)(informationLCM的概率參數(shù)化( probabilistic parameterization)evaluation criteria) ;其中,AIC準(zhǔn)則( akaike information包括兩種類型的參數(shù):潛在類別概率( latent class proba-criterion)和BIC準(zhǔn)則( bayesian information criterion)bilities)和條件概率( conditional probabilities)。 假設(shè)有是LCM選擇中使用最為廣泛( McCutcheon ,2002)的A、B、C三個(gè)外顯變量,分別具有1、J、K個(gè)水平數(shù),其彼信號(hào)評(píng)價(jià)指標(biāo),其均建立于似然比卡方檢驗(yàn)基礎(chǔ)之上,此之間不相互獨(dú)立。若存在一具有T個(gè)潛類別的潛可用于比較對(duì)參數(shù)進(jìn)行不同限制的模型,兩者均以越變量X,其不僅可以解釋A、B、C三者間的關(guān)系,且在小表明適配度越好。Lin與Dayton指出當(dāng)樣本量數(shù)以x的每個(gè)類別中,能夠維持A、B .C這個(gè)三個(gè)外顯變量千計(jì)時(shí)BIC指標(biāo)更可靠,否則AIC更佳(6)。的局部獨(dú)立性,即為潛在類別分析,其數(shù)學(xué)模型為:3.潛在分類πQC= 2mYmnxπXπx(1)在確定最優(yōu)模型以后,最后一步就是將各個(gè)觀察.值分配到適當(dāng)?shù)臐撛陬悇e當(dāng)中,來(lái)說(shuō)明觀察值的后驗(yàn)* :國(guó)家自然科學(xué)基金資助項(xiàng)目(30972553) ;中國(guó)疾病預(yù)防控制中心青類別屬性,即” 中國(guó)煤化工理是依據(jù)貝葉斯年基金項(xiàng)目(2009A204)理論,分類概MHCNM HG1.山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)教研室(030001)2.中國(guó)疾病預(yù)防控制中心Tij=T ^ABCX(4)O通信作者:張巖波. E-mail:yanbozh@ 126. com.中國(guó)衛(wèi)生統(tǒng)計(jì)2013年12月第30卷第6期.817●五個(gè)潛在類別群體。同理可以知道3804名學(xué)生總的較不同類別學(xué)生吸煙率以及進(jìn)行更深人的分析,進(jìn)而被分為5個(gè)類潛在類別,每一類別的人數(shù)分別為2879為控制青少年吸煙提供理論依據(jù)。人.367人、248 人、234人和76人。LCA在方法和技術(shù)上還有提高的空間。首先,局表4潛在類別模型個(gè)體分類結(jié)果部獨(dú)立性的這-基本前提假設(shè)在實(shí)際應(yīng)用中難以實(shí)目分類概率現(xiàn),需要使用模型設(shè)限等方法來(lái)滿足這一假設(shè)。其次,| 2345 6 7 8 Clusterl Cluster2 Cluster3 Cluster4 Clusters常用的最大似然法在LCA中常遇到模型無(wú)法識(shí)別、只能局部收斂或者邊界層解( boundary solution) 等問(wèn)題。0.000 0.00 0.000 0.212 0.788再者,模型評(píng)價(jià)指標(biāo)的精確性受樣本量外顯變量數(shù)目0.000 0.002 0.000 0.516 0.482不同程度的影響,根據(jù)不同的指標(biāo)所判定得到的模型! 1 1112 11 0.001 0.029 0.000 0.608 0.362 4往往不- -致。111112210.001 0.192 0.00 0.795 0.012總之,隨著潛在類別分析方法體系的不斷發(fā)展,我們相信LCA將具有更廣泛的應(yīng)用范圍與發(fā)展前景。討本研究實(shí)例分析資料中的外顯變量為二分類變Principle of Latent Class Analysis and Case Analysis Zeng量,在實(shí)際應(yīng)用中LCA還適用于多分類的類別變量、Xianhua , Xiao Lin, Zhang Yanbo. Health Statistics Department of等級(jí)變量的聚類分析,其他測(cè)量模型相結(jié)合,更可拓展Public Health School, Shanxri Medical University ( 030001 ),至對(duì)同時(shí)包含離散型和連續(xù)型外顯變量的資料進(jìn)行聚Taiyuan類分析。如混合潛在特質(zhì)模型(mixtureIRTmodel)、[Abstract] Objective To Introduce the principles, methods混合因素模型( mixture factor model)、混合結(jié)構(gòu)方程and techniques of the latent class model to explore the application of latent模型等( mixture SEM)等,拓展了混合數(shù)據(jù)( mix-modeclass analysis for clssifcation of multiple binary response variables.data)的統(tǒng)計(jì)分析方法。Methods Using latent class model and applying Mplus software, we基于研究目的的不同,LCA可分為探索性潛在類gave 3804 adolescents , who came from Taiyuan a classification according to別分析和驗(yàn)證性潛在類別分析。本研究通過(guò)潛在類別their knowledge about smoking. Results The population including 3804模型來(lái)探討青少年對(duì)煙草廣告的認(rèn)知,對(duì)青少年10個(gè)individuals is divided into 5 latent classes . and the five classes' number ofadolescents was 2876 ,367 ,248 ,234 and 76 respectively,and the probability問(wèn)題的作答情況進(jìn)行潛在聚類,分析時(shí)事先未對(duì)潛在of the five casses is 0. 757 ,0. 096.0.065 .0. 020 and 0. 062 respectively.類別數(shù)進(jìn)行預(yù)設(shè),也未對(duì)參數(shù)進(jìn)行特定設(shè)限,純粹由數(shù)Conclusion The lalent class analysis has a good efet on cassfication據(jù)決定潛在類別模型,并以非設(shè)限方式進(jìn)行參數(shù)估計(jì),of multiple binary response variables.屬于探索性潛在類別分析。而驗(yàn)證性潛在類別分析在[Key words]Latent class model ( LCM); Latent class分析前先提出一個(gè)先驗(yàn)的假設(shè)模型,然后與觀察數(shù)據(jù)cluster analysis ; Adolescents smoking進(jìn)行比對(duì),并利用模型評(píng)價(jià)指標(biāo)判斷假設(shè)模型是否被參考文獻(xiàn)接受(”。模型選擇是LCA主要方面之一,模型中潛在類別1.張潔婷.焦璨,張敏強(qiáng).潛在類別分析技術(shù)在心理學(xué)研究中的應(yīng)用.心理科學(xué)進(jìn)展,2010,18( 12)1991.1998.越多,Pearson和似然比卡方越小,模型適配性越好,似2. Kaufman L. Rosseeuw PI. Finding groups in data: an introduction to乎潛在類別越多越好。然而,在一般情況下,若多分出cluster analysis. New York : Wiley ,2005.來(lái)的潛在類別,其性質(zhì)與其他潛類的性質(zhì)差異不大時(shí),3. Hagenaars JA. McCutchcon AL. Applied latent class analysis. New York:這樣的分類毫無(wú)意義。因此,須綜合考慮實(shí)際情況和Cambridge University Press .2002.4.邱皓政.潛在類別模型的原理與技術(shù),北京:教育科學(xué)出版社.2008.模型適配指標(biāo)來(lái)確定最終的潛在類別數(shù)目。目前可用于LCA分析的軟件較多,如Latent-5.張巖波.潛變量分析.北京:高等教育出版社,2009.6. Lin TH,Dayton CM. Model selection information criteria for non-nestedGOLD Mplus SAS、LEM、PANMARK等,其各有優(yōu)缺latent class models. Joumal of Education and Behavioral Statistics .1997 ,點(diǎn)。本研究采用的是Mplus5. 1軟件,相比其他軟件,22(3) :249 264.Mplus在處理潛在類別模型時(shí),具有程序簡(jiǎn)單、易于理7.裴磊磊,郭小玲,張巖波,等抑郁癥患者單核苷酸多態(tài)性(SNPs)分解的優(yōu)勢(shì),尤其在處理不同性質(zhì)的數(shù)據(jù)與形態(tài)的混合布特征的潛在類別分析.中國(guó)生統(tǒng)計(jì),2010 ,27(1):7-10.(責(zé)任編輯:劉壯)模型方面是其他軟件無(wú)法比擬的。在對(duì)研究對(duì)象聚類分析之后,我們可以進(jìn)- - 步比中國(guó)煤化工MHCNMHG
-
C4烯烴制丙烯催化劑 2020-09-25
-
煤基聚乙醇酸技術(shù)進(jìn)展 2020-09-25
-
生物質(zhì)能的應(yīng)用工程 2020-09-25
-
我國(guó)甲醇工業(yè)現(xiàn)狀 2020-09-25
-
石油化工設(shè)備腐蝕與防護(hù)參考書(shū)十本免費(fèi)下載,絕版珍藏 2020-09-25
-
四噴嘴水煤漿氣化爐工業(yè)應(yīng)用情況簡(jiǎn)介 2020-09-25
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-09-25
-
甲醇制芳烴研究進(jìn)展 2020-09-25
-
精甲醇及MTO級(jí)甲醇精餾工藝技術(shù)進(jìn)展 2020-09-25



