醫學統計學(6)-卡方檢驗
《醫學統計學(6)-卡方檢驗》由會員分享,可在線閱讀,更多相關《醫學統計學(6)-卡方檢驗(143頁珍藏版)》請在裝配圖網上搜索。
1、單擊此處編輯母版標題樣式,,單擊此處編輯母版文本樣式,,第二級,,第三級,,第四級,,第五級,,,,*,醫學統計學〔6〕,《,中華醫學雜志,》,對來稿統計學處理的有關要求,卡方檢驗,(chi-square test),χ2檢驗是現代統計學的創始人之一,英國人Karl . Pearson于1900年提出的一種具有廣泛用途的統計方法。,,,可用于兩個或多個率間的比較,計數資料的關聯度分析,擬合優度檢驗等等。,卡方檢驗根本思想,用卡方值的大小來衡量實際頻數和理論頻數之間的吻合程度。,,在零假設H0 成立的條件下,實際頻數與理論頻數相差不應當很大,即x2值不應當很大。,,假設實際計算出的x2值較大,說
2、明實際頻數和理論頻數吻合程度小,相差大,則有理由疑心H0的真實性,從而拒絕H0,承受H1。,x,2,檢驗,單個樣本構成比的,x,2,檢驗,——,擬合優度檢驗,,獨立樣本四格表的,x,2,檢驗,,行,×,列,的,x,2,檢驗,,配對設計分類資料的,x,2,檢驗,,多維分類資料的,x,2,檢驗,x,2,檢驗,,單個樣本構成比的,x,2,檢驗,——,擬合優度檢驗,,獨立樣本四格表的,x,2,檢驗,,行,×,列,的,x,2,檢驗,,配對設計分類資料的,x,2,檢驗,,多維分類資料的,x,2,檢驗,在中醫藥科研中,常常遇到同一個樣本中兩個或多個構成比比較的問題,在滿足卡方檢驗的要求條件下,可用卡方檢驗來
3、分析實際頻數的比率是否符合理論比率。,【例1】為探究高血壓患者中醫證型構成,調查原發性高血壓患者3578例,中醫證型構成見表。問原發性高血壓患者中醫證型內部構成是否一樣?,,,A,T,X,2,=392.514,,V=5-1=4,,P=1-CDF.CHISQ(392.514,,,4)=0.000,SPSS,軟件操作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,例數→加權個案〔頻數變量〕,第,4,步:,x,2,檢驗,選擇,分析,→,非參數檢驗,→,卡方,,中醫證型,→檢驗變量列表,第,5,步:結果解讀,結果解讀:x2=392.514,p=0.000,
4、說明原發性高血壓患者中醫證型內部構成不一樣。,留意事項,進展擬合優度 x2 檢驗,一般要求有足夠的樣本含量,理論頻數不小于 5 。,,理論頻數小于 5 時,需要合并計算。,x,2,檢驗,,單個樣本構成比的,x,2,檢驗,,獨立樣本四格表的,x,2,檢驗,,行,×,列,的,x,2,檢驗,,配對設計分類資料的,x,2,檢驗,,多維分類資料的,x,2,檢驗,四格表的卡方檢驗,也是通過計算代表實際頻數A與理論頻數T之間的吻合程度的卡方值來進展檢驗的。,,理論頻數T承受兩組的合并狀況來計算。,【例2】某醫院把慢性支氣管炎患者376名,隨機分為2組,分別用中西醫結合法和西醫法治療,結果見表。問兩種療法治療
5、慢性支氣管炎病人的治愈率是否有差異?,理論值,T,的計算,345/376〔總的治愈率〕*276=253.24,276-253.24=22.76,345/376〔總的治愈率〕*100=91.76,100-91.76=8.24,卡方值的計算,卡方值的影響因素:,,1,、格子數,,2,、實測值與理論值的差距,,專用公式的推導,T11=(a+c)/(a+b+c+d)*〔a+b〕,T12=(b+d)/(a+b+c+d)*〔a+b〕,T21=(a+c)/(a+b+c+d)*〔c+d〕,T22=(b+d)/(a+b+c+d)*〔c+d〕,專用公式的推導,,SPSS,軟件操作,第,1,步:定義變量,第,2,步
6、:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1〕,選擇分析→穿插表,,穿插表對話框:組別和療效分別進入行和列,輸出4種卡方檢驗結果:1、pearson卡方2、卡方值的校正值3、似然比卡方,一般用于對數線性模型。4、fisher的準確檢驗5、線性趨勢檢驗,,輸出,2,種相關系數:,1,、,pearson,相關系數,2,、,spearman,相關系數,,,列聯系數:分析行與列之間的關聯程度,Kappa:全都性檢驗,,,風險:計算相對危急度〔RR〕和比數比〔OR〕。,,McNemar,:優勢性檢驗。,,,CMH,多維卡方檢驗,第
7、4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方,,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、百分比:行、列,,第5步:結果解讀〔1〕,結果解讀:,中西醫組的治愈率為,98.2%,,西醫組的治愈率為,74.0%,。,,,第5步:結果解讀〔2〕,結果解讀:x2=56.772,p=0.000,,兩種療法治療慢性支氣管炎病人的治愈率的差異有統計學意義,四格表,x,2,檢驗結果的選擇,1〕當n≥40,全部理論值≥ 5時,用pearson卡方檢驗。,,2〕當n≥40,但有理論頻數1≤理論值<5時,用連續校正的卡方檢驗;或者準確概率法。,,3〕
8、 n<40或有理論值<1,或P≈α時,用準確概率法。,卡方檢驗的校正公式,,,【例3】某中醫院比較兩藥治療某病的效果,所得結果見表。問甲乙兩藥療效有無差異?,校正公式,,,SPSS,軟件操作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1〕,選擇分析→穿插表,,穿插表對話框:組別和療效分別進入行和列,第4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、期望值、百分比:行,第5步:結果解讀〔1〕,結果
9、解讀:,甲藥組的有效率為,92.9%,,乙藥組的有效率為,64.3%,。,,,第5步:結果解讀〔2〕,結果解讀:,有,2,個格子的期望值小于,5,,不符合卡方檢驗的條件。,,,第5步:結果解讀〔3〕,結果解讀:四格表中有期望值小于5,選連續校正的卡方。x2=3.621,p=0.057?,,P〔exact〕=0.031?,四格表,x,2,檢驗結果的選擇,1〕當n≥40,全部理論值≥ 5時,用pearson卡方檢驗。,,2〕當n≥40,但有理論頻數1≤理論值<5時,用連續校正的卡方檢驗;或者準確概率法。,,3〕 n<40或有理論值<1,或P≈α時,用準確概率法。,【例4】某醫師為爭論乙肝免疫球蛋白
10、預防胎兒宮內感染HBV的效果,將33例HBsAg陽性孕婦隨機分為預防注射組和非預防組,結果見表。問兩組新生兒的HBV總體感染率有無差異?,SPSS,軟件操作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1〕,選擇分析→穿插表,,穿插表對話框:組別和感染結果分別進入行和列,第4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、期望值、百分比:行,第5步:結果解讀〔1〕,結果解讀:,預防注射組的感染陽性率
11、為,4/22,,非預防組的感染陽性率為,5/11,。,,,第5步:結果解讀〔2〕,結果解讀:,四格表中有期望值小于,5,,,總例數小于,40,。,,,第5步:結果解讀〔3〕,結果解讀:選Fisher的準確檢驗p〔exact〕=0.121,x,2,檢驗,,單個樣本構成比的,x,2,檢驗,,獨立樣本四格表的,x,2,檢驗,,行,×,列,的,x,2,檢驗,,配對設計分類資料的,x,2,檢驗,,多維分類資料的,x,2,檢驗,行,×,列卡方檢驗計算公式,n,為總例數;,R,和,C,分別為行數和列數;,A,為第,R,行、第,C,列位置上的實際頻數;,nR,為實際頻數所在行的行合計;,nC,為實際頻數所在列
12、的列合計。,【例5】某中醫師將某病患者隨機分為三組,分別用新藥、傳統藥物和勸慰劑治療,結果見表。問三種方法治療該病的有效率是否有差異?,,,,A,n,C,n,R,SPSS,軟件操作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1〕,選擇分析→穿插表,,穿插表對話框:組別和療效分別進入行和列,第4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、期望值、百分比:行,第5步:結果解讀〔1〕,結果解讀:新藥
13、組的有效率為88.9%,傳統藥物組的有效率為86.7%,勸慰劑組的有效率為70.9%。,,,,第5步:結果解讀〔2〕,結果解讀:,x,2,=13.238,,,p=0.001,,進一步的兩兩比較,P<0.017,才有,,統計學意義!!,【例6】某中醫院用三種治療方法治療413例糖尿病患者,資料見表。為避開中醫不同證型對療效比較的影響,分析3種療法治療的病人按3種中醫分型的構成比有無差異?,SPSS,軟件操作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1〕,選擇分析→穿插表,,穿插表對話框:組別和中醫分
14、型分別進入行和列,第4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、期望值、百分比:行,第5步:結果解讀〔1〕,結果解讀:,各組的中醫分型構成比,。,,,,第5步:結果解讀〔2〕,結果解讀:,x,2,=4.020,,,p=0.403,【例7】某醫院肝膽外科在手術中,觀看了222例膽結石患者,其發病部位與結石類型的資料見表,分析其發病部位與結石類型間有無關系?,行變量和列變量均為無序分類變量。,,可分析行、列兩變量之間有無關聯,關聯的親密程度。,,可進展多個樣本率或構成比的比較。,關聯性分析
15、,列聯系數的意義,,|r,p,|<0.4,,關聯程度低,,0.4≤|r,p,|<0.7,,關聯程度中等,,|r,p,|≥0.7,,關聯程度高,SPSS,軟件操作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1〕,選擇分析→穿插表,,穿插表對話框:結石部位和結石類型分別進入行和列,第4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方和相關系數,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、百分比:行、列,第5步:結果解讀〔1〕,結果解讀:,行與列均
16、為無序變量,行、列百分比均有各自專業意義。,,,,,,,第5步:結果解讀〔2〕,結果解讀:,x,2,=64.059,,,p=0.000,第5步:結果解讀〔3〕,結果解讀:,r,p,=0.473,,,p=0.000,,兩者有關聯,但關聯度不高。,行×列表卡方檢驗留意事項,同四格表資料一樣,R×C表的卡方分布是建立在大樣本的假定上的,要求總例數不行過少,不能有1/5以上的格子理論頻數小于5,且不能有一個格子的理論頻數小于1。,,假設消失上述狀況,可以考慮:增大樣本量;依據專業學問合理地合并相鄰的組別;刪除理論數太小的行列 ;改用其它方法分析,例如準確概率法或似然比卡方檢驗。,當多個樣本率〔或構成比
17、〕作卡方檢驗,結論為拒絕零假設時,只能認為各總體率〔或總體構成比〕之間總的有差異,不能說明兩兩之間有差異;兩組間的比較需進一步做多個樣本率或構成比的兩兩比較,即多重比較。,行×列表卡方檢驗留意事項,行×列表卡方檢驗留意事項,R×C表可以分為雙向無序、單向有序、雙向有序屬性一樣和雙向有序屬性不同等4類。,,通常狀況下只有雙向無序的資料〔例如多個樣本率的比較、多個樣本構成比的比較〕可以使用R×C列聯表卡方檢驗。,,右上表格使用卡方檢驗分析不同療法間療效是否有別,右下表格分析不同的血型分類結果是否有關聯〔不同的血型分類是否相互獨立〕;它們都屬于雙向無序的列聯表,都可使用卡方檢驗分析,療法,療效,,合
18、計,有效率,,(%),,有效,無效,,,物理療法,199,7,206,96.60,藥物治療,164,18,182,90.11,外用膏藥,118,26,144,81.94,合計,481,51,532,90.41,ABO,,血型,MN,血型,,,合計,,M,N,MN,,O,431,490,902,1823,A,388,410,800,1598,B,495,587,950,2032,AB,137,179,32,348,合計,1451,1666,2684,5801,行×列表卡方檢驗留意事項,單向有序R×C表 有兩種形式。一種是表中的分組變量〔如年齡〕是有序的,而指標變量〔如傳染病的類型〕是無序的,其
19、爭論目的通常是分析不同年齡組各種傳染病的構成狀況,可用行列表資料的χ2檢驗進展分析;而假設指標變量為二分類,如右上表,想分析是否隨工齡增加患病率也增加可以考慮線性趨勢檢驗;另一種狀況是表中的分組變量〔如療法〕為無序的,而指標變量〔如療效按等級分組〕是有序的,如右下表,其爭論目的為比較不同療法的療效,宜用秩和檢驗進展分析。,藥物,,種類,療效,,,合計,,治愈,好轉,無效,,A,16,50,4,70,B,4,5,21,30,C,20,25,15,60,合計,40,80,40,160,工齡,患病人數,未患病人數,合計,<1,1,51,52,1~,6,94,100,2~,23,201,224,4~,
20、35,156,191,6~,24,87,114,行×列表卡方檢驗留意事項,雙向有序屬性一樣的R×C表 表中的兩分類變量皆為有序且屬性一樣。實際上是2×2配對設計的擴展,即水平數≥3的診斷試驗配伍設計,如用兩種檢測方法同時對同一批樣品的測定結果。其爭論目的通常是分析兩種檢測方法的全都性,此時宜用全都性檢驗〔或稱Kappa檢驗〕,對比法,,測定結果,核素法測定結果,,,合計,,正常,減弱,異常,,正常,,58,2,3,63,減弱,1,42,7,50,異常,8,9,17,34,合計,67,53,27,147,行×列表卡方檢驗留意事項,雙向有序屬性不同的R×C表 R×C表中兩分類變量皆為有序的,
21、但屬性不同,如下表;對于該類資料,①假設爭論目的為分析不同年齡組患者混濁度之間有無差異時,可把它視為單向有序R×C表資料,選用秩和檢驗;②假設爭論目的為分析兩有序分類變量間是否存在相關關系,宜用等級相關分析;③假設爭論目的為分析兩有序分類變量間是否存在線性變化趨勢,宜用線性趨勢檢驗。,年齡,晶狀體混濁程度,,,合計,,+,++,+++,,20,~,,215,67,44,326,30,~,131,101,63,295,40,~,148,128,132,408,合計,494,296,239,1029,行,×,列表資料假設檢驗方法選擇,雙向無序的行×列表:pearson卡方、關聯度分析;,,單向有序
22、的行×列表:Ridit分析、秩和檢驗;,,雙向有序屬性一樣的行×列表:McNemar檢驗(優勢性檢驗)、全都性檢驗、關聯度分析;,,雙向有序屬性不同的行×列表:秩和檢驗、 Ridit分析、等級相關、線性趨勢檢驗等。,x,2,檢驗,,單個樣本構成比的,x,2,檢驗,,獨立樣本四格表的,x,2,檢驗,,行,×,列,的,x,2,檢驗,,配對設計分類資料的,x,2,檢驗,,多維分類資料的,x,2,檢驗,配對設計包括:,,①同一批樣品用兩種不同的處理方法。,,②兩個評估者對爭論對象進展逐一評估。,,③觀看對象依據配對條件配成對子,同一對子內兩個體分別承受不同的處理。,,觀看結果均分為k個一樣的類別,資料
23、可歸納整理成k×k的表格形式,又稱為方表。這樣的資料又稱為方表資料。,對于配對設計的分類資料,假設爭論目的為分析兩種方法(即行變量和列變量)之間的相關關系(包括是否有關聯、關聯程度及全都性),應選用 關聯度分析及全都性檢驗( Kappa 檢驗);,,假設爭論目的為分析兩種方法間是否存在差異則應用優勢性檢驗(McNemar檢驗)。,【例8】用兩種方法檢查60名乳腺癌患者,檢查結果如表。請對兩種檢查方法進展分析。,優勢性檢驗公式,X,2,=(b-c),2,/(b+c) n>=40,,X,2,=(|b-c|-1),2,/(b+c) n<40,,,全都性檢驗Kappa分析,SPSS,軟件操
24、作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1〕,選擇分析→穿插表,,穿插表對話框:甲法和乙法分別進入行和列,第4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方、相關系數、Kappa、McNemar,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、期望值、百分比:行、總計,第5步:結果解讀〔1〕,結果解讀:兩種方法穿插的例數關系。,,甲法陽性率65.0%,乙法陽性率48.3%。,,,第5步:結果解讀〔2〕,結果解讀:配對設計選用優勢性檢驗結果
25、,,p=0.031,。甲組的陽性率高于乙組的陽性率。,第5步:結果解讀〔3〕,結果解讀:關聯性rp=0.395,p=0.001,,全都性kappa=0.406,p=0.004,Kappa的意義,,<0.02 差,,0.02~ 稍微,,0.20~ 尚可,,0.40~中等,,0.60~好,,0.80-1.00 幾乎完全全都,【例9】下表為外側半月板撕裂的膝關節鏡診斷〔金標準〕與MRI〔核磁共振成像〕診斷的結果,試對兩種診斷方法進展分析。,SPSS,軟件操作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1
26、〕,選擇分析→穿插表,,穿插表對話框:MRI診斷和關節鏡診斷分別進入行和列,第4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方、相關系數、Kappa、McNemar,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、期望值、百分比:行、總計,第5步:結果解讀〔1〕,結果解讀:,兩種方法交互的例數關系。,,,,,,,第5步:結果解讀〔2〕,結果解讀:優勢性檢驗,p=0.268,。兩種診斷方法的診斷結果差異無統計學意義。,第5步:結果解讀〔3〕,結果解讀:關聯性rp=0.580,p=0.000,,全都性kappa=0.515,p=0.000,x
27、,2,檢驗,,單個樣本構成比的,x,2,檢驗,,獨立樣本四格表的,x,2,檢驗,,獨立樣本多個率和構成比的,x,2,檢驗,,配對設計分類資料的,x,2,檢驗,,多維分類資料的,x,2,檢驗,【例10】某藥業集團研制了一種治療慢性皮炎的新藥,為了解該藥的藥物療效,同某種常用藥物的療效作了比較,資料如表。問該新藥與常用藥物的療效有無差異?,SPSS,軟件操作,第,1,步:定義變量,第,2,步:輸入原始數據,第,3,步:定義頻數,選擇數據→加權個案,,頻數→加權個案〔頻數變量〕,第4步:x2檢驗〔1〕,選擇分析→穿插表,,穿插表對話框:組別、療效和中心分別進入行、列和層1的1,第4步:x2檢驗〔2〕,選擇統計量按鈕,,在穿插表:統計量對話框:勾上卡方及CMH統計量。,第4步:x2檢驗〔3〕,選擇單元格按鈕,,在穿插表:單元顯示對話框:勾上觀看值、百分比:行、列,第5步:結果解讀〔1〕,結果解讀:,每個中心的描述。,第5步:結果解讀〔2〕,結果解讀:,每個中心的卡方檢驗。,第5步:結果解讀〔3〕,結果解讀:中心效應,x,2,=1.642,,,p=0.650,第5步:結果解讀〔4〕,結果解讀:x2=5.531,p=0.019,,考慮分層〔多中心〕混雜因素影響后的卡方值。,第5步:結果解讀〔5〕,結果解讀:假設是病例比照爭論,或者隊列爭論,OR值及其95%CI。,謝 謝!,
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。