KM法生存分析,史上最詳細的SPSS教程!
一、問題與數據
研究者對長期吸煙的人進行戒煙干預,三種干預措施分別為: hypnotherapy programme – 催眠療法; nicotine patches – 尼古丁貼片; e-cigarettes – 電子煙。
研究納入了150例長期吸煙者,隨機分配到三個干預組中,每組各50例研究對象。研究的起始時間是吸煙者戒煙後,研究持續2年(104周)。結局是「再次吸煙」或「未再次吸煙」。
通過 Kaplan-Meier生存分析方法可以實現以下兩個目標:
1. 三個干預組的「生存」分布是否不同;
2. 如果三個干預組的「生存」分布存在差異,具體是哪兩種干預措施之間存在差異。
研究者收集了150例受試者的「生存」時間(time,單位:周)、結局(status:censored – 截尾,用「0」表示;event – 再次吸煙,用「1」表示)和干預措施(intervention:hypnotherapy programme – 催眠療法,用「1」表示;nicotine patches – 尼古丁貼片,用「2」表示; e-cigarettes – 電子煙,用「3」表示),部分數據如下:
(註:這裡status和intervention顯示的是變數值標籤而非數值,可以通過在菜單欄上選擇View> Value Labels來實現。)
二、對問題的分析
使用Kaplan-Meier法進行生存分析時,需要考慮6個假設。
對研究設計的假設:
假設1:結局變數是二分類變數,分別為「截尾」和「事件」;
假設2:研究的起始和終止時間(也稱「生存時間」)需要明確定義並測量;
假設3:盡量減少左截尾事件,所謂左截尾,是指觀察的起始時間難以確定。比如,研究皮膚癌患者的生存時間,理想的起始時間是皮膚癌發生的一刻,但一般情況都是患者被診斷時作為起始時間,這樣觀察的時間就不能代表皮膚癌發生到死亡的真正生存時間,所以要盡量要避免左截尾的發生;
假設4:「截尾」和「事件」相互獨立,如事件是死亡,那麼截尾不能是死亡或與死亡相關的情況;
假設5:不應該有長期變異。一般試驗的開始到結束的時間較長,而納入的研究對象是經過一段時間收集的,並不是同時進入研究。如研究皮膚癌發生到死亡的生存時間,如果在試驗的時間內出現了新的藥物,提高了後期進入試驗研究對象的生存率,這樣的「變異」就會對研究結果造成偏倚。
對數據的假設:
假設6:截尾在各個組的比例和分布相似。
三、對假設的判斷
那麼,進行Kaplan-Meier分析時,如何考慮和處理這6個假設呢?
由於假設1-5都是對研究設計的假設,需要研究者根據研究設計進行判斷,所以本文主要對數據的假設6進行檢驗。假設6包括兩個方面:截尾在各個組的比例相似;截尾在各個組的分布相似。
我們先通過散點圖對截尾的分布進行判斷。
1.首先要選出「截尾」的數據,在主菜單點擊Data > Select Cases...,如下圖:
2.選擇If condition is satisfied,點擊If。
3.將status=0填入右上方的方框內,點擊Continue,點擊OK。
4.打開變數視圖,可以看到status為event的數據已被過濾掉。
5.做散點圖
(1)在主菜單點擊Graphs > Chart Builder...,如下圖所示:
(2)在Chart Builder對話框下,從Choose from選擇Scatter/Dot,在中下部的8種圖形中,選擇左上角的那一種(如果點擊這個圖標會出現「Simple Scatter」字樣),並拖拽到主對話框中。
(3)主對話框中會出現標記「Y-Axis?」和「X-Axis?」的方框,將time拖拽到「X-Axis?」,intervention拖拽到「Y-Axis?」,點擊OK。
(4)從下圖可以看到,截尾隨時間均衡分布(儘管電子煙和尼古丁貼片在生存時間較小時有些聚集)。由於截尾在各個組的分布是否相似沒有一個嚴格的檢驗方法和標準,我們這裡認為截尾在三個干預組中分布相似。
(5)下面對剛才選擇的數據去過濾:在主菜單點擊Data > Select Cases...,如下圖所示。
(6)選擇All cases,點擊OK。
(7)在變數視圖中可以看到所有的數據都被選擇,如下圖。
四、SPSS操作
1.在主菜單點擊Analyze > Survival > Kaplan-Meier...,如下圖:
2.將time選入Time,將intervention選入Factor,將id選入Label Cases by,將status選入Status,點擊Define Event。
3.本研究中status=1代表事件,即再次吸煙,所以在Single value中填入1。
4.點擊Options,選擇Statistics下面的Survival table(s)和Mean and median survival, 選擇Plots下面的Survival,點擊Continue。
5.點擊Compare Factor,選擇Test Statistics下的Log rank、Breslow和Tarone-Ware,點擊Continue,點擊OK。
6.由於上面的檢驗是對三個組的分布進行的檢驗,如果想知道每兩個組之間的差異是否存在,就需要進行兩兩比較。進行兩兩比較時,重新進行上述操作1-5,在Compare Factor Levels時,選擇Test Statistics下的Log rank,下方選擇Pairwise over strata,點擊OK。
五、結果解釋
1.在Case Processing Summary的表格中,我們可以看到截尾在催眠療法、尼古丁貼片和電子煙三個組中所佔的比例分別是12.0%、14.0%和14.0%,較為相似,驗證了我們假設6「截尾在各個組所佔比例相似」。
2.三種干預措施的生存曲線如下圖所示,我們可以大致看出催眠療法的「生存」時間比尼古丁貼片或電子煙長。
3.在Means and Medians for Survival Time表格中,可以看到三種干預措施的「生存」時間和總「生存」時間的均值和中位數及相關統計量。由於「生存」時間一般不符合正態分布,所以這裡均值沒有中位數的意義大。
催眠療法、尼古丁貼片和電子煙三個組的「生存」時間中位數分別是69.000(95%CI:45.163-92.837)周、9.000(95%CI:6.563-11.437)周和9.000(95%CI:7.097-10.903)周。催眠療法的「生存」時間比另外兩種干預措施長,驗證了我們在「生存」曲線看到的情況。
4.在Overall Comparisons中,我們分別用了Log rank test (Mantel, 1966), Breslow test (Breslow, 1970; Gehan, 1965) 和Tarone-Ware test (Tarone & Ware, 1977)。
一般情況下,三種檢驗都勾選,如果三種檢驗的結果一致(P均小於0.05或均大於0.05),則報告Log rank檢驗的結果;如果三種檢驗結果不一致,則需要檢查截尾數據在各個組的分布情況並進一步討論。三種方法均採用的是卡方檢驗。
本例中,三種方法的P值均小於0.001,所以報告Log rank檢驗的結果:三個干預組中「生存」分布的差異具有統計學意義,χ2= 25.818,P<0.001。
這裡我們看到P值顯示為0.000,這並不代表P=0.000,如果想知道具體的數值,可以雙擊表格,並將滑鼠移動至0.000處,會顯示真正的P值,為0.000002,已經在下圖中突出顯示。
5.在Pairwise Comparisons表格中,我們可以看到通過Log rank方法檢驗的兩兩比較的結果。與多組比較相同,兩兩比較也是計算卡方統計量。但兩兩比較是進行了多次,所以顯著性水平P值不再是0.05,需要用Bonferroni法校正。
該兩兩比較共進行了三次:催眠療法與尼古丁貼片,催眠療法與電子煙,尼古丁貼片與電子煙。所以校正後的顯著性水平=0.05/3≈0.0167,即當表格中P<0.0167時,認為差異有統計學意義。
(1)催眠療法與尼古丁貼片:催眠療法組與尼古丁貼片組的「生存」分布的差異具有統計學意義,χ2=11.035,P<0.001。見下圖突出顯示的部分。
(2)催眠療法與電子煙:催眠療法組與電子煙組的「生存」分布的差異具有統計學意義,χ2=29.003,P<0.001。見下圖突出顯示的部分。
(3)尼古丁貼片與電子煙:尼古丁貼片組與電子煙組的「生存」分布的差異不具有統計學意義,χ2=1.541,P=0.214>0.0167。見下圖突出顯示的部分。
六、撰寫結論
本研究將吸煙者隨機分配到三個干預組中:催眠療法組(n=50),尼古丁貼片組(n=50)和電子煙組(n=50)。運用Kaplan-Meier生存分析比較三種干預措施對戒煙的效果。截尾在三個組所佔的比例相似,催眠療法組、尼古丁貼片組和電子煙組分別是12.0%、14.0%和14.0%,截尾在各個組的分布也相似。
催眠療法組戒煙後再吸煙的中位時間為69.0(95%CI:45.2-92.8)周,比尼古丁貼片組(中位時間:9.0周,95%CI:6.6-11.4)和電子煙組再次吸煙(中位時間:9.0周,95%CI:7.1-10.9)的中位時間長。用Log rank法對三種干預措施的「生存」分布的差異進行檢驗。三個干預組中「生存」分布的差異具有統計學意義,χ2= 25.818,P<0.001。
運用Log rank法對三種干預措施進行兩兩比較,並對顯著性水平進行Bonferroni校正,校正後的顯著性水平為≈0.0167。催眠療法組與尼古丁貼片組的「生存」分布的差異具有統計學意義,χ2=11.035,P<0.001;催眠療法組與電子煙組的「生存」分布的差異具有統計學意義,χ2=29.003,P<0.001;然而,尼古丁貼片組與電子煙組的「生存」分布的差異不具有統計學意義,χ2=1.541,P=0.214。
醫咖會微信:medieco-ykh
關注醫咖會,輕鬆掌握統計學!
有臨床研究設計或統計學方面的難題?快加小咖個人微信(xys2016ykf),加入醫咖會統計討論群,和小夥伴們一起交流學習吧;或者點擊公眾號下方自定義菜單的「統計諮詢」,提出你遇到的統計難題。
※統計方法套路深,細說I類錯誤和II類錯誤!
※SPSS教程:做多重線性回歸,方差不齊怎麼辦?
※WHO發布2017基本藥物示範目錄
※為了讓論文看起來更有價值,竟玩這些套路!
※兩組率的Meta分析,手把手教Stata操作!
TAG:醫咖會 |
※《生存者同盟》HD重置 今秋登陸PS4,Switch及PC
※PD-1抑製劑Opdivo可延長NSCLC患者生存期
※《INTOUCHABLES》 希望使人生存
※上海時裝周AW19 preview RICO LEE,星際生存
※沒數據,沒SPSS,如何輕鬆獲得生存分析結果?
※Steam周銷量排行榜:《絕地求生》「生存通行證:維寒迪」DLC登頂 《ATLAS》位居榜單第二
※NEJM:Durvalumab可顯著延長III期非小細胞肺癌患者總生存期
※AMD顯卡賣不過NVIDIA,CPU賣不過Intel,為什麼還能生存到現在?
※《數碼寶貝:生存》或將登陸PS4/Switch平台
※ASCO重磅:完勝化療!一線單用PD1抑製劑Keytruda顯著延長晚期患者生存期!
※PLos One:老年肺癌患者生存率預測G8篩查工具的前瞻性評估
※《Dead In Vinland》糅合了RPG、冒險和生存管理
※MCN的中國式生存法則
※性能毀滅者:巨量彈幕下誰能生存?華為P30 Pro碾壓iPhone XS!
※如何生存St.Paddy的一天
※方舟:生存進化 ARK:Survival Evolved
※男團現狀:新風暴失業,UNINE夾縫生存,R1SE家大業大,NPC難複製
※Bandai Namco公布生存RPG遊戲《Digimon Survive》
※MIKIMOTO:小眾品牌中國大市場的生存法則 | 財富品質
※強敵環伺 MMORPG如何在險境中生存