如何做TCGA數據的單因素Cox分析?
今天給大家分享一下如何做TCGA數據的單因素Cox分析。
1、下載TGCA數據並且整理成表達矩陣(這裡主要做mRNA)
2、做差異表達分析,得到差異基因的表達矩陣
3、下載臨床數據並整理好
4、將差異基因的表達矩陣與生存數據合併,直接用EXCEL即可,保存為input.txt
5、用Survival包做單因素的Cox分析,這裡直接將代碼分享給大家
#survival包的安裝
install.packages("survival")
library(survival) #載入survival包
setwd("C:\Desktop\COX\2_univariatecox") #改成自己的工作目錄
inputfile="input.txt" 改為自己的文件名
outdata=data.frame()
data=read.table(inputfile,header=T,sep=" ",row.names=1,check.names=F)
data1=log2(data[,3:ncol(data)]+1)
data=cbind(data[,1:2],data1)
for(a in colnames(data[,3:ncol(data)])){
cox
coxSummary = summary(cox)
outdata=rbind(outdata,cbind(gene=a,HR=coxSummary$coefficients[,"exp(coef)"],
z=coxSummary$coefficients[,"z"],
pvalue=coxSummary$coefficients[,"Pr(>|z|)"]))
}
write.table(outdata,"Cox_univariate_results.xls",sep=" ",row.names=F,quote=F)
這樣我們就得到了單因素的Cox分析的結果
希望這些代碼對大家有所幫助。
TAG:SCI狂人 |