使用inferCNV來推斷CCLE轉錄組數據的拷貝數變異
前面我們介紹了單細胞轉錄組表達矩陣可以推斷CNV的文獻出處及歷史,也簡單過了broad開發的inferCNV軟體,在其提供的測試數據上面成功運行了,也測試了airway這個轉錄組數據,但是效果不好,現在看看CCLE資料庫的測試結果吧,比較文章裡面對之進行過同樣的處理。
CCEL資料庫介紹
需要簡單註冊後才能下載:https://portals.broadinstitute.org/ccle/users/sign_in 可以先看看CCLE裡面收集的細胞系表型信息,大家可以自由統計。
準備輸入數據
目前總共是1046個細胞系,註冊並且下載數據導入R 的步驟我就不贅述了,如下;
還是跟前面一樣把數據寫出來,運行inferCNV這個軟體。
運行inferCNV軟體
前面我們詳細介紹了軟體,這裡直接給代碼:
我的運行代碼如下;
軟體倒是可以成功運行,出來的圖如下:
CCLE資料庫的晶元表達量的CNV
對CCLE的轉錄組數據同樣處理
出圖如下;
CCLE資料庫的RNA-seq表達量的CNV
似乎是跟其2014年發在science上文章(PMID: 24925914)的補充材料最後一個圖不相似:
highly-correlated-cnv-by-snp6array-and-rna-seq
一些其它關於CCLE資料庫的資源
Cell line (1035個細胞系簡介)Gene Sets,1035 sets of genes with high or low expression in each cell line relative to other cell lines from the CCLE Cell Line Gene Expression Profiles dataset.
http://amp.pharm.mssm.edu/Harmonizome/dataset/CCLE+Cell+Line+Gene+Expression+Profiles
一些關於CCLE資料庫的文章:
http://cancerres.aacrjournals.org/content/73/8_Supplement/2409.short
http://cancerres.aacrjournals.org/content/74/22/6390.short
https://clincancerres.aacrjournals.org/content/19/19_Supplement/IA2.abstract
http://onlinelibrary.wiley.com/doi/10.1002/cncy.21471/pdf 介紹了幾個類似的資料庫資源
http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0088557 講解了high/low的知識
//ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=7060697 藥物相關
Anticancer drug sensitivity analysis: An integrated approach applied to Erlotinib sensitivity prediction in the CCLE database
http://biorxiv.org/content/biorxiv/early/2015/10/02/028159.full.pdf 比較了CCLE和TCGA的數據
we have developed a database 「CancerDR」, which provides information of 148 anti-cancer drugs, and their pharmacological profiling across 952 cancer cell lines.
TAG:單細胞天地 |