一個lncRNA項目的實戰

最新 02-13

響應生信技能樹的號召：lncRNA數據分析傳送門, 一起來一個lncRNA數據分析實戰，你現在看到的是jimmy的筆記，首發於簡書：https://www.jianshu.com/p/56074633b629

step2 : 下載原始數據

首先下載sra的原始測序數據

樣本量稍微有點大，https://trace.ncbi.nlm.nih.gov/Traces/sra/?study=SRP081159

多餘0.5T的原始數據，我想一般人都不願意處理它的。

我們測試8個即可，主要是走完整個流程，了解數據分析的方方面面，而不是檢查別人的文章的錯誤之處。

分別是4個年齡段的恆河猴：1年（child），4年（Youth），10年（Adult）和20年（Old）；然後各有兩種性別。至於腦部區域，就不管了; prefrontal cortex (PFC), posterior cingulate cortex (PCC), temporal cortex (TC), parietal cortex (PC) and occipital cortex (OC), hippocampus CA1 and dentate gyrus (DG), andcerebellar cortex (CB) regions

但是進入了SRA資料庫才發現，8個樣本也是太多了，還是就分析兩個吧~

下載SRA資料庫裡面的數據方式非常之多，選擇最適合自己，並且網速最快的即可：https://www.ncbi.nlm.nih.gov/books/NBK158899/ 我比較喜歡直接wget，代碼如下：

當然，如果你們學校或者伺服器閑置著，也可以全部下載，整個數據流程沒啥區別，就是多了一個批處理而已。

fastq 格式的測序reads如下：

然後下載作者製作的表達矩陣

這裡下載到的表達矩陣是一個Excel表格，所以需要轉為csv然後讀入R裡面進行簡單的統計。

當然了，如果你看文章細心的話，會發現，作者在其GitHub上面也公布了這些表達矩陣：https://github.com/DChenABLife/RhesusLncRN

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 生信媛 的精彩文章:

※重磅！黃學輝等課題組水稻基因組複雜變異再登NG

TAG:生信媛 |