當前位置:
首頁 > 最新 > 代碼放送 微生物HUMAnN2分析

代碼放送 微生物HUMAnN2分析

HUMAnN2分析的全稱為HMP Unified Metabolic Analysis Network。它在宏基因組研究中非常有用,通過這個分析,不僅能獲得微生物的物種丰度信息,還能準確有效地獲得微生物代謝途徑和功能模塊信息。

1

分析流程

HUMAnN2的分析流程如下圖所示:

第一步

分析微生物群落(細菌、古菌、真核生物和病毒)的組成。使用MetaPhlAn2軟體,輸入數據為質量控制後的序列。

第二步

ChocoPhlAn資料庫的比對。分析泛微生物基因組的功能注釋。

第三步

上一步未比對上的reads,翻譯成蛋白序列,並和UniRef50資料庫進行比對。使用Diamond軟體。

第四步

通過HUMAnN的核心演算法,統計出基因的丰度信息,代謝通路的丰度信息,代謝通路的覆蓋度。

2

安裝HUMAnN軟體

2.1 依賴的軟體

MetaPhlAn2

Diamond (version >= 0.7.3) (automatically installed)

Python (version >= 2.7)

MinPath (automatically installed)

Xipe (optional / included)

Usearch (version >= 7.0) (only required if using usearch for translated search)

SAMtools (only required if bam input files are provided)

Biom-format (only required if input or output files are in biom format)

2.2 安裝軟體就一行命令

pip install humann2

2.3 測試軟體

humann2_test

2.4 下載分析流程中需要的資料庫ChocoPhlAn、UniRef50

humann2_databases --download chocophlan full

humann2_databases --download uniref uniref90_diamond $INSTALL_LOCATION

$INSTALL_LOCATION是你本地的路徑。

3

使用軟體

3.1 最基礎的命令

humann2 --input $SAMPLE --output $OUTPUT_DIR

其中$SAMPLE可以是fasta, fastq, fasta.gz, fastq.gz序列文件;也可以是bam, sam, blastm8的比對文件;也可以是gene的table表。

3.2 介紹KEGG代謝通路的注釋

humann2_humann1_kegg --ikoc humann1/data/koc --igenels humann1/data/genels --o legacy_kegg_idmapping.tsv

humann2_build_custom_database --input genes.pep --output custom_database --id-mapping legacy_kegg_idmapping.tsv --format diamond --taxonomic-profile max_taxonomic_profile.tsv

humann2 --input $SAMPLE.fastq --output $OUTPUT_DIR --id-mapping legacy_kegg_idmapping.tsv --pathways-database humann1/data/keggc --protein-database custom_database --bypass-nucleotide-search

humann1/data/koc:KO對應基因的信息

humann1/data/genels:基因對應基因長度的信息

legacy_kegg_idmapping.tsv:文件為四列,分別是基因名,KO號,基因序列長度,物種名

genes.pep:gene的核苷酸序列

max_taxonomic_profile.tsv:總的物種丰度表

humann1/data/keggc:pathway的map號對應KO號

3.3 繪製物種bar圖

humann2_barplot --input $TABLE.tsv --feature $FEATURE --outfile $FIGURE

3.4 處理PICRUSt 的結果

biom add-metadata -i otu_table.biom --observation-metadata-fp 97_otu_taxonomy.txt -o picrust.biom --sc-separated taxonomy

humann2_split_table --input picrust.biom --output $OUTPUT_DIR

humann2 --input $SAMPLE.biom --output $OUTPUT_DIR2 --pathways-database humann1/data/keggc

輸出文件為:Pathway abundance file,Pathway coverage file

3.5 HUMAnN2的關鍵參數介紹

-r, --resume

如果輸出文件存在,則不運行命令

--bypass-prescreen

跳過預篩選使用完整的ChocoPhlAn資料庫

--bypass-nucleotide-index

跳過核苷酸的建庫,使用現有的ChocoPhlAn 資料庫index文件

--bypass-nucleotide-search

跳過UniRef50蛋白資料庫比對

-i , --input

輸入文件類型

-o , --output

輸出文件夾

--nucleotide-database

核苷酸資料庫的目錄,(ChocoPhlAn資料庫)

--protein-database

蛋白資料庫的目錄,(UniRef資料庫)

--evalue

evalue的閾值

--search-mode

檢索uniref50或uniref90 gene

--metaphlan

MetaPhlAn軟體路徑

--metaphlan-options

Metaphlan軟體的參數,如"-t rel_ab"

--threads

線程數

--prescreen-threshold

匹配物種的最小閾值

--identity-threshold

比對的閾值

--translated-subject-coverage-threshold

subject翻譯成蛋白的比對閾值

--translated-query-coverage-threshold

query翻譯成蛋白的比對閾值

--memory-use

內存的使用

GIF/1K

代碼辣么多

慢慢實踐吧

若遇困難

歡迎留言諮詢

供稿:黃雲

編輯:王麗燕

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 銳翌基因 的精彩文章:

在線繪製軟體Matrix2png使用簡介

TAG:銳翌基因 |

您可能感興趣

「BLACKPINK」「新聞」190622 BLACKPINK澳門演唱會,紫衣少女「金智秀」美顏放送
TV動畫《BAKUMATSU》第2期將在2019年放送
X JAPAN「無觀眾Live」 將於11月10日在WOWOW放送
款式略勝Supreme?PALACE本周單品大放送!
TWICE獲《SHOW CHAMPION》一位!音樂放送六冠王達成
BLACKPINK摘得品牌評價1位,SEVENTEEN放送三冠王,蘋果頭公約
原創動畫《RELEASE THE SPYCE》PV放出將於十月開始放送
NCAA內部數據大放送
24小時:AOMG預告新藝人-WINNER放送、簽名、綜藝活動-姜丹尼爾xGRAY
Pの廣播◢特別放送 Sound Tripper 第36回
七月新番《BANANA FISH》第3彈CM公開 7月5日開始放送!
TV動畫《高達 Build Divers》中文預告公布 2018年四月放送!
陸星材,今天(11日)將通過YouTube進行12時間懲罰生放送(GETITK)
WANNA·ONE放送事故的思考
蘋果iPhone X Plus傳言大放送
TV動畫放送前活動「SAO Gun Gale Online & Atre秋葉原」開辦
SimonD在SNS Live放送中爆粗口引發爭論!
聖誕夜就該看《日在校園》!Abema TV 2018年聖誕節放送《School Days》、《SHUFFLE!》
陳冠希曝光 CLOT x Nike 全新聯名系列,《NBA 2K20》首波遊戲預告正式放送
遠遠不止 4 雙!NASA x Vans 完整聯名大放送