代碼放送 微生物HUMAnN2分析
HUMAnN2分析的全稱為HMP Unified Metabolic Analysis Network。它在宏基因組研究中非常有用,通過這個分析,不僅能獲得微生物的物種丰度信息,還能準確有效地獲得微生物代謝途徑和功能模塊信息。
1
分析流程
HUMAnN2的分析流程如下圖所示:
第一步
分析微生物群落(細菌、古菌、真核生物和病毒)的組成。使用MetaPhlAn2軟體,輸入數據為質量控制後的序列。
第二步
ChocoPhlAn資料庫的比對。分析泛微生物基因組的功能注釋。
第三步
上一步未比對上的reads,翻譯成蛋白序列,並和UniRef50資料庫進行比對。使用Diamond軟體。
第四步
通過HUMAnN的核心演算法,統計出基因的丰度信息,代謝通路的丰度信息,代謝通路的覆蓋度。
2
安裝HUMAnN軟體
2.1 依賴的軟體
MetaPhlAn2
Diamond (version >= 0.7.3) (automatically installed)
Python (version >= 2.7)
MinPath (automatically installed)
Xipe (optional / included)
Usearch (version >= 7.0) (only required if using usearch for translated search)
SAMtools (only required if bam input files are provided)
Biom-format (only required if input or output files are in biom format)
2.2 安裝軟體就一行命令
pip install humann2
2.3 測試軟體
humann2_test
2.4 下載分析流程中需要的資料庫ChocoPhlAn、UniRef50
humann2_databases --download chocophlan full
humann2_databases --download uniref uniref90_diamond $INSTALL_LOCATION
$INSTALL_LOCATION是你本地的路徑。
3
使用軟體
3.1 最基礎的命令
humann2 --input $SAMPLE --output $OUTPUT_DIR
其中$SAMPLE可以是fasta, fastq, fasta.gz, fastq.gz序列文件;也可以是bam, sam, blastm8的比對文件;也可以是gene的table表。
3.2 介紹KEGG代謝通路的注釋
humann2_humann1_kegg --ikoc humann1/data/koc --igenels humann1/data/genels --o legacy_kegg_idmapping.tsv
humann2_build_custom_database --input genes.pep --output custom_database --id-mapping legacy_kegg_idmapping.tsv --format diamond --taxonomic-profile max_taxonomic_profile.tsv
humann2 --input $SAMPLE.fastq --output $OUTPUT_DIR --id-mapping legacy_kegg_idmapping.tsv --pathways-database humann1/data/keggc --protein-database custom_database --bypass-nucleotide-search
humann1/data/koc:KO對應基因的信息
humann1/data/genels:基因對應基因長度的信息
legacy_kegg_idmapping.tsv:文件為四列,分別是基因名,KO號,基因序列長度,物種名
genes.pep:gene的核苷酸序列
max_taxonomic_profile.tsv:總的物種丰度表
humann1/data/keggc:pathway的map號對應KO號
3.3 繪製物種bar圖
humann2_barplot --input $TABLE.tsv --feature $FEATURE --outfile $FIGURE
3.4 處理PICRUSt 的結果
biom add-metadata -i otu_table.biom --observation-metadata-fp 97_otu_taxonomy.txt -o picrust.biom --sc-separated taxonomy
humann2_split_table --input picrust.biom --output $OUTPUT_DIR
humann2 --input $SAMPLE.biom --output $OUTPUT_DIR2 --pathways-database humann1/data/keggc
輸出文件為:Pathway abundance file,Pathway coverage file
3.5 HUMAnN2的關鍵參數介紹
-r, --resume
如果輸出文件存在,則不運行命令
--bypass-prescreen
跳過預篩選使用完整的ChocoPhlAn資料庫
--bypass-nucleotide-index
跳過核苷酸的建庫,使用現有的ChocoPhlAn 資料庫index文件
--bypass-nucleotide-search
跳過UniRef50蛋白資料庫比對
-i , --input
輸入文件類型
-o , --output
輸出文件夾
--nucleotide-database
核苷酸資料庫的目錄,(ChocoPhlAn資料庫)
--protein-database
蛋白資料庫的目錄,(UniRef資料庫)
--evalue
evalue的閾值
--search-mode
檢索uniref50或uniref90 gene
--metaphlan
MetaPhlAn軟體路徑
--metaphlan-options
Metaphlan軟體的參數,如"-t rel_ab"
--threads
線程數
--prescreen-threshold
匹配物種的最小閾值
--identity-threshold
比對的閾值
--translated-subject-coverage-threshold
subject翻譯成蛋白的比對閾值
--translated-query-coverage-threshold
query翻譯成蛋白的比對閾值
--memory-use
內存的使用
GIF/1K
代碼辣么多
慢慢實踐吧
若遇困難
歡迎留言諮詢
供稿:黃雲
編輯:王麗燕
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
TAG:銳翌基因 |
※「BLACKPINK」「新聞」190622 BLACKPINK澳門演唱會,紫衣少女「金智秀」美顏放送
※TV動畫《BAKUMATSU》第2期將在2019年放送
※X JAPAN「無觀眾Live」 將於11月10日在WOWOW放送
※款式略勝Supreme?PALACE本周單品大放送!
※TWICE獲《SHOW CHAMPION》一位!音樂放送六冠王達成
※BLACKPINK摘得品牌評價1位,SEVENTEEN放送三冠王,蘋果頭公約
※原創動畫《RELEASE THE SPYCE》PV放出將於十月開始放送
※NCAA內部數據大放送
※24小時:AOMG預告新藝人-WINNER放送、簽名、綜藝活動-姜丹尼爾xGRAY
※Pの廣播◢特別放送 Sound Tripper 第36回
※七月新番《BANANA FISH》第3彈CM公開 7月5日開始放送!
※TV動畫《高達 Build Divers》中文預告公布 2018年四月放送!
※陸星材,今天(11日)將通過YouTube進行12時間懲罰生放送(GETITK)
※WANNA·ONE放送事故的思考
※蘋果iPhone X Plus傳言大放送
※TV動畫放送前活動「SAO Gun Gale Online & Atre秋葉原」開辦
※SimonD在SNS Live放送中爆粗口引發爭論!
※聖誕夜就該看《日在校園》!Abema TV 2018年聖誕節放送《School Days》、《SHUFFLE!》
※陳冠希曝光 CLOT x Nike 全新聯名系列,《NBA 2K20》首波遊戲預告正式放送
※遠遠不止 4 雙!NASA x Vans 完整聯名大放送