KEGGgraph:根據kgml 文件從pathway中重構出基因互作網路
包可以解析kgml 文件,從中得到不同對象之間的網路結構,並在此基礎上進一步挖掘其中的信息。
包提供了以下3種基本功能:
將kgml 文件轉換為基因互作網路
用法示例
在 parseKGML2Graph 中,有兩個參數,expandGenes 和 genesOnly。
控制是否將基因進行展開,在pathway 中,會有1個KO 對應多個gene的情況,比如下面這種
表示將基因展開,每個基因作為一個節點。
參數控制是否將其他類型的entry (比如compound等類型)展現在network 中,默認值為 TRUE,所以最終得到的network 中節點全部是基因。
通過parseKGML2Graph 這一步我們就可以從一張pathway 中得到基因產物(蛋白)的互作網路, 還需要注意一點,整個網路是一個有向圖, 因為基因產物之間的互作關係是由方向性的。
對network 進行可視化
由於自帶的可視化不夠美觀,我們把nodes和edges 寫入文件,用cytoscape 進行可視化,用法示例
導入cytoscape 畫出來的圖
查詢節點的信息
對於一個netwrok 而言,每個節點的degree 信息是我們最常用的信息, 示例
由於是有向圖,所以有入度 indegrees 和 出度 outdegrees 的概念。
除了以上基礎功能外,還可以藉助其他的R包進一步挖掘信息,比如在整個基因互作網路, 哪個基因是最關鍵的。
示例:
對於network 而言,我們一般認為degree 越大的點在這個網路中越重要,所以需要看節點的degree 信息。除了這種基本的認識外,還有很多成熟的演算法,從network 中挖掘關鍵節點。 包提供了Brandes 的演算法,用來衡量節點在網路中的重要性,上面的結果中,toprbccs 就是我們篩選出的4個比較重要的節點。
總結
使用包,我們可以方便的從pathway中得到基因戶做網路;
可以將network 中的nodes和edges 信息導出,使用cytoscape 可視化;
可以藉助其他成熟的演算法挖掘基因互作網路中的關鍵基因;
TAG:生信修鍊手冊 |