R语言(ggplot2)画KEGG信号通路气泡图

KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个综合性的生物信息学数据库,其中包含了有关基因、蛋白质、代谢途径和信号通路的详细信息。KEGG信号通路是KEGG数据库中的一部分,提供了有关生物体内分子间相互作用、信号传导和代谢途径的信息。

1. KEGG信号通路的数据表be like⬇

需要将原始数据处理成至少包含Term\Count\pValue\EnrichmentScore四列的数据处理,上述还经过了对Count降序排序,最终保存为Excel数据,通过R语言中的openxlsx程序包来读取该数据。

2. R语言ggplot2画气泡图

ggplot2 是一种用于数据可视化的R语言包,它提供了一种高度灵活和强大的方法来创建各种类型的图表和图形。ggplot2 是 Hadley Wickham 开发的,它基于“图形语法”理念,允许用户通过构建图层来轻松地控制图形的各个方面。以下是用ggplot2处理KEGG数据绘制气泡图的步骤。

2.1 R code

#修改工作路径(win下的路径使用“\\”)

setwd("C:\\Users\\Lin\\KEGG-plot")

#读入Excel数据

library(openxlsx)

data_kegg<-read.xlsx("up-KEGG.xlsx",sheet = 1)

#查看数据列名

colnames(data_kegg)

dim(data_kegg)

#ggplot2画气泡图,修改横坐标的名称为“Enrichment Score”,scale_color_gradient设置蓝红配色

library(ggplot2)

ggplot(data_kegg,aes(x=EnrichmentScore,y=Term))+geom_point(aes(size=Count,color=pValue))+theme_bw()+labs(y="",x="Enrichment Score")+ scale_color_gradient(low="blue",high="red")

#修改气泡图横向缩放度:coord_fixed(ratio=1/200)

ggplot(data_kegg,aes(x=EnrichmentScore,y=Term))\

+geom_point(aes(size=Count,color=pValue))\

+theme_bw()\

+labs(y="",x="Enrichment Score")\

+scale_color_gradient(low="blue",high="red")\

+coord_fixed(ratio=1/200)

3. 结果展示图

精彩文章

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。