论文
MiDAS 4: A global catalogue of full-length 16S rRNA gene sequences and taxonomy for studies of bacterial communities in wastewater treatment plants
https://www.nature.com/articles/s41467-022-29438-7
数据链接
https://figshare.com/articles/dataset/Dueholm2021a_data_zip/16566408/1
代码链接
https://github.com/msdueholm/MiDAS4
今天的推文重复一下论文中的Figure4a
论文中没有直接提供这个作图数据,必要运行一系列代码得到,这里我不先容前面获取作图数据的代码了,感爱好的可以本身去找来代码试试,假如运行的话必要比力大的内存
作图数据部门截图
读取数据
library(ggrepel)library(tidyverse)library(ggplot2)library(ggtext)library(ggrepel)gV134<-read_csv("fig4a.csv")作图代码
p <- ggplot(gV134, aes_string(x = "V13_mean_abundance", y= "V4_mean_abundance", fill="Bias"), color="black") + geom_point(size = 2,shape=21) + geom_abline(size = 0.5) + geom_text_repel(data = filter(gV134, gV134$FC>1 & gV134$V4_mean_abundance>0.1), aes(label = Genus), #vjust = 1.5, colour="grey30") + geom_text_repel(data = filter(gV134, gV134$FC<(-1) & gV134$V13_mean_abundance>0.1), aes(label = Genus), #vjust = 1.5, colour="grey30") + xlab("Mean V13 amplicon genus read abundance (%)") + ylab("Mean V4 amplicon genus read abundance (%)") + scale_x_log10(limits=c(0.001,2)) + scale_y_log10(limits=c(0.001,2)) + theme_bw() + theme(legend.position = "none", plot.title = element_markdown())+ scale_fill_manual(values = c('Equally detected'="#898989", 'More abundant with V1-V3'="#2a7cb6", 'More abundant with V4'="#d41b21"))+ labs(title="352 genera equally abundant <span style = 'color:#898989;'>(gray)</span><br/> 112 genera more abundant with V4 <span style = 'color:#d41b21;'>(red)</span><br/> 111 genera more abundant with V1-V3 <span style = 'color:#2a7cb6;'>(blue)</span>") p
这里碰到的题目是添加的文本标签有点多,相互之间会有重叠,利用ggrepel这个R包也调治不出比力好的效果,只能出图后再编辑图片了
这里标题的文本只有一部门添加了颜色,可以借助ggtext这个R包的markdown语法实现
示例数据和代码可以本身到论文中下载
接待各人关注我的公众号
小明的数据分析条记本
小明的数据分析条记本 公众号 紧张分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读条记;3、生物信息学入门学习资料及本身的学习条记!
|