配景先容
NextDenovo是武汉未来组(如今大概得叫盼望组了)开辟的用于三代基因组组装的软件。
想当年读硕士的时间我还由于项目相助的事儿在未来组呆了好几个月来着。
可用资源
GitHub所在:https://github.com/Nextomics/NextDenovo
官方文档: https://nextdenovo.readthedocs.io/en/latest/
洲更学长的条记:ttps://xuzhougeng.top/archives/Assembly-nanopore-with-NextDenovo
软件安装
安装起来比力轻松舒畅,由于软件本体不必要安装,有编译好的二进制文件可以直接下载使用。唯一必要安装的就是一个python的依赖Paralleltask
# 下载软件本体wget https://github.com/Nextomics/NextDenovo/releases/download/v2.5.0/NextDenovo.tgz# 安装依赖python -m pip install Paralleltask# 解压软件tar -zxvf NextDenovo.tgz软件测试
压缩包解压开之后可以找到内里有个test_data文件夹和它下面的示例步调test_data/run.cfg,可以直接运行测试一下软件能不能在你的服务器上跑通。固然这一步是非必须的哈。
cd NextDenovonextDenovo test_data/run.cfg运行自己的项目
天生输入文件
把自己的组装数据的绝对路径存入文件并定名成input.fofn
ls /path/to/01RawData/PacBio/*hifi_reads.fastq.gz > input.fofn编写config文件
拷贝一份测试数据的cfg文件过来
cp ../NextDenovo/doc/run.cfg .按照自己的项目标现实环境去修改参数。我的test.run.cfg文件如下:
[General]job_type = local # local, slurm, sge, pbs, lsfjob_prefix = test_nextDenovotask = all # all, correct, assemblerewrite = yes # yes/nodeltmp = yes parallel_jobs = 24 # number of tasks used to run in parallelinput_type = raw # raw, correctedread_type = hifi # clr, ont, hifiinput_fofn = input.fofnworkdir = 01_rundir[correct_option]read_cutoff = 1kgenome_size = x.xg # estimated genome sizesort_options = -m 20g -t 15minimap2_options_raw = -t 8pa_correction = 3 # number of corrected tasks used to run in parallel, each corrected task requires ~TOTAL_INPUT_BASES/4 bytes of memory usage.correction_options = -p 15[assemble_option]minimap2_options_cns = -t 8 nextgraph_options = -a 1更多的参数阐明可以访问下面这个官方教程所在:
https://nextdenovo.readthedocs.io/en/latest/OPTION.html
接下往复run就可以了
nohup nextDenovo test.run.cfg &私货时间
- 在我如今用PacBio HiFi数据组装基因组的项目中,NextDenovo的结果仅次于hifiasm。
- GitHub上如今NextDenovo团队是把HiFi给划掉了,不知道是不保举使用NextDenovo用于组装HiFi数据还是啥别的意思。
- NextDenovo如今文章还未发布,如果使用了请引用GitHub所在:
https://github.com/Nextomics/NextDenovo
|