【小工具】智能归并测序数据fastq的脚本

分享
源代码 2024-9-28 07:59:15 114 0 来自 中国
先容:

这是一个可以自动归并数据的浅易脚本
应用场景:

有一批数据有三十几个样本,测序公司返回数据时由于数据量不达标,必要加测一次,部门样本数据量照旧不敷, 又加测一次才够,统共三次数据,必要根据样本名称归并成一个fq.gz。这么多数据要一个一个对应太贫苦了.
那么如果经常发生这种环境,发起换一家测序公司。
脚本利用留意事项:

批次之间的文件怎样区分:

通常是根据lane号区分的,好比:

  • XXX_L3_1.fq.gz(第一批测序返来的)
  • XXX_L2_1.fq.gz(第二批测序返来的)
再有就是两批数据完全类似的名称:

  • XXX_L3_1.fq.gz(第一批测序返来的)
  • XXX_L3_1.fq.gz(第二批测序返来的)
这两种都支持!
脚本的利用:

只必要放入必要归并的数据的全部路径,有多少批数据路径就放多少批数据路径:
./DataMerge.py /path/to/data1  /path/to/data2  /path/to/data3特此说明:由于脚本是打包了环境的,以是是一个二进制文件,直接利用就行,不消再安装python所需依靠包。遇到permission denied时:chmod 755  /path/to/data_merge/dist/DataMerge
已更新:


  • 支持相对路径
  • 效果不会更换原来的文件,而是生成新的文件夹:
  • 会查抄每个路径的fastq数目,并根据fastq名称逐一对应.
  • 支持10x数据的-1,-2,-3,-4的数据:
  • 全部的数据一个都不漏,该归并的归并,不必要归并的就链接地点过来.
待更新:

SE的数据没有验证过,
举例:

./DataMerge.py ../20220331_HG5GLDSX3_Result/Rawdata ../20220404_HFVV3DSX3_Result/Rawdata
点赞+品评获取脚本
您需要登录后才可以回帖 登录 | 立即注册

Powered by CangBaoKu v1.0 小黑屋藏宝库It社区( 冀ICP备14008649号 )

GMT+8, 2024-11-22 05:37, Processed in 0.180968 second(s), 32 queries.© 2003-2025 cbk Team.

快速回复 返回顶部 返回列表