先容:
这是一个可以自动归并数据的浅易脚本
应用场景:
有一批数据有三十几个样本,测序公司返回数据时由于数据量不达标,必要加测一次,部门样本数据量照旧不敷, 又加测一次才够,统共三次数据,必要根据样本名称归并成一个fq.gz。这么多数据要一个一个对应太贫苦了.
那么如果经常发生这种环境,发起换一家测序公司。
脚本利用留意事项:
批次之间的文件怎样区分:
通常是根据lane号区分的,好比:
- XXX_L3_1.fq.gz(第一批测序返来的)
- XXX_L2_1.fq.gz(第二批测序返来的)
再有就是两批数据完全类似的名称:
- XXX_L3_1.fq.gz(第一批测序返来的)
- XXX_L3_1.fq.gz(第二批测序返来的)
这两种都支持!
脚本的利用:
只必要放入必要归并的数据的全部路径,有多少批数据路径就放多少批数据路径:
./DataMerge.py /path/to/data1 /path/to/data2 /path/to/data3特此说明:由于脚本是打包了环境的,以是是一个二进制文件,直接利用就行,不消再安装python所需依靠包。遇到permission denied时:chmod 755 /path/to/data_merge/dist/DataMerge
已更新:
- 支持相对路径
- 效果不会更换原来的文件,而是生成新的文件夹:
- 会查抄每个路径的fastq数目,并根据fastq名称逐一对应.
- 支持10x数据的-1,-2,-3,-4的数据:
- 全部的数据一个都不漏,该归并的归并,不必要归并的就链接地点过来.
待更新:
SE的数据没有验证过,
举例:
./DataMerge.py ../20220331_HG5GLDSX3_Result/Rawdata ../20220404_HFVV3DSX3_Result/Rawdata
点赞+品评获取脚本 |