R代码归并TCGA体细胞突变数据

分享
手机游戏开发者 2024-9-29 04:15:32 93 0 来自 中国
前次通过图文给各人讲授了怎样从TCGA数据库下载体细胞突变的数据
☞ 怎样从TCGA数据库下载体细胞突变数据(somatic mutation)
前面我们也讲过,怎样从TCGA数据库下载RNAseq和miRNA-seq的数据。各人应该对TCGA数据库内里数据的格式有了肯定的相识。
☞ 新版TCGA数据库RNAseq数据下载
☞ 新版TCGA数据库miRNA数据下载
无论是RNAseq,miRNAseq还是体细胞突变的数据,都是单个的文件。也就是每一个样本会用一个单独的文件来存放相应的数据。如果我们想得到如下图所示的矩阵,就须要通过循环去读取每一个文件内里的内容,然后举行归并。
前面已经跟各人分享过怎样通过R代码或者是利用零代码的工具来归并RNAseq和miRNA-seq的表达矩阵。
☞ 【视频讲授】R代码归并新版TCGA中RNAseq表达谱矩阵
☞ 【视频讲授】R代码归并新版TCGA中miRNA表达谱矩阵
☞ 零代码归并新版TCGA中RNAseq和miRNA表达谱
归并体细胞突变数据的思绪,其实跟前面讲到的归并表达矩阵的思绪大要类似,固然也有一个很告急的差别之处。
1)读取sample sheet内里的内容,获取每个MAF(mutation annotation format)文件的路径,如下图所示。

2)循环读取每一个MAF文件内里的内容

3)将每个文件内里的内容按行贴起来,这个跟前面合成表达矩阵是不一样的。归并表达矩阵是按列来归并。终极我们可以得到下面如许一张表格。

4.png 基于这张表格的数据,我们就可以绘制前面提到过的瀑布图。关于这张表格内里每一列的寄义,我会在下面的文章内里给各人做详细的先容。

5.png
完备归并R代码+详细表明☟☟☟
R代码归并TCGA体细胞突变数据
您需要登录后才可以回帖 登录 | 立即注册

Powered by CangBaoKu v1.0 小黑屋藏宝库It社区( 冀ICP备14008649号 )

GMT+8, 2024-10-18 20:27, Processed in 0.099317 second(s), 35 queries.© 2003-2025 cbk Team.

快速回复 返回顶部 返回列表