TCGA新版数据库表达矩阵提取

计算机软件开发 · 2024-10-6 05:39:18

本文首发于公众号：医学和生信笔记

医学和生信笔记，专注R语言在临床医学中的使用，R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。

现在使用TCGAbiolinks下载转录组数据后，直接是一个SummarizedExperiment对象，这个对象非常重要且好用。因为里面 直接包含了表达矩阵、样本信息、基因信息，可以非常方便的通过内置函数直接提取想要的数据，再也不用手扒了！!
这个对象的结构是这样的：

上次我们下载了常见的组学数据，今天学习下怎么提取数据，就以TCGA-READ的转录组数据为例。
分别提取mRNA和lncRNA的表达矩阵，还要添加gene symbol的那种！
加载数据和R包

加载之前下载好的数据。
rm(list = ls())library(SummarizedExperiment)load("TCGA-mRNA/TCGA-READ_mRNA.Rdata")se <- data这个se就是你的对象，含有coldata, rowdata， meta-data，以及最重要的assay，共有6个assay
探索SummarizedExperiment对象

TCGA新版数据库表达矩阵提取

所属分类: 问答交流

新帖推荐: 30日

推荐作品