TCGA新版数据库表达矩阵提取

计算机软件开发 2024-10-6 05:39:18 101 0 来自 中国
本文首发于公众号:医学和生信笔记
医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。
现在使用TCGAbiolinks下载转录组数据后,直接是一个SummarizedExperiment对象,这个对象非常重要且好用。因为里面 直接包含了表达矩阵、样本信息、基因信息,可以非常方便的通过内置函数直接提取想要的数据,再也不用手扒了!!
这个对象的结构是这样的:


上次我们下载了常见的组学数据,今天学习下怎么提取数据,就以TCGA-READ的转录组数据为例。
分别提取mRNA和lncRNA的表达矩阵,还要添加gene symbol的那种!
加载数据和R包

加载之前下载好的数据。
rm(list = ls())library(SummarizedExperiment)load("TCGA-mRNA/TCGA-READ_mRNA.Rdata")se <- data这个se就是你的对象,含有coldata, rowdata, meta-data,以及最重要的assay,共有6个assay
探索SummarizedExperiment对象
您需要登录后才可以回帖 登录 | 立即注册

Powered by CangBaoKu v1.0 小黑屋藏宝库It社区( 冀ICP备14008649号 )

GMT+8, 2024-10-18 16:51, Processed in 0.160880 second(s), 32 queries.© 2003-2025 cbk Team.

快速回复 返回顶部 返回列表