TCGA改版后转录组数据的下载以及整理
作者:果子 生信技能树 2022-05-11 09:26
以从GDC数据库下载TCGA的BRCA转录组数据为例,更新一下既往的流程,以一个更快的速度来整理这些数据。
首先通过网址进入GDC网站
https://portal.gdc.cancer.gov/
点击repository 进入仓库,
从cases里面确定数据下载的组织
然后files里面选择下载数据的类型,是转录组数据,选择只是在出现多个选项的时候才选,如果只有一个选项,不勾选也没有关系
比如,当前数据格式tsv只有一种,不勾选没有关系
接下来把数据选择的数据加入到购物车,购物车里面数量会变成文件数目,当前是1226
数据下载
此时点击购物车,就会进入下载页面,因为当前数据挺大的,不建议直接下载而是采用他推荐的GDC Data Transfer Tool来进行
而使用这个工具,需要两个文件,一个是Manifest,一个是metadata
这个GDC Data Transfer Tool工具下载也提供了链接,点击进去,往下看,根据自己的电脑系统下载不同的文件。
--
FROM 59.41.66.*