RED——助您探索水稻基因的表达模式
2018/7/30 16:55:31 中国科学院北京基因组研究所

     图1. RED的首页

     为此,中国科学院北京基因组研究所,生命与健康大数据中心的科研人员于2017年开发了水稻基因表达库(RED, Rice Expression Database)。与传统的水稻数据库相比,RED将转录组测序作为唯一的表达数据入口,利用一套以(Hisat2 + Stringtie)为主体的高效分析流程,对公共数据库中海量的水稻转录组原始Reads进行整合分析。从而实现了表达数据从来源到分析流程的统一,令比较同一水稻基因在不同状态/处理下的表达谱成为了可能。

     RED的首页如图1所示,简单质朴的风格中,深藏功与名~

     下面通过实际操作,对大家比较关注的几个问题进行初步的探索。

     1

     用户在RED数据库中能获得哪些信息?

     当然是水稻基因的表达谱信息啦!具体地说,RED目前收录了五万多个水稻基因在已公开发表的二十四个水稻转录组测序计划(Projects)中,共计15,847,484个基因表达数据。这些数据涉及到9种不同的水稻组织,284个高质量的RNA-Seq实验。

     当给定某一个具体基因的登录号(Accession)时,用户们可以获得这一个基因在相关组织中的表达量的值(通过FPKM进行衡量与标准化分析),如图2所示。

    

     图2. LOC_Os06g47890基因表达量的箱线图

     与此同时,用户们还可以获得该基因在不同组织、实验处理下的基因表达谱热图。

    

     图3. LOC_Os06g47890基因表达量的热图

     所有这些图片,用户们均可以保存到本地,并在各自的项目中免费使用。值得一提的是,贴心的开发者们给大家提供了多种下载格式,除了常规的位图PNG和JPEG以外,小伙伴们还可以获得对应的矢量图(SVG)或PDF文档,以方便根据各自所需要的风格进行后续编辑。

     除此以外,RED数据库还提供了水稻基因具体的meta信息,如该基因在不同版本水稻注释系统中的登录号(Accession),基因Symbol,染色体及位置信息及功能描述等。

    

     图4. LOC_Os06g47890基因的meta 信息

     2

     如何在RED中搜索到想要的信息呢?

     RED提供了多种信息检索方式:(1)首先,用户可以提交某一个水稻基因的ID (如,Os01g0803200)对其表达谱直接进行查询;(2)其次,用户可以通过提供一个Ontology ID,来 对具有指定 Ontology 词条的基因进行检索;(3)用户还可以输入一个Project ID以便对NCBI中某一个具体的水稻转录组测序计划进行查询;(4)最后,RED还允许用户对指定染色体区域中的基因的表达谱进行检索。

    

     图5. RED数据库的信息检索界面

     3

     RED数据库中是否提供了分析工具?

     当然有!RED除了给大家带了丰富的水稻基因表达谱信息,还给大家提供了一些实用的在线分析工具。如水稻基因共表达网络分析工具(co-search)和管家基因/组织特异基因筛选工具(HK-TS):

     (1)水稻基因共表达网络分析工具(co-search, http://expression.ic4r.org/co-search),是基于水稻基因间表达数据的相似性而构建的网络图。

    

     图6. RED数据库的co-search工具展示

     用户可以提供一个基因列表,并设置相应的皮尔森相关系数,点击“Search”,既可以完成网络共表达网络图的构建。

    

     图7. 以LOC_Os01g09252和LOC_Os01g08420为主节点的共表达网络分析展示

     (2)水稻管家基因/组织特异性基因鉴定工具(http://expression.ic4r.org/hk-ts),这个工具利用基因表达特异性指数 — tau值来衡量水稻基因表达的稳定性。tau值越大的基因越倾向组织特异性基因,tau值越小则越倾向于持家基因。用户可以根据需求自己定义tau值,来进行筛选。

    

     图8. RED数据库的HK/TS工具展示

     4

     RED中的数据是否可以免费下载?

     那是当然的啦!RED提供了丰富的下载内容:如水稻基因在不同组织、不同发育时期、不同实验处理下的表达量矩阵(FPKM值);每个SRA项目通过分析所产生的bedGraph文件;基因之间的共表达数据(co-expression data);参考基因组信息等等。所有这些信息和数据大家都可以免费下载,并用于自己的实际项目。不过还是建议大家使用到RED的数据后,可以引用主页中的相关论文,以对研究人员表示鼓励~

    

     图9. RED的所提供下载的数据

     好啦,还在等什么!水稻基因表达数据库(RED) 约吗?!

     点击"阅读原文"直接进入RED

    http://weixin.100md.com
返回 中国科学院北京基因组研究所 返回首页 返回百拇医药