本服务平台的启动是针对2006 年中国科学院上海生命科学研究院申请的院重大项目《模式生物与细胞等功能系统的系统生物学研究》的数据支持而开展的,对该项目中转录组和蛋白质组产生的数据管理,集成,分析和共享提供解决方案。
基本介绍
- 中文名:蛋白质组丰度数据整合资料库
- 转录:组和蛋白质组产生的数据管理
- 时间:2009 年5 月
- 保证:数据的以季度为周期的更新
内容简介
本服务平台的启动是针对2006 年中国科学院上海生命科学研究院申请的院重大项目《模式生物与细胞等功能系统的系统生物学研究》的数据支持而开展的,对该项目中转录组和蛋白质组产生的数据管理,集成,分析和共享提供解决方案。该服务平台在2009 年5 月开始上线服务,集成了NCBI 的GEO 资料库数据和EBI 的Pride 资料库的数据(共4.7GB),以及项目本身自带的数据1GB。在服务平台的设计过程中,我们考虑了平台和公共资料库的半自动更新功能,保证数据的以季度为周期的更新。另外,用户可以遵守平台要求的格式(如SOFT 格式)提交自己的数据。
本服务平台除了数据存储功能外,还集成了转录组- 蛋白质组丰度数据的基本分析功能。针对生物大分子丰度数据的分析,我们提供了组间比较,聚类,主成份分析等功能。对于蛋白质组数据,本平台提供了蛋白质注释等功能。对于转录组和蛋白质组数据的整合分析,本平台提供以基因为中心的整合,即将两个不同生物学层次上的数据都映射到基因层次以保证数据实体的一致性。本平台部分自主开发的算法以R 包的方式(如蛋白质注释相关的函式见论文提供给用户下载和进一步开放。本服务平台中的数据对所有用户开放。用户可以匿名下载我们从公共资料库整合的数据,对于特定项目相关的数据,用户需要在系统注册后下载项目公共数据。匿名用户可以查看本系统中所有数据。

使用方法
本服务平台提供快速检索和高级检索两种方式。在快速检索框中,用户可以使用常用的限定词自由组合,快速实现对数据的搜寻;在高级检索中,用户既可以按限定词单个检索或逻辑组合检索还可以用平台的定义的规则编写搜寻规则语句进行搜寻。搜寻结果以简要显示或者概要显示格式展示。具体的搜寻规则可见本服务平台的帮助档案。
对于每个条目,用户可以浏览数据自身的元数据,对数据预处理得到的一些基本的统计描述信息。用户可以对选中的条目进行平台内嵌的统计方法进行统计分析。在每个条目中,我们会聚集所有和该条目相关的其它信息,如关联条目的连结,物种信息,实验信息,数据质控情况等。用户可以直接拷贝条目上的信息,或以文本格式下载。
对于平台提供的数据分析功能。用户除了对系统本身数据的直接分析,还可以递交自己的数据进行线上分析。对于小于10M 的线上数据分析,用户可以自己直接递交分析。但如果数据量过大,由于考虑到伺服器的负荷情况,我们需要用户进行预约。
套用案例
中科院系统生物学重点实验室蛋白质组学研究平台:本服务平台与中科院系统生物学重点实验室蛋白质组学研究平台进行了深入的合作,使用该蛋白质组学平台产生的实验数据对适配器技术(adapter)和蛋白质组学子库进行了测试,测试结果表明适配器技术可以有效地将不同实验室产生的数据有效地转化为标準数据交换格式(PRIDESchema、MZML、iPRIDESchema 格式),大大方便了实验室数据的发布和交流。
上海交通大学生命科学技术学院某实验室:该实验室同时拥有基因晶片数据和蛋白质组数据,因此通过我们的平台进行整合分析。首先该实验室将数据存入我们平台,然后通过平台的数据预处理(如PannBuilder 软体包的蛋白质注释)。借用平台已有的组间比较,聚类,主成份分析等功能,我们可以得到常规分析的结果。此时,我们可以对两个不同生物学层次的数据直接进行比较分析。
持续发展
本服务平台採用半自动更新方式,实现对GEO 和PRIDE 数据的同步,以保证每个季度的数据一致性。另外,主动参与到一些项目中,为这些科研项目提供技术支撑和数据存储。
