生物秀首页 新闻前沿 产业资讯 实验技术 仪器教程 生物考研 资源下载 生物人 物秀商城 生物论坛 图片 专业 博客 易生物 视频动画
生命科学实验中心
导航: 生物秀 > 实验 > DNA 实验 > 理论知识 > 正文
  • 倾力提供最优!
基于DNA微阵列的基因表达数据管理和分析
作者:谢建明 来源:生物秀 时间:2006-9-19

    有许多实验室建立了自己的数据库,微阵列数据和论文用不同的格式在作者的网页站点上发布,目前大多数公共数据没有用足够的材料进行注释,供不同的独立小组使用。事实上,通常不进行注释。关于数据质量、可靠性和特定数据点可能的错误水平的所有细节被完全剥离了。例如,对于两通道的微阵列数据,通常仅仅给出信号去除背景后的比例,没有提示关于信号和背景水平的绝对信息,但是这些信息对于评价每一个基因表达的可靠性是很重要的。
    有必要建立公共的微阵列数据仓库得到了公认。它的功能包括提供支撑基于微阵列实验的论文的数据的访问。这样的数据仓库在建设中,例如NCBI的GEO,日本的DNA数据库,和EBI开发的ArrayExpress,然而,那些必需的信息应该存在这些数据库中是不清晰的,存储原始的微阵列扫描图像,或每一个阵列元素最终的值(如两通道平台的每一个点的绿/红比率)是足够的吗?或者一些中间的数据,例如来自特定图像分析软件包的完整的输出?与原始数据发布或归一化的数据?实验中的那些信息是必须的?微阵列元素必须被注释使实验结果更容易被理解。
    数据库中存储的信息必须有特定数据库或仓库的功能决定。如果仅仅是发表论文的数据支撑,对于实验的一些细节已经在论文中说明。建立论文与数据库的访问接口就行。这样的系统不大可能是有效的和可扩展的,更重要的是非标准化数据库的价值和使用是非常受限制的。例如,使用这些数据库对于高通量的自动化的数据分析和挖掘是非常困难的。过去几十年序列数据库的经历证明了在数据产生的早期阶段应用的结构和一致的注释的策略是很重要的。
    对于微阵列实验相关的数据至少有三个层次:1、扫描图像(原始数据),2、图像分析过程得到的定量输出(微阵列定量矩阵);3、实验结果(基因表达数据矩阵)。来自微阵列研究的数据和注释必须满足一下要求:
    1、关于实验的信息应该足够解释该实验,必须有足够详细的说明来与相类似的实验进行比较,允许实验的重复。
    2、信息必须以某种方式结构化,保证有效的查询和自动化的数据分析和挖掘。
    目前在基于微阵列的基因表达数据管理的主要成果是MIAME和MAGE-ML。
    MIAME(the minimum information about a microarray experiment):
    由微阵列注释工作组开发。目的是描述对于明白解释微阵列数据所必需的最少的信息,随后可以独立的验证这些数据。MIAME不是微阵列实验必须遵循的教条,而是一组指导方针,它将帮助微阵列数据库和数据分析工具的开发。MIAME中包含的信息如图2所示。
    MAGE-ML:
    微阵列基因表达标记语言是一种语言,用来描述和基于实验的微阵列信息的通讯,它基于XML,可以描述微阵列设计、微阵列制造信息,微阵列实验组织和实施信息,基因表达数据和数据表达结果。MAGE-ML直接自动来自MAGE-OM, 后者是使用UML开发和描述——描述对象模型的标准语言。首先使用图形化表示法描述不同实体间的相互关系,比DTD更容易。然后,UML图表主要是针对人的,而DTD是面向计算机的。因此MAGE-OM可以认为是初级模型。
    这两个标准已被许多大的基因芯片研究和制造机构采用,可以预言它们很可能将成为一种该领域的一个标准。
    小结与展望
    随着DNA微阵列技术的完善和在生命科学研究中的广泛应用,产生了大量的基因表达数据,这些数据中蕴含着大量的信息,如基因调控规律的信息,不同条件下表达差异的信息等等,利用这些信息可以进行基因启动子区域顺式调控元件的研究、基因表达调节途径或网络的研究、疾病或药物作用特异表达谱的研究等等。数据的增多直接带来的两个问题是数据的管理和知识发现。数据的管理主要通过建立数据库的方式,目前已由较大的数据库服务器,这些数据间的共享和再利用迫切需要建立某种标准,从而提高利用效率,MIAME和MAGE-ML在这方面作了有益的尝试,有望成为一种规范。知识发现是从海量的数据中获取有生物学意义的信息,并形成新的生物学知识。在这方面的研究还处于初始阶段,最常采用的是统计学方法,如聚类分析、SAM等,但发展速度很快,目前已有大量的研究论文和分析软件。
    出于对该领域的兴趣,很希望对该领域的研究现状做一个全面和比较准确的综述,但由于个人知识结构的局限性和时间的有限,该作业完成的很仓促,仅仅是走出的第一步。

    图2 MIAME的结构表示
    参考文献:
    Quackenbush, H. Computational analysis of microarray data. Nature Reviews Genetics2002, 2:418-427.
    Eisen M B, Spellman P T, Brown P O, et al. Cluster analysis and display of genome-wide expression patterns. Proc. Natl Acad. Sci. USA, 1998, 95:14863~14868
    Tamayo P, Slonim D, Mesirov J, et al. Interpreting patterns of gene expression with self-organizing maps: methods and application to hematopoietic differentiation. Proc. Natl Acad. Sci. USA, 1999, 96:2907~2912
    Brown M P S, Grundy W N, Lin D, et al. Knowledge-based analysis of microarray gene expression data by using support vector machines. Proc. Natl Acad. Sci. USA, 2000, 97: 262~267
    http://genome-www5.stanford.edu/MicroArray/SMD/
    http://www.ebi.ac.uk/microarray/ArrayExpress/arrayexpress.html
    http://www.ncbi.nlm.nih.gov/geo/

    上一页  [1] [2] [3] [4] [5] 

关于〖基于DNA微阵列的基因表达数据管理和分析〗的最新评论
昵称:      评分: 1分 2分 3分 4分 5分
内容:
生物秀实验频道
    没有相关实验
设为首页 | 加入收藏 | 关于我们 | 战略伙伴 | 友情链接 | 法律声明 | 广告服务 | 联系我们 | 网站地图
Copyright © 2003-2008 生物秀 (中国·生物秀科技) 版权所有 信产部备案:鲁ICP备05001831号
客服信箱:info@bbioo.com  客服电话:15800302289  客服QQ:254857951
www.bbioo.com All Rights Reserved.