摘要:DNA微阵列是生命科学研究的重要工具,在疾病诊断、药物开发等领域得到了广泛应用。在应用过程中,产生了大量的数据,这些数据的存储、分发和数据挖掘成为DNA微阵列能被推广应用的关键技术。本论文简单介绍了这两方面的研究现状。
关键词:DNA微阵列 数据挖掘 数据仓库 标准 基因表达分析
一、引言
DNA微阵列(DNA microarray),也叫基因芯片,是近几年发展起来的一种能快速、高效检测DNA片段序列、基因型及其多态性或基因表达水平的新技术。它将几十个到上百万个不等的称之为探针的核苷酸序列固定在微小的(约1cm2)玻璃或硅片等固体基片或膜上,该固定有探阵的基片就称之为DNA微阵列。它利用核苷酸分子在形成双链时遵循碱基互补原则,可以检测出样本中与探阵阵列中互补的核苷酸片段,从而得到样本中关于基因结构和表达的信息。它的技术来源追溯到一个多世纪之前,Ed Southern发现被标记的核酸分子能够与另一被固化的核酸分子配对杂交。因此,Southern blot可被看做是最早的基因芯片。在八十年代,Bains W.等人就将短的DNA片断固定到支持物上,借助杂交方式进行序列测定。1995年,斯坦福大学开发出第一片cDNA芯片并用于生命科学研究,1998年美国Affymetrix公司将第一片带有13.5万个基因探阵的寡聚核苷酸芯片推向市场,标志着DNA微阵列的产业化,从此基因芯片或DNA微阵列的研究和应用得到了广泛的重视,可以说在生命科学研究界和产业界掀起了基因芯片热潮,1999年Nature出专刊介绍这门基因芯片及其应用。
基因芯片可用于DNA序列的再测序、基因SNP或多态性检测和基因表达分析。由于基因芯片技术是一种高通量检测技术,它可是并行的同时检测成百上千,甚至成千上万个基因的活动情况或DNA片段,改变了传统的每次只能检测一个基因的情况,因此能大大提高检测效率,降低检测成本,并保证了检测质量。基因芯片技术可广泛应用于疾病诊断和治疗、药物筛选、农作物的优育优选、司法鉴定、食品卫生监督、环境检测、国防、航天等许多领域。它将为人类认识生命的起源、遗传、发育与进化、为人类疾病的诊断、治疗和防治开辟全新的途径,为生物大分子的全新设计和药物开发中先导化合物的快速筛选和药物基因组学研究提供技术支撑平台。
通过基因表达谱的研究可以进行进一步的理论研究或应用研究。
1、理论研究。根据基因组基因表达谱可以进一步分析共表达基因是否存在共同的顺式调控元件,发现新的调控元件。此外,可以研究基因的调控规律,构建调控网络。
2、应用研究包括疾病诊断和药物开发。根据不同疾病状态下的差异表达谱的研究可以确定疾病的类型和进展。研究药物作用后基因表达谱的改变可以确定药物的毒性、预后和疗效,从而指导药物开发和临床合理用药。
在基于DNA微阵列的基因表达分析研究中,数据的分析和管理是一个关键性的问题,它直接影响了实验结果的准确型和实验的可靠性。
图1 DNA微阵列的基因表达数据的获得


