2.序列(Sequence):
DNA中核苷酸的排列称序列或顺序。凡有意义的排列关系叫作密码( Code)或信息,但并非所有序列都有意义的。能表达和最终能合成蛋白质的排列顺序是有意义的,基因就属于这种序列。在DNA中反复出现的序列叫作重复序列( Repeated Sequenc e);根据它们重复次数的多少,可分为:高度重复序列、中度重复序列和单拷贝(Copy)序列三种。高度重复序列的长度,由2~10 个核苷酸组成,如人的Alu 序列,重复次数达上百万次之多;中度重复序列,可从几个核苷酸到几千个之多组成,重复次数在几十次到几千次之间。单一拷贝的序列,在基因组中只出现一次或几次。真核细胞中单拷贝序列和重复序列是间隔排列的,在基因之间的重复序列叫间隔。重复序列有编码(表达)和不编码之分,间隔为不表达序列,基因内含子也属不编码重复序列。基因也有重复现象,重复次数多少与编码蛋白质的数量有关,需量大者重复多,如编码rRNA、tRNA 等的基因属重复序列。
3.基因:(图13-2,3)
人类一个基因平均由1~3kb(千碱基对)个核苷酸对(Base Pair:bp)组成,在一个基因中也有不表达的顺序,如rRNA、tRNA基因、珠蛋白基因等,或称蛋白质基因。另类基因不编码任何东西,但有重要调节作用,其中包括调节基因(Regulater)、启动子(Pro-moter)、增强子(Enhencer)、沉寂子(Silencer)等,它们与结构基因构成协同基因群,共同完成表达过程。人类编码蛋白质基因包括四个区域:人类基因并非都发生编码活动,从形成最终产物(蛋白质或酶),与否,基因可分成两类,一类为编码基因,如rRNA、tRNA 基因、珠蛋白基因等,或称蛋白质基因。
另类基因不编码任何东西,但有重要调节作用,其中包括调节基因(Regulater)、启动子(Pro-moter)、增强子(Enhencer)、沉寂子(Silencer)等,它们与结构基因构成协同基因群,共同完成表达过程。人类编码蛋白质基因包括四个区域:
【结构基因或表达区】有内含子外显子;一个基因外显子的数目不同,一般有2~30个;内含子介于外显子之间,数目与外显子相近。
【调控区】包括启动子和增强子等,位于编码区的5′或3′端。
【前导区】位于编码区的上游,即编码区的5′端区。
【尾端区】位于编码区的3′端区。
4.基因结构多态性:
从理论上讲,有相同功能的基因其构成应是相同的,事实上并非如此,两个相同功能的基因,产物相同,结构并不一定完全一样。表现在用同一内切酶切割时,两个相同基因的酶切位点不同,说明核苷酸序列不一致,即结构上有差异。这种现象称多态性(Poly-morhism)。
5.基因与染色体:
人类的全部遗传信息或基因都包含在46 条染色体上,由3×109bp 组成,共编码50 000~100 000 个基因;人的染色体平均为130Mb(106bp)平均含有2000~4000 个基因。
(二)DNA 生物性状:
1.变性和复性:
DNA双链借氢键相连,凡能破坏氢键的因素,如加热、强酸、强碱等,均可导致DNA双螺旋破坏,此现象称变性(Denaturation)。变性既受外界因素影响,也与本身结构有关;DNA 中G-C 间有三个氢键,A-T 只有两个,在相同变性条件下,A-T 破坏在先,G-C在后。因此含G-C 比A-T 多的DNA 在结构上比较稳定。双螺旋DNA 分子具有一定的韧性,在溶液中粘度较大,变性后DNA分离成单链,成为无规则的线团,溶液性质也
发生了变化:粘度降低、沉降速度增加、紫外线吸收值升高、生物活性丧失。另外,DNA发光基团(碱基)原在双螺旋内,变性后碱基暴露出来,因此变性也伴随着光学性质的变化。这些都可用于追踪DNA 变性过程。利用DNA 变性后的增色效应,是跟踪DNA变性过程的最方便的手段;比如用升温法使DNA变性,以温度对紫外吸收值作图,能得到一条S 曲线(图13-2)。产生紫外线吸收值跃变的温度称DNA 的熔点,通常是以使增色效应达到一半的温度作为熔点。熔点不仅受DNA本身性质影响,也与溶液条件有关。据DNA 变性中对紫外线吸收变化,可用分光光度计检测核酸的O.D.值(Opti-cal Density)作为进行核酸定量的依据(可附录)。解除变性条件后,变性的两条互补链可重新结合起来,再恢复成原来的双螺旋,这一现象称复性(Anneal)。DNA 复性速度受很多因素影响,归结起来有以下几点:
【温度】同一种DNA,温度条件较高的复性快;温度降低DNA 运动速度缓慢,减少碰撞机会,复性慢,并使误配对的片段很难再解开寻找到正确互补链。
【DNA 片段大小】长链DNA 的扩散速度,比片段小的DNA扩散慢。
【离子浓度】复性速度与离子浓度成正比。
掌握DNA 变性与复性规律,对分子细胞学技术如分子杂交等,有很大实用意义。
2.DNA 复制:
DNA 的复制,邓DNA 自身的合成。DNA以半保留方式复制;复制后DNA 的双链一半来自旧的,另半为新合成的。DNA复制过程十分复杂,涉及30 多种酶和蛋白质的协同作用。原核生物细菌和病毒DNA 复制始于特定位置,真核生物DNA 复制有多个起始点;E.Coli 复制代需20 分钟;而人染色体DNA 比E.Coli DNA 大40 倍,仅3 分钟即可完成。复制开始,由DNA 解链酶使合成部位双链解开,形成复制叉(图13-3)。人DNA
复制是不连续的,有多个起点同时进行。DNA 复制过程中需要有引物(Primer),引物是一种RNA;引物的合成称引发,引发过程非常复杂。引物先附于合成起始点,而后DNA 聚合酶从RNA 引物3′端开始合成DNA新链。即以两链为模板在DNA聚合酶(III)的作用下,各自分别以5′→3′的方向,按A-T,G-C 互补关系把各种核苷酸联结起来,每次增加一个核苷酸;原核生物每分钟合成约为105bp,真核生物为5×102~5×103bp。
(三)基因的生理活动:
1.基因表达:
基因产生功能的过程称表达(Expression),也叫编码(Code)。即遗传信息从DNA传给RNA,再通过翻译产生蛋白质的过程。信息从DNA 传给RNA 的过程叫转录(Tran-scription);RNA 产生蛋白质的过程称翻译( Translation)。表达由转录开始;DNA双链在转录时分开,能转录RNA 的那条DNA 单链叫有意义的链(Sense Strand);它起模板作用,因此也叫正链(Positiive Strand);对应的另条链叫反意义的链(Antisense
Strand),是为负链(Negative Strand);但正链和负链并非总是在一条DNA 单链上;在一条单链DNA 上既可有正链也可有负链。基因在编码过程中,外显子和内含子一起转录,形成前体mRNA(hnRNA),在进入细胞质前内含子表达的部分被加工剪切(Splicing)掉,只有外显子编码的RNA部分保留并相连接起来形成最终的mRNA,再进入细胞质中(图13-3)。基因表达通过mRNA翻译,最终产物为酶或蛋白质。所谓基因遗传型(Genotype)是指基因或染色体组成特点,而基因表型(Phenotype),是指基因产物(蛋白质或酶)状态或生物大体表现(如性别,肤色等)


图13-2 DNA 的变性与复性

图13-3 内含子和外显子
2.基因表达的调控:
基因表达是十分复杂的过程,虽尚未完全阐明,但进展很大。最初基因调控是在原核细胞体系中发现的,如有名的Jacob-Mond 乳糖操纵子模型(请参阅细胞生物学);在此基础上,近年真核细胞基因调控也取得了可观的成就。


