酵母基因组另一个明显的特征是含有许多DNA重复序列,其中一部分为完全相同的DNA序列,如rDNA与CUP1基因、Ty因子及其衍生的单一LTR序列等[8]。在开放阅读框或者基因的间隔区包含大量的三核苷酸重复,引起了人们的高度重视。因为一部分人类遗传疾病是由三核苷酸重复数目的变化所引起的。还有更多的DNA序列彼此间具有较高的同源性,这些DNA序列被称为遗传丰余(genetic redundancy)[8、10]。酵母多条染色体末端具有长度超过几十个kb的高度同源区,它们是遗传丰余的主要区域,这些区域至今仍然在发生着频繁的DNA重组过程。遗传丰余的另一种形式是单个基因重复,其中以分散类型最为典型,另外还有一种较为少见的类型是成簇分布的基因家族。成簇同源区(cluster homology region,简称CHR)是酵母基因组测序揭示的一些位于多条染色体的同源大片段,各片段含有相互对应的多个同源基因,它们的排列顺序与转录方向十分保守,同时还可能存在小片段的插入或缺失。这些特征表明,成簇同源区是介于染色体大片段重复与完全分化之间的中间产物,因此是研究基因组进化的良好材料,被称为基因重复的化石[5、8]。染色体末端重复、单个基因重复与成簇同源区组成了酵母基因组遗传丰余的大致结构。研究表明,遗传丰余中的一组基因往往具有相同或相似的生理功能,因而它们中单个或少数几个基因的突变并不能表现出可以辨别的表型,这对酵母基因的功能研究是很不利的。所以许多酵母遗传学家认为,弄清遗传丰余的真正本质和功能意义,以及发展与此有关的实验方法,是揭示酵母基因组全部基因功能的主要困难和中心问题。
2.酵母基因组分析
在酵母基因组测序以前,人们已知道在酵母和哺乳动物中有大量基因编码类似的蛋白质[11]。对于一些编码结构蛋白质(如核糖体和细胞骨架中的)在内的同源基因,人们并不感到意外。但某些同源基因却出乎人们意料,如在酵母中发现的两个同源基因RAS1和RAS2与哺乳动物的H-ras原癌基因高度同源。酵母细胞如同时缺乏RAS1和RAS2基因,呈现致死表型。在1985年,首次应用RAS1和RAS2基因双重缺陷的酵母菌株进行了功能保守性检测,结果表明,当哺乳动物的H-ras基因在RAS1和RAS2基因双重缺陷的酵母菌株中表达时,酵母菌株可以恢复生长。因此,酵母的RAS1和RAS2基因不仅与人类的H-ras原癌基因在核苷酸顺序上高度同源,而且在生物学功能方面保守。
随着整个酵母基因组测序计划的完成,人们可以估计有多少酵母基因与哺乳动物基因具有明显的同源性。Botstein等将所有的酵母基因同GenBank数据库中的哺乳动物基因进行比较(不包括EST顺序),发现有将近31%编码蛋白质的酵母基因或者开放阅读框与哺乳动物编码蛋白质的基因有高度的同源性[12]。因为数据库中并未能包含所有编码哺乳动物蛋白质的序列,甚至不能包括任何一个蛋白质家族的所有成员,所以上述结果无疑会被低估。酵母与哺乳动物基因的同源性往往仅限于单个的结构域而非整个蛋白质,这反映了在蛋白质进化过程中功能结构域发生了重排。在酵母5800多个编码蛋白质的基因中,约41%(~2611个)是通过传统遗传学方法发现的,其余都是通过DNA序列测定所发现。约有20%酵母基因编码的蛋白质与其它生物中已知功能的基因产物具有不同程度的同源性(其中约6%表现出很强的同源性,约12%表现出稍弱的同源性),从而能初步推测其生物学功能。酵母基因组中有10%基因(约653个)与其它生物中功能未知的蛋白质的基因具有同源性,被称为孤儿基因对或孤儿基因家族(orphan pairs or family);约25%的基因(~1544个)则与所有已发现的蛋白质的基因没有同源性,属首次发现的新基因,是真正意义上的孤儿基因[5、13]。这些孤儿基因的发现是酵母基因组计划的重要收获,对于其功能的阐明,将大大推进对酵母生命过程的认识,因而引起了众多遗传学家的重视。
为了系统地分析酵母基因组测序发现的3000多个新基因的功能,1996年1月,随着DNA测序工作的结束,欧洲建立了名为EUROFAN(European Functional Analysis Network)的研究网络。这一网络由欧洲14个国家的144个实验室组成,它包括服务共同体(service consortia,A1-A4)、研究共同体(research consortia,B0B9)和特定功能分析部(specific functional analysis nodes,N1-N14)三部分,每个部分下设许多小的分支机构。其中研究共同体中的B0部门负责制作特定的酵母基因缺失突变株。缺失突变株的制作采用新发展起来的PCR介导的基因置换方法进行,即将来自细菌的卡那霉素抗性基因(KanMX)与线状真菌Ashbya gossypil的启动子和终止序列构建成表达单元,它可赋予酵母细胞G418以抗性。然后,根据所要置换的染色体DNA序列设计PCR引物,这些引物的外侧与染色体DNA序列同源,内侧则保证通过PCR可以扩增出KanMX基因,PCR产物直接用于基因置换操作[14]。通过这项技术,可以有目的地将新发现的基因用KanMX置换,造成基因缺失突变,随后通过系统地研究这些酵母缺失突变株表型有无改变(如生活力、生长速度、接合能力等)以确定这些基因的功能[15]。此种方法中有两个方面的问题限制实验进程:其一是大部分的突变子(60%~80%)并不显示明显的突变表型,这往往与前面提到的遗传丰余有关;其二是许多突变子即使发生了表型改变,也不能反映其编码蛋白质的功能,如某些突变子不能在高温或高盐的环境中生长,但这些表型却不能提示任何有关缺失蛋白质在生理功能方面的信息。


