代谢路径和调控网络 作为对基因组"部件系列表"发展和日见成效的的蛋白质组学分析方法的补充,NHGRI将鼓励新技术的发展用以形成对于遗传调节网络和蛋白质相互影响途经的综合观点。
基因对健康、疾病和药物反应的影响 NHGRI将优先支持创造和使用新的横向基因组学工具、技术和战略来进行医学相关表型的遗传基础的鉴定。研究少见和常见的疾病、药物反应的基因影响将牵涉到主要是其他NIH研究团体和其他基金会感兴趣的生物系统和疾病。相应的,NHGRI希望它在这一领域的研究会通常通过合作和协作来实施。NHGRI特别对建立鉴定疾病抗性和表现为"良好的健康状况"的基因变异的研究方法感兴趣。
分子探针,包括小分子和RNA干扰,用来研究基础生物学和疾病病理 探索将化学基因组扩展到研究所和公众领域的可能性,特别是建立一个或多个集中的设施的可能性,这将通过NHGRI与其他机构的合作来实现。
数据库 另一个生物学和生物医学研究团体中的公共资源就是数据库(Box3)。但是数据库的支持表现了一个潜在的重要问题。提供资金的机构反映了研究团体的利益,更希望将研究基金用于产生新的数据,而对数据文档保存和稳定访问不断增长的支持的持续需求却经常被忽略。科研机构和基金会都必须认识到,在研究基金中对有效数据库的创造和维护的投资与对生成新数据的投资同等重要。NHGRI一直是几个主要遗传学/基因组学数据库的主要支持者,包括小鼠基因组数据库(www.informatics.jax.org/mgihome/MGD/aboutMGD.shtml)、酵母基因组数据库(genome- www.stanford.edu/Saccharomyces)、果蝇基因组数据库(flybase.bio.indiana.edu)、线虫基因组数据库(www.wormbase.org)和人类孟德尔遗传在线(Online Mendelian Inheritance in Man) (www.ncbi.nlm.nih.gov/omim)。NHGRI还将继续领导探索整合、显示基因组信息数据的有效方法和提供基因组学信息数据访问的解决途径。
伦理、法律和社会研究 NHGRI的ELSI研究活动将集中在基础的、广泛相关的社会问题上。这些社会领域的研究人员和学者,以及研究的问题的范围都需要再扩大。ELSI研究团体必须包括那些会更大程度地受到遗传信息的应用与误用的影响的少数民族或其他群体。还需要开发新的机制来提高ELSI研究者和基因组学和临床研究人员的对话及协作;这种例子可能包括各学科间研究的回报,强化短期课程培训或小奖学金用于交叉训练,还可以建立ELSI优秀研究成果的中心来方便各学科间的持续协作。
纵向人口群体 这是一个有前途的、可被广泛应用的研究课题。对这一课题的研究需要大量的资金,虽然NHGRI可以在设计和管理方面起协助的角色,但仍需要有其他的资金来源的参与和支持才能确保这一研究的成功。
健康和疾病中的非遗传因素 确定遗传因素在人类健康和疾病的作用促进了对环境及其他非遗传因素的认识和定义。这是NHGRI通过发展新战略和建立合作伙伴来涉及的另一个领域。
运用基因组学信息改善卫生保健 促进多种学科间的合作,在改善保健方面为患者和保健人员提供有效地运用个人化的基因组学信息的最佳方式。NHGRI还将努力确保这项领域的研究受基因组学的社会应用的指导并且拓展基因组学的社会学知识。
改善所有人的健康状况 支持探索如何确保基因组学相关信息用以缩小全球卫生健康状况的差距对NHGRI是非常重要的。这将包括提供一个强有力的支持来增加在基因组学研究者中的少数民族代表。但是对全球卫生健康状况差异的全部解决方案只能是通过政府、医疗系统和社会尽心的持续不断的努力来实现。
政策发展 NHGRI将继续帮助推动公共政策在遗传/基因组科学方面的发展。要有效地推动政策发展,需要关注那些会与政策议程产生最大影响以及可以推动基因组科学的问题。NHGRI还将关注那些可以帮助公众从基因组学获益的问题,如遗传信息的隐私、遗传服务获取、消费者-供应商直销、遗传信息的专利和特许经营、对被试者的适当对待,以及遗传试验的标准、用途和质量。
数据的公布
HGP的一个重要经验是从大型测序计划的快速数据公布中所带来的好处,正如Bermuda原则所体现的(www.gene.uc l.ac.uk/hugo/bermuda.htm)。为了科研团体的利益,其他的大型数据生成计划(如全长cDNA和单核苷酸多态性)也步其后尘。对大型数据库尽早的、开放的、持续的访问和保证优秀的科学家被吸引来生产出更多的类似资源可使科学进步和公共收益最大程度地提高。为使这一体系持续发展,公共资源数据提供者的职责是使他们的成果能够迅速被科学家们无偿及无约束地使用,而资源使用者的责任是认识到致力于数据产生的科学家们的重要性,并给予尊重。
虽然这些原则在基因组DNA测序时已被实现,但是许多其他类型的公共资源计划还没有(如,生物结构或基因表达数据)。发展有效的系统来实现不受限制的迅速公布数据和提供对材料和研究工具的连续、普遍的通道应该是计划和发展新公共资源的不可缺的组成部分。科学家们还应该鼓励在单独发表成果前自愿公布这种数据,适当奖励和保障那些愿意与公众共享数据的科学家的利益。
量子飞跃(Quantum leaps)
技术革新可以增强研究和临床应用,直至改写全部生物医学方法,推测潜在的技术革新是一件非常有趣的事。聚合酶链式反应(PCR)、大片段插入克隆系统、低成本、高通量DNA测序等方法的出现就是这种跃进的例子。
在NHGRI计划讨论过程中,出现了其他类似?quot;技术飞跃"的想法,虽然听起来不切实际,但是如果一旦实现,将为生物医学研究和临床实践带来革命性的变化。
下列例子虽不详尽,但是可以激发创造性的梦想:
o 能够以极低成本检测基因型,用约400,000个遗传标记物筛选2,000个人,只需10,000美元或更低;
o 能够降低DNA测序成本四到五个数量级,只用1,000美元或更少的费用完成一个人的基因组测序;
o 能够以每个碱基0.01美元成本精确合成长DNA分子,使合成任意顺序基因大小的DNA只需10到10,000美元;
o 能够测定单细胞中的所有DNA的甲基化状况;
o 能够通过一次试验监视一个单细胞中的所有蛋白质的状态。
3.总结
对基因组学研究的未来作一个预期总是几乎令人叹而观止的,但同时也是令人兴奋的。成百的专家们自愿提供最大胆的、最好的主意,走出他们自身利益的领域,投入关于机会和优先顺序的激烈的讨论,使成果更加丰富和大胆,这是在计划刚一开始时并没有估计到的。这篇文章能够抓住基因组学新学科令人兴奋的感觉应该归功于他们。这一计划参与者的完整名单可见www.genome. gov/About/Vision/Acknowledgements.
最后值得我们提一下本展望的广泛程度。我们必需选择是描述一个基因组学研究的广阔未来,还是更加关注于NHGRI的特殊角色。鉴于研究人员和公众对一个领域的希望比对资金的来源更感兴趣,我们在这里集中讲述了科学机遇的广泛前景。但是在这篇文章里,我们也发现了特别适合NHGRI领导的领域。这些领域是普通研究领域,并非专门针对某一个疾病或者器官,但是具有更广泛的生物医学和/或社会应用价值。但是即使在那种情况下,"合作"这个词还是有意地多次出现了。我们期待不仅与其他公共资金机构成为合作伙伴,如26个NIH研究所和中心,而且与其他政府机构、私人基金会以及私营企业合作。事实上,公共-私营合作伙伴关系,如SNP协会(the SNP Consortium),小鼠测序协会(the Mouse Sequencing Consortium)和国际HapMap计划,提供了有力的新模式来产生迅速的、具有广泛应用价值的公共数据体系。所以,许多基因组学研究的最令人兴奋的机会跨越了特定疾病定义的传统界限、传统定义的科学学科、资金来源和公共与私营的企业。当这种传统的界限变少的时候,一个繁荣的新纪元将出现。
虽然这里提到的机会都是高度可实现的,一个特定计划的正式开始还需要许多更详细的分析。在有限的资源里,相对优先的部分要先考虑到。NHGRI计划在今年下半年发布一个修正的项目公告和其他核准的基金,用以对此计划外的研究人员为实现这一宏伟展望提供更详细的指导。另外,在基因组学研究中,我们学会了期望那些未预期的结果。在以前的经验中,如果生物学、医学和社会环境不发生意想不到的变化可能会十分令人惊讶(可能更加失望)。这一事实要求我们定期回顾这个前景。
总的来说,HGP所有最初目标在这个月的成功完成使我们可以大胆地开始基因组学研究的新阶段,去探测现在展示在我们面前的巨大机会。像莎士比亚一样,我们可以说:"过去的都是序言"(The Tempest, Act II, Scene 1)。如果我们象大胆的建筑师一样,在HGP(图2)坚实的基础上可以设计和建造这个空前的、高贵的结构,那么进行基因组学研究、造福全人类的口号就可以实现了。
"不做小计划;小计划不会激起人们的热血,而且很可能无法实现。制定大计划;瞄准高高的希望并为之工作,牢记一个珍贵的、合理的图画一旦记录下来就不会灭亡,而在我们死后很久依旧存在,用不断加强的坚持来显示自我的存在"(摘自Daniel Burnham,architect)。
附:与基因组研究三大主题相关的六个方面(见图2)
BOX1 资源
人类基因组计划(HGP)的关键和独特的目标之一就是产生大量可共享的、全套试剂和数据(科学资源或"基础设施"),和其他新的、强有力的技术一起,共同组成基于基因组的研究的工具包。基因组图谱和序列就是最明显的例子。其他则包括序列差异数据库、克隆文库和匿名细胞家族的收集。这种资源的不断产生非常重要,具体来说:
o 代表性的哺乳动物、脊椎动物、脊索和无脊椎动物的全基因组序列
o 代表性物种的不同形式的全套编码序列,如全长cDNA序列和相应的克隆,单核苷酸引物,及基因芯片
o 某几种入选动物的所有基因的基因敲除(knockout)和基因沉默(knock-downs)的收集,以加速疾病模型的发展
o 代表性物种的不同形式的全套蛋白质,如在表达载体中、带有亲和标签和点阵在蛋白芯片上
o 全套蛋白亲合试剂
o 把序列与附加信息及其他大型数据整合了的数据库,以及能够有效发掘数据的工具
o 用来发现对健康影响的遗传因子以及检测个体基因差异对患病风险影响的研究所需要的一批人群,包括"健康"群体
o 大型的小分子文库,以及自动化的筛选方式和随后的药物化学手段,可为研究者提供容易和可负担的工具
BOX2 技术发展
人类基因组计划得益于几个"突破性"技术的发展,包括Sanger DNA测序技术及其自动化、基于DNA的遗传标记物、大片段插入克隆系统和聚合酶链式反应(PCR)。在人类基因组计划中,这些技术被大规模使用并且通过"革命化"的技术革新(如自动化和小型化) 而更为有效。新的技术,包括毛细管测序和最近引入的测定单核苷酸多态性的方法,导致基因组分析能力的进一步提高。甚至更新的方法,如纳米技术和微射流技术,正在被开发并且大有希望,但是还需要进一步的技术进步。如:
o 测序和基因型分型技术,以进一步降低成本,并可以被范围更广的研究者使用
o 鉴定和确认不编码蛋白的功能成分
o 活体内实时监控基因表达和在所有相关的细胞类型中基因产物的定位、特征、修饰和活性/动力学
o 调节所有基因产物的表达,使用大规模突变,小分子抑制剂,基因沉默(如RNA介导的抑制)等手段
o 在任何细胞内监控所有蛋白的绝对量(包括膜蛋白、低丰度蛋白和所有的修饰形式)
o 提高成像技术,可以非介入性地观察分子基因型
o 利用单体型信息或全面变异信息建立遗传变异与人类健康和疾病的联系
o 以实验室为基础的基因型分型,包括应用蛋白亲和试剂、蛋白质组手段和基因表达分析
o 建立分子构象和生物学的联系,特别是疾病的路径生物学
BOX3 计算生物学
计算方法已成为现代生物学研究的本质,它们的重要性只能在大规模数据产生更为显著,数据量和复杂性不断增长,要回答的问题更为复杂时才能获得进一步提高。所有未来的生物医学研究都将融合计算和试验。新的计算能力将促进假设的产生,并激励实验方法的发展来验证这些假设。试验产生的数据回过头来又将用来产生新的精致的模式来提高我们的全面理解并增强它在疾病中的应用的机会。对基因组学研究的未来极为重要的计算生物学领域包括:
o 新的解决问题的方法,如DNA序列中不同特性的鉴定,分析基因表达和调节,阐明蛋白结构和蛋白间相互影响,决定基因型和表型间的关系,鉴定人口的遗传变异模式和产生这些模式的过程
o 可重复使用的软件模块以推动协同性
o 阐明环境(非遗传)因素和基因-环境相互作用在健康和疾病方面的影响的方法
o 新的论述来描述不同的数据类型
o 强化的数据库技术以促进不同数据类型的整合和描述,如有关路径、蛋白结构、基因变异、化学抑制和临床信息/表型的信息
o 强化的知识管理系统和数据系统标准化,便于知识在学科间的联合
BOX4 培训
应对基因组学面临的科学、医学和社会/伦理的挑战需要科学家、临床医生和学者具备了解生物学系统和有效地应用这些信息造福于人类的技能。需要适当的培训满足如下的需求:
o 计算技能 由于生物医学研究正涉及到越来越多的数据,计算能力正在迅速成为一门必须的技能。
o 跨学科的技能 虽然有了一个良好的开端,还需在以下各学科间拓展联系:科学之间(生物学、计算科学、物理学、数学、统计学、化学和工程学),基础和临床科学之间,生命科学之间,社会科学和人文学科之间。这些联系需要在个体水平(科学家、临床医生和学者需要能将各学科相关问题、顾虑和能力从不同的学科带到各自的研究领域中),合作水平(研究人员需要能够有效地参与将生物学和其他学科联系在一起的各学科间的协作研究),和学科水平(新的学科需要在各传统学科的界面之间出现)上进行。
o 不同的看法 作为研究人员和参与者,少数民族和弱势人群在基因组学研究中都没有得到充分代表。这个可叹的状况使这个领域缺乏来自各个背景的最好最聪明的人,使问题的视角变得狭小,减弱了执行研究草案的文化敏感性,损害了研究的整体有


