让我们考虑一下子代的繁殖, 这是生命特征之一. 无论生命形式复杂或简单, 从细菌到多细胞生物, 所有的生物体都在基因中包含了他们自己全部的信息. DNA分子表达了遗传信息. 正如计算机采用0和1的二进制作为存储单位, DNA采用A, T, G, C的四进制. 神奇之处在于几乎地球上所有的生物体都将DNA作为遗传载体, 其余的采用改性DNA. 这也就是所我们和植物和病毒在本质上并没有显著差异.
DNA分子是一种线形大分子, 由脱氧核糖与作为信息的四种碱基(腺嘌呤, 鸟嘌呤, 胸腺嘧啶, 胞嘧啶)联结. 每个含有碳水化合物和碱基的单位与磷酸基相连. 计算机存储器可有二维或三维结构, 但是物种的遗传信息仅选择了一维结构. 通过 A-T, G-C配对, DNA以双链形式存在. 绝大多数情况下一条链即可储存遗传信息, 另一条链仅是作为互补链用来对遗传信息进行维护和修补. 下一个问题就是遗传信息如何传递. 自Watson和Crick第一次报道DNA结构以来, 尽管我们不完全了解每个细节, 但是关于遗传信息用于指导蛋白质的合成已成定论. 换句话说, 生物系统内合成的蛋白质的种类和数量决定了生物体的所有特性, 从我们皮肤的颜色到甚至无意中流露的习惯.
DNA

<SGI, U.S. Department of Energy Human Genome Program>
蛋白质包含20种氨基酸, 能够催化多种生化反应的酶和细胞骨架都是蛋白. 我们的体内可以合成诸如碳水化合物和酯等非蛋白物质, 但那只是酶催化作用的次级产物. 蛋白质基本上是氨基酸一维联结构成的线形大分子, 当然还可以有一些修饰. 用来合成一个蛋白质的DNA单位称为基因, 包含一个物种所有遗传信息的集合称作基因组. 每个基因的两端都包含有蛋白质首端和尾端合成的遗传信息.
氨基酸
非极性 侧链
极性非质子化 侧链
极性质子化 侧链
身高和肤色等显性基本是不同遗传组合表达的结果. 问题是遗传的蓝图, DNA, 采用四进制而蛋白质采用20进制. 为了解决这个问题大自然采用三个DNA密码表达一个蛋白质. 因为三位的密码可以容纳4´4´4 = 64 条遗传信息, 大大超过容纳20个氨基酸所需要的量因而一些氨基酸可以重复对应. 因此如果可以破解一个物种的全DNA序列, 就可以知道其所有合成的蛋白质并从理论上预言其所有特性. 正因此现今通过测定完整DNA序列来破译人类所有遗传信息的工作很活跃, 这被称作“基因组计划”. 人类DNA序列估计约有30亿碱基对, 也就是300,000基因. 除了红细胞等, 所有细胞细胞核中都含有遗传信息. 由于细胞种类不同, 用于合成蛋白质的基因估计约占所有基因的十分之一. 换句话说, 人类细胞能合成30,000种蛋白质, 蛋白质种类的不同决定了不同细胞的特性, 如神经, 肌肉, 骨细胞等. 由于DNA双链的碱基长度约有3埃, 人类细胞整条DNA长度约有1米.
遗传密码子 
<http://www.discoverbiology.com>
