首页 » 解码生命 » 解码生命全文在线阅读

《解码生命》第5章 科学的天堂,官僚的地狱

关灯直达底部

通常使用恰当的酶把这个大分子打碎,然后这些小的碎片被相互分离并测序。得到足够的结果后,这些结果被一个程序安装在一起形成一个完整的序列。这个过程必然是相当缓慢并且冗长乏味的,常常陷入持续的领悟和筛分中,而且这种方法也很难用于大DNA分子……看起来想要测序遗传物质我们需要一个合适的新方法。

——弗雷德里克·桑格(Frederick Sanger),

诺贝尔获奖讲演,1980年12月8日

我发现自己走进黑暗走廊的一间无窗的房子里,这间房子位于我曾提到的36号楼的二层,它将是我在国家神经紊乱和中风研究所(NINDS)的新项目的研究室。这座建筑是马里兰州贝塞斯达(Bethesda)的国家健康研究所的一群无计划地占用山林农田建造的复杂建筑之一。为了建设和装备这个实验室,我花了几十万美元,为了启动我在分子生物领域的新研究事业,现在我有一笔100多万美元的年度预算。把我在布法罗的研究小组的大多数成员带来后,我就可以很快开始研究了。

在国家卫生研究大院里,有数百名全国顶级的研究人员在我们的周围一起工作,我们可以和他们相互合作。在我们楼下是马歇尔·尼伦伯格(Marshall Nirenberg)的实验室,他因为破译了遗传密码,揭示了怎样由一个基因中的DNA的三个“字母”编码一个氨基酸过程,氨基酸是构成蛋白质的单位,从而与人分享了诺贝尔奖。他和他的NIH的精英们可以教我们新的东西,有助于激发我们的新奇想法。我在贝塞斯达学会的技巧和产生的兴趣在我以后的生命中起了意义深远的影响,也给我日后产生解读基因组的兴趣奠定了基础。这里真是研究者的天堂。

但我深知享受愉快必须付出的代价。正如每一次漂亮的周末航行总是伴随着充满狂风和惊涛骇浪的海上的累人的旅程。在NIH享受顶级科学工作的同时我也受到了它的影响,我不得不和一些行动迟缓的政府官僚机构打交道。我是以最高的民用服务等级——15级10等进入NIH的。问题是分配给我的实验室的人力资源明显没有按这个等级委派。最典型的是:当某位政府机构忠实官员遇到一些麻烦时,他采取了一个小小的抵制方案:把我的文件夹扔到抽屉的最底层并把它忘诸脑后。我不得不打电话询问我的薪水并确认一些必要的事宜,因为他们找不到我的文件而发生一些不愉快的事情。幸亏罗斯威尔·帕克还一直将我作为相关基金的研究员发放工资,否则,我可能会几个月没有工资。当最终对质此事时,这个人力主管承认是因为害怕搞乱程序而决定什么也不干的。

这并不是唯一的摩擦起因。本来承诺有一个固定职位给克莱尔的,同时也给几个关键的人员诸如多琳·洛宾逊(Doreen Robinson)和马丁·史瑞夫(Martin Shreeve)安排职位以便他们可以跟我从布法罗转入NIH。但是在我到NIH不久,我被叫到学术主任欧文·柯宾(Irven Kopin)的办公室,被告知克莱尔一定会得到固定职位,但是必须在一年或更久以后,因为他们觉得她的科学资历低于他们的标准。

寻找一套新房子被证明同样比我们预期的要难,因为在华盛顿附近,生活消费水平相对较高。一套比我们在布法罗的又小又旧的房子要几十万美元,而布法罗的是8万美元。我们的不动产代理芭芭拉·罗德贝尔(Barbara Rodbell)是马蒂·罗德贝尔(Marty Rodbell)的妻子,正是他联系我们来NIH的。芭芭拉刚开始卖房子,而我们是她的第一个(也是唯一一个)客户。

我们在马里兰的西尔弗斯普林(Silver Spring)买了一套住所,这也是我们唯一可以支付得起的,它是一座价值10.8万美元的有两个卧室的市内别墅。我们和恺撒——我们的一条6个月的荷兰卷尾狮毛小狗,它的名字源于它在我们的生存空间中的绝对支配地位——算是有可安身之所。我也为我的8.5米长的凯普岛瑞游艇(一次几乎导致我们的经济出现问题的放纵产物)找到一个泊位,位于马里兰盖尔斯威尔(Galesville)的哈特格斯(Hartges)游艇园。西河在这里通行无阻地注入切萨皮克海湾,形成了几千海里的海岸线和巨大的停泊地点。当地经济支柱是烟草和捕蟹,这使得这个地方有浓浓的怀旧情结,特别是那些有烧木头的壁炉和跳棋格子的桌子的杂货铺更加重了这种风格。

一个周末,我计划到海湾航行探险,探险是我的职业和个人热情的交汇点。在前往盖尔斯维尔的路上,沉醉于飞车的我始终敏锐地盯着后视镜看有没有无标志的警车,我自然会注意到任何的不寻常的事情,比如坐在一辆褐色福特车前排的两个可疑的人。不管我变换车道还是选择复杂的路线前往盖尔斯维尔,这辆特殊的福特车始终跟在我的后面。一到达哈特格斯我很快就忘了这条神秘的尾巴。但一天的航行后,在我回西尔弗斯普林的路上它又出现了。我开始担忧那辆福特车,疑惑是否我的反战抗议的日子回来困扰我了,因为现在我已是一名政府高级雇员了。如果我知道那辆车中的人会对我日后的研究方向产生重大影响的话,我就不会这样多疑了。

下周一早上,当我发现有两名穿黑套装打领带的男子在我的狭窄的NIH办公室等我时,我的担心看起来似乎是发生了。当我走进来时,他们站起来并出示了身份证,他们是美国国防部的。他们解释说,他们来此是想要跟我谈谈用我的研究探索神经毒气以及相关生物战争试剂。这个要求是有道理的,因为我正在研究的受体蛋白正是神经毒素的作用对象。尽管这个话题很严峻,但是听到他们感兴趣的是我的研究内容而不是我个人,我还是松了一口气,请他们坐下说话。

他们要我从事的研究的基本思想很简单:是否可以开发神经毒剂附着的在体内引起伤害的相同的蛋白质来检测神经毒剂的存在?这些蛋白质是否可以当作诱饵来吸收空气中相当微小的神经毒剂,并借助精细化学分析通过微弱的光信号的闪烁来警告其周围的人员,已受到毒剂攻击?

虽然我当时正在研究的特别肾上腺素受体不能得到作此用途的足够剂量,但是信使化学物质乙酰胆碱作用的烟酸乙酰胆碱受体可以得到足够的量,我认为,我们可以将这种物质作为替代品。可以说,这正是他们所愿意听到的。乙酰胆碱传递神经信号给各种各样的肌肉,包括控制呼吸的膈肌。神经性毒剂如塔崩(Tabun, GA),梭曼(Soman, GD),和沙林(Sarin, GB)阻碍一种称为乙酰胆碱酯酶的关键酶的活性,这种酶分解和排除乙酰胆碱。化学毒剂在几分钟就起作用了,通过加重人体对神经刺激的传递,从而导致神经系统的短路,最终使膈肌瘫痪让人窒息。

因为乙酰胆碱还对大脑的数个位点也起作用,所以非军事科学家们也对该受体感兴趣。尼古丁引发位于神经末梢的那些受体位点,增加脑中多巴胺的消耗,多巴胺是另外一种信号分子,它反过来在神经科学家们所谓的“犒赏通道”上发挥作用,从而导致吸烟者的渴望感受。

乙酰胆碱受体已被约翰·林德斯特姆(John Lindstrom)成功地提纯,他当时在圣迭戈的索尔克研究所(Salk Institute)。约翰很高兴以相当高的价格为我提供这种蛋白质,有一点我认为是合理的,如果让我们努力去分离它将会是相当艰辛的。这样,他就会得到国防部的钱去进行他的基础研究,而我也可以解决怎样帮助政府检测神经毒剂。

但是政府的官僚脑袋并不是一个统一协调的实体。NIH的官僚作风使得我从国防部拿钱难度加大了很多。科学家们不会把政府的钱转入NIH,他们通常直接在工作中把钱花掉。尽管有人说我太商人作派了并且我的确不需要额外的钱,最后一个25万美元的机构间转账还是以我的名义被安排储存在NIH的一个特殊账户里。

一旦我的实验室成立,我们就随时可以从人脑中分离或克隆肾上腺素受体基因,这将为我们提供其分子结构和其神秘的工作方式的新线索。在这个意义上,克隆意味着基因的复制,通常是把它放在实验室里置入大肠埃希氏杆菌中,随着细菌的繁殖,我们想研究的基因复制也完成了。事实上,克隆一个基因也意味着在细胞或染色体中找到它以便我们能揭露基因用来制造蛋白质的DNA处方——既然这样,对肾上腺素有反应的大脑中的受体蜂拥而至。为了达到这一目的,我们必须隔离受体蛋白质,计算出它的氨基酸序列,然后推论出能够拼出这些序列的可能的DNA编码。

这个描述使过程听起来简单容易。实际上,要花10年的辛苦。相同的工作现在只需花少部分时间,甚至几天的工夫,这里面也有我的一部分努力。不过让我们回到20世纪80年代,那时分离和研究人体内微量的蛋白质是很艰难的。

为了使微量的受体蛋白质达到我们能开始基因捕获的数量,我想利用最近开发的叫高性能液体色谱(HPLC)的新技术。用这种方法,人类细胞膜的成分在清洁剂中被溶解成脂肪和油脂,然后使它们穿过柱状物质把它们分开。每个蛋白质的前进速度取决于它的大小或负荷,所以越小越敏捷的分子穿越得越快。

采用这一新方法,我需要有经验的人。我雇用了安东尼·克拉维奇(Anthony Kerlavage),他已经在加利福尼亚大学圣迭戈分校和苏珊·泰勒(Susan Taylor)一起做过高性能液体色谱蛋白质的提纯工作。发展分子生物技术的力量就必须研究蛋白质,为此我建立了一支青年小组,由北卡罗来纳州的一个博士后钟富荣(Fu-Zon Chung音译)和两个从布法罗来的实验室技术员珍妮·高科因(Jeannine Gocayne)和迈克·菲茨杰拉德(Michael FitzGerald)组成。

当我的小组全力制造纯化受体时,我们最后发表了30篇有关受体结构和功能的不同方面的科学论文。当受体的设计被解构出来时,更重要的发现之一是,大自然是多么节俭,一次一次地使用相同的结构,几乎没什么变化。我们对于蝇蕈碱乙酰胆碱受体(乙酰胆碱受体的亚型)和α肾上腺素受体(一类肾上腺素受体)结构的分析显示它们的基本结构是类似的,尽管它们被认为是人体内不同的神经递质。这对科学界来说是令人惊奇的,科学界普遍认为,不同受体属于不同的研究领域。结果,很多人拒绝接受我们的发现直到几年后受体基因被排序出来,发现它们是极为相似的。

两年内,虽然我们的士气正遭受挫败,但我们的努力却取得了重大进步,我们的目标就在眼前,我们正从少量提纯的受体上获得第一个氨基酸序列。我们被杜克大学(Duke University)的罗伯特·莱夫科维茨(Robert Lefkowitz)团队打败了,他们与梅克(Merck)制药公司合作提纯和克隆来自火鸡的红细胞的肾上腺素受体。他们的成功使这个领域的每个人都很兴奋,包括我。我召集我那失望的小组成员在一起,提醒他们这是我们研究领域的早期结果,大多数发现还有待我们挖掘。我们应该逐渐赶上他们并且充分利用莱夫科维茨的克隆人脑中的稀有肾上腺素受体这一突破性发现。

为了取得进展,我们充分利用基因密码中的互补碱基对——双螺旋的2条单链——的连接方式。在他们那次极具洞察力的1953年的重大突破中,沃森和克里克已经通过碱基对配对的方式计算出一条DNA链是怎样轻松地被复制成一个互补链的。这反过来反映了当细胞分离时,它们是怎样复制染色体中的DNA的。在基因字母表中的4个碱基中,他们发现A总是与T对应,C总是与G对应。把双螺旋分成2条单链,这个简单的规则帮助生成一个互补链。同样地,如果你重组一串单独的碱基对,那个相同的规则就确保它会粘到一个互补链上——实际上,这就给你一个DNA探针,它与人类染色体的巨大环境中的一个单独基因相附着。

我们以两种方式充分利用这个互补的碱基对继续探索人类肾上腺素受体的基因密码。首先,我们能利用已取得的小部分的人类受体蛋白质序列推断相应的DNA序列,并且用它作为一个探针搜索人类基因组中的基因。接着,我们利用进化遗产:火鸡肾上腺素受体基因很可能有一个类似的人类受体的基因密码。换句话说,我们从火鸡受体基因本身开发DNA探针:如果它们黏结在互补的人类DNA,它们就会显示相等的人类基因。通过把一个放射性标记贴到任何一种探针上,我们能通过确定探针附着处的放射性斑点来评估我们的成功。

但是,仍然有一个实际问题有待克服。我们首先需要得到适合操作这些试验的人类基因组:甚至就像它在细胞里一样以染色体的形式打包起来,这个编码还因太大无法操作。把人类基因密码分裂成易处理的碎片对搜寻基因来说是至关重要的。如果你把人类细胞中所有的DNA补充物拿走,把它分裂成碎片,你最终就会得到科学家们称之为文库的东西。有两个基本类型的DNA文库:基因组文库和互补DNA文库。

基因组DNA文库可以通过特殊的限制酶制造出来,利用这种酶把人类染色体切割成片段,每一片段大约由1.5万~2万个DNA碱基对组成。为了能处理这些人类DNA片段,我们也需要一个复制和储存的方法,就像一本书需要印刷和装订一样。在复制过程中,将人类DNA的每个片段都附着在一个噬菌体DNA上,噬菌体可以感染细菌,并且能够在其中繁殖。当这个经过处理携带的病毒被用来感染埃希氏大肠杆菌时,它携带着人类DNA。在皮氏培养皿表面涂上受过以上感染的埃希氏大肠杆菌,在细菌菌落上就会生长出清晰的斑点,病毒已经把埃希大肠杆菌杀死。这些斑点被称为空斑,它们包含数百万的病毒微粒——因此包含数百万最初人类DNA片段的复制品。

互补DNA文库以细胞中的另一遗传物质信使RNA为材料,它被用来执行基因组的命令合成蛋白质。我们的基因密码只有3%负责编码蛋白质,所以集中RNA合成蛋白质,我们最终得到一份更简明的人类DNA密码的“工作副本”(一个典型的基因能包含100万个碱基对;相反,转录的RNA可能只有1000个碱基)。换句话说,这个文库揭示了一个方法:大自然的复制者把整个基因密码转录成一段相当小的信使RNA,它仅代表特定细胞或组织需要的基因遗传信息。

信使RNA本质上是中转站。为了将它从细胞中分离出来,以便于直接解读,我们通过一种叫反转录酶的酶,将RNA复制成DNA的稳定形式。它被称为互补DNA(cDNA)。通过分离人类RNA产生cDNA,你将得到人类基因组的浓缩版本,其中包含易读形式的蛋白质编码基因。就像基因组文库,互补DNA文库的大小都必须处理成能够处理和复制的形式。大自然再次提供了解决方案。通过隔离在组织中工作的信使RNA,把RNA转变成互补DNA片段,然后把这些片段插到一个质粒中,它是一个小的环状DNA,并为细菌携带指令,互补DNA文库就被制造出来了。当埃希氏大肠杆菌被感染上质粒,它将再次为文库里的书提供“印刷机”。因为每一个细菌将包含人类cDNA的不同片段,当细菌复制时(分裂成子代细胞),亲代和子代细胞将包含相同的人类基因片段。

尽管肉眼看不见这些DNA片段,但是用科学工具可以观察它们。稀疏地展开包含人类cDNA的埃希氏大肠杆菌,注意让两个细胞绝不会互相接触,单个的群体将开始生长。最终,当有斑点出现时,每个群体将包含数百万的相同细菌细胞(克隆体),所有这些群体都具有相同的人类cDNA片段。在一个小皮氏培养皿中,可能有几万到几十万这样的单个群体,从而得到一个人类DNA的巨大文库。

使用任意类型的文库,利用互补DNA粘贴在一起的方法,搜寻受体的工作现在可以开始了。用一张滤纸就可能把DNA从皮氏培养皿中移出来,培养皿中正在用基因组文库或cDNA文库培养埃希氏大肠杆菌。然后将滤纸整夜浸入探测受体的DNA探针溶液中。为确定它是否被束缚在文库中的互补DNA上,探针被附加了放射性标记——通过与一个放射性核素32P交换DNA中的磷原子。然后清洗滤纸以便去掉没有附着任何DNA片段的放射性探针,然后晾干,放到一个X射线胶卷盒里好几天。阳性菌落和噬菌斑——表示放射性探针已经粘在目标DNA上——在显影的X线上呈现黑色斑点。将皮氏培养皿与胶卷重叠,阳性菌落和噬菌斑就能被识别,它们的DNA被分离和扩增。

并不总是很容易发现不稳定的编码少量蛋白质的信使RNA。以一个难以捉摸的膜蛋白质为例,比如肾上腺素受体,在每个细胞中只有几千个蛋白质分子。结果,编码受体蛋白质的RNA信息也是稀少的。利用捐献给医学科学的人脑中的基因物质,我们必须检测超过100万的cDNA菌落,才能找到一个包含制造肾上腺素受体信息的cDNA菌落。一旦我们培养一个菌落产生一批足量的这种DNA,我们就能用测序DNA的过程把它解读出来——算出4个核苷酸(CGAT)的顺序,它们形成了糖和磷酸盐的DNA外部骨架中的“横档”。我们可以用两种基本测序方法来读出DNA中这些碱基对的顺序。一种方法是弗雷德里克·桑格在剑桥的英国医学研究委员会分子生物学实验室(Medical Research Council's Laboratory of Molecular Biology)里发展出来的,他是一个专注的研究者(同样也爱好划船),他曾经说自己是“有良好的思想,却不太擅长讲话”。第二种方法是哈佛的沃利·吉尔伯特(Wally Gilbert)的工作,他被描述为一个“政治掮客,一个有宏伟目标的男人”[1]。虽然桑格和吉尔伯特在1980年共同分享了诺贝尔奖,但是过去10年间完成的大多数序列是桑格设计的方法的一个直接扩展。桑格是一个有着惊人才能的科学家,他能解决生物界一些高难问题。1975年5月桑格因为他的首批DNA部分序列而得到大家的敬重,然后继续得出一个噬菌体基因组的首批完整序列:细菌病毒(噬菌体)的基因密码中有5375个碱基对,被称为φ-X174。接着桑格测序了大约17000个人类线粒体(我们的细胞中的能量工厂)中的DNA碱基对,标志着首批人类基因组工程的开始。考虑到他有这么多的显著纪录,桑格是双诺贝尔奖获得者就不足为奇了(第一次诺贝尔奖,是由于1958年他对于蛋白质结构的工作,当时他拆开了大约50个组成胰岛素分子的氨基酸),尽管他的学术影响巨大,得到同行的敬重,但是桑格是一个安静的、谦虚的、不招摇的人。他说:“我没有多少学术才气。”

桑格在剑桥和阿兰·考尔松(Alan Coulson)一起开创的DNA解读方法涉及到用DNA聚合酶制造无数的DNA分子复制体。复制DNA聚合酶必须放在DNA的基本片段液中,即核苷酸中。酶从每一个源DNA链的末端阅读,用核苷酸制造新的复制体。桑格的贡献是把另一成分“末端核苷酸”加到这个溶液中,“末端核苷酸”的每个核苷酸用32P做放射性标记,这样命名末端核苷酸是因为,当它们在培养的复制体中合并时,它们会随着末端聚合酶的活动,用放射性周期标记培养链的结束。这一过程在任何阶段都可能发生,大量DNA分子复制体是在试管中制造的。结果是DNA不同长度的片段的混合物,每片段都是以放射性标记的C, G,A或T上结束,依赖于哪一个碱基标记32P。

这些片段然后在电场作用下,通过平板凝胶,按DNA分子的大小被分离开。现在人们能读出它们的序列是因为DNA的最大片段在平板凝胶中移动速度慢。四个核苷酸上C, G,A, T的标记是相同的,都能在X线胶卷上产生相同的黑色标记,人们必须对每个片段进行四次检验,每次检验出对应密码中的一个碱基。一旦DNA聚合酶和每一个不同的终止核苷一起被识别(以便在一批中,所有的C都被标记,另外所有的G都被标记,其他两个也一样),它们就被分放在相同的凝胶平板体的4个邻近的泳道上。当片段分离后,一个泳道显示DNA片段以一个C结束,另一个就显示以一个G结束,其他两个也一样。