第14章 拉绳子(1/3)
珠海每年总有些时候潮湿得惊人,海风漫着水云,潮一样地淹没整个城市,所有地方都凝着厚厚的水,不仅潮得骇人,偶然还带着海边的腥臭,衣服是没法晾干的——汪海成经常把衣服放在空调下面,开着抽湿档拼命地吹。
60K黑体辐射信息的破译工作偶然之间取得了进展,但一方面进展太突然,另一方面又太莫名其妙——60K黑体辐射为什么会跟小鼠模式动物基因库联系起来?在珠海已经闷湿得透不过气来的天气里,大家更是焦躁得心火上涌。
按初级工程兵赵侃的处理办法,黑体辐射信息被编译成了四进制数据——现在连高中生都知道DNA碱基对有四种:A—腺嘌呤、G—鸟嘌呤、T—胸腺嘧啶、C—胞嘧啶。
所以自然的,四进制数列天然就有类似基因碱基的数据结构。
但拥有类似的数据结构,跟拥有一样的数据之间还有无限的距离:不能说都是1和0,你用两个按键就能写出一套操作系统来。
这是一个巧合吗?一个违反科学常识出现的60K黑体辐射信息,跟一个小鼠模式动物基因数据之间的联系是什么?这巧得也太过离谱了吧?
白泓羽突然想起一本科幻小说《银河系漫游指南》,地球是老鼠创造的超级计算机,为寻找生命、宇宙以及一切的终极答案而制造的设备;老鼠才是地球真正的主人,而人类不过是设备上的寄生虫。
或许这才是真相,白泓羽想到这里,忍不住笑。
这如果是真的,那也太可爱了吧?想到自己当年本科生物实验的时候杀过那么多小鼠,又突然有点后怕。
这个奇妙的巧合让负责保密工作的领导开了足足两个小时的会。
会议之后,组织决定采纳白泓羽的建议,请南京大学模式动物研究所的所长安森青教授前来协助。
他们会怎么去请安教授呢,一堆绝密安保人员一拥而上闯进办公室吗?白泓羽很有些好奇。
她本科在南京大学读的生物和天文双学位,安教授当年曾给她上过两学期课,也不知道还记不记得自己。
安森青教授是内蒙古人,流着草原牧民的血,爱喝酒,脾气很大。
年轻时繁重的野外调查工作常常露宿荒野,说话声如洪钟,但是总不记得人的名字。
就算天天跟你见面,也会开口叫你:“那个这谁……过来一下。
”
想想安老师因这个看起来八竿子打不着的事情,被一群特工从南京往珠海“请”,白泓羽就觉得很欢乐,总浮现起安老师那张圆乎乎、气哼哼的脸。
第二天临近中午的时候,专车把安森青教授送到了学校。
车门滑开,这个一米九几的大个子跳下来,一脸不快。
一见到迎接自己的白泓羽和汪海成,安教授就怒气冲冲地嚷嚷了起来:
“能耐啊你们,这跟绑架一样嘛。
我课还上不上了?会还开不开了?下周亚洲模式动物研讨会我的主题演讲还准不准备了?你们谁啊?”
好在白泓羽早有准备,她本科的同学现在还有几位在安森青教授手下读博,对教授的毛病和喜好一清二楚。
她满脸赔笑地对老师说:“安老师,安老师,别生气。
”眉毛一挑,低声说:“我们给你准备了茅台。
”
安教授最爱喝酒,当年白泓羽毕业的时候就眼睁睁看他一人干掉一瓶高度五粮液。
但随着年纪越大,当领导应酬越多,肝脏也不如从前了。
家里和学校都有人管着,安森青教授虽然嗜酒如命,但是除了过年开恩典,平时真是喝不到,听白泓羽这么一说,脸色一下就好了许多。
“不耽误工作吧?”
“不耽误,不耽误。
安老师,我本科是你学生呢。
不记得了吧?”
“是吗?哦哦哦。
哈哈哈,珠海这边的榕树长得挺好呢,空气真比南京好多了。
”
“就是潮得狠,适合红树林。
”
三人寒暄一番,白泓羽把自己过去的老师和现在的老师相互介绍了一下,才拥着安教授进了办公室,气氛一时和睦。
负责保密培训的工作人员给安教授讲条款的时候他又连翻了几个白眼,不过还是麻利地签了保密协议,一边签一边指着白泓羽朗声道:“那个这谁啊,说好啊,你要是敢拿两三两酒来对付我,可没完!”
保密培训来来回回折腾了大半天,等到那薄薄一叠资料拿给安森青教授的时候已经是下午了。
教授看材料一共花了二十分钟不到,前面关于60K黑体辐射信息的解释他最初不是很明白,草草翻过。
短短两页小鼠基因库他倒是花了些时间,看完了眉头紧锁,又翻过去仔细重读信息源的说明。
几个人都在等他开口解释,安森青教授却往椅子上一仰,闭目半天不说话。
几个人面面相觑,等了快有五分钟,安教授突然睁眼,说道:“我实在搞不懂你们给我看的这个是什么鬼名堂。
”
汪海成刚想说话,安教授抬手打断了他,继续说道:“如果你们只是问我这些碱基数据是怎么回事儿,我给你们解释一下没问题。
但别的事情就不要再麻烦我了。
”
众人一时不知该如何接话。
安教授从椅子上坐直,转过头对白泓羽说:“上本科的时候,学校教你的东西都还记得吧?”
白泓羽点头,“基本都记得。
”
“这些碱基序列全部都是启动子和终止子。
”说了这句,他双手交叠,又沉默不语了。
汪海成听得不明不白,只得看向白泓羽。
白泓羽先是一愣,然后努力地一边从记忆里捞起这两个概念,一边拿起手上的资料来确认这些碱基数据。
安教授知道汪海成没听明白。
现在科学界隔行如隔山,就像自己对“黑体辐射”半懂不懂,只能理解成“地球外的某种无线电信号”一样,汪海成自然也对分子生物学领域的东西一团雾水。
他想了想,整理一下自己的思路,给汪海成解释起来。
跟外行打交道他没有太多经验,要从头讲起也是困难重重。
“DNA你们都知道是什么吧?”
汪海成点了点头,好歹也是二十一世纪的科学工作者,不能连双螺旋的脱氧核糖核酸都不知道,就是遗传物质嘛。
“DNA是双螺旋结构,遗传信息可以看成是记录在DNA的碱基对上。
DNA分子是链条非常非常长的螺旋长链结构,就好像是一张巨大连续的设计蓝图。
跟修建筑一样,设计蓝图是需要一部分一部分进行解释的,钢筋要什么型号,水泥要什么型号,要分成很多很多有独立意义的信息才行。
DNA也一样,需要表达成很多很多不同的蛋白质,每个蛋白质有自己的功能。
”
“明白。
”
“因为DNA的碱基是连续的,就是AGCT长链。
一个DNA分子可能包含了很多个基因,多的甚至能上万,每个基因都只是这个DNA长链中的一段。
那这就有一个很关键的问题:怎么识别一个基因从哪里开始是起点,到哪里是终点?注意,DNA分子翻译成蛋白质的过程并不是从头上第一个碱基开始翻译,一直翻译到尾巴上最后一个碱基。
”
见汪海成有点半懂不懂,白泓羽插嘴解释道:“就好像电脑硬盘。
一个2T容量的硬盘,整个磁片上2T都是有磁信息的。
但硬盘肯定不能是一个2T的文件。
系统会需要标记从哪个位置开始,到哪个位置结束,这些磁信息的01二进制数据是一个文件。
这样就需要东西标记,把一个硬盘的信息分成很多很多个文件,每一段信息就可以翻译成一个蛋白质。
”
“说得对,我以后给本科生上课用!”安森青一拍大腿,“当然实际要复杂得多,很多不同的基因信息彼此都有交叠。
但总的来说,为了实现这个功能,DNA碱基对上有很多特殊的碱基序列,它们标识从某个位置开始可以进行蛋白质的转录翻译,这些特殊序列叫作启动子。
而另外有一些特殊序列标记着转录翻译的终点,这些标记序列叫作终止子。
一个文件头的标记,一个文件尾的标记,合起来就能让转录RNA识别怎么开始,怎么结束。
”
汪海成为自己终于听懂了高兴了大约五秒时间,然后等把这些信息整理起来,又隐隐有些不安。
他开始往下面想,这时候就感到了一种莫名的恐惧。
他有点明白了安森青教授看完材料之后,半晌才说出的第一句话是什么意思。
他有些害怕地确认自己的疑问,“小鼠的启动子……”
“不是小鼠的启动子。
”安教授摇摇头。
“啊?什么……您什么意思?”
“启动子就是启动子,是所有真核生物基因表达共用的序列结构,不管是线虫,还是小鼠或人类,启动子和终止子序列都是通用的。
”
“字典。
”白泓羽在一边轻轻地说。
字典?
字典。
字典!
这把早就悬在心头的巨剑终于落了下来,汪海成觉得喉咙被扼住,呼吸越来越困难,在闷湿的空气里喘不过气来。
他赶紧站起身抓着胸口,手忙脚乱地在旁边桌子上抓到一个不知道干什么用的纸袋,套住自己的口鼻用力开始喘气,半分钟之后,才重新镇定下来。
密码学上,把记录暗文密码和明文文字的对应关系,叫作字典。
字典存在的第一个价值是隐藏原文的本意,第二个价值,是压缩信息量。
60K黑体辐射的信息并不是一个普通的数据,而是一个文件列表。
它用启动子和终止子标记了文件的开始和结尾。
而这个文件列表所检索的文件库,来自地球生命的基因数据。
汪海成激动起来,会议室的椅子像是长了手一样,让他全身每一寸都发痒,房间的墙壁和天花板好像摇晃着,活物一样扩展开去,离自己越来越远,狭小的会议室瞬间张开。
他也不跟人答话,起身就朝外面走出去。
珠海的天空青蓝如水洗过,汪海成仰头望天,这通透的天际之上淌下道道精光,如流蜜。
似乎看到无数双触手,上面长满无数只眼,在目力不及的距离上包裹着这个星球,紧盯着这个星球。
真的会有一个超乎自然规律之上的超然存在,在生命基因中埋下字典,然后在今天用这个字典破解密码吗?
这个密码背后,最终又会解出什么信息?
激动之下,破译工作快速进行。
这时候这个项目还没正式启动,也还没定名字,在安森青教授的指导下,工作人员开始从多个基因库获取