分子可视化简史

发布时间:2020-07-31 16:17:41
全世界都在关注疫情,或多或少看到过一些专业的文章,描述冠状病毒上面的某个蛋白分子长成什么样子,会用一张飘带图表示,大体上就是下面这些图形的样子:



这里面的图都是从国际蛋白质数据库里面查到的,跟冠状病毒或多或少有关系的蛋白质的样子。


看了这些图,你会有什么想法?我随即检查了几个亲朋好友,有人感叹病毒的蛋白质分子长的还挺漂亮的。可惜错长在冠状病毒身上了,简直是一朵鲜花插在了牛粪上。也有人观察的比较仔细,问了很多问题,比如这些飘带的颜色代表什么意思?为啥有粗有细?难道是参考了兰州拉面里面的大宽、二宽、韭叶、二细?还有箭头啥的,都是啥意思,是说氨基酸会跑步吗?蛋白质分子真的是长成这个样子吗?我也是跟你一样很好奇,就学习了一圈儿,分享给大家。

第一章原子可视化


要说起分子可视化,咱得先从原子的可视化说起。原子到底长什么样子?说来话长,第一个出场的是Thales,泰勒斯,古希腊七贤之一,西方思想史上第一个有记载有名字留下来的思想家,被称为“科学和哲学之祖”。既然是第一个有名字的,肯定提出的问题也是很牛的,他第一个提出“世界的本原是什么”?这样的问题,然后他回答说,水生万物,万物复归于水。在他老人家眼里,原子大概就是水了。


泰勒斯也是单身狗的鼻祖。年轻时,他老妈逼婚,他说,时辰未到。年老的时候,他老妈再逼婚,他说,时辰已过。科学兼哲学之祖度过了何其悲惨的一生!

第二个出场的是Empedocles(恩培多克勒),说世间万物是由土、气、火与水四种原素组成的,它们以不同的比例混合起来,这样就产生了我们在世界上所发现的种种变化着的复杂物质。



第三个出场的是Anaxagoras(阿那克萨戈拉,本文译作安娜拉),他认为“种子”有各种不同的性质,数目无限多,体积无限小,是构成世界万物的最初元素;种子具有各种形式、颜色和气味,它们的结合构成了世界上千差万别的事物,头发是由头发的种子、血是由血的种子、金子是由金子的种子构成的。山有山种,水有水种。



第四个出场的是老子,姓李名耳,字聃。老子在他的《道德经》第四十二章中写道,道生一,一生二,二生三,三生万物。



第五个出场的是Leucippus(留基伯,本文译作刘慈普,大概是刘慈欣他哥)和Democritus(德谟克利特,本文译作德谟克)。刘是德的老师,他们认为万物的本原是原子和虚空。原子是不可再分的物质微粒,虚空是原子运动的场所。无数原子从古以来就存在于虚空之中,既不能创生,也不能毁灭,它们在无限的虚空中运动着构成万物。原子的数目是无穷的,它们之间没有性质的区别,只有形状、体积和序列的不同。大概其是下图这个样子:



这个德谟克可是不得了。为了能想明白原子是啥,不受干扰,戳瞎自己的眼睛,半夜在墓地思考原子论。他的著作有五十二种,据说柏拉图曾想把他的作品全部烧光,现仅存极少数断片。

第六个出场的Dalton(道尔顿)就已经是2200年之后了。道尔顿说,原子是最小的、不能再分割的实心球体,同种元素的原子是相同的,如体积、质量以及化学性质等,但不同元素的原子是不同的;化合物是由两种成两种以上元素的原子组成的,在化合物中,任意两种元素的原子数之比不是一个整数就是一个简单的分数;化学反应就是不同原子的分离、结合成重新组合,而没有原子的创生或消失。



道尔顿的模型,我们到现在还在用。他通常被看成是科学原子论之父。


第七个出场的是J. J. Thomson(汤姆孙)于1898年提出了新的原子模型,这个也就是枣糕模型,在课本里属于被推翻的那种倒霉科学家典型,还是被自己的弟子打脸,当然换个角度看,也是青出于蓝而胜于蓝的美谈。即原子是球形胶冻状的颗粒,其中均匀分布着一定数量的正电荷,并且在这个球形胶冻状的颗粒上镶嵌着一定数量的电子,但是原子作为一个整体是电中性的,其中包含的正电荷数目和负电荷数目相等。


第八个出场的就是Rutherford(卢瑟福)了。卢瑟福是汤姆孙的学生,1912年,卢瑟福根据α粒子散射实验现象提出原子核式结构模型。该实验被评为“物理最美实验”之一。卢瑟福模型又称原子太阳系模型,认为原子的质量几乎全部集中在直径很小的核心区域,叫原子核,电子在原子核外绕核作轨道运动。原子核带正电,电子带负电。


第九个出场的是Niels Bohr(波尔)了。在卢瑟福模型的基础上,他提出了电子在核外的量子化轨道,解决了原子结构的稳定性问题,描绘出了完整而令人信服的原子结构学说。


你要是想看最复杂的元素118号,中文名为<气奥>,读音:ào,波尔的原子模型是这个样子的:


第十个出场的就是原子本尊了。这里你看到的是第一张氢原子的真实照片。


到这里,该总结一下了。分子是由原子组成的,一个蛋白质分子可能包括成千上万个原子,你会哪一种表达方式呢?以上种种,还是道尔顿的球球,是最简单的。

第二章分子球棒模型


英国的John Dalton(约翰·道尔顿,容易联想到:蓝脸的窦尔敦·盗御马,红脸的窦尔敦·战长沙。。。没关系,道尔顿是色盲,分不出来蓝脸还是红脸),既然是近代化学之父,不能只想着原子论,他也想到了用符号来表达分子。


他也被认作是第一个分子插画表现者,他发明了一种用圆形符号成簇的方式来表现已经被大家所知的元素。他还是用木质模型来表现原子、分子形态的第一人。我们来看看他画的分子:



第二个出场的是Jons Jakob Berzelius(贝采尼乌斯,本文译作贝泽柳),他第一个用字母(每种元素的拉丁文名称的开头字母)作元素符号,并用元素符号来表示化合物的化学式,他规定每个化学元素符号在化学式中只代表该元素的一个原子。H2O就是来表示水的。那个时代很多人发明了很多写法,最后效法秦始皇,统一到贝泽柳的写法上。



第三个出场的是三人行:Edward Frankland(爱德华·弗兰克兰爵士,本文译作坦白地),提出化学键;ArchibaldScott Couper(斯科特·库珀)提出碳原子为4价及自相连接的学说;Alexander Crum Brown(亚历山大·克伦·布朗)开始绘制分子图片,他在其中将原子的符号括在圆圈中,并使用虚线将原子连接在一起,从而满足每个原子的化合价。


这三个人里面,库珀最惨,据说由于他导师推迟论文发表,库珀没能在凯库勒之前发表苯的结构式。库珀与导师闹僵,被赶出实验室,不久就疯了,在疯人院度过了余生。
August Kekulé(奥古斯特·凯库勒)做梦看到一条蛇首尾相连,发现了苯的环状结构。德国化学家奥古斯特·威廉·冯·霍夫曼(August Wilhelm von Hofmann)由球和金属丝制成的“糖类配方”(1865年)。“为了表现出“结合力”,即化合价,将金属管和大头钉拧入钢珠中,以连接钢珠并以此方式养育一种机械结构,以模仿要展示的原子结构。



自此,诞生了分子的球棒模型。从最开始表达最简单的有机分子,到后来也能表达一些稍微复杂的分子模型。


第三章空间填充模型


在化学中,空间填充模型,也被称为圆顶模型,是一种类型的三维(3D)的分子模型。其中原子通过球体其半径是正比于所表示的原子半径并且其中心到-中心距离与原子核之间的距离成比例,并且都处于相同的比例。不同化学元素的原子通常由不同颜色的球体表示。


接下来是一个标准的三人行。1952年,Robert CoreyLinus Pauling描述了他们在加州理工学院建立的分子的精确尺度模型。在他们的模型中,他们设想分子的表面由分子中每个原子的范德华半径确定,并将原子精加工为直径与每个原子的范德华半径成比例的硬木球体1英寸= 1Å。为了允许原子之间的键,将每个球体的一部分切掉,以创建一对匹配的平面,并按尺寸调整尺寸,以使球体中心之间的距离与标准化学键的长度成比例。1965年,沃尔特·科隆(Walter L. Koltun)设计并申请了简化系统的专利,该系统具有各种颜色的模制塑料原子,并通过专门设计的卡扣连接器进行连接,这种用颜色编码,键长定义的范德华式空间填充模型现在通常称为CPK模型。


第四章大分子可视化


以上的各种方法可以表达小型的分子,对于蛋白质、核酸这样的大分子,就几乎无能为力了。随着X射线结晶照相术的诞生,科学家们有了新的办法。


这是一台X射线晶体仪。科学家们就是用这个仪器来测量蛋白质分子的结构、大小,然后绘制分子图。



首先获得蛋白质的结晶颗粒,用X光束照射,然后再将结晶颗粒旋转,再照射。从不同角度获得缝隙和光影,获得多张图片。从影像中计算出分子的大小、位置坐标,最终获得蛋白质的3D模型。


1953年,James Watson(詹姆斯•沃森)和 Francis Crick(弗朗西斯•克里克)公布了 DNA 的结构,就是采用的X射线计算出来的数据,他们开启了分子生物学和精准医学时代的大门。


第五章飘带图


那个年代的科学家,通过X射线,做出一个蛋白质的模型,是相当耗时间的。但回报也是很赞的。John Cowdery Kendrew(约翰·考德瑞·肯德鲁)和导师Max Perutz(马克斯·佩鲁兹)于1959年完成了对血红蛋白结构的研究,一起在1962年获得了诺贝尔化学奖。


看起来那个时代的化学家都不容易,个个都是穿珠子的高手。后来就轮到艺术家登场了,毕竟画画比串珠子快。美国艺术家欧文·盖斯(Irving Geis)帮助Kendrew在《科学美国人》上绘制插图。下面是Geis对血红蛋白四聚体的图解。


终于来到了现代飘带图的作者:Jane Shelby Richardson(简·谢尔比·理查森),今天,简是杜克大学(Duke University)生物化学教授。从盖斯的艺术图中获得灵感,她定义了飘带图(Ribbon diagram),并将之发扬光大。难怪飘带图这么漂亮,原来是美女。。。曾经是美女的化学家发明的!


飘带图用来表示蛋白质构造的三维模型非常直观。3D形式的彩带显示蛋白质主链的整体路径和架构,并作为可视框架,在其上镶嵌原子结构的细节。其中α螺旋被画成盘绕的带或粗管,β折叠显示为箭头,而线或细管显示为非重复的线圈或环。多肽链的方向由箭头局部显示,一些不同的多肽骨架可以通过彩条带的颜色变化表示。

第六章计算机时代


进入计算机时代,这些手段得到了突飞猛进的进展。包括前述的X射线晶体绘制蛋白质结构图、飘带图、CPK模型图等,大幅提升了效率。

以达索系统的BIOVIA Discovery Studio为例,它是构建在BIOVIA Pipeline Pilot上专为生命科学发现研究需求而设计的分子模拟研究工具。前文所提及的诸多显示方式,在其中都可以用来帮助生命科学领域的实验生物学家,药物化学家,结构生物学家,计算生物学家和计算化学家来更好更快的设计开发他们所需要的药物和生物大分子。

Discovery Studio中对于分子和蛋白质能够使用不同的模式进行显示。例如,对于蛋白和与它作用的小分子,就可以展示为:


这些显示模式的调整,用户可以在Discovery Studio界面使用Ctrl+D即可完成。

对于小分子的显示,前文所提及的球棍模型,空间填充模型(CPK模型),以及单纯表示原子空间位置的线性模型,都可以在原子显示设置中进行查看和更改。你说拿诺贝尔奖的Kendrew看了这个会怎么想?


下面是一个用来显示原子空间位置的线性模型显示,每一个线段的终点表示原子的质心,长度表示原子与原子间的化学键形式,单线表示单键,双线表示双键:


接下来是用来标识原子和相互作用位置的球棍模型,每一个球表示一个原子,棍表示原子间的化学键:


接着是用来表示原子空间占据情况的空间堆积模型(CPK模型),在此种显示模式中,每个球的大小即为该原子的范德华(VDW)半径尺寸。



对于大分子的显示,前文所提及的飘带模型等,都可以在蛋白显示选项中进行查看和更改。


来看看这是一个典型的飘带模型用来显示蛋白质:



现在我们把宽面拆成细面,下面是使用线条展示的飘带模型展示的蛋白质:



接下来是仅展示骨架碳连接和空间位置的蛋白质:



接下来是展示蛋白质二级结构单元组成的蛋白质,其中圆柱体表示螺旋结构,箭头表示Beta折叠:



Discovery Studio不仅能够显示大分子结构,前文所提及使用X射线晶体数据解析蛋白质结构的工作,也可以在Discovery Studio中通过使用生物大分子X-ray晶体结构解析模块来完成从X射线晶体学数据到结构构建和精修的全套工作流程。基于成熟的CNX软件包,可以很方便的通过工具面板实现结构的检测和精修。

X射线晶体数据处理过程中,诸如CNXXPROLIG原子键入引擎之类的访问工具可帮助解释X射线实验产生的复杂数据。除了建立和完善蛋白质-配体复合物的结构模型外,Discovery Studio还可以生成和可视化电子密度图,并执行X射线结构优化任务,并自动将配体调整到可用的密度。

在大分子设计与分析方面,Discovery Studio可以帮助确定大分子的三维结构和特性,例如酶、抗体、DNA或RNA,是广泛研究活动的基本组成部分。Discovery Studio提供了经过市场验证的科学工具的全面组合,能够协助基于大分子的研究的各个方面。

看到这里,你会不会感叹,原来这漂亮、拉风的飘带图,敢情都是骗人的啊!



- END -


转自:升华洞察 冯升华 张亮


[返回列表]

上一篇:没有上一篇了

下一篇:2019年10月汽车工业经济运行情况