教学参考-36
来自cslt Wiki
教学目标
- 了解如下基础概念:氨基酸序列通过折叠形成空间结构,形成蛋白质;蛋白蛋的这一空间结构决定功能。了解结构解析的艰难。
- 理解安芬森理论,理解氨基酸序列决定空间结构这一理论的重大意义。
- 理解氨基酸序列预测空间结构的困难,理解AlphaFold成功背后的重要意义
- 理解AlphaFold数据开源的重要意义
教学内容
蛋白质的重要性
- 蛋白质是一种有机大分子,也是构成生物细胞的重要组成部分。以我们人体为例,皮肤、肌肉、骨骼、神经、血液等重要组织均是由蛋白质组成的,它约占人体重量的16%~20%。
- 从功能上讲,蛋白质对于维持生命体的正常生命活动具有十分重要的意义。例如血红蛋白能够帮助我们的呼吸系统运输氧气;免疫蛋白可以帮助我们抵御细菌和病毒的入侵;酶蛋白可以帮助我们消化食物;视锥蛋白可以让我们的眼睛看到世界万物。可以说,蛋白质是生命活动的主要承担者, 没有蛋白质就没有生命。
蛋白质的组成、结构和功能
- 如此神奇的蛋白质,它的基本组成却非常的简单,主要包含我们所熟知的C(碳)、H(氢)、O(氧)、N(氮)四种元素。根据功能的不同,一些蛋白质可能还会包含少量的P(磷)、S(硫)、Fe(铁)、Zn(锌)等微量元素。目前地球上已知的元素有一百多种,组成蛋白蛋的元素不到总量的十分之一。
- 虽然蛋白质的组成非常简单,结构却很复杂,而这些复杂的结构决定了蛋白质功能。例如,鸡蛋煮熟了会变凝固,是因为其中蛋白质的结构发生了变化。因此,要理解蛋白质的功能,需要对蛋白质的结构进行解析。
- 然而,蛋白质的结构解析异常困难,这是因为蛋白质是由一类称为氨基酸的小分子化合物组成的,这些分子在空间中经过排列折叠,会形成非常复杂的结构。因此,氨基酸的数量可能很有限,但它们折叠出的空间构象却是种类繁多,让科学家们望洋兴叹!
- 为了解析蛋白质结构,科学家们可谓是费了九牛二虎之力,动用了全世界最为先进的科技手段,包括核磁共振仪、X射线、冷冻电镜等。这些设备不仅极其昂贵,而且操作复杂,耗时耗力。经过半个多世纪的努力,人们已经确定了17万种蛋白质的结构,但是还有2亿种已知蛋白质等待检测。
安芬森理论和蛋白质结构预测
- 1972年,诺贝尔化学奖得主克里斯蒂安·安芬森提出了一个理论:“至少对于小球状蛋白来说,其固有结构仅由蛋白质的氨基酸序列决定”。这就是说,在确定的环境条件下(包括温度、溶剂浓度和成分等),氨基酸序列决定了蛋白质的一种稳定的、具有最小自由能的“原生结构”。
- 安芬森的研究非常重要。因为蛋白质的氨基酸序列是很容易得到的,如果通过氨基酸序列可以决定蛋白质结构,那么就可以将氨基酸序列作为一把钥匙,通过它来序测蛋白质的原生结构,从而打开蛋白质结构这把锁。
- 然而,如何实现这一预测并不容易,因为不论是氨基酸序列的折叠过程还是最后形成的蛋白质结构都非常复杂。
AlphaFold
- 2018年,DeepMind的研究者们开始探索用氨基酸序列预测蛋白质结构的可能性。在前人工作的基础上,他们开发出了第1代系统,称为AlphaFold1,达到了当时最好的精度,但距离实用还有一些差距。研究团队再接再励,2020年,AlphaFold2 横空出世,将预测误差一举降低到1.6埃,相当于一个原子的尺度,达到了实用精度。
- 安芬森的理论被证明了,困扰人们50年的难题解决了。现在科学家们在电脑前输入一个氨基酸序列就可以得到一个蛋白质的结构了。有了这些结构信息,人们就可以深入了解这些蛋白质的特性,从而为生命科学的研究铺平了道路。
解析蛋白质宇宙
- 2022年7月,DeepMind宣布他们已经完成了对两亿种蛋白质的结构预测,覆盖了动物、植物、细菌、真菌等上百万个物种,几乎囊括了人类目前能接触到的所有蛋白质。
- DeepMind将这些预测结果发布到在线AlphaFold数据库中,供研究者免费使用。目前,来自190多个国家的50多万名研究者将AlphaFold作为他们的日常工作平台。生物学家们正在利用AlphaFold数据库设计药物,探究疾病的致病机理,甚至理解生命活动本身的奥秘。