蛋白质结构研究加速度
蛋白质是生命的基石,由氨基酸链组成,并折叠成复杂的形状。蛋白质根据储存在dna中的指令产生复杂的生物分子,它们执行着至关重要的细胞任务,并完成各种机体功能。
一些蛋白质是有益的,例如那些参与消化食物的蛋白质;而另一些则是有害的,例如那些参与肿瘤生长的蛋白质。它们各自都有着非常复杂的形状和结构。
由于蛋白质的形状与其功能密切相关。了解蛋白质的结构可以更好地了解其作用和工作原理,这也是解决许多生命科学问题的关键。
以前,研究人员需要付出几个月或几年的时间和精力,才能弄清蛋白质的结构。
如今,凭借人工智能的力量,几秒钟内就能完成。
它不仅可被用于疾病研究、食物安全、疫苗开发、可持续发展等领域;
还帮助科学家深入了解体内复杂过程是如何工作的、以及哪些有机分子能被用于克服污染、生命起源于何处等那些为全人类所关注的重要问题。
alphafold蛋白质数据库
alphafold蛋白质数据库不仅实现了1000倍的扩容,成为[蛋白质宇宙],更能在几分钟破解渐冻人等不治之症相关的世界级生物难题。
这些转储数据将在deep mind和欧洲分子生物学实验室欧洲生物信息研究所共同建立的一个数据库中免费公开。
在这些逾 2.14 亿个结构预测中,约35%的预测结果被认为准确度很高,即和实验解析的结构一样可靠。
另有45%的预测被认为置信度足够高,在很多情况下都能使用。
alphafold预测的许多结构都很可靠,能在很多情况下替代实验解析的结构。
其他情况下,研究人员会用alphafold的预测结果验证和解读实验数据。
不可靠的预测结果一望即知,其中一些源于蛋白质固有的无序性质,这种无序意味着蛋白质本身没有固定的形状,至少在没有其他分子的情况下是无序的。
alphafold的发展历程
2016年,deepmind公司开发的alphago击败韩国传奇围棋选手李世石后,其先进性与潜力受到认可,deepmind决定成立团队开始研究[蛋白质折叠问题]。
2018年12月,alphafold在第13届国际蛋白质结构预测竞赛上预测出了43种蛋白质中25种蛋白质的最精确结构。
2020年,deepmind 推出一个名为 alphafold的ai算法,它可以正确地完成蛋白质的结构测定。
2021年,与欧洲分子生物学实验室embl合作,建立了一个公开发布 alphafold 预测结果的可搜索数据库,即 alphafold db,其公布的最初一组数据包含了 98% 的人类蛋白质。
2021年7月15日,deepmind通过一篇nature论文开源了其基于深度学习神经网络的alphafold2模型;
7月22日,deepmind再次发表nature论文,推出alphafold蛋白质结构数据库,向公众免费开放人类蛋白质组以及另外20种模式生物的总共超过350000种结构,并且对98.5%的人类蛋白质结构进行了准确预测。
今年1月,deepmind 宣布已经有超过30万研究者使用了 alphafold数据库,并且添加了超过27个蛋白质组,总计超过19万条蛋白质结构预测数据。
这次添加的重要性在于其中17个蛋白质组都和被忽视热带疾病有关,影响全球十多亿人。
今年7月,deepmind 将 alphafold 数据库从近100万条扩展到2.14亿条,覆盖了人类已知的绝大多数蛋白质。
目前预测准确度尚待提升
人工智能有一个学习的过程,要通过大量的训练来提升其准确性。
如果alphafold预测的蛋白质结构是不常见的结构,ai无法通过已有的知识学习到这个结构,预测时就容易产生偏差。
ai是一个能够利用现有的知识预测将来的工具,如果连现有的知识都是缺失状态,自然无法预测新结构。
除非把世界上所有的蛋白质结构都预测并验证过了,否则是不可能达到100%的准确率。
虽然对部分蛋白质结构的预测不完全准确,但alphafold蛋白质结构数据库在开放数据的同时也提供了相应结构预测的准确度报告,为使用者提供参考。
将开启数字生物学新时代
过去几十年来,确定蛋白质结构的主要方法是实验室中的各种成像技术,包括x 射线晶体学、冷冻电镜、微晶电子衍射等。
这些方式通常依赖昂贵的设备,耗时比较长,解析出一个蛋白质结构可能需要数月甚至数年时间。
与实验室中的各种成像技术相比,基于氨基酸序列预测蛋白质结构是一种极具吸引力的方式,也是 ai 在生命科学领域的重要落脚点。
以 alphafold 为代表的蛋白结构预测模型可能是人工智能对科学界的最大贡献。
deepmind 在官方通稿中表示:以 alphafold 为代表的蛋白结构预测将生物学带入了一个结构更为丰富的时代,并以数字化速度开启科学探索。
结尾:
数量庞大的蛋白质结构为生命科学研究带来的影响仍是毋庸置疑,尤其是在结构生物学的领域。
alphafold蛋白质结构数据库中的结构虽然有不足之处,不能全部将其应用于研究中,但数量庞大的蛋白质结构对生命科学各个领域的研究,仍有着不可忽略的意义。
部分资料参考:雷锋网:《alphafold 新成果再次引爆生命科学界》,zaker:《alphafold把几乎所有已知蛋白质的结构预测完了》,硅星人:《deepmind“顺手”放的大招,要一举攻克渐冻人症》
“遥感十四号”卫星成功发射
基于Android 2.3的多媒体播放器软件解决方案
智慧高速的技术架构总体的三个层级
单片机测控系统的接地作用及方式
手柄沟槽信号蝶阀
基于人工智能的AlphaFold蛋白质破解
红米Note7后续或推出6GB+128GB版本
前端工程师的发展路线及经验分享
5G基站下的电源模块设计有哪些方面的注意事项
S3C2410X在无线宽带通信网中的应用
事故频发的自动驾驶真的安全吗?
纸张表面瑕疵在线检测设备的原理及功能
自制收音机教程
AI也性别歧视?算法的歧视,AI不背锅!
AquiSense宣布新UV-C LED水处理系统通过美国国家卫生基金会认证
vr眼镜是干什么_vr眼镜伤眼睛么
梧升半导体IDM项目在南京举行启动仪式
哪几款智能运动手表值得关注
阿里与京东之争,电商企业加码拼购
叶面积指数测量仪是测定植物叶面积的专业测量仪器