DeepMind方案:基于深度神经网络

alphago和alphazero又有新兄弟,这次轮到科学家惊呆了。
deepmind近日宣布,过去两年一直在研发alphafold:一个用人工智能加速科学发现的系统。
它仅仅基于蛋白质的基因序列,就能预测蛋白质的3d结构,而且结果比以前的任何模型都要精确。
在“蛋白质结构预测奥运会”casp比赛中,力压其他97个参赛者。《卫报》报道称,alphafold预测出了43种蛋白质中25种蛋白质的最精确结构。在同一类别中排名第二的队伍,只预测出了3种。
△竞赛结果,谷歌为g043
相关的研究者纷纷表示,deepmind厉害!很想知道他们方法的细节。
对于这项研究,deepmind称其为“deepmind在科学发现领域的第一个重要里程碑”,在生物学的核心挑战之一上取得了重大进展。
《卫报》评论称,这将“开启医学进步的新时代”。
到底是个多大的进展?
任何给定的蛋白质能做什么,取决于它独特的3d结构。 所以,能精确预测蛋白质的3d结构意义非凡。
首先,它能够帮助科学家更好地理解蛋白质在人体内的作用。对于诊断和治疗由蛋白质错误折叠引起的疾病,比如阿尔茨海默氏症、帕金森氏症、亨廷顿氏症等,至关重要。
其次,它会提高我们对身体及其工作原理的认识,使科学家能够更有效地设计新的、有效的疾病治疗方法。
随着我们通过模拟和模型获得更多关于蛋白质形状和它们如何运作的知识,会使药物开发方面更容易,同时也会降低相关的实验成本。
第三,它也有助于更好地设计蛋白质,一个例子是,可以推动可生物降解酶的进步,帮助我们控制像塑料和石油这样的污染物。
事实上,研究人员已经开始对细菌进行工程改造,使其分泌蛋白质,让废物可生物降解,进而变得更容易处理。
不过,仅仅根据基因序列来确定蛋白质的3d形状是一项复杂的任务。
挑战在于,基因序列中只包含蛋白质组成部分氨基酸残基的序列信息,这些氨基酸残基会形成长链。 预测这些长链如何折叠成复杂的3d结构,被称为“蛋白质折叠问题”(protein folding problem)。
蛋白质越大,氨基酸之间的相互作用越多,建模也就更复杂,困难度也会成倍上升。正如利文索尔佯谬(levinthal’s paradox)中指出的那样,在找到一个蛋白质正确的3d结构之前,要列举一个典型的蛋白质所有可能的构型,需要的时间比宇宙存在的时间还要长。
那么,deepmind解决这个问题的思路是怎样的呢?
deepmind方案:基于深度神经网络
deepmind表示,他们专注于从零开始模拟目标形状,而不是使用以前解决的蛋白质作为模板。
因此,在预测蛋白质结构的物理性质方面,deepmind达到了非常高的准确性,然后使用两种不同的方法,来构建完整的蛋白质结构预测。
这两种方法都依赖深度神经网络,需要训练深度神经网络从基因序列中预测蛋白质的两种特性:
1) 成对的氨基酸之间的距离;
2) 连接这些氨基酸的化学键之间的角度。
具体的操作步骤为:
训练一个神经网络来预测蛋白质中每对残基之间的距离分布。然后,将这些概率组合成一个分数,用来估计一个蛋白质结构的准确度。
此外,deepmind还训练了一个单独的神经网络,基于所有距离的总和来评估初步给出的蛋白质结构与正确答案的接近程度。
然后,基于这些评分函数,去找到符合预测的结构。
deepmind使用的第一种方法,基于结构生物学中常用的技术,用新的蛋白质片段反复替换蛋白质结构的片段,他们训练了一个生成神经网络来发明新的片段,用来不断提高蛋白质结构的评分。
第二种方法是通过梯度下降法优化得分,这是机器学习中常用的一种数学技术,可以进行小的、增量的改进,从而得到高精度的结构。
他们将这项技术应用于整个蛋白质链,而不是那些在组装前必须单独折叠的片段,从而减少了预测过程的复杂性。
还有“一吨”多的想法
deepmind的目标,是将alphafold打造成基础科学领域的alphago和alphazero。他们表示,
我们首次涉足蛋白质折叠领域的成功表明,机器学习系统可以整合各种信息来源,帮助科学家快速找到复杂问题的创造性解决方案。
正如我们已经看到人工智能如何通过alphago和alphazero等系统帮助人们掌握复杂的游戏一样,我们同样希望有一天,人工智能的突破也将帮助我们掌握基础的科学问题。
deepmind的首席执行官demis hassabis对此信心满满。
“我们还没有完全解决蛋白质折叠问题,这只是第一步,”他说。“这是一个极具挑战性的问题,但是我们有一个良好的体系,我们还有’一吨’多的想法还没有实施。”

Power Integrations发布可设定恒压/恒流及恒功率输出特性的离线反激式开关电源IC
RTX在分布式实时仿真系统中的应用
emc问题是什么意思?EMC三大规律和产生EMC问题三要素解读
罗技MXVertical鼠标手怎么样 值不值得买
兼容多种运算核心 HSA架构提高处理器能源效率
DeepMind方案:基于深度神经网络
儿童智能机器人测评:蛋宝“五项全能”获评高级启蒙老师
特斯拉:严格按照中国法律法规生产,不存在 “为产量不惜降低质量”现象
关于电源稳定性的分析和介绍
锂电池和铅酸电池电动车如何选择
英韩加密货币居然主动进行自我监管
modelsim仿真没有波形或看不到波形的原因及解决方法
华为Mate10确定:10月16日发布,售价五千起!华为Mate9全速降至冰点价
如何选择视频会议系统
中关村前沿技术构建高精尖经济结构,人工智能引领 “中国速度”
5G+医疗让医疗技术更加“智慧”
外媒:须重新评估中国5G数据安全
Ubuntu修改SSH默认端口指南
低功耗1V供电的升压电路(原创)
有了NFC和蓝牙,为何还要UWB?什么时候UWB才是首推选择呢?