深度学习破解DNA数据复制难题

dna作为一种数据存储介质,只有在读取、复制和发送到其他地方时才有用。从细胞核中传递遗传信息的介质是rna(https://www.genome.gov/genetics-glossary/rna-ribonucleic-acid)——从dna转录而来,它本身永远不会离开细胞核。现在,伊利诺伊州埃文斯顿西北大学的研究人员利用深度学习,解开了rna转录过程中的一个复杂部分:细胞如何知道何时停止复制。
在rna转录中,知道何时停止是至关重要的。编码成rna的信息在整个细胞中用于合成蛋白质和调节广泛的代谢过程。要想将正确的信息传递给预期的目标,需要这些rna链尽可能多地表达——仅此而已。
“this is a very useful prescreening tool for investigating genetic variants in a high-throughput manner.”
—emily kunce stroup, northwestern university
停止rna复制过程——称为聚腺苷酸化(polya,https://en.wikipedia.org/wiki/polyadenylation),是指它连接在切断的rna链末端的一系列腺嘌呤分子——涉及一系列相互作用从未被完全理解的蛋白质。
因此,为了帮助解开polya,西北大学的研究人员zhe ji和emily kunce stroup开发了一个机器学习模型,可以定位和识别polya位点。它的工作原理是将经过训练以匹配遗传密码中重要序列的卷积神经网络(cnns,https://spectrum.ieee.org/tag/convolutional-neural-networks)与经过训练以研究cnn输出的递归神经网络(rnn,https://spectrum.ieee.org/the-neural-network-that-remembers)配对。
虽然之前的模型采用了类似的方法,同时使用了cnns和rnn,但这些研究人员随后将cnn/rnn模型的输出输入到另外两个经过训练的深度学习模型中,以定位和识别基因组中的polya位点。
另外两个模型似乎起到了帮助作用。stroup说:“拥有这些串联输出是我们工作中真正独特的东西。让模型向外延伸到两个独立的输出分支,然后我们将其组合起来以高分辨率识别站点,这是我们与现有工作的区别。”
从他们的模型中,研究人员了解了导致polya进展顺利或不佳的几个重要方面。模型的cnn部分学习了已知能吸引控制polya的蛋白质的dna中的遗传模式,而模型的rnn部分揭示了可靠地切断转录需要在这些模式之间仔细间隔。由于该模型的核苷酸分辨率,这些研究人员可以得出如此精确的结论。ji说:“我们的模型能够准确地捕捉到这一点,这令人震惊。”
该团队表示,今后他们计划将他们的模型和类似技术应用于识别可能导致疾病的关键基因突变的研究,然后从中开发出一种可能的更有针对性的治疗药物。stroup说:“这是一种非常有用的预筛选工具,可以以高通量的方式研究基因变异。这有望帮助减少候选突变的数量,使这一过程更加有效。”

谷歌和苹果宣布了一项联合行动,以帮助追踪接触者
2000字详解MOS管的体二极管
PCB行业产业链详细分析和前三大领域的应用情况
rfid标签怎样制作成嵌入式的温度检测系统
张一山、戚薇等众明星齐站台,OPPO这一波预热你得服
深度学习破解DNA数据复制难题
GAIN在PID调节和音响上表示的意思
FIFO使用及其各条件仿真介绍
德索LVDS连接器对性能的要求
深度学习遇上物理学,更好地识别粒子和分析数据
夏普全面屏新款手机曝光,不碎屏的全面屏加上骁龙660的处理器你爱吗?
聊聊电影中那些离我们现实生活中比较近的高科技
IPv6的4大优势
中国城市竞争力蓝皮书
单轴MEMS角速率陀螺及三轴MEMS角速率陀螺
通过哪三个方面对动力电池测试进行了解
碳化硅推动电动汽车快速充电器的成本和性能优势
微克科技:坚持自主技术创新 聚焦穿戴核心科技
【数据库数据恢复】MS SQL数据库提示“附加数据库错误 823”如何恢复数据?
南京云栖大会九所江苏高校与阿里云合作