kb体育(中国)官方网站-登录入口






咨(zī)询热线(xiàn):021-80392549

kb体育(中国)官方网站-登录入口 QQ在线 kb体育(中国)官方网站-登录入口 企(qǐ)业微信
kb体育(中国)官方网站-登录入口
kb体育(中国)官方网站-登录入口 资讯 > 人工(gōng)智能 > 正文

人工智(zhì)能预测蛋白质结(jié)构数量(liàng)将超亿 阿尔法折叠革命何去何(hé)从?

2022/04/22央广网342

十多年来,德(dé)国马克斯普朗克生物物理研究所分子生物学家马丁·贝克及其(qí)同事(shì)一直试图拼凑出世界上最难的(de)拼图游戏之一:人类细胞中最大分子机器的详(xiáng)细模型(xíng)。这个庞然大物被称(chēng)为核孔复合体,控制着(zhe)分(fèn)子(zǐ)进出细胞核的流动,而细(xì)胞核正是(shì)基因(yīn)组所在(zài)之处。每个细胞中都存在数(shù)百(bǎi)个这样的(de)复合物,每(měi)个都由超过1000种蛋白组成,它们(men)形(xíng)成一个环,镶嵌(qiàn)在(zài)核膜上(shàng)。




这1000块拼图由30多种蛋白质构建块组成(chéng),它们以(yǐ)多种方(fāng)式交(jiāo)织在一起。让拼图(tú)更难的是,实验确定的这些构(gòu)建(jiàn)块(kuài)的三维结构是来自许多物种的结构大杂(zá)烩,并不(bú)能总是很好地融(róng)合(hé)在一起。而且,拼图的终极(jí)目标,即核孔复合体(tǐ)的(de)低分辨率三维视图缺乏足够的(de)细节(jiē),人们无法知道需要有(yǒu)多少块能精(jīng)确地拼在一起。


2016年,贝克团队报告了一个模型,它覆盖(gài)了核孔复合(hé)体约30%以及30个构建块的约一半,称为Nup蛋白。2021年7月(yuè),深度思维公司公(gōng)开(kāi)了一款名为(wéi)阿尔法折叠2的(de)人工智(zhì)能(AI)工具。该软件可从(cóng)蛋白质的(de)基因序(xù)列中(zhōng)预测其三维结构,并且大部分情况下是精确的。这(zhè)改变了贝克的任务,以及成(chéng)千(qiān)上(shàng)万(wàn)其他生物学家(jiā)的研究。


在(zài)某些情况下,AI为(wéi)科学家们节省了时间(jiān);在其他情况下,它(tā)使(shǐ)以前难以(yǐ)想象(xiàng)或(huò)极不现(xiàn)实(shí)的研究成为可(kě)能。尽管它(tā)有局限性,但它的(de)发展已经不可(kě)阻挡。


“一鸣惊人”的(de)成功


2020年12月,阿尔法折叠引(yǐn)起了轰动(dòng)。当时,它在一场名为“蛋白质结构预(yù)测关键评估”的比赛(sài)中大放异彩(cǎi)。而阿尔法折叠2的(de)预测平(píng)均而言已与大多(duō)数(shù)实验数据不相(xiàng)上下。


在阿(ā)尔法(fǎ)折叠算法广泛开源之(zhī)前,美国华盛(shèng)顿(dùn)大学医(yī)学(xué)院蛋(dàn)白质设计研究所(suǒ)研究人员开发了AI工具RoseTTAFold,其拥有可(kě)媲美(měi)阿尔(ěr)法折叠2的蛋白(bái)质结构预测超高准确度(dù),而且速度更快、所需计算机处理(lǐ)能力更低。


2021年7月15日,深(shēn)度思维宣布,它已经使(shǐ)用(yòng)阿尔(ěr)法折叠预测(cè)了几乎每一种人类制造的蛋白质(zhì)的结构,以及其他20种被广泛研究的生物的整(zhěng)个蛋白(bái)质组(比如小鼠和大肠杆菌),共(gòng)计(jì)超过36.5万个结(jié)构。深度思维还将这(zhè)些数据公开(kāi)发布到欧洲生(shēng)物信息学研究所维护的数据库中,这个数据库已扩展到近100万个结构。


今年,深度思维(wéi)计划发布(bù)总(zǒng)计超过1亿个结构预(yù)测。这几乎占所有已知蛋白质的一半,是蛋白质数据库(PDB)结构(gòu)库中实验确定的蛋(dàn)白质数量的数百(bǎi)倍(bèi)。阿(ā)尔法折(shé)叠还部署了深度学习神(shén)经网络,目前已经接受了PDB和其他(tā)数据库中的数十万个实验确定的蛋白质结构和序列(liè)的训练。


从结构角度解(jiě)答新科学(xué)问题


阿尔法折叠解决结构的能(néng)力给生物学(xué)家们(men)留下了(le)深刻(kè)的(de)印(yìn)象。“只要一种蛋白质卷曲成(chéng)单一的明确的三维结构,阿尔法折叠的预测就很难被推翻。”瑞典斯德哥(gē)尔(ěr)摩大学(xué)蛋白质生物信息学家阿恩(ēn)·埃洛夫松说,“这是一种一键(jiàn)式解决方(fāng)案,你可能会得到最佳模型。”


英国伦敦大学学(xué)院计算生物学家克里斯汀(tīng)·奥伦戈团(tuán)队正在利用其确定(dìng)新(xīn)的蛋白质种类,并发现了数百、甚至(zhì)数千个潜在的新蛋白质(zhì)家族,扩大了科学家对蛋白质外观和功能的了解。在另(lìng)一项工(gōng)作中,该团队(duì)正(zhèng)在搜(sōu)索从海洋(yáng)和废水中收集的DNA序列数据(jù)库,试图识别新的分(fèn)解塑料的酶。


美国哈佛大(dà)学进化生物(wù)学家谢尔(ěr)盖·奥夫钦尼科夫表(biǎo)示(shì),将任何蛋白质(zhì)编码的基(jī)因序列转化为可靠(kào)结构的能(néng)力都非(fēi)常(cháng)可贵。研(yán)究人员(yuán)通过比较基因序列,以确定生物及其基(jī)因在不同物种之间的关(guān)系。但对于远亲基因(yīn),仅(jǐn)通过比较,可能(néng)找不到进化上的近亲,因(yīn)为序列发生了太大(dà)的变化。而通(tōng)过比(bǐ)较蛋白质结构,其变化速度往往不如基因(yīn)序列那么快,研究人员或(huò)能揭示被(bèi)忽视的古(gǔ)老(lǎo)关系。这为研(yán)究蛋白(bái)质的进(jìn)化和(hé)生命起源(yuán)提供了一个绝(jué)佳(jiā)的机会。


存在一(yī)定(dìng)局(jú)限(xiàn)性(xìng)


目前已有尝(cháng)试证明,阿尔法折叠不具备(bèi)预测蛋白质新突变后果的能力,因为没(méi)有与进化相关的序列来检验。


研究人员表示(shì),许(xǔ)多蛋白质具有多种构象,并与DNA和RNA等配(pèi)体、脂肪(fáng)分(fèn)子和(hé)铁等(děng)矿物质一起(qǐ)发(fā)挥作用,但阿尔(ěr)法折叠的(de)预测是针对孤立结构,它(tā)不能(néng)真正处理那(nà)些可在不同构象中(zhōng)采(cǎi)用不同结(jié)构的蛋白(bái)质。


美国哥伦比亚大学的计算生物学家穆罕默德·库雷(léi)希说,开发下一代神经网络将是一个巨(jù)大的挑战(zhàn)。目前还无法获得大量的数据来捕捉蛋白质动力学(xué),或者蛋白质可能与之(zhī)相互(hù)作用的数万亿个较小分子的形状。


欧洲生物信息学研究所计算生物学家(jiā)珍妮特·桑顿(dùn)认(rèn)为,阿(ā)尔法折叠最大(dà)的影响之一可能只是说服(fú)生物学家(jiā)对计算和理论方法的见解持(chí)更开放的态度。“对我来说,这场革命就是观(guān)念的改(gǎi)变”。


但(dàn)阿尔法折叠革命激发了欧(ōu)洲(zhōu)分子(zǐ)生物学实验室结构(gòu)建模师扬·科辛斯基的远大梦想。他设想(xiǎng),受阿尔法折叠启发的工具不仅可用来对(duì)单个蛋白质和(hé)复合体进行(háng)建模,还可用来对整个细胞器(qì)甚至细胞进行建模(mó),直到完整单个蛋白质分子,“这是我们在接下来的几十(shí)年里要(yào)追(zhuī)寻的梦想”。

关键(jiàn)词: 人工智能




AI人工智能网声明:

凡(fán)资讯来源注明为其他(tā)媒体来源的信息(xī),均为转载自其他(tā)媒体(tǐ),并(bìng)不代表本网站(zhàn)赞同其(qí)观点,也(yě)不(bú)代表(biǎo)本网站对(duì)其真(zhēn)实性负责。您若(ruò)对该文(wén)章内(nèi)容有任(rèn)何疑问或质(zhì)疑,请(qǐng)立即与网站(www.jiangx.bijie.shanxi.linyi.jiaxing.zz.pingliang.ww38.viennacitytours.com)联系,本网站将迅速给(gěi)您回应(yīng)并做处理。


联系电话:021-31666777   新闻、技术文章(zhāng)投稿(gǎo)QQ:3267146135   投稿邮箱:syy@gongboshi.com

工(gōng)博(bó)士人工智能网
kb体育(中国)官方网站-登录入口
扫描二维码关注微信
扫码反馈(kuì)

扫一扫,反馈当(dāng)前页(yè)面

咨询反馈
扫码关注(zhù)

微信公(gōng)众号

返回顶部

kb体育(中国)官方网站-登录入口

kb体育(中国)官方网站-登录入口