PRODUCT CLASSIFICATION
產(chǎn)品分類(lèi)了解蛋白質(zhì)挑戰(zhàn)的AI解決方案
根據(jù)一項(xiàng)嚴(yán)格的獨(dú)立研究,在一項(xiàng)重大的科學(xué)進(jìn)步中,DeepMind的AI系統(tǒng)AlphaFold的-新版本已被認(rèn)為是解決已有50年歷史的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)挑戰(zhàn)(通常稱(chēng)為“蛋白質(zhì)折疊問(wèn)題”)的解決方案。評(píng)定。從長(zhǎng)遠(yuǎn)來(lái)看,這一突破可以大大促進(jìn)生物學(xué)研究,從而在疾病理解和藥物發(fā)現(xiàn)等領(lǐng)域開(kāi)辟新的可能性。
CASP14的結(jié)果表明,DeepMind的-新AlphaFold系統(tǒng)在結(jié)構(gòu)預(yù)測(cè)中達(dá)到了無(wú)與-倫比的準(zhǔn)確性。該系統(tǒng)能夠在幾天之內(nèi)確定高精度結(jié)構(gòu)。CASP是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的關(guān)鍵評(píng)估,是始于1994年的兩年一次的社區(qū)運(yùn)行評(píng)估,是評(píng)估預(yù)測(cè)技術(shù)的金標(biāo)準(zhǔn)。參加者必須盲目地預(yù)測(cè)剛剛通過(guò)實(shí)驗(yàn)確定的蛋白質(zhì)(或者在某些情況下尚未確定)的蛋白質(zhì)結(jié)構(gòu),并等待將其預(yù)測(cè)與實(shí)驗(yàn)數(shù)據(jù)進(jìn)行比較。
CASP使用“全-球距離測(cè)試(GDT)”度量標(biāo)準(zhǔn)來(lái)評(píng)估精度,范圍為0-100。新的AlphaFold系統(tǒng)在所有目標(biāo)上的GDT總體平均得分為92.4。系統(tǒng)的平均誤差約為1.6埃,大約是原子的寬度。根據(jù)CASP聯(lián)合創(chuàng)始人兼主席John Moult教授的說(shuō)法,大約90 GDT的分?jǐn)?shù)被非正式地認(rèn)為與通過(guò)實(shí)驗(yàn)方法獲得的結(jié)果具有競(jìng)爭(zhēng)力。
馬里蘭大學(xué)CASP聯(lián)合創(chuàng)始人兼主席John Moult教授說(shuō):“近50年來(lái),我們一直在解決這個(gè)問(wèn)題(蛋白質(zhì)如何折疊)這一問(wèn)題。親身經(jīng)歷了DeepMind對(duì)此的解決方案在這個(gè)問(wèn)題上停留了這么長(zhǎng)時(shí)間,經(jīng)過(guò)了無(wú)數(shù)停頓,開(kāi)始思考我們是否會(huì)到達(dá)那里,這是一個(gè)非常特殊的時(shí)刻。”
對(duì)現(xiàn)實(shí)世界的影響
DeepMind很高興能與其他人合作,以了解有關(guān)AlphaFold潛力的更多信息,AlphaFold團(tuán)隊(duì)正在研究蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)如何與少數(shù)專(zhuān)家小組一起幫助理解某些疾病。
還有跡象表明,作為科學(xué)界開(kāi)發(fā)的許多工具之一,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)可能在未來(lái)的大流行應(yīng)對(duì)工作中有用。今年早些時(shí)候,DeepMind預(yù)測(cè)了SARS-CoV-2病毒的幾種蛋白質(zhì)結(jié)構(gòu),實(shí)驗(yàn)人員令人印象深刻的快速工作現(xiàn)已證實(shí)AlphaFold在其預(yù)測(cè)中達(dá)到了很高的準(zhǔn)確性。
AlphaFold是DeepMind迄今為止重要的改進(jìn)之一。但是,與所有科學(xué)研究一樣,還有許多工作要做,包括弄清楚多種蛋白質(zhì)如何形成復(fù)合物,它們?nèi)绾闻cDNA,RNA或小分子相互作用以及如何確定所有氨基酸側(cè)鏈的精-確位置。
與早期的CASP13 AlphaFold系統(tǒng)一樣,DeepMind計(jì)劃在適當(dāng)?shù)臅r(shí)候向同行評(píng)審的期刊提交詳細(xì)介紹該系統(tǒng)工作原理的論文,并同時(shí)探索如何-好地以可擴(kuò)展的方式為系統(tǒng)提供更廣泛的訪問(wèn)。
AlphaFold在展示AI作為輔助基礎(chǔ)科學(xué)發(fā)現(xiàn)的工具的驚人潛力方面開(kāi)辟了新天地。DeepMind期待與他人合作以釋放這種潛力。
諾貝爾獎(jiǎng)得主,皇-家學(xué)會(huì)主席Venki Ramakrishnan教授說(shuō):“這項(xiàng)計(jì)算工作代表了蛋白質(zhì)折疊問(wèn)題的驚人進(jìn)展,蛋白質(zhì)折疊問(wèn)題是生物學(xué)界50年來(lái)的巨大挑戰(zhàn)。它已經(jīng)發(fā)生了數(shù)十年,而該領(lǐng)域的許多人將我們已經(jīng)預(yù)見(jiàn)到了。很高興看到它將從根本上改變生物學(xué)研究的許多方式。”
為什么蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)很重要
蛋白質(zhì)對(duì)生命至關(guān)重要,其形狀與功能密切相關(guān)。準(zhǔn)確預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的能力使人們能夠更好地了解它們的作用及其運(yùn)作方式。目前,主數(shù)據(jù)庫(kù)中有超過(guò)2億種蛋白質(zhì),而它們的3-D結(jié)構(gòu)中只有一小部分已經(jīng)被繪制出來(lái)。
一個(gè)主要的挑戰(zhàn)是蛋白質(zhì)在理論上可以折疊成終的3-D結(jié)構(gòu)之前可以折疊的天文方法。從根本上說(shuō),社會(huì)面臨的許多大挑戰(zhàn),例如開(kāi)發(fā)疾病的治療方法或?qū)ふ铱煞纸夤I(yè)廢物的酶,都與蛋白質(zhì)及其作用密切相關(guān)。確定蛋白質(zhì)的形狀和功能是科學(xué)研究的一個(gè)主要領(lǐng)域,主要是使用實(shí)驗(yàn)技術(shù),每個(gè)結(jié)構(gòu)可能要花費(fèi)數(shù)年的艱辛和艱巨的工作,并且需要使用數(shù)百萬(wàn)美元的設(shè)備。
DeepMind解決蛋白質(zhì)折疊問(wèn)題的方法
突破性突破是DeepMind在2018年*參加CASP13的基礎(chǔ)上,初的AlphaFold版本在所有參與者中都達(dá)到了-高的準(zhǔn)確性。現(xiàn)在,DeepMind為CASP14開(kāi)發(fā)了新的深度學(xué)習(xí)體系結(jié)構(gòu),從生物學(xué),物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域以及過(guò)去半個(gè)世紀(jì)蛋白質(zhì)折疊領(lǐng)域的許多科學(xué)家的工作中汲取了靈感。
折疊的蛋白質(zhì)可以被認(rèn)為是“空間圖”,其中殘基是結(jié)點(diǎn),邊緣將殘基緊密相連。該圖對(duì)于理解蛋白質(zhì)內(nèi)的物理相互作用及其進(jìn)化歷史非常重要。對(duì)于在CASP14上使用的-新版本的AlphaFold,DeepMind創(chuàng)建了一個(gè)基于注意力的神經(jīng)網(wǎng)絡(luò)系統(tǒng),端到端進(jìn)行了培訓(xùn),該系統(tǒng)試圖解釋該圖的結(jié)構(gòu),同時(shí)對(duì)所構(gòu)建的隱式圖進(jìn)行推理。它使用進(jìn)化相關(guān)序列,多序列比對(duì)(MSA)和氨基酸殘基對(duì)表示來(lái)完善此圖。
通過(guò)重復(fù)此過(guò)程,系統(tǒng)可以對(duì)蛋白質(zhì)的潛在物理結(jié)構(gòu)進(jìn)行強(qiáng)有力的預(yù)測(cè)。此外,AlphaFold可以使用內(nèi)部置信度量度來(lái)預(yù)測(cè)每個(gè)預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)的哪些部分是可靠的。
該系統(tǒng)接受了來(lái)自蛋白質(zhì)數(shù)據(jù)庫(kù)中約170,000種蛋白質(zhì)結(jié)構(gòu)組成的公開(kāi)數(shù)據(jù)的培訓(xùn),使用的是現(xiàn)代機(jī)器學(xué)習(xí)標(biāo)準(zhǔn),使用的計(jì)算量相對(duì)較小-大約運(yùn)行了128個(gè)TPUv3核(大約相當(dāng)于100-200個(gè)GPU)幾個(gè)星期。
郵箱:1170233632@qq.com
傳真:021-51870610
地址:上海市顧戴路2988號(hào)B幢7樓