15女上课自慰被男同桌看到了,亚洲国产精品久久久久久久,大雞巴亂倫有声小说,国产精品成人一区二区三区

English | 中文版 | 手機版 企業登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > Nature文章分享:蛋白質的AI設計仍然面臨的五個問題

Nature文章分享:蛋白質的AI設計仍然面臨的五個問題

瀏覽次數:3049 發布日期:2024-11-21  來源:本站 僅供參考,謝絕轉載,否則責任自負

文章來源:智藥邦 2024年11月15日 08:02 上海

2024年11月4日,Nature發表文章Five protein-design questions that still challenge AI,討論了蛋白質的AI設計仍然面臨的五個問題。

德國慕尼黑大學的Alena Khmelinskaia說:“希望設計定制蛋白質就像訂餐一樣簡單。想象一下一臺自動售貨機,任何研究人員都可以用它來指定所需的蛋白質的功能、大小、位置、partners和其他特征。理想情況下,你會得到一個完美的設計,能夠同時完成所有這些事情。”

蛋白質設計,這一曾被視為遙不可及的夢想,如今正隨著計算技術與機器學習的飛速發展而逐步變為現實。傳統方法依賴于微生物的變異來產生所需蛋白質,過程繁瑣且效率低下。然而,機器學習算法的興起徹底顛覆了這一領域。

借助如RFdiffusion、Chroma等AI工具,研究人員能在電腦上輕松生成新的蛋白質結構,并通過ProteinMPNN等算法找到匹配的氨基酸序列。更令人振奮的是,RoseTTAFold和AlphaFold等技術的出現,使得預測新蛋白質能否正確折疊成為可能。這一系列技術進步極大地縮短了從設計到驗證的周期,提高了蛋白質設計的成功率。2024年諾貝爾化學獎的頒發,更是對AlphaFold等蛋白質結構預測與設計程序的極高認可。這不僅證明了人工智能在蛋白質設計領域的巨大潛力,也預示著這一技術將為人類帶來前所未有的福祉。然而,挑戰依然存在。這篇Nature的采訪揭示了蛋白質設計所面臨的最大難題,以及專家們提出的解決方案。盡管前路尚有坎坷,但隨著技術的不斷進步和科研人員的不懈努力,我們有理由相信,蛋白質設計的未來將更加光明,其帶來的益處也將更加深遠。

構建可靠的結合物

蛋白質設計領域早期面臨的核心挑戰之一,是如何精確預測蛋白質間的相互作用,這對于制藥行業尤為重要。因為特定蛋白質的“結合物”能夠作為藥物,精準地激活或抑制疾病通路。在這一背景下,2024年諾貝爾化學獎得主、西雅圖華盛頓大學的計算蛋白質設計先驅David Baker及其團隊,通過開發RFdiffusion和AlphaProteo等生成式人工智能程序,極大地簡化了這一復雜任務。

Baker指出,這些生成式AI工具能夠像手一樣精確地為特定目標(如癌癥蛋白)設計出結合物。例如,在2023年,他的團隊就利用RFdiffusion技術成功制造出了一種傳感器蛋白,該蛋白在附著于特定肽類激素時會發光,這一成果展示了生成式AI在蛋白質設計上的巨大潛力。

蛋白質設計先驅David Baker蛋白質-蛋白質結合算法的成功,很大程度上得益于其“語言”的簡潔性:所有天然蛋白質均由相同的20個氨基酸構成。這種統一性為機器學習提供了豐富的數據和理想的學習案例,如Generate Biomedicines的計算機科學家John Ingraham所言,PDB(蛋白質數據庫)中成千上萬的結構和蛋白質-蛋白質相互作用數據,為AI學習提供了堅實的基礎。然而,挑戰并未因此消失。對于與藥物和其他小分子結合的蛋白質,由于可用訓練數據相對較少,AI設計的結合蛋白可靠性往往較低。此外,許多制藥公司的小分子結構及其與蛋白質的相互作用數據都是嚴格保密的,這進一步限制了AI的學習范圍。谷歌DeepMind公司的計算生物學家Jue Wang指出,現有公共數據的注釋質量參差不齊,且結構多樣性有限,這可能導致訓練出的模型無法學習到通用的化學規則。 盡管如此,DeepMind還是通過發布AlphaFold3等更新版本,不斷提升AI預測蛋白質與小分子結合影響的能力。據該公司表示,與現有預測方法相比,AlphaFold3在蛋白質與其他分子類型的相互作用預測上至少提高了50%,對于某些重要相互作用類別的預測準確率更是翻倍。然而,Baker強調,挑戰遠未解決。例如,即使一個結合蛋白能夠很好地與目標結合,也并不意味著它就能發揮預期的生物功能。有些結合蛋白可能激活靶點,而有些則可能阻斷靶點,而AlphaFold等程序并不總能區分這兩種情況。此外,生成式AI系統還容易“幻化”出自然界中不存在的蛋白質結構,這反映了AI在追求最優解時可能忽視生物物理學的實際限制。為了克服這些挑戰,Ingraham認為,更好地理解生物物理學以及獲取更多關于蛋白質如何與分子結合的高質量數據至關重要。他的公司正在通過整合盡可能多的蛋白質相互作用和功能數據,以及模型生成的設計高通量數據,來尋找通用的解決方案。這一努力旨在充分利用現有的蛋白質信息,推動蛋白質設計領域向更高層次發展。

新催化劑

科學家們正致力于利用計算工具設計具有全新功能的酶,如清除二氧化碳的催化劑或分解塑料的酶,以期解決環境問題。雖然從具有類似功能的天然酶出發看似合理,但蛋白質結構與功能之間的復雜關系卻構成了重大挑戰。相似的形狀并不總意味著相似的功能,而看似無關的酶卻可能執行相同任務。

天然酶雖為進化產物,但其結構未必是設計新酶的理想起點。研究人員需深入分析酶在進化中的保守序列,以確定哪些部分對功能至關重要。然而,即使進化保守的序列也可能包含看似無用實則關鍵的氨基酸鏈,它們影響著蛋白質與其他分子的結合或構象變化。為應對這一挑戰,研究人員正開發新方法以識別并利用這些關鍵部分。Baker及其團隊利用射頻擴散技術創造了水解酶,并通過機器學習分析酶的活性位點,進而構建全新蛋白質。盡管他們已成功設計出能以新方式水解底物的酶,但將活性位點轉移到新蛋白質環境中仍面臨挑戰。蛋白質的動態性使得這一任務更加復雜。蛋白質并非靜態物體,而是處于不斷運動中。當動態變化出現時,現有的建模方法往往難以準確預測。因此,研究人員需進一步探索蛋白質的動態特性,以更精確地設計具有全新功能的酶。盡管挑戰重重,但科學家們仍對計算工具在蛋白質設計領域的潛力寄予厚望。

構象變化

蛋白質構象多變,受溫度、pH值、化學環境及分子結合等因素影響。然而,實驗通常只能捕捉到最穩定構象,難以揭示蛋白質活躍態。計算所有可能構象對超級計算機也是巨大挑戰,因一個僅含100個氨基酸的蛋白質就有3的100次方種可能構象。Microsoft Research的機器學習科學家Kevin Yang說,要真正了解蛋白質的工作原理,研究人員需要了解其潛在運動和構象的全部范圍--這些替代形式不一定在PDB中。機器學習雖能助力縮小范圍,但受限于訓練數據不足。為解決此問題,研究人員正設計大型蛋白質庫,通過變異揭示蛋白質動態變化。同時,設計能在兩種構象間切換的蛋白質,既助訓練AI模型,又可為構建復雜分子機器提供構件。

此外,有團隊開發算法如AF-Cluster,引入隨機性探索其他構象,但適用性尚待驗證。總體而言,蛋白質構象的多樣性和動態性為研究和設計帶來了巨大挑戰,也激發了科研人員不斷探索新的解決方法。

復雜的創造

除了酶,研究人員還在探索設計其他功能多樣的蛋白質,如自組裝結構、載體、產生物理力或糾正折疊錯誤等。計算設計已在醫療領域取得突破,如SKYCovione疫苗的成功,展示了計算蛋白質設計的實際應用潛力。

現在,研究人員正利用機器學習開發更多功能,如空心納米粒子用于藥物傳輸。然而,對于更復雜結構如細菌鞭毛,因缺乏足夠理解透徹的例子,機器學習仍面臨挑戰。因此,人類研究人員需要思考構成分子機器的部件,并使用設計工具逐一創建。這些部件可能包括分子開關、車輪、車軸及邏輯門系統等。Kortemme的實驗室正在設計可納入合成信號轉導級聯的細胞信號分子,以拓展蛋白質設計的應用范圍。Wang強調,在蛋白質的巧妙重組中,人類的聰明才智將發揮關鍵作用。研究人員正致力于制造蛋白質的螺絲、螺栓、杠桿和滑輪等基礎構件,并探索其創新應用。未來,如何巧妙利用這些構件,將決定蛋白質設計的無限可能。

從錯誤中學習

盡管蛋白質設計在預測算法上取得進步,但仍然很難一次就生成準確結果。Steinegger指出,算法驗證與軟件發展存在時間不匹配,導致算法難以從錯誤中吸取教訓。此外,研究人員往往不公布負面結果,限制了有用信息的共享。為解決這些問題,Khmelinskaia強調合作的重要性,認為建立涵蓋多方面技能的團隊是挑戰,但合作能加速研究進展。Yang也表示,計算機資源和數據已就緒,合作將推動領域更快發展。

來源:上海瑋馳儀器有限公司
聯系電話:18521301252
E-mail:xiaojing.su@weichilab.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
主站蜘蛛池模板: 平湖市| 沁源县| 峨边| 错那县| 闽清县| 平度市| 开封市| 藁城市| 米林县| 永福县| 钟山县| 武乡县| 来凤县| 陇西县| 安丘市| 金阳县| 德阳市| 玉门市| 舟山市| 南昌市| 通山县| 昌都县| 都兰县| 赞皇县| 额尔古纳市| 论坛| 肥乡县| 博湖县| 叶城县| 策勒县| 班玛县| 伊吾县| 天柱县| 云林县| 景德镇市| 凤凰县| 吴桥县| 澎湖县| 固镇县| 博湖县| 山阴县|