隨著合成生物學的快速發展,一場由“干實驗"(數據)與“濕實驗"(實驗)深度融合的革命正在悄然改變蛋白質研發的游戲規則。如何快速、高效、按需地生產目的蛋白質已成為全球科研界與產業界共同關注的焦點。
如今,兩項革命性技術——無細胞蛋白合成(CFPS)與人工智能(AI)正以未有的方式融合,為蛋白質工程和酶設計帶來變革。這種強強聯合不僅極大加速了生物催化劑開發進程,更重新定義了生物制造的可能性邊界。
一、CFPS:為AI量身打造的實驗場
傳統的細胞內表達系統雖已成熟,卻常受限于細胞膜屏障、毒性產物抑制、以及復雜的調控網絡。在此背景下,無細胞蛋白表達(CFPS)以其開放、靈活、快速的獨特優勢,正從實驗室的“小眾利器"躍升為下一代生物制造的核心平臺。CFPS允許研究人員直接操縱反應環境,實時監測蛋白質合成過程,為蛋白質工程研究提供未有的便利,使其天然具備了與AI協同的優勢:
高度可控與模塊化: CFPS的反應組分明確,可以像“搭積木"一樣進行精確配比和調整。這種模塊化設計,為AI算法提供了理想的、低噪聲的變量。
快速迭代: 一次CFPS反應通常在數小時內即可完成,從基因到蛋白表達的周期被極大壓縮。這意味著AI驅動的“設計-構建-測試-學習"(DBTL)循環可以以未有的速度運轉,迅速積累高質量數據。
功能讀出: 開放的體系允許直接向反應液中添加底物、熒光探針或報告分子,實現對蛋白產量、活性甚至折疊狀態的實時、原位檢測,為AI模型提供了豐富且直接的“學習標簽"。

圖1:CFPS 自動化工作流程
二、AI賦能CFPS:智能化設計-構建-測試-學習閉環
以機器學習(ML)和大型語言模型(LLM)為代表的人工智能(AI)與CFPS技術的深度結合,創造了一個高效的設計-構建-測試-學習(Design-Build-Test-Learn, DBTL)工作流程。這一閉環系統極大地加速了蛋白質工程的發展進程。
2.1 機器學習引導的酶工程創新
Grant M Landwehr等人開發了一種機器學習引導的無細胞酶工程平臺,成功實現了對酰胺鍵合成酶McbA的定向進化。研究人員通過無細胞系統快速合成了1216種酶變體,并在10953個獨特反應中評估了它們的底物偏好性。利用這些數據,團隊構建了增強嶺回歸模型,預測能夠高效合成9種小分子藥物的酶變體。
結果顯示,機器學習預測的酶變體相對于母體活性提高了1.6至42倍。這一突破性研究展示了機器學習與CFPS系統結合的強大潛力:機器學習提供預測能力,CFPS系統提供實驗驗證,二者形成良性循環,不斷優化蛋白質設計。

圖2:設計-構建-測試-學習工作流程
2.2 AI模型的創新應用
機器學習(ML)工具改變了蛋白質結構預測、工程和設計,但該方法的成功取決于算法訓練數據的質量。為了獲得高質量的結構或功能數據,通常需要蛋白質純化,傳統的方法耗時耗力。
一項發表在ACS Synth Biol上的文章聚焦于蛋白酶的定向進化,研究人員通過CFPS系統在6小時內快速篩選了48個隨機變體來初步采樣適應度景觀(一種模型),隨后用AI模型預測并測試了32個目標變體。并結合蛋白酶活性檢測,快速評估數百種蛋白酶變異的功能,識別出多個活躍變體,并將蛋白酶的整體適應度提升了4倍。
這意味著,研究人員可以突破“算得出卻做不到"的困境,創造出更多具有特殊功能的蛋白質。這種基于AI模型的蛋白質設計方法,為生物制藥等領域開拓了廣闊的創新空間。

圖3:工作流程
三、協同效應:釋放CFPS未有的應用潛能
AI與CFPS的強強聯合,正在催生一系列應用場景,充分彰顯其“大有可為"的廣闊前景:
抗體發現與優化:在抗體研發領域,傳統方法需要數周甚至數月時間。而通過CFPS技術在短時間內就能表達和分析數百種抗體的抗原特異性結合情況。這一技術大大加速了抗體的發現和表征過程,讓抗體篩選從“蝸牛式"的緩慢進程變成了“火箭式"的快速沖刺。我司的PLD無細胞蛋白合成篩選加速了AI與濕實驗的閉環銜接,實現AI預測與實驗驗證的無縫融合,有效降低抗體開發的試錯成本,提升研發效率。
四、未來展望
隨著CFPS和AI的不斷發展,這一融合領域呈現出幾個明顯趨勢:
一是模型精度不斷提升,從簡單回歸模型向復雜神經網絡演進;
二是自動化程度提高,全流程機器人工作站將進一步減少人工干預;
三是應用范圍擴展,從單一酶優化向復雜生物系統設計發展。
CFPS與AI的融合,正引生物技術領域邁向智能化、自動化的新紀元。這一技術協同不僅解決了傳統蛋白質工程中的瓶頸問題,更開創了生物制造的新范式。隨著技術的不斷成熟和普及,我們有理由相信,這種“AI預測設計+無細胞CFPS實驗驗證"的研發模式將在未來成為生物技術創新的主流路徑之一,為醫藥健康、綠色制造和可持續發展等領域貢獻重要力量。
參考文獻:
Landwehr, Grant M et al. “Accelerated enzyme engineering by machine-learning guided cell-free expression." Nature communications vol. 16,1 865. 20 Jan. 2025, doi:10.1038/s41467-024-55399-0.
Thornton, Ella Lucille et al. “Cell-Free Protein Synthesis as a Method to Rapidly Screen Machine Learning-Generated Protease Variants." ACS synthetic biology vol. 14,5 (2025): 1710-1718. doi:10.1021/acssynbio.5c00062.
微信掃一掃