Nature丨AI重構(gòu)生命密碼:開(kāi)源基因編輯器OpenCRISPR-1打破專利壟斷
基因編輯技術(shù),特別是以CRISPR-Cas9為核心的體系,徹底改變了生命科學(xué)研究和醫(yī)學(xué)應(yīng)用。然而,依賴天然演化而來(lái)的蛋白質(zhì)(如SpCas9)存在固有局限:功能優(yōu)化空間受限,且復(fù)雜的專利格局阻礙了技術(shù)的廣泛普及。盡管科學(xué)家們嘗試通過(guò)定向進(jìn)化或蛋白質(zhì)工程進(jìn)行改良,但這些傳統(tǒng)方法通常需要精確的機(jī)制認(rèn)知和結(jié)構(gòu)指導(dǎo),成效有限。
近期,人工智能(AI)在蛋白質(zhì)設(shè)計(jì)領(lǐng)域的崛起為解決這些難題提供了全新路徑。2025年7月30日,一項(xiàng)發(fā)表于《Nature》雜志的論文“Design of highly functional genome editorsby modelling CRISPR–Cas sequences”展示了這一方向的巨大潛力。來(lái)自美國(guó)Profluent公司的研究團(tuán)隊(duì),在Ali Madani博士的領(lǐng)導(dǎo)下,成功利用AI大語(yǔ)言模型技術(shù),設(shè)計(jì)并驗(yàn)證了名為OpenCRISPR-1的新型基因編輯器。這項(xiàng)工作標(biāo)志著“人造”基因編輯工具開(kāi)發(fā)的重要里程碑。

核心方法與突破
數(shù)據(jù)驅(qū)動(dòng)的模型訓(xùn)練:研究團(tuán)隊(duì)首先構(gòu)建了一個(gè)龐大的“CRISPR-Cas Atlas”數(shù)據(jù)庫(kù),整合了超過(guò)120萬(wàn)種天然CRISPR-Cas系統(tǒng)操縱子序列。基于此海量數(shù)據(jù),他們對(duì)已有的蛋白質(zhì)生成大語(yǔ)言模型(ProGen2)進(jìn)行了針對(duì)性微調(diào),使其專注于理解和生成具有CRISPR功能的蛋白質(zhì)序列。
創(chuàng)造性的蛋白質(zhì)設(shè)計(jì):利用微調(diào)后的大語(yǔ)言模型,研究者生成了近百萬(wàn)種人工設(shè)計(jì)的、與天然Cas9功能類似的蛋白質(zhì)(稱為“類Cas9”蛋白)。這些設(shè)計(jì)蛋白展現(xiàn)出了驚人的序列多樣性(整體與天然Cas9序列一致性僅約57%),其新穎程度堪比自然進(jìn)化。
結(jié)構(gòu)預(yù)測(cè)與功能潛力:先進(jìn)的結(jié)構(gòu)預(yù)測(cè)工具(如AlphaFold2)分析顯示,超過(guò)80%的人工設(shè)計(jì)蛋白能形成穩(wěn)定的、高置信度的三維結(jié)構(gòu)。關(guān)鍵的是,這些結(jié)構(gòu)普遍保留了Cas9執(zhí)行基因編輯功能的核心結(jié)構(gòu)域(如負(fù)責(zé)切割DNA的HNH和RuvC區(qū)域、識(shí)別靶點(diǎn)的PAM互作域及調(diào)控域),即使部分蛋白序列同源性低于40%。
OpenCRISPR-1脫穎而出:在實(shí)驗(yàn)驗(yàn)證階段,研究者從數(shù)十萬(wàn)種候選設(shè)計(jì)中篩選了數(shù)百種進(jìn)行細(xì)胞功能測(cè)試(主要在HEK293T細(xì)胞中進(jìn)行)。其中,被命名為OpenCRISPR-1的設(shè)計(jì)蛋白表現(xiàn)尤為亮眼:
· 高效精準(zhǔn):在多個(gè)基因組位點(diǎn)上,其編輯效率與廣泛使用的SpCas9相當(dāng),甚至更優(yōu)。
· 脫靶率低:嚴(yán)格的脫靶檢測(cè)(如SITE-Seq)證實(shí),OpenCRISPR-1具有顯著降低的非目標(biāo)編輯活性,意味著更高的特異性。
· 序列獨(dú)特:OpenCRISPR-1由1380個(gè)氨基酸組成,與SpCas9存在超過(guò)400個(gè)氨基酸位點(diǎn)的差異,也與任何已知天然蛋白明顯不同(至少182個(gè)位點(diǎn)不同)。結(jié)構(gòu)預(yù)測(cè)表明,這些差異主要位于蛋白表面或非關(guān)鍵界面。
· 兼容性強(qiáng):研究者成功將OpenCRISPR-1與堿基脫氨酶融合,構(gòu)建出功能性的堿基編輯器,證明了其作為編輯平臺(tái)核心的實(shí)用性。
· 免疫原性低:初步數(shù)據(jù)顯示其可能具有較低的免疫原性風(fēng)險(xiǎn)。
系統(tǒng)級(jí)設(shè)計(jì):研究不僅限于編輯蛋白本身。團(tuán)隊(duì)還利用AI模型設(shè)計(jì)了適配這些新型類Cas9蛋白的引導(dǎo)RNA(sgRNA),其中數(shù)十種設(shè)計(jì)sgRNA的性能超越了標(biāo)準(zhǔn)sgRNA。此外,他們還應(yīng)用類似策略對(duì)堿基編輯器的關(guān)鍵組分——堿基脫氨酶進(jìn)行了成功的設(shè)計(jì)優(yōu)化。
意義與前景
這項(xiàng)研究首次系統(tǒng)性地證明了基于大語(yǔ)言模型的AI設(shè)計(jì),能夠創(chuàng)造出性能可與天然明星蛋白比肩甚至更優(yōu)的全新基因編輯工具。OpenCRISPR-1的成功開(kāi)發(fā)是這一策略的有力例證。
突破專利壁壘:尤為關(guān)鍵的是,研究團(tuán)隊(duì)宣布OpenCRISPR-1將采取免費(fèi)開(kāi)源的方式提供。這為學(xué)術(shù)界和產(chǎn)業(yè)界繞過(guò)現(xiàn)有復(fù)雜的Cas9專利限制,推動(dòng)基因編輯技術(shù)的更廣泛、更自由的應(yīng)用,開(kāi)辟了一條極具吸引力的新路徑。
開(kāi)啟設(shè)計(jì)新時(shí)代:該成果不僅提供了一種強(qiáng)大的新型基因編輯工具,更重要的是確立了一種“全鏈條”的AI蛋白質(zhì)設(shè)計(jì)范式——從核心編輯酶(Cas9類似物)到功能配件(脫氨酶)再到引導(dǎo)元件(sgRNA)均可進(jìn)行人工設(shè)計(jì)和優(yōu)化。這為未來(lái)開(kāi)發(fā)更多樣化、功能更強(qiáng)大的下一代基因編輯技術(shù)奠定了堅(jiān)實(shí)基礎(chǔ)。
結(jié)論
人工智能驅(qū)動(dòng)的蛋白質(zhì)設(shè)計(jì)正以前所未有的速度重塑生物技術(shù)領(lǐng)域。OpenCRISPR-1的問(wèn)世及其開(kāi)源策略,是AI在解決基因編輯關(guān)鍵瓶頸(功能局限和專利障礙)上的重大實(shí)踐成果。它不僅帶來(lái)了一個(gè)高性能的新工具,更打開(kāi)了一扇通向按需設(shè)計(jì)、功能定制化基因編輯系統(tǒng)的大門(mén),預(yù)示著該領(lǐng)域即將迎來(lái)更深遠(yuǎn)的變革。
參考文獻(xiàn)
https://doi.org/10.1038/s41586-025-09298-z
