蛋白設計改變藥物研發方式,AI 開啟合成生物新革命
蛋白質是構成生命的基本元件,破解它們的功能是揭開各種生命現象的金鑰匙。然而再複雜的蛋白質也僅由 20 多種氨基酸以不同長度排列組合組成,在幾微秒至幾毫秒內迅速地摺疊成一個特殊的三維結構,不同的結構決定了蛋白質之間迥異的功能。
在生命科學領域,蛋白質結構預測是個令人著迷的話題,吸引了眾多科學家的攻堅,卻也一直面臨著難度大、成本高、進展緩慢的局面,直到迎來了人工智慧的加入,單個蛋白質摺疊這一世紀難題才得到基本解決。這一革命性的進展令 AI 在基礎科學領域掀起了巨大波瀾,此後全球進入了生命科學技術爆發期。
在新冠肺炎疫情大流行的背景下,AI +合成生物學厚積薄發,而 AI 蛋白質設計正異軍突起。近日,人工智慧企業天壤,基於自主研發的 AI 主導的蛋白質設計平臺 TRDesign,從頭設計了新冠病毒刺突蛋白(S 蛋白)結合劑,可以阻止刺突蛋白和人體細胞 ACE2 受體的結合。
ACE2 即血管緊張素轉換酶 2,是新冠病毒(SARS-CoV-2)進入人體細胞所需的受體,在 SARS-CoV-2 入侵細胞的過程中起著至關重要的作用。相較於傳統次突蛋白接合劑開發常採取製備抗體或改造天然 ACE2 的辦法,天壤的設計方法具有迷你蛋白分子量小、熱穩定性高且成本低的優勢,且計算方法更高效,摺疊空間更豐富,能有效覆蓋 ACE2 與新冠病毒刺突蛋白結合的整個介面以應對病毒的各類潛在突變,這在國內尚屬首家。
從全球範圍來看,以 AI 為核心的蛋白質設計已經從技術概念過渡到價值驗證階段,已經有多款以 AI 為主導研發的生物酶、醫藥蛋白進入臨床試驗階段。國內企業的強勢入局,加速了這一領域的技術富集,為強化合成生物技術戰略科技力量打下了堅實基礎。相信在未來幾年內,將有大量的機構和企業湧入該類技術創新的浪潮中。
合成生物學的春天
合成生物學日益成為催生生物經濟的顛覆性力量,逐漸從理論研究轉變為未來的製造正規化。理論上,合成生物學是指透過構建生物功能元件、裝置和系統,對細胞或生命體進行遺傳學設計、改造,使其擁有滿足人類需求的生物功能,甚至創造新的生物系統。微生物可以製造許多目前工業製造產品,因此合成生物學提供了生產香料、紡織品到食物和燃料等幾乎所有人類所需產品的新方法。
合成生物學的發展,有望使供應鏈不再受到原材料供應的限制。企業可以從頭開始,利用細胞設計和製造無限量的產品。例如,0.5 克牛肌肉細胞就可產生多達 44 億磅牛肉,比墨西哥一年的牛肉消費量還多。合成生物學催生了以科學為基礎的初創企業,這些企業正試圖改變傳統的產品和工藝。
美國對合成生物學的佈局比較早,近年來更是連續釋出了多份科技路線圖,在《2021 美國創新與競爭法案》中,合成生物學位列關鍵競爭技術之一。
與此同時,中國正進入合成生物學競爭快車道。5 月 10 日,國家發展改革委印發《“十四五” 生物經濟發展規劃》。在這份檔案中,合成生物學多次受到提及,覆蓋醫療健康、食品消費兩大領域,其中明確要加快推動合成生物學、人造蛋白等產業的發展,促進生物技術與資訊科技深度融合。
全球合成生物學市場大爆發,初創企業蓬勃發展。2020 年全球合成生物學領域的相關企業獲投融資 78 億美元,是 2019 年的 2.5 倍。2021 年第三季度,合成生物學初創企業的投融資為 61 億美元,增幅達 33%。其中,健康和醫藥領域的投融資增長遠超其他領域。
波士頓諮詢集團在 2022 年 2 月發文指出,預計到本世紀末,合成生物將廣泛應用在佔全球產出 1/3 以上的製造業,創造 30 萬億美元的價值。由於實時資料收集、自動化和人工智慧的發展,一些行業可能更容易受到影響。未來五年,健康與美容、醫療器械和電子等行業將面臨合成生物領域競爭對手的挑戰,正如製藥和食品行業已經面臨的挑戰。
近年來,基於深度學習的 AI 演算法快速發展,其在海量資料的持續學習和對未知空間的智慧探索方面的突出能力有效契合了當前合成生物學工程化試錯平臺的需求,在複雜生物特徵的高緯關聯資訊挖掘與生命系統的設計方面呈現出巨大潛力。
以 AI 為主導的從頭設計應用於合成生物學,可以有目的地設計具有特定功能的標準生物元件,代替部分需要在實驗中獲得有效表達和測試的環節,跨越下游實驗最佳化的時間和成本,數以百萬計的潛在有價值的蛋白質無法透過生化方式獲得,現在可以直接透過設計研究,並用於生物醫學和化學、工業、農業、食品、材料學、環境保護等眾多領域,加速應用於合成生物學的工程化落地。
自 2020 年資本市場和技術實現重大突破後,全球已有 10 多家公司成功上市,超過 30 多款 AI 技術參與的候選化合物進入臨床階段。近年來,中國以 AI 為核心的藥物設計產業態勢迅猛,主要集中在分子生成、活性預測、虛擬篩選等領域,大多以提高藥物研發效率為目標,而少數以 AI 為主導的從頭設計公司,將從技術的更底層突破,有望改變藥物根本的研發方式,發展潛力巨大。
蛋白設計開啟新閥門
生命系統極其複雜,包含大量不同的基因和調控元件,而元件之間又以海量不同的組合形成模組、網路,難以精確描述和預測。僅在人體中,就有數以萬億級的細胞相互作用並形成反饋。與之相比,獲取細胞及其相互作用的過程卻十分低效,其中包括大量試驗和糾錯的過程,這給高效設計合成生物系統提出了挑戰。
蛋白設計是一種全新的生命科學技術。蛋白質結構的實驗解析方法存在 “實驗技術要求高、實驗儀器造價高、實驗耗時成本高” 的問題,使得結構資訊的獲取十分困難,大大阻礙了蛋白質工程中對於序列-結構-功能的分析和研發。而運用 AI 技術將使高通量、準確的蛋白質結構資訊的獲取成為現實,大幅加速蛋白質工程設計。
當前蛋白質藥物開發依賴於人類已知功能的天然蛋白質,是龐大的蛋白質空間的極微小子集。透過蛋白設計的方式,能夠為以前無藥可醫的疾病快速創造全新的蛋白質候選藥物,減少藥物研發的偶然性,從根本上改變藥物研發方式。
蛋白質結構的預測和設計均是瞄準蛋白質摺疊這一核心問題的研究,兩者常被作為互逆向命題。國外由生命科學頂級風投 Flagship Pioneering 孵化的 Generate Biomedicines,基於機器學習驅動的 Generative Biology 平臺,研究了百萬量級的蛋白質,學習蛋白質功能密碼,從而快速設計、生成執行目標功能的新型蛋白質療法。並在 2022 年 1 月拿到來自 Amgen 的 5 個訂單,預付款約 5 千萬美元,潛在合約價值超 19 億美元。
除了天壤,目前國內已經湧現出了一些在該領域攻關的企業,比如智峪生科和分子之心。透過純 AI 計算和設計方法,智峪生科可以在短時間內將醫藥中間體的酶從天然底物出發進行了改造和設計。資料顯示,改造後的酶催化活性大約提高了 5-7 倍,熱穩定性也提高了近 30 度。
此前,天壤自主研發了快速、準確度媲美 AlphaFold2 的蛋白質結構預測平臺 TRFold,構建了具有端到端從頭進行蛋白質設計、檢測並進行穩定性、親和力最佳化的蛋白質設計平臺 TRDesign。以 AI 技術為驅動,突破蛋白質設計方法計算複雜粗糙,且需要主側鏈反覆迭代更新的難題。將蛋白質摺疊中學到的序列-結構-功能關聯反向對映,根據目標功能快速生成氨基酸序列,實現更加高效、成功率更高的蛋白質設計,使 “規模化生物製造” 的目標成為可能。
據《Nature》報道,新藥研發的平均成本約為 26 億美元,大約耗費 10 年時間。它包括了漫長的小分子化合物研發階段、三期臨床試驗、以及註冊審批的過程。然而,能夠透過這重重考驗併成功上市的藥物,僅有不到 10%。
天壤創始人兼 CEO 薛貴榮告訴動點科技:“以 AI 為主導的蛋白質設計方式與傳統 AIDD 截然不同。我們已經基於 AI 構建了高效的蛋白質設計平臺。後續,天壤還將建設智慧溼實驗室,以 AI 為核心、依靠實驗資料的反饋來建立自我強化學習的實驗體系,真正超越傳統化學和生物學方法;未來,以規模化的方式加快探索更具有價值的蛋白質和人類疾病的潛在療法。我們相信 AI 有巨大的潛力能夠站在一個更高的視野理解生命、設計生命、拓寬生命的廣度。”
百度風投 CEO 高雪也曾表示,蛋白質藥物設計是生物製藥皇冠上的明珠。AI 在蛋白質結構預測方面的卓越表現,使得基於 AI 的蛋白質藥物從頭設計成為可能。
而分子之心團隊針對 AI 蛋白質預測與設計開展科研攻關和工業應用,並已經打造了一個擁有自主智慧財產權的 AI 大分子最佳化與設計平臺 “MoleculeOS”,運用資料驅動的深度學習方法,幫助生物技術專家快速識別和產生最合適的蛋白質,快速將實驗室研究成果規模化投射到工業級應用。
紅杉中國合夥人楊雲霞表示,利用預測蛋白結構的 AI 演算法,根據靶點結構即可實現從頭設計結合特定位點的全新蛋白,這一突破有望對藥物發現產生顛覆性影響。
隨著新冠病毒變異的不斷升級,重組蛋白藥物也將迎來發展熱潮。未來如果 AI 的從頭設計這種源頭創新能力能夠和 AIDD(AI 輔助藥物研發)以及傳統藥物開發流程有機融合,針對不同特定需求組合應用和最佳化,推進實現規模化生產更多高價值功能的蛋白質藥物和落地轉化,那麼 AI 與合成生物學擦出的美妙火花,將預示著一個高效且低成本的蛋白質研發時代的到來。