你能想象,有着“十年、十億美元”定律的製藥行業,有朝一日,會將這兩個數字縮短到“18個月”和“260萬美元”嗎?
這件事情,在AI技術的幫助下,真的實現了。
近日,AI製藥公司英矽智能宣佈,利用人工智能技術發現新機制特發性肺纖維化藥物,這在全球範圍內是一個標誌性的里程碑事件。
英矽智能首席科學官任鋒博士表示,我們通過人工智能發現了治療具有廣泛適應症的創新靶點;同時,通過人工智能產生了全新的小分子化合物,並且一直把這個化合物推到臨牀侯選化合物。
據雷鋒網瞭解,目前,該化合物已經通過了體外測試、體內測試,即將進入臨牀研究階段,目標是今年年底將臨牀候選化合物推向臨牀。
3月2日,啓明創投、創新工場以及英矽智能聯合舉辦了一場線上高端對話 —— 從 “AI+醫療” 到數字醫療:機遇與挑戰。
啓明創投主管合夥人梁頴宇女士、創新工場董事長兼CEO李開復博士、英矽智能創始人兼首席執行官 Alex Zhavoronkov博士、首席科學官任鋒博士共同圍繞英矽智能以及製藥行業的前景進行了討論。
製藥行業的通用性難點新藥研發,是人類發展中最複雜、最具風險和耗時最漫長的技術研究領域之一。
要想發現一種藥物,需要許多生物、化學和醫學方面的高智商和高技能的專家。整個過程需要耗費數十年,數十億美元,且失敗率達90%以上。
2020年,FDA共批准53款新藥上市,其中35種是小分子藥物,這是史上新藥獲批數量最高的一年。
而且這些藥物中的許多都是針對已知分子靶點,發現能夠作用於廣泛適應症新靶點的新分子是極其罕見的。
英矽智能首席科學官任鋒博士表示,製藥行業面臨幾個共同的痛點:
第一,如何找到合適的靶點或者全新的靶點來治療某種疾病
第二,找到靶點之後如何發現或者發明全新的化合物,去針對靶點推向臨牀
第三,如何設計好的臨牀方案去減少臨牀上的不可預測性
藥物研究的低效率問題,主要是由於生物系統的巨大複雜性和人類對自然運作方式的有限理解,這些客觀因素決定了,藥物研發本就是一個壁壘極高的行業。
然而,藥物研發“燒錢”的另一個重要因素,是次優的研發(R&D;)流程。
大型製藥公司複雜而繁瑣的工作流程,以及不同藥物發現過程階段之間的顯著脱節。
在傳統的流程中,生物學研究是由一家公司完成的,而化學研究則是由另一個部門甚至是另一家公司主導進行的,隨後的臨牀研究又是由另一個部門或機構進行的。
英矽智能表示,這些階段的過渡,例如靶點驗證到苗頭化合物發現兩個階段的過渡,很多好的想法、投入的鉅額資金可能就會付諸東流。
AI為什麼能在製藥行業有所作為?
這是因為,現階段的人工智能發展依賴於數據,尤其是高質量的大數據集。而藥物發現過程的每一步都會產生大量數據,這些數據為現代人工智能技術的發展奠定了基礎。
特別是在疾病假設和靶點識別階段。
深度學習模型和自然語言處理技術在建模大型複雜多維數據集,如基因組學、蛋白質組學、臨牀數據、靶點結構數據和非結構化文本(研究論文、專利、科研經費等)方面的作用已經被多數的研究者證明是有用武之地的。
去年12月,DeepMind旗下AlphaFold2破解“蛋白質摺疊預測”問題,可以算得上是“AI+新藥”最大的新聞。
這個困擾生物學界50多年的重大難題正被AI破解,AlphaFold 的突破 “將改變一切”。
因此,從去年開始,多家AI製藥公司相繼獲得規模不小的融資,其技術也被很多製藥和生物技術公司廣泛採用,用於虛擬篩選或數據分析等特定任務。
然而,在線上對話環節中,李開復也表示,“AlphaFold在非常難的蛋白摺疊問題上做出超越人的能力。但是,坦誠地説,那是在單點上超越人。新藥研發的總體過程仍然是一系列連接不佳的各個階段,沒有一個整體有效的從錯誤中學習的反向傳播元素。”
他提及的正是此前提到的研發流程“脱節”問題。
李開復補充到,“只有將人工智能用於藥物發現各個階段,並搭建一個從假説到臨牀前和臨牀階段的一體化的系統,才能實現真正的顛覆性轉變。”
英矽智能的AI故事回到這次英矽智能的成果。
在病種的選擇上,英矽智能的切入點比較好:特發性肺纖維化(IPF)。這是一種廣泛的疾病,僅限於肺部,好發於中老年人羣。隨着病情的發展,患者的健康逐漸惡化,可能危及生命。
目前來講,針對特發性肺纖維化的治療手段非常有限,目前的藥物有吡非尼酮和尼達尼布。
在用藥第一年,這兩個化合物可以減緩用力肺活量的降低,但是對於血氧飽和度沒有明顯的改善,藥物有明顯的缺陷。
儘管如此,這兩個藥物在2019年的銷售額也達到了30多億美元。
從2016年開始,英矽智能在藥物設計方面研究出生成式對抗網絡(GAN)技術。
從實現的過程來看,英矽智能利用深度神經網絡基於年齡和不同類型的纖維化進行訓練,發現了一個新的生物靶點,並生成了能夠作用於特發性肺纖維化 (IPF)這一非常難治疾病的一個新的小分子。
據雷鋒網瞭解,英矽智能的人工智能系統,包括生物問題解決引擎PandaOmics和化合物生成引擎Chemistry42。
這兩個系統進行相應的配合,集成了數百個人工智能模型,每個模型負責一項特定的任務。
利用PandaOmics發現了一個新的能夠作用於廣泛適應症的靶點,Chemistry42平台利用這個新發現的靶點作為基礎,設計了一類新型的小分子抑制劑。
此外,AI平台上還包括了一個臨牀試驗結果預測引擎 InClinico,用於預測臨牀研究的成功率、指導正確的臨牀研究方案。
為了成功獲取臨牀前候選藥物,Insilico設計併合成了不超過80個分子,其中有幾個分子達到臨牀前候選化合物的水平,這是迄今為止取得的前所未有的命中率。
並且,整個研發過程僅耗費短短18個月,研發成本相當於類似項目的十分之一。
這樣的成果,已經相當驚人。
事實上,早在兩年前,英矽智能的AI技術就已經展現出了非常大的潛力。
雷鋒網瞭解到,2018年,英矽智能發表了一項研究,公開了首個採用Entangled Conditional Autoencoder (ECAAE) 糾纏條件式自動編碼器生成的JAK3抑制劑,並進行了實驗驗證。
彼時,英矽智能的引擎已經可以為G蛋白偶聯受體和其他靶點類別實現合理的命中率。
2019年,英矽智能在短短21天內預測了一個眾所周知的纖維化疾病靶點分子,併成功地在體外和體內驗證了預測。
研究結果發表在了《自然-生物技術》雜誌上,並獲得資深新藥發現專家和科研人員的反饋。
AI製藥的中國式創新2019年,英矽智能完成了3700萬美元的B輪融資,由啓明創投領投,跟投方包括斯道資本、F-Prime Capital、禮來亞洲基金、創新工場、百度風投、蘭亭投資、BOLD Capital Partners等其他投資方(包括A輪投資方)。
自成立以來,Insilico Medicine已經發表了150多篇論文,並在100多場會議上公開分享多項成果。
成立之初,英矽智能也曾遭到過質疑。
例如,早期的模型用來生成的分子不夠多樣化,或者不容易合成,而且靶點是大眾已熟知的,或者容易通過已知的苗頭化合物優化得到。
不過,在幾年的時間裏,隨着深度學習模型的豐富,這樣的問題正在逐步解決。
在對外合作上,英矽智能也拿下不少大藥企的單子,包括默克、輝瑞、勃林格殷格翰、安斯泰來、強生製藥子公司楊森製藥等。
2020年11月,英矽智能將Chemistry42生成化學AI平台整合到默克集團的高性能計算基礎設施上,以實現快速高效的藥物設計
啓明創投主管合夥人梁頴宇表示,AI在醫療領域第一個大規模的應用是AI+影像,這也得益於AI圖像識別技術發展的成熟。
但是,還有很多AI沒有介入的領域,很多問題更復雜,需要更長的時間、更系統化的解決方案。而藥物研發領域就是未來的一條黃金賽道。
在梁頴宇看來,中國將成為全球醫藥創新的重要力量,中國將在藥物的原發性創新上成為引領者和推動者。
這也是為什麼,2019年,英矽智能將總部從美國馬里蘭州約翰霍普金斯大學移到香港。
Zhavoronkov表示,未來5年內,中國創新藥企業將迎來一場大爆發,中國會成為世界的醫藥創新中心。
主要原因之一在於:“中國政府正在創造絕佳的環境,要求國內的製藥公司進行創新。”雷鋒網