楠木軒

大名鼎鼎的IBM Watson也要被賣了,人類的AI夢該醒了?

由 勞新忠 釋出於 科技

人類豐滿的AI夢,正在撞上冰冷的現實。

1 月 19 日,據《華爾街日報》援引知情人士報道,IBM 正在考慮出售 Watson Health 業務,可能的方案包括出售給私募股權公司、醫療行業企業或者與一家特殊目的收購公司(SPAC)合併。

Watson Health 部門主要負責將 AI 用於幫助醫院、保險公司和製藥企業處理資料。《華爾街日報》援引知情人士報道,該部門年收入大約為 10 億美元,但目前仍未盈利。

IBM 在 2020 年 4 月迎來了新任 CEO 阿爾溫德·克里希納(Arvind Krishna)。上任後,克里希納著手簡化公司業務線,讓雲計算在市場中變得更加有競爭力。如若 Watson Health 真的被出售,對 IBM 的 AI 業務來說,無疑是一次不小的挫折。

曾想替人類解決腫瘤治療

長久以來,Watson 都是 IBM AI 業務的一塊招牌,也是人類最初充滿野心的AI夢的代表。

2011 年,深度學習方法剛剛被重新定義,仍未掀起新一輪 AI 浪潮。但此時 IBM 的 Watson 就在美國最受歡迎的智力競猜節目《危險邊緣》中,擊敗了該節目歷史上最成功的兩位人類選手。

Watson 在比賽中展現了強大的自然語音理解能力。要贏得比賽,它必須解析大量文字找到線索,然後搜尋大量文字資料庫,以檢索可能的答案。在擊敗兩位人類冠軍後的第二天,IBM 宣佈了 Watson 的新職業目標:一名 AI 醫生。

從邏輯上看,Watson 在競猜節目上展現的能力,似乎可以移植到醫學領域——都是先理解自然語言(患者的電子病歷),然後檢索文字資料庫(治療方案和最新醫學文獻),最終給出答案。這個方案的價值在於,每天有將近 8000 篇醫療文章釋出,醫生一篇篇讀是不可能的,AI 能幫助醫生閱讀最新醫學成果。

2013 年,IBM 更是將研究重心聚焦於腫瘤治療這一最大的、人類尚無法攻克的醫學挑戰上。2015 年,IBM 成立了專門的部門—— Watson Health,可見其當時的決心。IBM 前 CEO 羅睿蘭(Virginia Rometty)曾把 Watson Health 稱之為公司的“登月計劃”。

眾所周知,AI 的基礎是大量訓練資料。為了獲得這些資料,IBM 花費約 40 億美元收購了 4 家醫療領域資料驅動型公司,分別是 Phytel、Explorys、Merge Healthcare 和 Truven Health Analytics。2016 年,成立僅兩年的 Watson Health,員工規模已經達到一萬多人。

在重點發力的腫瘤治療領域, Watson Health 吸引了許多著名合作機構,包括安德森癌症中心、紀念斯隆-凱特琳癌症中心、梅奧醫院、奎斯特診斷公司。2016 年 8 月,Watson Health 還進軍中國,推出“健康中國”生態圈共贏計劃。

聲勢壯大的宣傳、數額龐大的併購、權威機構的合作,IBM 透過一系列舉措讓外界對 Watson Health 的預期提得非常高。畢竟,用最前沿的 AI 技術來解決最困難的醫療問題,這件事情聽上去就非常性感。

不過,後來的發展事與願違。安德森腫瘤中心曾與 IBM 合作,為腫瘤學家建立諮詢工具。該工具利用自然語言處理技術來彙總患者的電子健康記錄,然後匹配資料庫提供治療建議。安德森癌症中心在這個專案上投入了 6200 萬美元,但最終結局卻是雙方在 2017 年 2 月終止了合作關係。

業界開始對 Watson Health 產生懷疑,它自己的問題也接踵而至。2018 年 5 月,美國媒體 The Register 報道,Watson Health 部門要解僱大約 50%-70% 員工,引發了巨大震動。不過後來科技媒體 IEEE Spectrum 的報道指出,被裁員工主要來自收購的三家公司 Phytel、Explorys 和 Truven。大量收購使得公司面臨人員臃腫問題,為裁員埋下了伏筆。

但這些都是表面現象,歸根到底,對 Watson Health 來說致命的問題在於,它的診斷結果不準確。

2018 年 8 月《華爾街日報》報道,沒有任何已發表的研究表明,Watson 提升了患者的治癒率。有十幾位使用過該系統的機構和醫生反饋,其癌症應用收效甚微,某些情況下還會出錯。並且,由於缺乏罕見病例資料,Watson 的更新速度跟不上癌症治療的發展速度。

丹麥一個醫院在一份研究中指出,Watson 給出的診斷方案,與專家給出的僅有 30% 重合度,因此拒絕採購 Watson 系統。德國媒體也曾報道,德國兩家機構在實際應用中發現,Watson 對於那些症狀特殊的病人會開出致命藥物。2018 年 10 月,IBM Watson Health 當時的 CEO Deborah DiSanzo 宣佈離崗。

一切都不可逆轉地指向最終結局,如今終於傳出 IBM 尋求出售 Watson Health 的訊息,失去業界的信心,再丟掉雄厚資金的支援,這個人類最早的AI明星的前景,不再明朗。

AI 夢該醒了?

當前 AI 應用於醫療最普遍的場景是識別醫療影像,比如視網膜眼底影像。而 Watson 所挑戰的是診斷問題,並且還是醫學上難度最大的腫瘤治療領域。在該問題上,Watson Health 面臨著資料和 AI 智慧的雙重挑戰。

在資料獲取層面,大部分醫療資料是非結構化資訊,比如醫生撰寫的病歷和出院總結。雖然 AI 的自然語言理解能力進步飛快,但相比人類依然差很多。圖靈獎得主約書亞·本希奧(Yoshua Bengio)曾表示,在醫學文字文件中,AI 無法理解歧義,也無法找到人類醫生會注意到的細微線索。

另一方面,有些罕見病例的資料往往難以獲取。《中國工業和資訊化》雜誌 2020 年的一篇文章指出,在解析Watson的資料中發現,在罕見病例研究中,本來應該餵給 Watson 大量的真實資料從而找到新的治療手段,由於罕見病例資料的極端匱乏,實際上 Watson 被灌了一堆沒什麼用的假想資料,而並不是真正的病人資料。這種透過假想資料學出來的 AI,準確性可想而知。這就出現了罕見病例中 Watson 的誤診情況。

全球領先的醫學資訊平臺 Medscape 在 2018 年一篇報道指出,Watson 在學習根源上有問題 —— 它並沒有使用足夠的真實病例進行學習,而負責訓練它的人群,僅僅是紀念斯隆-凱特琳癌症中心的腫瘤學家和 IBM 自己的工程師。Watson 大量訓練時間用於掌握上述腫瘤學家設計出的理想化病例和治療方案。它用於訓練的真實病例數量很小,最多的肺癌也僅有 635 例,最少的卵巢癌更是僅有 106 例。

IBM 在資料獲取上曾做過努力,花費 40 億美元收購了 4 家公司,但在資料融合上,IBM 低估了複雜度。上述《中國工業和資訊化》雜誌文章指出,IBM 前員工和前客戶的醫院管理人員說,雖然收購了大量資料,但在融合各種各樣的資料時發現需要花費難以想象的人力物力,還沒開始訓練,就讓人筋疲力盡。在巨大的經濟壓力和暗淡的前景面前,各個合作伙伴只能選擇終止合作,留下一個爛尾樓。

AI 目前的智慧程度,更是難以匹配腫瘤治療的複雜性。AI 的本質是統計學,它所得出的結論侷限於人類訓練員提供的資料,而無法像一個專業醫生一樣,獨立生成新的見解。

也就是說,Watson 只能比人類專家更快地給出相同的診斷結果,而無法治療人類醫生治不了的病。

在巨大的風險面前,醫生只會將 Watson 的診斷結果作為參考,依然會進行大量臨床研究。在 IBM 的宣傳中,Watson 能夠憑藉著強大的計算能力發現人類看不到的模式。但事實證明,AI 的智慧遠未到這個程度。Watson 對醫生的意義,也就大打折扣。

Watson Health 的挫折反映出 AI 應用在診斷上困難重重,但這並不意味著 AI 在醫療領域沒有前景。在影象分析、基因分析和製藥領域,都有不少公司在探索 AI 的應用場景。即使是在診斷領域,IBM 的 Watson 沒做好,也不意味著其他人做不好。至少,後來者可以在 Watson 上學到一些經驗。一名中國AI醫療企業的創始人就對品玩說,無論AI領域創業者,公司還是投資人,都在變得務實,按今天AI與醫療的現狀,與其一上來就瞄準高精尖問題,倒不如先用自己的技術解決一下醫院院長的痛點。這樣自己的公司也能活下去,AI也真的能體現點價值。