醫療行業的AI應用,要避免“垃圾進、垃圾出”
對於人工智能和機器學習在醫療保健行業的價值和未來的看法已經發生了很多改變。這個行業正在蓬勃發展。與在醫療保健市場中不斷髮展的區塊鏈技術一樣,人工智能和機器學習也需要一些短期期望管理。雖然它們的效用和價值會隨着時間的推移不斷提高,但是在現在這個階段,它們還不是解決美國醫療系統中眾多護理和成本交付問題的靈丹妙藥。
筆者不是人工智能程序員,不玩Python,也從來沒有構建過機器學習算法。但是,我在醫療保健領域擁有三十年的實踐經驗,並且在這期間使用過信息技術系統和應用程序,例如從電子病歷(EMR)系統中收集高質量的數據和結果,並且部署基礎分析。除此之外,在IT方面也擁有相當廣泛的背景。
去年,當區塊鏈技術隨意蔓延的時候,我認為在醫療服務中要穩妥地部署區塊鏈技術還需要等上一段時間,這是因為醫療服務交付系統之間還存在着巨大的差異,同時還需要大量的輸入,存在諸多變數。使用/部署區塊鏈技術解決特定問題需要使用共識數據集。通常來説,人工智能技術也是一樣的。這是説人工智能、機器學習和區塊鏈不會在未來的醫療保健行業中發揮作用嗎?當然不是這樣的。我相信這些技術都將發揮重要的作用。
但是,儘管出現了各種強大的IT產品,在短期內,挑戰仍將繼續存在。醫療保健行業需要人工智能、機器學習、區塊鏈和其他尖端技術改進、協調護理服務,降低“系統”成本並減少冗餘,並且幫助確保提供可重複的服務質量。但很少有技術是完美無缺的,絕大多數的技術都需要時間,才能隨着使用範圍和規模的增長不斷髮展成熟。
什麼是人工智能?
首先,簡單闡明一下人工智能的定義。就如同遠程醫療一樣,人們經常將“telehealth”和“telemedicine”兩個詞互換使用,很多人也會將人工智能和機器學習混為一談。事實上,很多組件都屬於人工智能的範疇,包括機器學習。憑藉人工智能,機器可以模仿人類的認知功能。在這種情況下,人工智能包含了機器學習、自然語言處理(NLP)和“推理”。在機器學習技術中,機器沒有明確的指令,但是可以推斷並確定大量數據中的模式。
“推理”是與規則結合在一起的信息存儲,可以用於演繹。NLP是自然人類語言的處理、分析、理解和生成。可以教會機器學習和辨別物體。例如,可以部署編碼來標識不同的葉子,每片葉子都有數據元素區分符,可幫助計算機“學習”葉子的類型。然後,隨着時間的推移,計算機可以把橡樹葉從楓樹葉中挑揀出來。當然,這只是個例子。但是除非你告訴計算機這些物體是什麼以及如何對它們進行定義,否則它對此就一無所知。輸入必須是正確的,而且編寫算法的人必須具備解決手頭潛在問題的相關背景知識(例如橡樹葉和楓葉之間的差異)。
這可能就會是一個麻煩。主題專家(SME)和數據科學家必須通力合作才能描述要解決的問題,明確所需的數據,對算法進行培訓以確保它們的相關性。對計算機糟糕的“訓練”和糟糕的數據輸入會導致糟糕並且/或者是不正確的輸出。
▲ 圖中顯示了這些組件如何在更大的“AI保護傘”下生存
不良的構造是如何呈現自己的呢?一方面,我們最近發現糟糕的數據輸入會導致糟糕的輸出。最近很多機構對新冠肺炎所做的各種預測都非常不準確,高估了感染率和死亡人數。雖然問題不在於人工智能本身,但是肯定是算法、邏輯和數據輸入存在着缺陷,導致了結果出乎意料地不準確。同樣,糟糕或錯誤的輸入和糟糕的算法也會導致糟糕的輸出。
需要強調一下,事實上我相信人工智能將在醫療保健服務中扮演越來越重要的角色;這是時間和必要性的問題。關鍵在於邏輯數據的開發、構建和參數,科學家和主題專家們(例如,臨牀醫生和醫療保健主管)必須清楚地進行溝通。無法清晰描述自身需求和輸入的主題專家們將會導致程序員們朝着錯誤的方向前進,將結構性錯誤代入算法之中,從而有效地阻止機器“學習”正確的響應和輸出。因此,高質量的輸出不僅僅需要建立在正確的算法之上(程序員的工作),還需要正確的輸入為機器賦能,幫助它們“學習”如何提供可行的見解和/或者做出正確的決策。
人工智能在企業內的失誤已經非常嚴重,如果你部署了一個沒有內置所有正確輸入和參數的心臟病人工智能協議,這可能會造成生死攸關的後果。正如我之前提到的那樣,這個問題也在最近的《福布斯》(Forbes.com)文章(《區塊鏈技術可能(最終)會幫助醫療保健行業:但是不要屏住呼吸》,2019年7月刊)中討論到,人工智能混亂是存在的。“在2018年7月,StatNews審查了IBM的內部文件,發現IBM的Watson提供了錯誤的,有時甚至是危險的癌症治療建議。”[i] [ii]
話雖如此,在短期內,小規模的企業用例可能會被證明更加容易實現。例如,在醫療保健行業中,在財務方面面臨下行風險的責任制醫療組織(ACO)可以開啓一個定義明確的項目,專注於病患遷出。定義/要求的輸出可能是量化的ACO財務風險,確定哪些醫生傾向於理所當然地轉診,明確轉診人員的來源和去向。這樣一個特定的用例,具有明確定義的結果/目標,因為具備可操作性。
可以説,在醫療保健行業中,“輸出”比在小部件製造行業中要重要得多。此外, IDC的一項調查顯示,四分之一的公司表示他們實施的人工智能項目中,失敗率接近50% [iii]。
人工智能將推動醫療保健行業的成功
人工智能在醫療保健行業中的使用和價值將會繼續增長。無論是針對疾病狀態、企業收入週期的現金流或者基於價值的護理計劃的預測分析,人工智能都將大有用武之地。
具體來説,人工智能技術在醫療保健行業中增長的成功因素可能包含但不限於以下幾點:
- 合理、定義清晰的業務用例(不要想一口吃成個胖子)
- 業務專家和數據科學家之間清晰溝通預期產出
- 正確、乾淨的數據
- 模型的可擴展性
所以,人工智能在醫療保健行業中的前景可以説一片光明。但是這種技術的應用是一場馬拉松,而不是一場短跑。
注:
[i] 此聲明絕不是要攻擊IBM和Watson,而是想要指出人工智能在醫療保健行業中可能造成的負面影響。
[ii] 在題為《Setting the Record Straight》的博客文章中,IBM回應了一些媒體報道,表示Watson“在將人工智能的益處引入醫療保健行業領域還沒有取得‘長足的’進展”這種説法是不準確的。
[iii] 人工智能全球採用趨勢和策略,IDC,2019年7月