來源:【科技日報】
2019年是知識圖譜相關技術飛速發展的一年。這是市場調研機構艾瑞諮詢集團近日發佈的《中國知識圖譜行業研究報告》得出的結論。該報告顯示,2019年涵蓋大數據分析預測、領域知識圖譜及自然語言處理(NLP)應用的大數據智能市場規模約為106.6億元,預計2023年將突破300億元,年複合增長率為30.8%。
確實,知識圖譜概念近年來被人們熟悉,並被應用到各行業和領域中,如百度的“知心”,搜狗的“知立方”, IBM的Watson等。
究竟何謂知識圖譜,它又將如何改變人們的生活?
讓機器去理解這個世界
“從學術角度看,知識圖譜本質上是語義網的知識庫。”人工智能醫療系統研發企業深睿醫療聯合創始人喬昕告訴科技日報記者,“從實際應用角度看,可以簡單地把知識圖譜理解成多關係圖。”他進一步解釋説,知識圖譜是一種對事實的結構化表徵,它由實體、關係和語義描述組成。
業內普遍認為,知識圖譜的概念最先是由谷歌於2012年正式提出,主要用來支撐下一代搜索和在線廣告業務。此後,這項技術迅速火爆,給互聯網語義搜索、智能問答等領域帶來活力,讓人工智能具備認知能力和邏輯能力,進而實現智能分析、智能搜索、人機交互等場景應用,成為互聯網知識驅動的智能應用的基礎設施。知識圖譜與大數據和深度學習一起,成為推動互聯網和人工智能發展的核心驅動力之一。
“當我們進行搜索時,搜索結果右側的聯想就來自於知識圖譜技術的應用。”喬昕介紹説,知識圖譜可以幫助系統依據消費者的習慣和愛好推薦合適的服務。
喬昕介紹道,知識圖譜按覆蓋範圍可分為通用知識圖譜和行業知識圖譜。通用知識圖譜覆蓋融合更多實體,準確度不夠高,主要應用於智能搜索等領域;行業知識圖譜通常依靠特定行業的數據進行構建,對特定行業有重要的意義,“行業知識圖譜需要考慮不同的業務場景和使用人員,所以實體的屬性和數據模式比較豐富”。
“知識對於人工智能的價值在於讓機器具備認知能力,而構建知識圖譜的本質就是讓機器形成認知能力,去理解這個世界。”喬昕説。
關鍵在於滿足業務需求
中國電子學會高級諮詢師凌霞曾撰文分析,隨着人工智能技術的發展與應用,知識圖譜作為關鍵技術之一,已被廣泛應用於很多行業與領域,如智能搜索、智能問答、個性化推薦、人機交互對話系統等領域。
艾瑞諮詢此次發佈的報告顯示,2019年知識圖譜市場中以金融領域和公安領域應用份額佔比最大,金融領域因標準化數據積累豐富,行業認知與直接需求最為明顯等因素,成為數據智能最早落地併產生價值的行業。事實上,業內專家認為,包括醫療在內的多個行業也將是知識圖譜大展身手的領域。
凌霞指出,例如,研發新藥的成本高,週期長,基於這樣的現狀,在歐盟第七框架下的開放藥品平台OpenPhacts項目,利用了來自實驗室的理化數據、各種期刊文獻中的研究成果以及各種開放數據。在醫療行業,還可通過整合大量醫療文獻和書籍以及各種電子病歷來獲取海量高質量的醫療知識,向醫護人員提供輔助臨牀決策。
“目前醫學知識圖譜技術在疾病風險評估、智能輔助診療、醫療質量控制及醫療知識問答等智慧醫療領域都有着很好的發展前景。”喬昕説,例如針對新冠肺炎開發的醫助系統,新冠肺炎知識圖譜可用於計算問句之間的相似度以及輔助解答用户提問。
“雖然醫療是個典型的以異構數據為主的行業,多源異構數據的融合在實際應用場景中確實更復雜,而且涉及到的數據集往往數據質量本身也有問題,相對而言構建知識圖譜也更難一些,但總體來説,目前構建知識圖譜已不存在太大技術上的難題,更重要的是將挖掘更多應用場景,構建出質量更好、更好用的知識圖譜。”喬昕説。
華為雲通用AI服務總經理、語音語義創新Lab主任、首席科學家袁晶則認為,知識圖譜對於企業來説其實只是一個工具,關鍵是要讓知識獲取、知識建模、知識管理來匹配知識應用,最終還是要能滿足具體的業務需求。在他看來,對於企業來講,應用知識圖譜的門檻在於如何高效構建知識圖譜並實現可擴展可更新,或者説需要有一個相對通用的框架,幫助企業快速地發揮業務數據的價值。