“新基建”中的佼佼者:基於知識圖譜的工業互聯網
你可能或多或少已經在各種演講和文章中看到過知識圖譜(Knowledge Graph)的身影,這一名詞在2018年被Gartner第一次加入新興技術成熟度曲線。正如其名,它是一系列顯示知識發展進程與結構關係的不同的圖形,用可視化的技術,描述知識資源及其載體,挖掘、分析、構建、繪製和顯示知識及它們之間的相互關係。
與數據和表格有所不同,知識圖譜由節點和連接線段組成。很多企業正在其平台和產品中運用這種技術,因此到了2019年,知識圖譜在Gartner成熟度曲線中的位置快速前進,這意味着其正在快速成熟。
由於知識圖譜非常適合分析從非結構化資源中提取的數據,包括隱式的提供結構和內容的元數據,常被用於描述客觀世界中,各種實體或者概念之間的彼此關係。
越來越多的企業將知識圖譜應用在物聯網和工業互聯網領域,他們運用知識圖譜充分挖掘事物背後客觀的隱性關係,將這種隱形關係轉化為可計算數據,並且以可視化的形式展示在人們面前。
知識圖譜讓我們將分析的重點放在了探索各種“關係”上,包括隱性關係。最近,當我邀請走向智能研究院執行院長、工信部CPS發展論壇副秘書長、工業互聯網領域的專家趙敏參與物聯網智庫組織的直播活動時,知識圖譜引起了我們的共同關注。
物聯網是不是隻能把已知要素聯接起來,表達已知的物與物之間的關係?
還是可以把未知關係的物與物也聯接起來?
未知的關係要怎麼聯接,聯起來以後做什麼?
針對這些問題,趙敏以《新基建中的佼佼者:基於知識圖譜的工業互聯網》為題,進行了一次精彩的演講,本文將我在聆聽中的收穫與你分享。
目前絕大多數的工業互聯網平台,聯接了“看得見、摸得着、想得清”的已知工業要素,建立了這些要素之間的數據採集、互可操作、協作控制等關係,形成了全新的工業管理邏輯,創造了巨大的經濟效益。
但這還不夠,如果想要進一步發展,一個未被提及的公式躍然紙上,那就是聯接度。
聯接度=已經聯接的要素/未被聯接的要素
工業互聯網的“第一性原理”,就是要廣泛地聯接各種機器設備和工業系統,由此而實現“聯接-管控-優化-效益”的基本邏輯。
因此,工業互聯網的聯接範圍,從一開始就不侷限於企業邊界之內,而是以跨越企業的“價值鏈”,甚至是以聯接各種企業的“價值網”作為起點,聯接企業內外部要素,特別是在用工業品,向基於雲的新價值體系探索。
這時,聯接度是評價工業互聯網發展的重要指標。
在聯接度的計算公式中,分子是指“可見要素”,包括看得見、摸得着、想得清的工業要素,它們大多數已經實現了聯接;分母是指“不可見要素”,包括看不見、摸不着、想不清的工業要素,以及這些要素之間的隱形關係。
為什麼分析聯接度尤為重要?舉一個現實中的例子。今年2月,媒體報道了一則“山東省司法廳廳長因疫情防控不力被免職”的新聞。乍一看,你可能會好奇,山東司法廳廳長與武漢新冠肺炎的關係是什麼?經過分析與挖掘之後,我們看到了一條清晰的關係路徑:
山東任城的獄警→有武漢親戚→到武漢探親→過程中感染了山東任城獄警→再感染其它幹警→繼續感染在押犯人→造成任城重大疫情→導致省委追責→結果任城監獄長、書記被免職→最終造成山東司法廳長被免職。
這些關係是常人無法全部獲知、並且立即能夠在非常抽象的場景下想得清楚的。就像我們在工業場景中,各種產品與系統越來越複雜,如果出現質量問題或者設備故障,如果關鍵要素及其關係沒有被清晰的記錄、分析和系統化呈現,很難鎖定真實源頭一樣。
“聯接度”是描述工業互聯網的“地基”是否真正牢固的一個評價指標。提高聯接度,可以通過兩種方式:第一是增大分子,聯接更多的工業要素,我們常説的“人、機、料、法、環”,都是可見要素;第二是減少分母,推斷出不可見的工業要素,找到規律並且將其實現聯接,包括各種隱形關係更要分析出來。
這個看似不可能完成的任務,可以藉助知識圖譜來得以實現。
知識圖譜是人工智能的一項重要分支技術,與工業互聯網的結合是一個新的技術發展方向,而人工智能和工業互聯網都被列入了新基建的重點範疇。從今年開始,知識圖譜可能會異軍突起的趨勢愈發明顯。
在工業互聯網領域,知識圖譜的價值在於將“三不”變為“三可”。“三不”和“三可”是指:
過去不可見的要素可見;
過去不可計算的要素可計算;
過去不可聯接的要素可聯接。
這些不可見、不可計算、不可聯接的工業要素,可以分為多種情況,我們分別舉例來説。
1. 已經知曉其存在的要素,但是難以捕捉其關鍵信息,無法進行聯接。
我們知道複雜產品的缺陷一定存在,但是關鍵難題是找不到缺陷在哪裏。例如,宇航器的發射,每次我們並不知道是不是會成功,失敗的概率還是挺高的。這種複雜產品,我們知道其中一定有缺陷,但是不知道是哪個大部件、哪個小零件上的缺陷,最終可能導致發射失敗。
最典型的例子是在1986年,挑戰者號航天飛機剛剛發射就爆炸了,這可以説是人類航天史上最慘痛的事故,里根總統專門下令組織了一個調查委員會,著名的物理學家費曼就是其中的成員。最後他發現事故的原因是一個小小的塑料密封圈,在低温下這個密封圈變形了,由此釀成了事故。
費曼是怎麼發現這個問題的呢?過程挺傳奇的。他的一位同事早上上班,車壞了,自己動手修車,那個車上也有個密封圈,這位同事靈機一動,趕緊給費曼打電話,費曼這才按照這個思路去調查。
不關鍵的缺陷,即使有了也問題不大,但是關鍵的缺陷,就會造成大問題。10,000個環節哪怕有9,999個沒問題,但是碰到一次關鍵缺陷,就很可能導致嚴重事故。除了宇航器,我們身邊的汽車和各種精密設備,都是相似的實例,複雜產品很難準確判斷具體會在哪裏出錯。
2. 已經知曉其存在的要素,可以捕捉到其關鍵信息,但是技術上無法聯接。
有些物理對象,即便捕捉到了關鍵信息,在技術上也無法聯接。最典型的例子是大跨度的懸索橋,柔性很高,相對容易產生振動,而且找不到完全消除振動的好辦法。我們較難判斷它在什麼樣的風速下就發生了振動,顫振、弛振、共振、抖振等,只能一發生振動就停止通行。
比如5月初,廣東虎門大橋發生異常抖動,橋面呈現波浪形湧動。這種懸索橋振動的主要原因是在特定的風環境條件下的橋樑渦振現象,並非橋樑質量問題。
事後調查發現,虎門大橋採用的是流線型的斷面設計,本身的風阻較小,發生渦振的概率也比較小。但由於近期虎門大橋在修吊杆和主纜,橋樑兩邊放置了臨時擋牆(俗稱“水馬”)防止車撞,“水馬”把橋上通風的部分堵住,形成了一堵牆,因而造成了渦振的現象。
在工業現場,很多基礎設施和大型設備包含多種參數,它們的“脾氣”人類並不掌握。
3. 已知、未知要素之間的隱形關係是更為複雜的情況。需要首先確定其隱形關係的存在,然後通過推理和計算找到其關鍵信息,再設法建立聯接。
例如,一袋酸奶出現質量問題,到底是在生產過程中哪個環節出現的問題?我們是極難追溯的,這時很多要素之間的隱形關係需要預先建立。
再舉個例子,一個工廠採購了多台德國知名品牌的立式加工中心,但是其中一台總是出現X軸方向超差的問題,奇怪的是其餘幾台都沒有遇到類似情況,操作員曾經想:難道是遇鬼了?經過長時間的分析,工廠逐一排除了傳動部件鬆動的問題、熱變形的問題,以及X軸本身變形的問題…
最終,一位頗有經驗的專家來診斷才看出原因所在,因為機牀的地基存在問題。操作員將機牀移開之後發現,地面已經塌陷了一個小坑,説明地基的確存在問題,是由於地基的變化引發了機牀的變形。
知曉了這些隱形關係,有助於我們進一步順藤摸瓜,發現那些原本我們並不知道其存在性的工業要素。理清各種要素之間的關係,對研發、生產和管理等環節,有可能會產生巨大的好處和幫助。
03、利用聯接“關係”,撬動深層價值
知識圖譜的重要性在於,它推進了異構數據結構化的過程,讓數據建立聯接關係,為各種算法的介入提供了一個核心支撐。沒有它,很多數據的訪問是鬆散的。
在推進工業智能的過程中,有兩個大的支柱,第一是知識圖譜,其次才是深度學習。現階段我們最應該重視的是知識圖譜,而且很多工業領域的核心企業已經圍繞知識圖譜進行佈局。
在《“中國智造”如何走出與“工業4.0”不同的道路?這家巨頭用知識圖譜給出答案》一文中,我曾經介紹了西門子在這方面的進展。
西門子的物聯網服務事業部就以知識圖譜為抓手,幫助企業推進數字化轉型。西門子認為,如果工業想用好人工智能,無法繞過的路徑是先建立知識圖譜。如果不把前期的語義模型和知識圖譜搭好的話,人工智能很可能只是一個空中樓閣。
基於知識圖譜已經建立的模型,持續的採集和積累數據,才能為後面的數字化和人工智能應用鋪好路。當有了知識圖譜以後,人工智能才有可能實現最後的終極目標,就是所有的設備完全自主、自治。
施耐德電氣則與企業級的知識圖譜平台Stardog合作,構建了智能建築領域的物聯網知識圖譜,打通了建築物管理、居住舒適度調節、電源監控等數據孤島,分析和集成來自無數物聯網傳感器和系統的信息,同時降低了開發者和工程師的工作量,實現最優化的智能建築運營。
國內的初創企業智通科技在2020年初,發佈了全新的知識圖譜產品:通圖Smart.KG,它擁有知識圖譜的構建和全過程的可視化操作能力,幫助企業將數據隱形關係顯性化,殘缺關係完整化,並提供不同場景的圖譜智能化服務,目前已經在食品飲料、紡織、能源等行業取得了一定的應用進展。
知識圖譜的構建思路包括“自下而上”和“自上而下”,分別適合不同的場景。基於知識圖譜已經建立的模型,持續的採集和積累數據,才能為後面的數字化和人工智能應用鋪好路。利用知識圖譜作為數字孿生的基礎,打造一個可持續使用、可持續開發的數字化平台,這才是關鍵。
知識圖譜就像語義世界的百科全書,更確切的説,這是一套物聯網設備可以使用的百科全書,它是一個活着的數字孿生。
預計基於知識圖譜的工業互聯網平台,在今後一段時間將會獲得業界青睞,具有較大的發展動能與應用潛力。