圖片來源:攝圖網
編者按:本文來自微信公眾號機器之心(ID: almosthuman2014),作者吳昕,創業邦經授權轉載。
十七年前,時任《哈佛商業評論》主編的 Nicholas Carr 在一篇長文中挑戰了資訊科技作為商業戰略武器變得越來越重要的傳統智慧。
他發現,IT 遵循著與鐵路、電力等早期技術極為相似的傳播和演化規律。隨著資訊科技已經開始將自己從潛在的戰略資源變成和水電一樣的商品,它們正在變成所有企業都必須支出的成本,也因此不再具有真正的戰略價值,因為後者靠的是稀缺性。
文章引發的轟動直到今天還音猶在耳。亞馬遜 CTO Werner Vogels 在一次公開採訪中曾讚許該文,IT 不再是公司差異化競爭所在,公司最重要競爭力是為客戶構建與眾不同的能力。只不過,時過境遷,這一次 IT 技術又多了新的成員機器學習。
從最初「基礎款」到 2016 年釋出機器學習服務,AWS 歷經十年,當時釋出的服務也只有三個。最近三年,AWS 更新節奏明顯加快,每年增加的服務和功能超過 200 個。特別是去年,一系列自帶場景有趣產品的釋出表明,機器學習步伐明顯加速。
在 2020 年底的年度 re:Invent 全球大會上,AWS 一口氣帶來 180 項更新。與往年明顯不同的是,其中五項機器學習服務直接用於工業領域,包括 Amazon Monitron、Amazon Lookout for Equipment、AWS Panorama 一體機、AWS Panorama SDK 和 Amazon Lookout for Vision。
這也是 AWS 首次推出的開箱即用的工業領域機器學習解決方案,旨在為有一定資料但技術能力薄弱(缺人、缺錢)中小型製造商,提供逐步採用新技術的機會。
一、為什麼是工業?生命科學與醫療、消費品、科技與媒體,是中國應用 AWS 最多的領域,跨境出海企業中,金融服務、能源科技公司也對上雲有豐富需求,但 AWS 也有足夠的理由開闢工業領域新戰場。
製造業年度資料產生量為各行業之首,每年大概可產生 1,812PB 的資料量,超過通訊、金融、零售等行業。在過去二十年中,製造企業決策過程因數字資訊的大量增長而變得複雜,企業正試圖透過智慧化技術有效地處理和利用資訊,解鎖資料的模式和可用性,解決之前甚至無法預見的問題。
《造有道 智萬物——德勤人工智慧製造業應用調查》顯示,製造業年度資料產生量為各行業之首。
工業界普遍認為,工業人工智慧平臺讓企業以更低的成本應用人工智慧,是人工智慧在工業領域的落地和普及的必要條件。近些年,以製造業為代表的千行百業的客戶需求正在爆發,工業已經成為市場規模增長最快的傳統產業領域。
特別是疫情之後,網際網路雲廠商都在不斷強化工業領域的佈局。
《造有道 智萬物——德勤人工智慧製造業應用調查》顯示,人工智慧被製造業寄予厚望,也是傳統行業中,市場規模增長最快的領域。
在典型場景和 「 Killer App 」上,AWS 和其他網際網路大廠一樣,將自身在機器視覺上多年積累和優勢延伸到質量檢測、預測性維護和工作場所安全等三大工業場景。
《造有道 智萬物——德勤人工智慧製造業應用調查》顯示,AWS 關注的幾個應用場景都位列其中。
一方面,這些場景存在可觀且頗具潛力的市場。
比如,現代製造系統非常精細,故障率通常只有 1% 或更低。但即使很小缺陷也會讓企業付出昂貴代價,小則替換、退款,大則削弱客戶信任。因此,發現並標記那些被遺漏的缺陷仍然非常重要。
半導體、PCB 行業,康耐視、基恩士大都採用傳統的視覺演算法分析方法,基於成熟的模板匹配、灰階等演算法,不僅會有漏項,也需要有許多工人複檢。
無論是必勝客還是達美樂(Domino),保質保量的生產出符合標準的披薩是他們的首要目標,一旦尺寸不合格、配料不齊全或是乳酪含量不達標的披薩流入市場,會給公司帶來巨大損失。
相較於傳統紅外等感測器,機器視覺可以表達更為豐富的資訊,隨著感測器等硬體成本不斷降低,AI 在質量監控和缺陷管理方面的潛力被一致看好。
晶圓上同一部位重複出現劃痕,再綜合感測器資料,可以用於識別相關製程問題或裝置問題。
德勤的一份製造業調查報告顯示,未來兩年內,將有更多人工智慧技術用於產品質量監控和缺陷管理。
《造有道 智萬物——德勤人工智慧製造業應用調查》顯示,在智慧生產領域,目前應用比較多的場景是自動化生產工廠與訂單管理和自動化排程;未來兩年內,將有更多人工智慧技術用於產品質量監控和缺陷管理。
至於預測性維護,製造現場一旦發生故障,常常需要具有 10 年以上經驗的技術員才能解決,故障不解決就會導致大量次品的產生,甚者會造成停產。
較之中國工業的粗放,邁入成熟、追求精益的西方工業體系可能更需要它。裝置維護,實際上是生產系統成本中最重要的因素,但有三分之一的美國製造企業的系統維護是白花錢。
精益管理只能解決可見的問題和浪費,卻無法去預測和管理不可見因素造成的影響,比如效能衰退、精度缺失、易耗件磨損、工藝引數不穩定等。
另一方面,這些場景的技術應用門檻都不低。特別是預測性維護,非常複雜,以至於企業很難實現自身預期。
企業不僅需要僱傭熟練的技術人員和資料科學家從頭構建複雜的解決方案,同時需要針對用例識別和購買正確型別的感測器,並將它們連線至 IoT 閘道器。接下來,公司必須測試監測系統並將資料傳輸到本地或雲上進行處理。只有這樣,資料科學家才能構建機器學習模型來分析資料模式和異常情況,或者在檢測到異常時建立警報系統。
即使一些企業已經為在裝置和必要的基礎設施上安裝感測器用於資料連線、儲存、分析和警報方面進行了大量投資,大部分企業依然缺乏專業知識和人員來構建和完善高階的機器學習模型,無法進行高度準確的預測性維護。
有調查發現,人工智慧專案結果與預期差距較大是全球普遍存在的現象, 91% 的人工智慧專案未能達到企業預期。
《造有道 智萬物——德勤人工智慧製造業應用調查》顯示,91% 的人工智慧專案未能達到企業預期。人工智慧專案結果與預期差距較大是全球普遍存在的現象。落差主要因素包括基礎設施條件制約;資料採集方法及資料質量問題;缺乏工程經驗;以及專案規模過大、過於複雜等。
與亞馬遜這樣的人工智慧頭部公司合作填補能力空白,成為這些傳統企業的主要選擇之一。
《造有道 智萬物——德勤人工智慧製造業應用調查》顯示,藉助合作伙伴的力量(比如諸如亞馬遜這樣的頭部公司)填補能力空白,成為這些製造企業的主要選擇。
其實,Nicholas Carr 早在十幾年前就預測過,隨著 IT 變得廣泛可用和成本可控(也就是商品化),該技術為公司帶來差異化(戰略優勢)的潛力就會不可逆轉地節節下降,「親力親為」 只是給企業徒增大量無意義的重複性工作。而諸如 AWS 這樣的技術供應商會進入一場爭奪規模的戰爭,將自己變成實質上的公共承運人一樣的角色。
二、 簡單易用:30 張圖片即可訓練模型發現缺陷傳統方式主要有兩種,一個是人類檢查,另一個是機器視覺系統。比如,檢測乳酪在比薩表面上的適當覆蓋,系統雖然可以很好滿足最初檢查要求,但當檢測的物件是一款多澆頭新產品時就會手足無措。
系統不夠聰明也不會學習,使用者也往往缺乏針對特定環境微調系統的專業知識,如果聘請外部專家,對方還要花好幾個月瞭解公司環境才能制定規則。無論是必勝客還是達美樂 (Domino) 都在嘗試 AI 檢測披薩是否達標。
如果冷凍披薩製造商 Dafgards 也想自己做,需要僱傭數個計算機視覺方面的專業人員,然後開發、訓練並部署相應的模型,至少花費數月才能完成這項工作。現在,Dafgards 只需將 30 個合格披薩餅產品的影象輸入 AWS 提供的基礎模型,就能獲得一個可以快速、準確判斷披薩餅是否合格的機器學習模型。
Amazon Lookout for Vision 可自動執行並擴充套件對多種產品型別的檢查,例如帶有蔬菜的乳酪比薩。在擴大新產品質量保證同時,也將對運營影響降到最低。
作為一種異常檢測解決方案,Amazon Lookout for Vision 利用機器學習每小時處理數千張影象以發現製造缺陷和異常,無需使用者具備任何機器學習經驗。
製造商僅需將影象傳送給系統,就可以得到識別缺陷的模型,包括機器部件的裂紋,面板上的凹痕,不規則形狀(比如披薩是否夠圓)或不正確的產品顏色。
讓人驚歎的是,使用者僅需提供少量影象就可以獲取 Lookout for Vision 學習功能。比如,少至 30 張影象,包括 10 張缺陷或異常影象,加上 20 張「正常」影象。
這套系統不僅可以用於質檢,還可以用於預測性維護。
儘管在為影片開發機器學習技術方面,電商平臺出身的亞馬遜可謂經驗豐富,但亞馬遜工程師仍然連續用了兩個「Many」來形容開發期間遇到的困難。
與缺陷率在 0.1% 範圍內的客戶合作,必須找到關鍵缺陷,這本身就對資料收集提出重大挑戰。開發系統所用的資料不僅要考慮異常型別,還要考慮發現的異常分佈。更何況在模型上訓練的樣本缺陷並不符合車間的實際情況。
為此,工程師們乾脆在印度建了一家模擬工廠。採購傳送帶、攝像頭以及各種各樣的物體,模擬各種製造環境。建立包含正常影象和物件的資料集,繪製或建立合成異常資料集,比如缺失元件、劃痕、變色和其他效果。
他們配備了不同質量和價位攝像頭,這樣就可以嘗試複製實際工廠裡傳送帶的多種變化。比如,改變傳送帶的紋理或顏色。他們還試圖解決或監控照明條件、與物體的距離、固定位置攝像頭等問題。
從 5 到 10 個訓練資料集開始,工程師會與科學團隊一起評估反饋,判斷哪些內容有用,哪些沒用。連少樣本學習也被派上用場,偶爾在完全沒有缺陷影象的情況下,他們也能工作。
現在,Lookout for Vision 可以用正常影象進行訓練,由此產生的模型可藉由「試驗檢測」功能來擴充套件訓練集,進而用於挖掘未標記影象集合中的異常。
不過,打磨技術並不是降低門檻的全部內容。為協助製造業順利享受新技術,AWS 提供了完整的解決方案,裡面包含了「物」與「雲」,可讓移動端輕易且安全地與雲服務互動。
比如,面向沒有建立感測器網路的客戶,AWS 推出了 Amazon Monitron ,一套端到端系統。
不僅提供了用於捕獲振動和溫度資料的 IoT 感測器(可以安裝在諸如軸承、電機、泵、傳送帶各種工業和製造領域的旋轉裝置上)、用於將資料聚合和傳輸到 AWS 的閘道器,還包括用於檢測異常裝置模式並在數分鐘內提供結果的機器學習雲服務,無需客戶具備任何機器學習或雲經驗。
安裝也很容易,使用者只要在安卓手機上安裝相應應用程式,就可以透過藍芽設定 Monitron 閘道器,並以 NFC 配對感測器,幾分鐘內完成安裝,開始監控。
對於已經擁有感測器但不希望自己構建機器學習模型的客戶,他們可以訂閱 Amazon Lookout for Equipmen 服務。
客戶可以將感測器資料傳送到 AWS,由 AWS 為其構建模型並返回預測結果,從而檢測異常裝置行為。由此,製造企業可以輕量地擁有先進的預測性維護解決方案。
比如,GS EPS 是一家在能源,零售,建築和服務領域處於領先地位的韓國工業集團。十多年來,公司一直在跨資產生成資料,但僅使用基於物理和基於規則的方法來獲得對資料洞見。有了 Amazon Lookout for Equipment,即使工廠運營團隊沒有機器學習專業知識,也能在裝置上構建模型。
三、簡單易用:擴圈工業領域開發者談及 AWS 在工業領域的競爭力,僅停留在頂層工具集合(SaaS)是不夠的。網際網路雲廠商更大可能性在於提供工業級的 PaaS 平臺。
其實,與大部分單點突破的創業公司不同,AWS 一開始就是「先做全,再演化得更好」,要給客戶最完整的選擇,也更願意把功夫花在不同產品體系間的協調上。
「 AWS 顯然是一種 PaaS,或者至少具有 PaaS 服務。」幾年前, Werner Vogels 在接受外媒採訪時曾說道,儘管他可能更喜歡「無伺服器應用程式」這樣的表述。
對於那些具有一定技術實力的機器學習使用者(比如機器學習愛好者、開發者),AWS 也提供了趁手的兵器。
比如工具集的中間層,面向那些技術能力較強的客戶,他們有大量的資料可以進行機器學習模型訓練,有一定的演算法人才,不要花精力管理基礎設施,專注於自己的應用和業務創新。
其中 ,SageMaker 讓人印象最為深刻,也是首個為整個機器學習開發的生命週期提供完全託管的平臺,支援快速構建、訓練和部署機器學習模型。為了保持平臺與時俱進,SageMaker 不斷在新資料上接受訓練,擴充套件其識別物件、場景和活動的能力,從而提高準確識別的能力,使用者可以「坐享其成」。
SageMaker 也可以有效貼近工業的實際需求,降低演算法實施過程中開發、環境、運維對工程師的依賴。
比如,中科創達已經將 Amazon SageMaker 整合到智慧工業 ADC (Automatic Defect Classification) 系統, 讓製造業客戶可以在工業生產中輕鬆獲得 AI 質檢能力。SageMaker 的彈性 Notebook、實驗管理、自動模型建立、模型除錯分析,以及模型概念漂移檢測等強大特性,大大加速了質檢落地程序。
就剛推出的新服務而言,工業客戶不僅可以使用 Amazon SageMaker 開發計算機視覺模型,將其部署到 Panorama Appliance 以在影片源上執行該模型,還可以在 Amazon SageMaker 中訓練自己的模型,並將其一鍵部署到使用 AWS Panorama SDK 構建的攝像頭上。
為了將機器學習甚至是大型深度學習帶給更多的使用者,SageMaker 將能夠自動分解大型神經網路的各個部分,並將這些部分分佈在多臺計算機上。有了這種模型並行性,以前需要專門的研究實驗室花費數週的時間並手動調整培訓程式碼,現在只需幾個小時。
在工具集底層,面向那些技術能力超強的客戶,希望將人工智慧和機器學習作為自己的核心競爭力。AWS 不僅支援主流的機器學習框架,客戶還可以透過容器部署的方式,自帶機器學習框架;除了基於英偉達、英特爾、AMD、賽靈思等晶片廠商的最新處理器的強大算力,同時還透過自主設計的處理器,極大地降低機器學習的算力成本。
除了雲服務內容,在雲計算部署模型上,AWS 也考慮到了製造業使用者希望在本地也能用上雲工具,享受同等便利。
事實上,製造支援系統也要求一些工作負載需要在本地,有些應用對網路延遲非常敏感,需要接近本地資產。
比如,某個高吞吐量的生產線上出現質量問題,客戶希望立即得到預警,問題存在時間越長,解決問題成本越高;一些工業設施通常位於偏遠地方,網路連線很慢、昂貴或完全不存在。
對於客戶來說,實時進行影片監控,不僅操作難度高、易出錯並且成本高,有些客戶希望使用具有足夠處理能力的智慧相機來執行實時監控模型,卻很難達到高準確性、低延遲的效能。大多數客戶最終會執行一些簡單的模型,卻無法程式設計為可以整合到工業機器中的自定義程式碼。
過去,AWS 已經構建 Direct Connect 和 Virtual Private Cloud,以及可在本地和雲中執行的工具,例如 CodeDeploy,儲存閘道器以及身份和訪問管理。
今年釋出了 AWS Panorama Applicance 將機器學習能力擴充套件到邊緣,幫助客戶在沒有網路連線的情況下在本地進行預測。每個 AWS Panorama Appliance 都可在多個攝像頭資料流上並行執行計算機視覺模型,從而使諸如質量控制、零件識別和工作場所安全的用例成為可能。
AWS Panorama 開發套件可以幫助公司將機器視覺帶入本地攝像機,在更低成本裝置上構建更復雜模型,從而以高精度和低延遲在本地進行預測。
今年 AWS 還發布了 Amazon SageMaker Edge Manager 幫助開發人員最佳化、保護、監控和維護部署在邊緣裝置叢集上的機器學習模型。
四、簡單易用、價效比高行為至此,關鍵詞「 簡單易用」只是 AWS 在工業領域核心競爭力的一半,當與「價效比高」合為一體才能勾勒出 AWS 在工業領域核心競爭力的全貌。
「透過重塑企業購買算力的方式,AWS 成為了一家規模非常大的企業。」最近,亞馬遜 CEO 貝索斯在談及競爭時說道。而 Werner Vogels 曾在採訪中將 AWS 的成功秘訣歸結為「重新書寫經濟模式」。
無需提前付費、「用多少服務給多少錢」這些都非常關鍵,從根本上改變 IT 行業,大大降低製造業企業使用網際網路服務的門檻,讓企業更專注構建於自己獨特的能力。BP、德勤、Fender 芬達、GE 醫療和西門子交通、格蘭仕等企業陸續出現在 AWS 朋友圈。
事實上,不斷幫助客戶省錢的精神也已經貫徹到了 AWS 的產品演進路線層面。
AWS 為每個開發人員提供最具成本效益的雲基礎架構,無論開發人員選擇哪種 CPU,GPU 或 AI 框架;
經過十幾年的迭代,最基礎的 S3 物件儲存產品已經演進出 6 種適用於不同場景的產品,從高頻訪問到低頻訪問再到存檔場景,對應不同的效能要求與不同的價格,不斷精細化合理計費的顆粒度,相比粗放式的單一產品能做到為客戶節省 80% 的綜合成本;
去年推出的 UltraWarm for Amazon ElasticSearch Service 可以幫助客戶在使用 Amazon 託管 ElasticSearch 服務時透過 UltraWarm 服務自動將冷資料從 EBS 挪到 S3(S3 物件儲存的價格大概僅為 EBS 塊儲存的 1/3);
最新推出的資料庫服務 Aurora Serverless v2,可以做到實時擴容,在不到 1 秒的時間內,即可瞬間擴充套件到支援幾十萬個數據處理事務。開發者不需要買大量伺服器來匹配峰值的運算需求,而是按需擴容,可以節省高達 90% 的成本。
也正是在這裡,我們再度看到亞馬遜零售經驗的再現。業務看似無邊,實則內有章法。
2006 年,AWS 問世,作為一項資金和技術密集投入的專案,曾一度持續性虧損。貝索斯堅信這是夢幻產品並在未來多年獲得經濟回報:
和零售一樣,包括伺服器、網路、資料中心、資料庫、資料倉庫等在內的全球性服務支援市場,其規模不受限制。而且 AWS 團隊正努力地讓產品變得更加簡單易用。
和零售打法一樣,初期大手筆資金投入,低價吸引使用者。AWS(以及開源軟體)的出現極大的降低了創業早期嘗試一個新想法的成本,從 2000 年初需要自己購買伺服器並且從頭搭建服務的百萬美元級成本下降了 10 倍。
低利潤率商業模式讓 AWS 在矽谷非常受歡迎,實現高速增長。隨後 AWS 進入亞馬遜最擅長的發展模式,不斷擴大自身業務規模的同時,不斷降低服務價格。亞馬遜曾在不到十年的時間裡 42 次下調雲計算的服務價格,而不斷降低的價格又吸引了更多的客戶,更多的客戶帶來更大的規模效應,透過規模效應又可以進一步降低成本和服務價格,形成良性迴圈。
同樣,如何讓工業應用機器學習更簡單、更便宜也將推動著 AWS 服務的規模化,規模效應又進一步降低價格,帶來更大的規模效應。最終,AWS 向下,演化為工業領域的基礎設施;工業企業向上,構建與眾不同的核心競爭力。
本文(含圖片)為合作媒體授權創業邦轉載,不代表創業邦立場,轉載請聯絡原作者。如有任何疑問,請聯絡