「出圈」工業,亞馬遜雲憑什麼?
圖片來源:攝圖網
編者按:本文來自微信公眾號機器之心(ID: almosthuman2014),作者吳昕,創業邦經授權轉載。
十七年前,時任《哈佛商業評論》主編的 Nicholas Carr 在一篇長文中挑戰了信息技術作為商業戰略武器變得越來越重要的傳統智慧。
他發現,IT 遵循着與鐵路、電力等早期技術極為相似的傳播和演化規律。隨着信息技術已經開始將自己從潛在的戰略資源變成和水電一樣的商品,它們正在變成所有企業都必須支出的成本,也因此不再具有真正的戰略價值,因為後者靠的是稀缺性。
文章引發的轟動直到今天還音猶在耳。亞馬遜 CTO Werner Vogels 在一次公開採訪中曾讚許該文,IT 不再是公司差異化競爭所在,公司最重要競爭力是為客户構建與眾不同的能力。只不過,時過境遷,這一次 IT 技術又多了新的成員機器學習。
從最初「基礎款」到 2016 年發佈機器學習服務,AWS 歷經十年,當時發佈的服務也只有三個。最近三年,AWS 更新節奏明顯加快,每年增加的服務和功能超過 200 個。特別是去年,一系列自帶場景有趣產品的發佈表明,機器學習步伐明顯加速。
在 2020 年底的年度 re:Invent 全球大會上,AWS 一口氣帶來 180 項更新。與往年明顯不同的是,其中五項機器學習服務直接用於工業領域,包括 Amazon Monitron、Amazon Lookout for Equipment、AWS Panorama 一體機、AWS Panorama SDK 和 Amazon Lookout for Vision。
這也是 AWS 首次推出的開箱即用的工業領域機器學習解決方案,旨在為有一定數據但技術能力薄弱(缺人、缺錢)中小型製造商,提供逐步採用新技術的機會。
一、為什麼是工業?生命科學與醫療、消費品、科技與媒體,是中國應用 AWS 最多的領域,跨境出海企業中,金融服務、能源科技公司也對上雲有豐富需求,但 AWS 也有足夠的理由開闢工業領域新戰場。
製造業年度數據產生量為各行業之首,每年大概可產生 1,812PB 的數據量,超過通訊、金融、零售等行業。在過去二十年中,製造企業決策過程因數字信息的大量增長而變得複雜,企業正試圖通過智能化技術有效地處理和利用信息,解鎖數據的模式和可用性,解決之前甚至無法預見的問題。
《造有道 智萬物——德勤人工智能製造業應用調查》顯示,製造業年度數據產生量為各行業之首。
工業界普遍認為,工業人工智能平台讓企業以更低的成本應用人工智能,是人工智能在工業領域的落地和普及的必要條件。近些年,以製造業為代表的千行百業的客户需求正在爆發,工業已經成為市場規模增長最快的傳統產業領域。
特別是疫情之後,互聯網雲廠商都在不斷強化工業領域的佈局。
《造有道 智萬物——德勤人工智能製造業應用調查》顯示,人工智能被製造業寄予厚望,也是傳統行業中,市場規模增長最快的領域。
在典型場景和 「 Killer App 」上,AWS 和其他互聯網大廠一樣,將自身在機器視覺上多年積累和優勢延伸到質量檢測、預測性維護和工作場所安全等三大工業場景。
《造有道 智萬物——德勤人工智能製造業應用調查》顯示,AWS 關注的幾個應用場景都位列其中。
一方面,這些場景存在可觀且頗具潛力的市場。
比如,現代製造系統非常精細,故障率通常只有 1% 或更低。但即使很小缺陷也會讓企業付出昂貴代價,小則替換、退款,大則削弱客户信任。因此,發現並標記那些被遺漏的缺陷仍然非常重要。
半導體、PCB 行業,康耐視、基恩士大都採用傳統的視覺算法分析方法,基於成熟的模板匹配、灰階等算法,不僅會有漏項,也需要有許多工人複檢。
無論是必勝客還是達美樂(Domino),保質保量的生產出符合標準的披薩是他們的首要目標,一旦尺寸不合格、配料不齊全或是奶酪含量不達標的披薩流入市場,會給公司帶來巨大損失。
相較於傳統紅外等傳感器,機器視覺可以表達更為豐富的信息,隨着傳感器等硬件成本不斷降低,AI 在質量監控和缺陷管理方面的潛力被一致看好。
晶圓上同一部位重複出現劃痕,再綜合傳感器數據,可以用於識別相關製程問題或設備問題。
德勤的一份製造業調查報告顯示,未來兩年內,將有更多人工智能技術用於產品質量監控和缺陷管理。
《造有道 智萬物——德勤人工智能製造業應用調查》顯示,在智能生產領域,目前應用比較多的場景是自動化生產工廠與訂單管理和自動化排程;未來兩年內,將有更多人工智能技術用於產品質量監控和缺陷管理。
至於預測性維護,製造現場一旦發生故障,常常需要具有 10 年以上經驗的技術員才能解決,故障不解決就會導致大量次品的產生,甚者會造成停產。
較之中國工業的粗放,邁入成熟、追求精益的西方工業體系可能更需要它。設備維護,實際上是生產系統成本中最重要的因素,但有三分之一的美國製造企業的系統維護是白花錢。
精益管理只能解決可見的問題和浪費,卻無法去預測和管理不可見因素造成的影響,比如性能衰退、精度缺失、易耗件磨損、工藝參數不穩定等。
另一方面,這些場景的技術應用門檻都不低。特別是預測性維護,非常複雜,以至於企業很難實現自身預期。
企業不僅需要僱傭熟練的技術人員和數據科學家從頭構建複雜的解決方案,同時需要針對用例識別和購買正確類型的傳感器,並將它們連接至 IoT 網關。接下來,公司必須測試監測系統並將數據傳輸到本地或雲上進行處理。只有這樣,數據科學家才能構建機器學習模型來分析數據模式和異常情況,或者在檢測到異常時創建警報系統。
即使一些企業已經為在設備和必要的基礎設施上安裝傳感器用於數據連接、存儲、分析和警報方面進行了大量投資,大部分企業依然缺乏專業知識和人員來構建和完善高級的機器學習模型,無法進行高度準確的預測性維護。
有調查發現,人工智能項目結果與預期差距較大是全球普遍存在的現象, 91% 的人工智能項目未能達到企業預期。
《造有道 智萬物——德勤人工智能製造業應用調查》顯示,91% 的人工智能項目未能達到企業預期。人工智能項目結果與預期差距較大是全球普遍存在的現象。落差主要因素包括基礎設施條件制約;數據採集方法及數據質量問題;缺乏工程經驗;以及項目規模過大、過於複雜等。
與亞馬遜這樣的人工智能頭部公司合作填補能力空白,成為這些傳統企業的主要選擇之一。
《造有道 智萬物——德勤人工智能製造業應用調查》顯示,藉助合作伙伴的力量(比如諸如亞馬遜這樣的頭部公司)填補能力空白,成為這些製造企業的主要選擇。
其實,Nicholas Carr 早在十幾年前就預測過,隨着 IT 變得廣泛可用和成本可控(也就是商品化),該技術為公司帶來差異化(戰略優勢)的潛力就會不可逆轉地節節下降,「親力親為」 只是給企業徒增大量無意義的重複性工作。而諸如 AWS 這樣的技術供應商會進入一場爭奪規模的戰爭,將自己變成實質上的公共承運人一樣的角色。
二、 簡單易用:30 張圖片即可訓練模型發現缺陷傳統方式主要有兩種,一個是人類檢查,另一個是機器視覺系統。比如,檢測奶酪在比薩表面上的適當覆蓋,系統雖然可以很好滿足最初檢查要求,但當檢測的對象是一款多澆頭新產品時就會手足無措。
系統不夠聰明也不會學習,用户也往往缺乏針對特定環境微調系統的專業知識,如果聘請外部專家,對方還要花好幾個月瞭解公司環境才能制定規則。無論是必勝客還是達美樂 (Domino) 都在嘗試 AI 檢測披薩是否達標。
如果冷凍披薩製造商 Dafgards 也想自己做,需要僱傭數個計算機視覺方面的專業人員,然後開發、訓練並部署相應的模型,至少花費數月才能完成這項工作。現在,Dafgards 只需將 30 個合格披薩餅產品的圖像輸入 AWS 提供的基礎模型,就能獲得一個可以快速、準確判斷披薩餅是否合格的機器學習模型。
Amazon Lookout for Vision 可自動執行並擴展對多種產品類型的檢查,例如帶有蔬菜的奶酪比薩。在擴大新產品質量保證同時,也將對運營影響降到最低。
作為一種異常檢測解決方案,Amazon Lookout for Vision 利用機器學習每小時處理數千張圖像以發現製造缺陷和異常,無需用户具備任何機器學習經驗。
製造商僅需將圖像發送給系統,就可以得到識別缺陷的模型,包括機器部件的裂紋,面板上的凹痕,不規則形狀(比如披薩是否夠圓)或不正確的產品顏色。
讓人驚歎的是,用户僅需提供少量圖像就可以獲取 Lookout for Vision 學習功能。比如,少至 30 張圖像,包括 10 張缺陷或異常圖像,加上 20 張「正常」圖像。
這套系統不僅可以用於質檢,還可以用於預測性維護。
儘管在為視頻開發機器學習技術方面,電商平台出身的亞馬遜可謂經驗豐富,但亞馬遜工程師仍然連續用了兩個「Many」來形容開發期間遇到的困難。
與缺陷率在 0.1% 範圍內的客户合作,必須找到關鍵缺陷,這本身就對數據收集提出重大挑戰。開發系統所用的數據不僅要考慮異常類型,還要考慮發現的異常分佈。更何況在模型上訓練的樣本缺陷並不符合車間的實際情況。
為此,工程師們乾脆在印度建了一家模擬工廠。採購傳送帶、攝像頭以及各種各樣的物體,模擬各種製造環境。創建包含正常圖像和對象的數據集,繪製或創建合成異常數據集,比如缺失組件、劃痕、變色和其他效果。
他們配備了不同質量和價位攝像頭,這樣就可以嘗試複製實際工廠裏傳送帶的多種變化。比如,改變傳送帶的紋理或顏色。他們還試圖解決或監控照明條件、與物體的距離、固定位置攝像頭等問題。
從 5 到 10 個訓練數據集開始,工程師會與科學團隊一起評估反饋,判斷哪些內容有用,哪些沒用。連少樣本學習也被派上用場,偶爾在完全沒有缺陷圖像的情況下,他們也能工作。
現在,Lookout for Vision 可以用正常圖像進行訓練,由此產生的模型可藉由「試驗檢測」功能來擴展訓練集,進而用於挖掘未標記圖像集合中的異常。
不過,打磨技術並不是降低門檻的全部內容。為協助製造業順利享受新技術,AWS 提供了完整的解決方案,裏面包含了「物」與「雲」,可讓移動端輕易且安全地與雲服務交互。
比如,面向沒有建立傳感器網絡的客户,AWS 推出了 Amazon Monitron ,一套端到端系統。
不僅提供了用於捕獲振動和温度數據的 IoT 傳感器(可以安裝在諸如軸承、電機、泵、傳送帶各種工業和製造領域的旋轉設備上)、用於將數據聚合和傳輸到 AWS 的網關,還包括用於檢測異常設備模式並在數分鐘內提供結果的機器學習雲服務,無需客户具備任何機器學習或雲經驗。
安裝也很容易,用户只要在安卓手機上安裝相應應用程序,就可以透過藍牙設定 Monitron 閘道器,並以 NFC 配對感測器,幾分鐘內完成安裝,開始監控。
對於已經擁有傳感器但不希望自己構建機器學習模型的客户,他們可以訂閲 Amazon Lookout for Equipmen 服務。
客户可以將傳感器數據發送到 AWS,由 AWS 為其構建模型並返回預測結果,從而檢測異常設備行為。由此,製造企業可以輕量地擁有先進的預測性維護解決方案。
比如,GS EPS 是一家在能源,零售,建築和服務領域處於領先地位的韓國工業集團。十多年來,公司一直在跨資產生成數據,但僅使用基於物理和基於規則的方法來獲得對數據洞見。有了 Amazon Lookout for Equipment,即使工廠運營團隊沒有機器學習專業知識,也能在設備上構建模型。
三、簡單易用:擴圈工業領域開發者談及 AWS 在工業領域的競爭力,僅停留在頂層工具集合(SaaS)是不夠的。互聯網雲廠商更大可能性在於提供工業級的 PaaS 平台。
其實,與大部分單點突破的創業公司不同,AWS 一開始就是「先做全,再演化得更好」,要給客户最完整的選擇,也更願意把功夫花在不同產品體系間的協調上。
「 AWS 顯然是一種 PaaS,或者至少具有 PaaS 服務。」幾年前, Werner Vogels 在接受外媒採訪時曾説道,儘管他可能更喜歡「無服務器應用程序」這樣的表述。
對於那些具有一定技術實力的機器學習用户(比如機器學習愛好者、開發者),AWS 也提供了趁手的兵器。
比如工具集的中間層,面向那些技術能力較強的客户,他們有大量的數據可以進行機器學習模型訓練,有一定的算法人才,不要花精力管理基礎設施,專注於自己的應用和業務創新。
其中 ,SageMaker 讓人印象最為深刻,也是首個為整個機器學習開發的生命週期提供完全託管的平台,支持快速構建、訓練和部署機器學習模型。為了保持平台與時俱進,SageMaker 不斷在新數據上接受訓練,擴展其識別對象、場景和活動的能力,從而提高準確識別的能力,用户可以「坐享其成」。
SageMaker 也可以有效貼近工業的實際需求,降低算法實施過程中開發、環境、運維對工程師的依賴。
比如,中科創達已經將 Amazon SageMaker 集成到智慧工業 ADC (Automatic Defect Classification) 系統, 讓製造業客户可以在工業生產中輕鬆獲得 AI 質檢能力。SageMaker 的彈性 Notebook、實驗管理、自動模型創建、模型調試分析,以及模型概念漂移檢測等強大特性,大大加速了質檢落地進程。
就剛推出的新服務而言,工業客户不僅可以使用 Amazon SageMaker 開發計算機視覺模型,將其部署到 Panorama Appliance 以在視頻源上運行該模型,還可以在 Amazon SageMaker 中訓練自己的模型,並將其一鍵部署到使用 AWS Panorama SDK 構建的攝像頭上。
為了將機器學習甚至是大型深度學習帶給更多的用户,SageMaker 將能夠自動分解大型神經網絡的各個部分,並將這些部分分佈在多台計算機上。有了這種模型並行性,以前需要專門的研究實驗室花費數週的時間並手動調整培訓代碼,現在只需幾個小時。
在工具集底層,面向那些技術能力超強的客户,希望將人工智能和機器學習作為自己的核心競爭力。AWS 不僅支持主流的機器學習框架,客户還可以通過容器部署的方式,自帶機器學習框架;除了基於英偉達、英特爾、AMD、賽靈思等芯片廠商的最新處理器的強大算力,同時還通過自主設計的處理器,極大地降低機器學習的算力成本。
除了雲服務內容,在雲計算部署模型上,AWS 也考慮到了製造業用户希望在本地也能用上雲工具,享受同等便利。
事實上,製造支持系統也要求一些工作負載需要在本地,有些應用對網絡延遲非常敏感,需要接近本地資產。
比如,某個高吞吐量的生產線上出現質量問題,客户希望立即得到預警,問題存在時間越長,解決問題成本越高;一些工業設施通常位於偏遠地方,網路連接很慢、昂貴或完全不存在。
對於客户來説,實時進行視頻監控,不僅操作難度高、易出錯並且成本高,有些客户希望使用具有足夠處理能力的智能相機來運行實時監控模型,卻很難達到高準確性、低延遲的性能。大多數客户最終會運行一些簡單的模型,卻無法編程為可以集成到工業機器中的自定義代碼。
過去,AWS 已經構建 Direct Connect 和 Virtual Private Cloud,以及可在本地和雲中運行的工具,例如 CodeDeploy,存儲網關以及身份和訪問管理。
今年發佈了 AWS Panorama Applicance 將機器學習能力擴展到邊緣,幫助客户在沒有網絡連接的情況下在本地進行預測。每個 AWS Panorama Appliance 都可在多個攝像頭數據流上並行運行計算機視覺模型,從而使諸如質量控制、零件識別和工作場所安全的用例成為可能。
AWS Panorama 開發套件可以幫助公司將機器視覺帶入本地攝像機,在更低成本設備上構建更復雜模型,從而以高精度和低延遲在本地進行預測。
今年 AWS 還發布了 Amazon SageMaker Edge Manager 幫助開發人員優化、保護、監控和維護部署在邊緣設備集羣上的機器學習模型。
四、簡單易用、性價比高行為至此,關鍵詞「 簡單易用」只是 AWS 在工業領域核心競爭力的一半,當與「性價比高」合為一體才能勾勒出 AWS 在工業領域核心競爭力的全貌。
「通過重塑企業購買算力的方式,AWS 成為了一家規模非常大的企業。」最近,亞馬遜 CEO 貝索斯在談及競爭時説道。而 Werner Vogels 曾在採訪中將 AWS 的成功秘訣歸結為「重新書寫經濟模式」。
無需提前付費、「用多少服務給多少錢」這些都非常關鍵,從根本上改變 IT 行業,大大降低製造業企業使用互聯網服務的門檻,讓企業更專注構建於自己獨特的能力。BP、德勤、Fender 芬達、GE 醫療和西門子交通、格蘭仕等企業陸續出現在 AWS 朋友圈。
事實上,不斷幫助客户省錢的精神也已經貫徹到了 AWS 的產品演進路線層面。
AWS 為每個開發人員提供最具成本效益的雲基礎架構,無論開發人員選擇哪種 CPU,GPU 或 AI 框架;
經過十幾年的迭代,最基礎的 S3 對象存儲產品已經演進出 6 種適用於不同場景的產品,從高頻訪問到低頻訪問再到存檔場景,對應不同的性能要求與不同的價格,不斷精細化合理計費的顆粒度,相比粗放式的單一產品能做到為客户節省 80% 的綜合成本;
去年推出的 UltraWarm for Amazon ElasticSearch Service 可以幫助客户在使用 Amazon 託管 ElasticSearch 服務時通過 UltraWarm 服務自動將冷數據從 EBS 挪到 S3(S3 對象存儲的價格大概僅為 EBS 塊存儲的 1/3);
最新推出的數據庫服務 Aurora Serverless v2,可以做到實時擴容,在不到 1 秒的時間內,即可瞬間擴展到支持幾十萬個數據處理事務。開發者不需要買大量服務器來匹配峯值的運算需求,而是按需擴容,可以節省高達 90% 的成本。
也正是在這裏,我們再度看到亞馬遜零售經驗的再現。業務看似無邊,實則內有章法。
2006 年,AWS 問世,作為一項資金和技術密集投入的項目,曾一度持續性虧損。貝索斯堅信這是夢幻產品並在未來多年獲得經濟回報:
和零售一樣,包括服務器、網絡、數據中心、數據庫、數據倉庫等在內的全球性服務支持市場,其規模不受限制。而且 AWS 團隊正努力地讓產品變得更加簡單易用。
和零售打法一樣,初期大手筆資金投入,低價吸引用户。AWS(以及開源軟件)的出現極大的降低了創業早期嘗試一個新想法的成本,從 2000 年初需要自己購買服務器並且從頭搭建服務的百萬美元級成本下降了 10 倍。
低利潤率商業模式讓 AWS 在硅谷非常受歡迎,實現高速增長。隨後 AWS 進入亞馬遜最擅長的發展模式,不斷擴大自身業務規模的同時,不斷降低服務價格。亞馬遜曾在不到十年的時間裏 42 次下調雲計算的服務價格,而不斷降低的價格又吸引了更多的客户,更多的客户帶來更大的規模效應,通過規模效應又可以進一步降低成本和服務價格,形成良性循環。
同樣,如何讓工業應用機器學習更簡單、更便宜也將推動着 AWS 服務的規模化,規模效應又進一步降低價格,帶來更大的規模效應。最終,AWS 向下,演化為工業領域的基礎設施;工業企業向上,構建與眾不同的核心競爭力。
本文(含圖片)為合作媒體授權創業邦轉載,不代表創業邦立場,轉載請聯繫原作者。如有任何疑問,請聯繫