RPA+AI落地,真的難嗎?

RPA+AI落地,真的難嗎?

作者|胡一川 來也科技CTO

RPA(機器人流程自動化)將原本需要人工重複執行的軟件操作交給機器人執行,能夠極大地幫助企業降低成本、提升效率,成為推動企業數字化轉型的利器。

但是,傳統RPA只能實現基於規則的流程自動化,應用場景相對受限。藉助AI之後,RPA機器人則能具備感知和認知能力,將自動化拓展到更復雜的業務流程,產生更大的價值。

不過,RPA AI,這聽起來十分美好,但在實際場景中又該如何落地?

本文會從技術角度對RPA和AI進行分析,並結合來也科技在RPA AI方面的實踐,談談如何破局,並對未來進行展望。

兩種軟件開發範式

本質上來講,RPA和AI屬於兩種截然不同的軟件開發範式。

RPA是基於規則的軟件開發範式,每一行代碼都對應真實場景中的業務邏輯。因此,開發RPA機器人前,首先要梳理清楚業務流程,然後根據業務流程去編寫代碼。

AI則是一種全新的軟件開發範式。在這種範式下,開發者不再需要用代碼去編寫規則,而是用代碼編寫機器學習模型,然後用數據來訓練這個模型,最後軟件基於模型的輸出去完成特定的任務。

簡單的説,RPA開發是給機器明確的指令每一步該做什麼,AI開發是教機器過去是怎麼做的,讓機器去學習並舉一反三。

RPA+AI落地,真的難嗎?

RPA和AI屬於兩種不同的軟件開發範式(左圖:RPA流程的源代碼視圖;右圖:AI訓練神經網絡參數)

開發範式的不同會帶來一系列的後果,這導致RPA AI在實際落地中遇到巨大挑戰。

第一,RPA和AI對開發人員的要求不同。RPA的特點是非侵入、低代碼,讓不懂編程的業務人員也能開發流程。而AI模型的訓練則有較高的門檻,通常需要專業的數據科學家或算法工程師才能完成。由於這類人才的稀缺,導致RPA AI的落地變得很難。

第二,AI的開發週期要比RPA長。RPA強調的是快速落地、快速見效,而AI模型的訓練要經過數據獲取、數據標註、模型訓練、模型部署、模型持續優化等流程。這意味着RPA AI項目的落地週期會大大加長。

第三,AI的使用成本比RPA高。RPA是客户端程序,只要計算機的軟硬件配置和系統環境滿足基本要求,即可運行。AI基於深度神經網絡,對計算、存儲、網絡等都要較高的要求,通常需要運行在GPU服務器上,部署和運維成本不小,這使得RPA AI項目的前期投入大。

以上幾點,都導致RPA AI在實際業務中的落地並沒有想象中的容易。

如何破局

不久前,來也科技發佈了全新的RPA AI平台產品——UiBot Mage,這是專為RPA機器人打造的AI能力平台,以拓寬RPA的使用邊界。

UiBot Mage上線後,將與UiBot家族原有的Creator(創造者)、Worker(勞動者)、Commander(指揮官)三大模塊集結,分別為RPA機器人生產、執行、分配、智能化提供相應的工具和平台。

提供開箱即用的AI能力

既然AI模型依賴數據和訓練,第一種破局的思路就是提前把模型訓練好供RPA使用。這個方案的前提是,我們要知道RPA需要什麼樣的AI能力。

為此,來也科技深入分析了幾十個業務場景中的幾百個業務流程,從中梳理出RPA最需要的AI能力。我們發現,在RPA流程中,最能夠用到AI能力的地方,是對各種非結構化數據的處理。在這些場景中,RPA可以利用文字識別、文本理解等AI能力將非結構化數據進行結構化。

RPA+AI落地,真的難嗎?

文字識別即我們常説的OCR,它可以應用於文檔識別、表格識別、票據識別、卡證識別等垂直場景。UiBot Mage針對每個場景提供若干個開箱即用的模型。例如,票據識別場景下開箱即用的模型覆蓋了增值税專用發票、增值税普通發票、行程單、火車票等20多種票據類型,在卡證識別場景則包括了銀行卡、身份證、護照、營業執照等20多種模型。

此外,UiBot Mage在文本理解方面也提供一系列開箱即用的模型。以信息抽取為例,我們提供的模型支持幾十種常見的實體抽取,包括企業名稱、日期、時間、金額、地址、電話等,能夠應對大多數業務中的信息抽取需求。

以上AI能力的開箱即用還體現在與Creator的無縫集成上。所有AI能力都以自定義命令的形式存在於Creator中,開發者只需通過拖拽和簡單設置就可在RPA流程中使用AI能力。這樣,沒有任何AI經驗的RPA工程師甚至業務人員,都可以享受到AI給RPA帶來的價值。

通過提供開箱即用的AI能力,UiBot Mage可覆蓋到RPA中常見的需要AI能力的場景。但是,對於長尾的、非標準化的場景,開箱即用的模型無法滿足用户的需求,因此我們需要有新的解決方案。

通過預訓練降低訓練成本

2018年底,Google推出BERT,其核心原理是,用海量數據預先訓練一個基於深度神經網絡的語言模型,然後針對特定NLP任務在原網絡的基礎上再次訓練得到一個模型(這個過程叫做Fine-tune),其效果在幾乎所有NLP任務上都明顯優於當時最好的模型。

這個方法叫做預訓練(Pre-training),它給我們的最大啓示在於不同的機器學習任務其底層有相通之處,我們可以用大量任務無關的數據(大數據)事先訓練好一個模型,等到要解決特定任務時,只需要用少量任務相關的數據(小數據)對模型進行微調,即可達到理想的效果。這種方法對訓練數據量的要求更少,數據標註成本更低,訓練時間也更快,最為關鍵的是,在預訓練基礎上訓練的模型比沒有預訓練的模型效果要好。

回到RPA AI場景,前面提到的OCR任務雖然使用不同的模型,其底層確有相通之處。比如,雖然針對不同類型文檔有不同的OCR模型,但我們都可以將其拆分為其字符檢測和字符識別兩部分。因此,我們可以通過大量數據預訓練得到檢測和識別的基礎模型,然後在特定任務上進行Fine-tune,這樣便能在保障模型效果的前提下,大大減少對訓練數據的要求,並降低了模型的訓練成本。

對於NLP任務,預訓練同樣能給我們帶來明顯的收益。前面提到的BERT,屬於預訓練的語言模型,除此之外,我們還可以對詞的表示、句子的表示、篇章的表示等模型進行預訓練。

未來展望

UiBot Mage通過提供開箱即用的模型、預訓練等手段來加速RPA AI的落地,但RPA AI今天仍然在發展早期,未來還有很長的路要走。對於RPA AI的未來發展,以下幾個方向值得我們持續關注和不斷創新。

前面提到,基於深度學習的AI模型對於硬件有較高的要求,其部署過程也比RPA要複雜很多,這無疑增加了RPA AI的落地門檻。未來,軟硬件一體的RPA AI產品或許能夠有效解決這一問題,用户不用擔心硬件的選型、部署和維護,讓RPA AI真正做到“開箱即用”。

此外,邊緣計算能力的提升和普及,使得AI的推理可以從服務端轉移到客户端。由於RPA是運行在客户端的軟件,相比基於服務端的RPA AI方案,基於邊緣計算的RPA AI方案在架構上更加簡單、靈活,其成本也將大幅下降。邊緣計算的RPA AI方案將讓我們真正實現“人人都有一個機器人”。

最後,一個好的AI系統需要“活”的數據來持續更新模型適應環境變化。因此,在RPA AI中如何高效的實現人機協同,形成數據閉環,是一個未來值得研究的重要課題。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 2968 字。

轉載請註明: RPA+AI落地,真的難嗎? - 楠木軒