楠木軒

智能文本研發商再獲深創投領投2.7億:識別率超98% 客户包括深交所等

由 解洪海 發佈於 科技

鉛筆道5月14日訊,“達觀數據”本日宣佈正式完成2.7億元B 輪融資,由深創投領投,軟銀賽富、寬帶旗下基金晨山資本、眾麟資本等跟投。本輪融資將進一步投入到產品技術研發和市場擴張上,逐步完善AI RPA的主要業務。

據天眼查資料,達觀數據成立於2015年,以自然語言處理(NLP)、光學字符識別(OCR)、知識圖譜等AI技術起家,建立了較為完整的文本數據採集、標註、訓練體系——在數據知識層構建知識倉庫和知識圖譜;在數據應用層訓練機器學習模型,並結合業務場景來開發出一系列智能機器人產品。在具體場景上,達觀能夠提供文檔審閲、智能推薦、資料搜索、知識圖譜等多款文本自動化方案,憑藉着這套系統服務了包括招商銀行、中國平安、華為、中國移動等數百家金融、製造、軍工、科技等領域企業和政府機構。

達觀自2018年年初開始研發RPA產品,2019年1月落地1.0版本,推向試點客户。在去年7月推出的NLP RPA OCR的新解決方案中,達觀可以將RPA的應用場景覆蓋面提升80%以上。

首先,達觀數據在底層技術上的各項指標都有長足進步。在這段時間內,達觀可以識別的文檔資料種類有接近10倍的提升,已經覆蓋到了類似物流行業貨單、運單、報關單等種類,在語言方面也能夠支持中英文乃至其他語言的處理。

經歷了多年發展,目前達觀數據的產品在財務、税務、法律等領域應用較多。在財務領域,其產品的識別準確率能夠達到98%以上。

而在RPA方面,達觀於2019年正式推出“達觀智能RPA”,融合語義理解模塊,是“NLP OCR RPA” 一體化的智能化機器人。這與主流RPA產品的不同之處在於,主流RPA產品大多數基於微軟的開源框架研發,而達觀選擇走自研開發框架的路線。

達觀在這段時間重點投入到AI RPA的產品研發中,目前已經迭代至8.0版本,內部集成了眾多AI組件。具體到產品落地上,融合了達觀自研的NLP和OCR模塊的機器人已經能夠進入到較為複雜的場景。

在業務落地層面,達觀數據主要服務於大型企業客户,通常是各行各業的頭部企業。最近一年中,公司在重點領域中拿下了許多標杆客户,如銀聯、人民網、深交所、建行、工行、渣打、匯豐等,累計服務數百家企業,主要分佈於金融、法律、傳媒、電信、製造業、政府等領域。

而關於本輪融資後的計劃,CEO陳運文表示,達觀數據在AI RPA層面將繼續大規模地快速迭代,在公司看好的幾個大行業中持續提升解決方案自動化水平,在客户服務上繼續打磨,維持行業口碑。

團隊方面,目前達觀數據團隊近400人,研發人員佔比過半,另外還有銷售、解決方案專家、市場等人員,在北京、成都、深圳、鄭州等地設有分支機構。核心團隊中,CEO陳運文為復旦大學計算機博士,曾擔任盛大文學首席數據官,騰訊文學高級總監、數據中心負責人,百度核心技術研發工程師,國際計算機學會(ACM)會員、中國計算機學會(CCF)高級會員、在國際頂級學術期刊和會議上發表多篇SCI論文,多次參加ACM國際數據挖掘競賽並獲得冠軍。