楠木軒

專訪合合信息聯合創始人陳青山:“AI+大數據”為現代企業賦能

由 撒宏才 發佈於 科技

撰文丨黃兆琦

編輯丨常亮

如今,名片全能王、掃描全能王、啓信寶已經是不少商務人士必備的手機APP,其實它們都誕生於同一家公司——合合信息。當傳統的手寫或打字錄入信息被“掃一掃”替代,我們的數據採集和處理方式就發生了根本性變革,人工智能開始在文字識別上替代人力。

中國的文字識別技術(OCR)起步較晚,到20世紀80年代才有實質性的進展,落後於西方國家和日本約十年。然而,目前合合信息的產品已經擁有了來自全球的10億用户,其合作企業遍佈海內外地區,在世界OCR技術領域居於領先地位。

此外,合合信息充分發揮在大數據採集和分析方面的優勢,在新冠疫情防控期間快速上線了基於啓信寶的“全國疫情防控物資企業查詢平台”,助力緩解醫療資源供需緊張的局面,實現物資高效對接。

陳青山先生是合合信息聯合創始人,同時也是啓信寶的CEO。此次億歐科創專程訪談陳先生,試圖探究:合合信息為何能在文字識別技術上做到世界領先?在現代企業數字化轉型的過程中,合合信息將扮演什麼樣的角色?

“十倍級”效率提升

名片、票據、身份證、銀行卡、賬單……這些文字憑證在我們日常生活和工作中隨處可見,然而,在數據量爆炸的時代,收集和整理此類碎片化信息毫無疑問是極其困難的,大量勞動力消耗的背後,還隱藏着數據出錯的風險。

近年來,全球數據產生量迅猛增長。預計到2020年,全球數據產生量將達到51ZB,同比增長23%。在2018-2020年期間內,大數據市場整體的收入規模將保持每年約70億美元的增長,預計2020年將達到560億美元。數據信息的高速增長為人工處理信息帶來了困難,也導致勞動力成本不斷上升。

由此可見,以機器智慧替代人力,完成對海量數據的結構化處理是大勢所趨。

文字識別技術在工作場景中的降本增效作用是顯著的。“原來錄一張名片要花上幾分鐘,現在幾秒鐘就可以,這是個數量級的變化,能帶來10倍的好處才能吸引客户。”陳青山先生如此説道。

事實上,合合信息的產品和技術的確能帶來“十倍級”的效率提升。據估算,通過AI文字識別技術代替人工錄入信息,如果一年工作250天來算,大概能節省45萬人每年的工作量。在數據的精準度上,AI技術也毫不遜色。利用文字識別錄入信息準確率可以達到99%,遠高於人工錄入90%的準確率。

合合信息在AI文字識別技術上的優勢成功幫助用户降本增效,其在C端市場推出了名片全能王、掃描全能王、啓信寶等APP,全球用户數已達10億。OCR市場從來不乏參與者,合合信息為何能佔領市場先機?

“對於我們來説,技術產品加上時機是關鍵,但是時機也不是我們主動判斷的事情,它也跟我們的積累有關係。”陳青山認為,合合信息能夠在C端市場取得成功的關鍵因素在於技術和時機。

合合信息的創始團隊都是技術出身,以手寫識別輸入法起家,在安卓、IOS出來之前,就已經開始積累手機APP產品開發經驗,從而建立起技術先發優勢。在合合信息的人才架構中,76%是研發人員,96%是本科及以上學歷,37%是碩士,還有一個博士團隊:負責未來3-5年科技的發展趨勢,確保在技術上的領先性和前瞻性。

在2010-2014年移動互聯網興起之時,合合信息由於早期技術積累深厚,在對產品的理解上更注重手機APP的客户體驗,從而在一些競品中脱穎而出,建立起良好的產品口碑;2014年以後,國家開放企業工商信息查詢,合合信息順勢推出啓信寶,其業務由“名片信息數字化”向“企業信息數字化”拓展。

助力企業數字化轉型

除了定位於C端市場的名片全能王、掃描全能王、啓信寶這幾個知名APP以外,合合信息在B端也擁有了招商銀行、浦發銀行、海通證券、申萬宏源證券等重要客户。那麼,它如何實現由C端向B端市場的擴張?

“對於C端和B端的結合點,我們有底層技術和用户上的協同性。”陳青山先生對此給出了答案。

在技術上,合合信息的C端與B端產品依託的數據採集和結構化的底層技術具有複用性,邊際成本較低。同時,二者的客户也具有相似性,名片全能王的用户以商務人士為主,其所在企業組織很可能就是合合信息的潛在B端客户。技術和用户層面的協同作用有利於合合信息將服務向各企業組織拓展。

合合信息的B端客户以銀行、券商和保險公司為主,其選擇以金融行業作為進軍B端市場的突破點,是因為金融行業本身數據量大,並且整體在數字化能力、意識和進程上都比較領先,能夠更好地與合合信息的產品和服務相匹配。

合合信息的啓信寶涵蓋國內2.1億家企業和組織機構名錄,700多億條實時更新的商業數據。在啓信寶的基礎上,合合信息打造出商業大數據平台,能夠完成金融領域中的智能風控、智能拓展客户、智能合規審查等業務場景。

陳青山向我們闡釋了合合信息在招商銀行的項目案例:“招行大約有15000位一線信貸經理都在使用我們打造的風險防控大數據體系。並且,針對像招商銀行這樣數字化程度較高的金融機構,我們還可以提供基礎平台服務,如機器學習和大數據治理,對它們直接進行AI技術賦能。”

合合信息的大數據平台在招商銀行項目上的成功應用為其進一步拓展客户資源打下了堅實基礎。在隨後的鄭州銀行項目中,合合信息完成了交付模塊、對接技術以及SaaS產品的標準化。

陳青山對其B端產品標準化的過程解釋道:“各個項目模式有它的共性所在,我們將這些業務場景以及具體功能和痛點沉澱到標準化的SaaS產品裏面去,從而能夠複製到其他機構中。”

根據企業規模、業務需求的不同,合合信息可以提供由5-7萬到數百萬的不同配置的產品服務。陳青山先生表示,在券商行業中,70%的遠程開户系統的身份證識別驗證系統都是由合合信息提供的。

此外,合合信息將SaaS產品“化整為零”,提供半定製化的服務,將其功能嵌入到企業原有的系統中去。這樣一來,企業的實施成本大大降低,員工可以不需要適應新的操作系統就能實現工作效率提升。

陳青山認為這種“化整為零”是模式帶來的好處是多方面的:“首先實施週期短,實施成本也低;第二,避免另外上一套系統,節省了內部員工學習的時間;第三,我們的產品嵌入企業系統裏之後,它的功能在需要的時候才出來,不需要的時候就不存在,比較靈活。”

在金融行業積累了一定經驗後,合合信息能夠完成更復雜、更多種類的商業數據處理工作,其B端客户也在向房地產、製造業等領域擴散。針對一些數字化基礎比較差的企業,合合信息還能夠首先幫助它們進行數據清洗和結構化處理,為下一步業務場景智能化升級做好準備。

合合信息基於技術和用户上的協同效應,以金融行業為切入點,實現產品市場由C端向B端延伸,並通過“化整為零”的方式實現了標準化產品推廣。在助力企業數字化轉型方面,合合信息可謂是成效顯著。

讓AI識別“走出去”

商業數據的採集和處理在全球都擁有很大需求,合合信息早在2010年就受到了美國媒體和部分跨國公司關注,比如《華爾街日報》、三星、微軟、黑莓公司。它在國際化佈局上做了怎樣的努力?

在談及國際競爭格局時,陳青山先生對合合信息在東亞市場的競爭力信心十足:“東亞文字一定是我們最厲害。”在中文、日文、韓文的識別上,合合信息都處於全球領先地位。

除了在中國市場擁有億級用户數量以外,合合信息在日本和韓國市場也大顯身手。

陳青山表示:“海外B端客户的要求會更高,我們當初拿下三星這個客户的時候,三星是對橫的、豎的、有陰影的、傾斜的等各種識別難度較高的2000張名片進行識別準確率統計,這樣嚴格的測試更能體現硬碰硬的技術實力。”

在日本,合合信息推出企業版名片全能王,能夠幫助企業集中處理各個分散的名片信息,以適應其精細化管理模式。而在韓國市場,合合信息打敗了俄羅斯競爭對手ABBY,成為了三星手機全線識別類模塊的技術提供商,並持續至今。

在英語和西歐文字上,由於合合信息的識別技術具有很好的複用性,其產品在歐美地區推廣起來並不困難。並且,對於從右往左閲讀的阿拉伯文,合合信息也能克服技術難關,在提高產品的國際化水平上做了充分準備。

目前,合合信息的產品在海內外市場齊頭並進。名片全能王、掃描全能王面向全球發佈,在Google、Apple應用商店上架,全球用户數已超過10億。

在國內市場,華為、小米手機中的識別功能均由合合信息提供,並且名片全能王、掃描全能王在多個品牌手機中成為預裝應用;在海外金融B端市場,合合信息的重要客户有PayPal、瑞士的Swiss RE、印度的ICC Bank等,市場認可度較高。

總結來看,合合信息在C端市場推出名片全能王、掃描全能王、啓信寶等APP,打響了品牌口碑和知名度;在B端市場幫助企業降本增效,向數字化、智能化轉型。此外,合合信息以國際化視野面向全球用户,成功讓中國的文字識別技術走出國門。

通過“AI+大數據”為商業數據和現代企業賦能,這一直是合合信息所堅持的自身定位。未來,它將繼續深耕人工智能與大數據技術,緊密追蹤商業需求,打造出具備全景商業數據的智能世界。