螞蟻集團的保險 AI 秘密武器丨萬字長文

保險科技的技術含量和應用規模，或許已經與你的想象大不同。從獲客和諮詢開始，到核保，理賠，復購，甚至到用户退保這最後一步，每一環各有其解決之道。

近日，在上海舉行的外灘大會上，螞蟻集團就披露了自己在保險科技領域部署的多項「秘密武器」。

其中，螞蟻集團保險智能產品部總經理方勇以《AI將成為保險降本增效的第一生產力》為主題帶來演講，展示了螞蟻「理賠大腦」的技術應用細節，詳細分享如何在底層數據、算法、知識圖譜三大基礎上針對諮詢、理賠、調查等環節進行優化和效率提升。

在方勇看來，知識圖譜將在保險問答等多個場景發揮更大的承載能力，機器人更多地採用選擇性半開放式的交互。他透露，通過運用視頻面訪小程序，案件時效比較以往提升了35%；在OCR+NLP的加持下，理賠的智能審核使人效比提升了70%以上。

隨後，螞蟻集團保險事業羣CTO陳當陽也上台演講，帶來《智能化用户增長在螞蟻保險的實踐》的分享，講述在拉活促新、退保挽留等多個細分獲客場景下的技術方法論。

陳當陽表示，拉新促活包括了潛客挖掘、新客獲取、二次復購，涵蓋用户整個成長進階的路徑，以及整體用户活躍度的提升。退保挽留則要識別用户心智，去發現退保原因，給予相應權益，以及嘗試召回已流失用户。

為此，螞蟻保險在前端構建了非常完整的一套智能化的投放系統，這個投放系統可以從渠道聯動、權益優選、擇時投放等一系列環節解放一線運營的生產力。

以下為方勇和陳當陽的全場演講，AI金融評論做了不改變原意的編輯如下：

方勇：AI將成為保險降本增效的第一生產力

我分享的基本分兩個階段：降本增效有哪幾個方面，降低成本可以從哪幾方面做，再分享一下我們螞蟻的做法。

獲客成本：從成本角度來説，第一方面，各大保險公司來跟螞蟻交流的時候，都表達獲客很難。大家知道從抖音或其他渠道獲得一個成交用户，都已經要一兩百塊的成本。怎麼降低獲客成本，這部分將由螞蟻集團保險事業羣的首席技術總監當陽同學稍後來跟大家分享。

用户諮詢：有些內容是代理人可以直接解釋的，但有些比較專業。

比如核保，相關內容很細節。像是甲狀腺結節、肝功能指標在什麼情況下可以保？肺部陰影的情況又怎麼處理，這樣的內容普通代理人並不一定能夠直接解釋，需要打電話給各個保險公司的核保人確認。因此，內部需要不少高等級的用户諮詢人員。

理賠材料：傳統方式，如果比較複雜的重大疾病保險，是需要用户到保險公司的櫃枱，把相關的材料交給櫃員。因為材料比較複雜，有些疾病像惡性腫瘤，可能需要提交術中的病理報告才能確診是不是惡性腫瘤。

但是有些症狀類的疾病，比如説雙耳失聰，是損害等級類的，需要事後幾個月的損害鑑定報告才能確定理賠程度。

這樣不同的內容，普通用户不一定搞得清楚。我們系統中識別的憑證數量是107類，這麼多憑證數量對於單一沒有受過培訓的用户來講，非常難分清楚，這就有可能出現用户需要反覆幾次往返醫院和自己家，再到保險公司，然後才能搞明白，我為了這次理賠，到底需要提交多少材料。

這是材料收集的環節，不同保險公司對於不同的種類，比如車險、壽險、重疾險也要設立不同的前台部門承接用户的諮詢和反饋。

現場調查：佔成本很大一部分的，還有重大疾病保險的現場調查。如果各位有做過現場調查就會知道，線下調一個案子成本有多少，基本上兩三千是平均價格。如果是邊遠一點的省份，很可能是四五千、五六千起，因為在那邊沒有駐點。

釐算核賠：這個工作很貴的原因是因為它既需要懂醫學常識的人，又需要懂保險領域專業的人，這樣的人其實在我們整個社會當中，是沒有這麼多的，剛畢業的小朋友還沒有這麼多經驗去承擔這樣的角色。

何為「理賠大腦」？

接下來分享一下我們螞蟻在後面這四個階段有些什麼樣的做法。這是我們第一次在公開的場合去傳播理賠大腦這樣一個概念，這個概念為什麼我們現在才講呢？

因為大家知道，如果從理賠的用户體驗來講，原有的退換貨運費險體驗已經很好，因為所有鏈路數據都在線上，鏈路後端通過智能理賠審核系統，就能夠決定賠和不賠，只有極少量需要提交一下線下拍照的憑證，這是我們最早做理賠的情況。

再後來我們做了贈險的對於C端用户的多付多保，然後做了B端商家的多收多保，門診險這方面的應用也已經做了一些積累。

但對於傳統保險來説，如果最最複雜的重疾險的整個流程沒有走通，我們其實不敢説我們整個理賠的流程都懂。在今天這個時候，我們第一次給大家展示一個全鏈路的理賠大腦，主要包含了三大系統：

第一方面是智能材料收集系統；

第二是智能調查系統，主要管的就是對外部的公估公司對應的管理，以及對於作業回來材料要求的管理；

第三是智能審核系統，支撐這三大系統的是底層數據、算法、知識圖譜。

講到知識圖譜，中間再插一個用户諮詢。我本人10年前就開始做自動機器人的相關產品，我是我們阿里系內第一個智能產品的產品經理，這個產品現在叫阿里小蜜，現在已經越來越發展成在淘寶上對C端進行服務的機器人。對於保險，它更偏專業性。

有三大技術趨勢可以分享：

趨勢一：保險知識問答，會從傳統的Q&A;轉向通過知識圖譜來承載

最開始第一代就是用的Q&A;，不同的知識點可以用同義詞、語義矢量算法，去計算兩個問題之間的相似度，尋找答案。

但是因為同一個知識點可能確實對應於多種不同的用途，問法都不一樣，所以會擴充好多種問法。做完以後發現它的維護量和維護成本非常大，因為你要不斷地蒐集客户想問的不同問題。

還有很大的問題在於，上下文場景關聯比較強的時候，考驗機器人的語義理解能力強不強，多輪對話是個很重要的指標。而恰恰在保險業，你在一個健康告知或病程諮詢的過程中，多輪對話是必不可少的。多輪對話這種能力的語義擴展性在原有的Q&A;上是很難實現的。

所以螞蟻保險在兩年前開始，整個知識體系已經全部遷移到知識圖譜上了，它的好處是所有在知識圖譜裏存儲的內容，都是結構化的數據。

第二個好處是，這個圖譜是人可以檢查的，然後機器又容易處理的，（即AI的可解釋性）。

為什麼要強調這一點？因為在這個領域，很多創業公司，會跟大家講AI的神經算法。但如果仔細研究一下，其實你根本都不知道它最後得出這個結論是怎麼得出來的，就和人腦做判斷的時候一樣，其實叫意識快於你的邏輯，是憑第一感覺出來的印象。

AI神經做法在這種情況下，是黑盒的算法，這對於保險理賠中動輒十幾萬幾十萬的賠付，人不可驗證規則的方式，是極其危險的。但是知識圖譜有一個很大的好處是機器能理解，但是人又能非常容易看懂箇中邏輯。

第三個好處是，整個語義的擴展非常容易。

就像剛才問的甲狀腺能不能保，一年內有沒有做過B超？有沒有對應的檢測報告？是良性還是不良？如果沒有，它怎麼描述這個病症？這個病症有什麼其他描述？……是根據這樣多輪的擴展，就可以得到很明確的答覆。中間的邏輯，普通的業務人員就能檢查。

趨勢二：選擇性半開放式的機器人交互

這在四五年以前，所有機器人的交互形式都是很開放式的。幾年來做得好一點的公司，其實做的對話機器人都是半開放式的，為什麼？對於一個非專業領域的人，闡述問題的時候，如果沒有給予一定的引導，其實是説不清楚的。

而在這種情況下，你會觀察到國外今年年初推出的產品，跟兩年前推出的完全不一樣，仔細看它的理念也有很多應用半交互模式，一開始是全開放的，先定位到一個險種，然後是用選擇性半開放式的方式，這種方式非常高效。

趨勢三：人工客服的兜底

一定要有對應的人工來做客服，恰如其分地介入，整個客户流程才相對完整。

講到這裏，我先給大家演示一下我們線上智能相機到底能做些什麼。我剛才講了，我們沒有前端的受理人員，全部是APP。我們是第一個把很多模型算法前置到了APP端，讓APP在用户手中就能夠實時做一些提示和攔截，提高用户應用性的解決方案。我在市面上好像沒有看過，國際上也沒有對應的解決方案，我們是第一個大規模使用的。

系統已經識別到這張是住院單的首頁；第二張是一個模糊材料的鑑別，我們發現互聯網的報案應用性，會大大激發用户來使用這個服務。會使得我們整個報案材料裏面，原有報案材料的模糊、翻拍、缺失關鍵性憑證，這裏面的佔比非常大。也給後端的整個理賠審核服務帶來極大的壓力。

第三段檢測的是翻拍電腦屏幕的畫面，就看到系統提示了是翻拍畫面，請使用真實文檔來做拍攝。

第四個因為我們的前端相機能夠實時識別107類憑證，所以我剛才講到的，你去報案報的是什麼樣的疾病，就需要對應提供什麼樣的材料。

如果沒有提供，前端報案的時候就會提示你缺少什麼東西，包括有些像出院小結，缺少醫生的簽字，缺少醫院的蓋章，都要提示他補充上來。這樣一來，留到後端審核鏈路上的文檔質量就會比較好。

智能調查

我們主要講兩個東西，一個是作業小程序，所有的外部調查員都必須要使用調查小程序來作業。最主要的工作是，把原來脱離保司管控的線下調查的黑盒，變成一個白盒。

首先需要身份認證，意思是他要作業，要取這個案子調查，要刷臉核實他是本人，取到這個案子。

然後我們還會對他的培訓級別做一定的認證，假如我們更新了一些產品的案例，他沒有去通過對應的培訓和考試，就沒有辦法從業接這個案子。

還有位置信息，我們可以知道他本人有沒有去醫院真正的取對應憑證。

為了安全取證，所有端內拍下來的圖片都是被加密過的。在調查員的手機端，用他的圖庫是看不到所有拍照的照片的，可以保證這些圖片在上傳到我們服務器端以後，在他的圖庫也不存在，離線的情況下也沒有辦法調出來再次查看。

還有結構化回覆，關鍵是把理賠作業的線下作業每一個環節都數據化，這樣理賠人員就知道在不同的任務裏，要取回來什麼材料，填寫什麼內容。後端的任何人員也會看到結構化的回覆，比較容易做回覆篩選和判斷。

第二塊是視頻面訪。原來跟調查員在線下跟用户的面訪過程當中，怎麼確保他們之間沒有講其他的話，或者他的整個過程，有沒有説了不該説的話，有沒有盡到他的調查職責？另外有個很大的問題，被訪人到底是不是被保人。

視頻面訪，首先是身份的核實，通過刷臉核實被保險人，然後再來進行遠程面訪，整個過程會被保留在服務器後台，在這中間雙方説的話都會被系統自動提取成文字，形成一些智能的風險識別。

如果有講到一些疾病，或者是有講到一些以往的病史，就會被系統提示出來。提示出來以後，會提示面訪員，進行進一步的風險挖掘問題。

通過這樣的視頻面訪小程序，我們已經把線下的每一個工作環節都在掌控之中，整個案件的時效比以前提升了35%，是個很大的比例。

智能審核

在我們的展示區，有理賠大腦整個鏈路的展示，但是我到了以後突然發現這個好像有點像買家秀和賣家秀，什麼意思呢？理賠區展示的視頻形式，其實可能只有我們線上真正能力的一半，所以大家如果去那裏看，在走廊上看過，就當作是一個示意就行了，我們實際上的能力比那邊展示的要強得多。

我們通過用户上傳的案件材料，包括調查回來的材料，再加上用户買的保險，或者是參與籤的健康告知的版本，從原始材料中提取關鍵的信息。

大家想想看，傳統的理賠人員，怎麼做這個核賠？無非是先鑑定用户提交的材料，是不是得了這個病，確定真實性以後，然後再去看他得的這個病，以前有沒有既往史，然後再加上他得病確診的時間，是不是在保障的範圍內。

我們通過內置的知識圖譜裏面的疾病庫、健告庫、診療庫，還有醫院庫，再加上原始材料，包括用户提交的，公估公司這邊採回來的。

大家可能對公估公司採回來的案件材料沒有概念，我這邊可以講一個數字：如果是重大疾病的病患，一般住院週期7天左右的病患，公估公司取回來的材料，再加上走訪以前的一些有歷史醫療記錄的材料，總的頁數平均在165頁，我這裏講的是調查員線下調回來的。

但實際上用户提回來的只有10來頁不到一點，存在這樣一個級別的差異。

165頁的材料，讓審核人員怎麼看？後面查找對應到圖片，再上下翻對應的證據，再找到對應的時間，篩選和審核的時間非常長。

我們會把材料全部按照時間順序——因為每份材料都有時間，按照用户的整個就診事件的維度，就一次一次住院的時間維度整理起來，去提示審核人員看看哪些地方會有風險，這樣幾步工作後，整個人效比傳統提升70%以上。

我們做了很多實驗，會發現醫生們寫這些住院病歷的時候，有很多的習慣會寫病人家族史有什麼，有些説疑似什麼東西，後面會打個問號，這種不算確診。

還有一些情況，實際過程中，機器看這段大文本的時候，需要向一定專業的理賠人員一樣，有一定的語義理解能力，能夠看出來。

有些體檢報告，我們看到上面都是打勾的，會出現很多疾病的名稱。如果你把這些東西都圈出來，明顯不是審核人員要看的東西。像這樣的憑據和內容，都是需要機器有識別能力才能夠處理。

陳當陽：智能化用户增長在螞蟻保險的實踐

今天非常榮幸給大家分享螞蟻保險在用户增長方面的實踐。

對保險行業而言，我們是四輪驅動，用户增長、風控、服務和投資。那前面我的同事已經在服務和風控方面給大家做了一些分享，今天我主要想分享的是用户增長。

在互聯網上，在買保險的時候由於缺少線下代理人這種非常重要的觸達用户的渠道，因此在互聯網上如何進行可持續的保險用户增長這很重要。

在互聯網上，目前在用户增長領域碰到幾個問題。

退保率和轉化率問題：退保率之所以高、轉化率之所以低，其實核心是兩個問題引起的：首先對於保險行業而言，C端用户對產品的理解成本遠遠高於其他金融行業的產品。其次，在中國的保險市場當中，C端用户的風險保障意識相對於西方市場而言有一定差距。

舉個問題，在線上保險當中，很大一部分客户沒有辦法區分報銷型的醫療保險和給付型的重型保險。甚至更大比例的人會認為，我只要買了社保其實我就不需要商業保險。

低效運營問題：隨着整體產品結構越來越複雜，隨着用户分羣越來越細化，隨着運營活動的設計越來越精巧，如何解放運營人員的生產力也是非常重要的問題。

在此之上和用户增長緊密相關的兩個主題，一個是拉新和促活，還有一個退保挽留。

所謂拉新和促活，包括潛客的挖掘、新客的獲取，對用户的二次復購，用户的整個成長進階的路徑，以及整體用户活躍度的提升。

退保挽留，包括我們要去識別用户的心智，去發現退保的原因，基於退保的原因給予它相應的權益，最終還要對已經流失的用户進行召回。

為了達成整個拉新促活和退保挽留這個事情，我們在前端構建了非常完整的一套智能化的投放系統，這個投放系統可以從渠道聯動、權益優選、擇時投放等一系列環節解放一線運營的生產力。

同時，為了更好的和行業融合，螞蟻作為一個開放平台，我們還有線上線下相融合的體系，會把一部分線上的流量往線下導。

在整個用户增長過程中，保守用户隱私是我們螞蟻一條紅線，在這個過程中我們嚴格遵守用户的授權，以及在監管合規的框架下去推動相關的工作。

用户增長，首先的事情是用户洞察，我們要知道誰是我們的用户，我們的用户有什麼樣的特徵，以及基於特徵他是如何進階的，還要知道他為什麼購買我們的產品。

因此，我們除了去分析用户的基本屬性，還會分析用户相關的行為序列，基於用户屬性和行為序列構建完整的機器學習模型，基於機器學習模型更好洞察用户想要什麼，我們應該給用户推薦什麼。

當然在用户洞察過程中，有兩個最關鍵的問題，一個所謂新客的獲取，另一個潛客的挖掘。

中國的保險市場很廣闊，很多用户還沒有成為真正的商業保險用户，如何讓這些潛客也購買相應的保險產品，核心兩個問題：1.我們需要降低我們的保險產品對C端用户理解的成本。2.我們需要去提升潛在保險客户的風險保障意識。

然後在這個過程中技術如何去賦能業務，去達成我剛才説的這兩個目標，這是任重而道遠的問題，這個問題由於時間有限不展開講。

新客獲取實踐：色階網格

這是螞蟻在用的非常有用的工具，我們叫為色階網格。

在互聯網上賣保險的時候有三個動作，首先是曝光，其次點擊，第三是轉化。那如何去看到這三者是否匹配，這可能是一個非常重要的命題。特別是在中國互聯網流量已經逐步見頂的情況下，對流量的精細化運營很重要。

我們在每個網格中有三個數字，第一個數字表示曝光的量，第二個數字表示點擊的量，第三個數字表示轉化的量，在整個網格中分為三種情況。

冷色系表示的網格會存在一種現象，所謂的曝光不足，但點擊和轉化是OK的，對這一類用户的人羣，我們需要做提升他的流量供給。

暖色系的網格曝光是OK，點擊和轉化從某種程度上説是不夠的，對這樣的人羣，我們需要輔以相應的拉新促活手段提高他的轉化。

黑白系網格從某種程度上曝光、點擊、轉化是比較匹配的，有了這個東西，我們可以按人羣精準調整流量投放的情況。

拉新從某種程度上來説，是整個用户增長領域最核心的命題。它本質上就是通過對用户行為和用户心理的分析，把最合適的產品和服務推廣給我們的用户，或者推薦給我們的用户。

從技術層面來説，拉新本質上是一個推薦問題，真正在落地的時候，我們最關注用户行為序的建模和行為心理的分析，後續動作包括內容投放、智能客單和復購，內容投放核心圍繞讓用户更容易理解保險產品，提升用户的風險保障意識來推進。

智能客單

更多在用户購買保險產品過程當中，我如何讓用户去選擇更適合他的產品？購買過程中的一些要素，包括像我們的保額、保期、繳費年期，包括是否需要附加額外的險種？在這個過程中，如何進行千人千面的推薦？

還有復購，所謂復購是二次來購買的用户，對二次購買的用户而言，如何預測他想購買的險種，包括他可能在哪個時間點購買，包括哪個渠道購買。

行為序列建模

重點講下這個事情，這是很有技術含量的。大致可以分為這幾步：首先是行為向量化，其次是基於行為向量進行文本挖掘和意圖識別，並形成行為模式，最後從行為模式最終向泛化為行為推理能力。

真正在落地的時候，技術方案上是前向反饋深度神經網絡，得出初步結論後，後續還有多層重構的神經網絡進行維度降階。行為序列建模在應用上最常見的場景，就是基於行為序列的建模如何進行產品推薦。

從產品推薦的角度看，核心包括行為特徵描述，描述內容除了行為序列，還包括客户基本畫像，以及當時所處的一些環境信息，對這些信息會進行統一的embedding降維，然後匹配產品的特徵，最終得出用户的產品躍遷路徑，整體上是一個複雜的多層卷積神經網絡。

用户的產品躍遷路徑

這就是用户的興趣點遷移，本質上是前面提的從行為模式到行為推理的一個非常好的應用點。所謂的興趣點遷移，對我們用户而言，他購買保險產品的時候，不同用户在不同時間點購買不同的產品，他的需求肯定不一樣。

在實際場景中，這種改變往往是從事件出發，用户不會告訴你，你只知道用户的行為，基於用户行為進行推理，反推出有可能發生什麼事件，再基於事件推薦相應的產品和服務給用户，這就是所謂興趣點遷移。

退保挽留

這在整個互聯網保險的用户增長中是非常重要的一部分內容。

首先要識別誰想退保，第二要識別退保的原因是什麼，第三識別出退保的概率多大，第四基於退保的分析採取相應的行動。

最關鍵的步驟，是退保的歸因分析和概率預測。

歸因分析是比較老的學科，從1958年已經有第一本歸因分析相關的專著。從整個退保歸因分析來看，站在螞蟻實踐角度，我們綜合利用首次點擊歸因，末次點擊歸因、基於位置的歸因、基於時間的歸因、線性歸因等一系列歸因分析的方法，最終尋找用户真正退保的原因。

現在很多同業的保險實踐當中，退保歸因往往在最後的退保頁面會出來一些選項，讓用户選擇退保原因是什麼。

這會有兩個問題：其一，沒有辦法真正羅列所有的退保原因，由於頁面展示限制，只能把最主要的退保原因放上去；其二，用户很可能沒有告訴你真實的退保原因——基於用户的行為真正找到他退保的原因到底是什麼，這很重要，這是退保挽留最核心的一步。

概率預測，是説我知道了用户的退保原因之後，需要基於用户的行為數據以及退保歸因分析的結果，做一個概率預測。

這是一個全連接的深度神經網絡，分為三部分：

把用户行為序列和退保原因進行降維。

在降維的基礎之上進一步抽取關鍵特徵。

把抽取之後關鍵特徵映射到有退保屬性的語義空間中，基於這個語義空間，在後面通過幾層重構的神經網絡進行降維處理，最終可以得到這個用户退保的意願和時機預測。

得到用户的退保概率後，如何去做退保挽留這件事，本質上是一個運籌優化的問題。

它的目標函數很簡單，就退報挽留的成本最小化，他有兩個非常重要的條件：第一，單人的退保挽留成本必須低於某個閾值，第二，我的整體退保挽留的人數必須高於某一個閾值。

自動化投保系統

然後前面這些拉新促活，包括退保挽留，最終需要有一套自動化投保系統來承載。

首先是場景挖掘和網格化的洞察，基於這個基礎之上我們自動化生成相應的投放策略，包括做投放，包括自動化做效果分析。最終能夠來實現運營同學解放生產力的目的。

其實從智能化用户增長這個角度看，對螞蟻而言也只是萬里長征走出第一步，將來隨着大數據分析和人工智能技術的進一步應用，可以更準確給我們用户推薦他想要的產品和服務，同時會把相關技術能力逐步開放出來，給行業去提供相關的賦能。（雷鋒網）

雷鋒網()雷鋒網雷鋒網