AI 時代地圖語音助手的體驗進化

語音是人們日常生活中最常用的互動方式，隨著AI技術的發展，也被逐漸應用車載產品中，語音助手有助於駕駛過程中解放使用者的手眼，提升駕駛安全性。本文從語音助手的概念出發，對當前語音助手的體驗設計趨勢進行了梳理與說明，與大家分享。

人們日常出行越來越依賴地圖進行導航指路、查路況以及找附近興趣點。而使用者在開車途中用手操控或視線瀏覽螢幕，具有很大的安全風險。語音助手的出現極大解放了駕駛過程中使用者的手眼，提升駕駛安全性。它不僅支援全程語音喚醒，還能快速精準理解使用者指令，提出有效解決方案。

01 語音助手概念

語音助手是指在硬體裝置或 APP 軟體上植入人機對話程式，輔助使用者透過語音方式使用宿主裝置或程式上的功能。完整的人機對話包括聲音訊號的前端處理、將聲音轉為文字供機器處理、在機器生成語言之後，用語音合成技術將文字語言轉化為聲波，從而形成完整的人機語音互動。

02 語音助手體驗趨勢

AI技術的發展以及硬體升級，賦予智慧裝置越來越多感知通道，也不斷增強透過各種媒介進行資訊輸出的能力。感知和輸出層之外，情感計算能力的提升使機器在認知層得到質的飛躍。它們遠比之前更懂使用者，也遠比之前更會表達。基於設計理解與實踐，我們認為語音助手體驗在互動通道、互動物件方面正呈現三個趨勢：

資訊服務的表達融合多通道體驗
對話貼近人的自然本能
具備情感互動能力

2.1 資訊服務的表達融合多通道體驗

除語音通道外，AI計算機視覺技術拓展了人臉、隔空手勢等互動通道，而傳統觸控、旋鈕等互動方式在操作精度、資訊輸出效率以及技術成本方面還有自身優勢。多通道融合能發揮不同通道的優勢和場景適用性，對資訊服務的表達更自然，效率最大化。

2.1.1 地圖語音互動形態重構

基於觸屏手機裝置的地圖語音，視覺資訊的協同輸出能有效彌補語音無形、線性、不易記憶等缺陷，增進使用者對語音互動體驗的理解。在近場互動時，觸屏還支援資訊快速回復。

形態是地圖語音不可或缺的重要通道。

初次引入語音互動能力，為了減少認知成本，地圖語音的互動形態沿用業界通用的封閉式對話流。而這種形態也隨著語音支援的地圖功能擴充套件而產生侷限性：

(1) 形態獨立封閉且與場景不融合，會對導航產生干擾，影響駕駛安全。

(2) 不能利用地圖原有的資訊表達，需要在對話流中單獨呈現結果。不僅影響算路等複雜需求的拓展，還會增加設計與開發的維護成本。

為真正適合地圖場景，語音助手形態完成向非模態、任務伴隨式面板的重構：利用地圖原有的資訊功能做展示，同時支援語音和觸控兩種回覆方式，提升多輪對話效率。區別於封閉式對話流，伴隨式面板不跳脫當前場景，帶給人更輕量的感受。

語音形態的簡化在一定程度削弱了語音狀態的表達，為了確保使用者對語音狀態的強感知，面板資訊框架的頭部在語音程序中持續展示小度頭像動效和文案提示。

2.1.2 地圖語音結果VUI與GUI協同

在檢索地點等任務場景中，使用者通常注重效率。VUI結果話術的設計首先以目標為中心為原則，在精確檢索單個結果時，引導使用者進行下一步行動；而在模糊檢索有多個結果時，向用戶詢問選擇或推薦可能最感興趣的地點並引導行動。

配合VUI話術，GUI也做相應的協同展現：數字序號匹配VUI的問詢和使用者選擇，而推薦結果的高亮和標籤使VUI推薦地點對映GUI，增強結果的表達效率。

2.2 對話貼近人的自然本能

連續對話且可隨時打斷，符合日常交流本能意識，但目前絕大多數產品語音互動仍不夠自然：發起對話需要在安靜環境下，先喚醒再發出指令，並且以“一問一答”為主。隨著全雙工免喚醒等語音技術的出現，透過上下文資訊對使用者指令的預測和判斷，可以免去中間喚醒環節，實現更為自然流暢的多輪對話。

在實現自然對話前，有效的認知教育是降低使用者使用語音門檻的必經途徑。

2.2.1 地圖語音認知教育體驗創新

由於語音資訊“隱形”特性，存在技能可發現性弱的缺陷，導致使用者時常忽略使用。同時，經地圖語音基礎調研發現，不習慣操作方式是使用者不使用語音的首要原因。

地圖語音基礎調研_不使用語音原因

語音技能在不斷擴充的同時，需要解決如何增強語音可感知，加強使用者學習並培養使用習慣。入口觸達和場景化引導是增強語音可感知必不可少的手段：在使用者未形成語音喚醒習慣時，入口作為使用者在觸屏感知功能的意符必不可少，而它還是語音喚醒效果不佳時的有效補充。另外，語音作為自然高效的互動模式，需要基於語音優勢場景強化引導，激發使用動力。

技能中心是進行語音集中使用者教育的特有場所。市面上絕大多數產品的技能中心，都是以說明書的文字方式進行教育，本質上仍是閱讀為主。而認知研究表明，而我們的大腦為語言而非閱讀而設計。說話和理解口頭語言是自然的人類活動，但閱讀不是。為了追求最真實的學習效果，地圖語音透過線上真實環境以聽說的方式完成沉浸式新手教育。

在使用者的心智模型裡，語音的工具概念決定了使用者在有意圖時才會使用，這對學習以及習慣養成所需的實踐頻次和規律性都難免造成影響。因此，地圖語音技能中心提出小度成長概念，完成每日任務，用獎勵幫助小度成長，使用者在潛移默化之快速學習技能，培養使用習慣。

任務主要在個性化、熱度、等級等維度進行組織，比如個性化方面，優先展示使用者容易出錯的指令任務，透過反覆學習解決指令的表達問題。

2.3 具備情感互動能力

語言是人類智慧的象徵，使用者對語音產品會產生“移情”效應。情感計算可以使產品透過情緒分析等機器學習演算法處理相關資料，如人的面部表情、肢體動作以及各種心理引數：心跳、脈搏、腦電波等，結合外界環境資訊，最終計算出人的情感狀態。再從硬體層面、GUI及VUI層面給予立體的情感反饋，實現情感互動。

當前地圖語音主要基於導航駕駛環境的資料來主動提供服務與建議。

2.3.1 地圖語音主動服務

地圖語音主動服務當前主要包括安全建議、路況以及目的地服務等三個主要場景。比如在使用者高速長時間駕車時，提供最近休息服務區；路段出行擁擠時，建議合適路線；而在臨近目的地時推薦方便停車點。在駕車過程中的關鍵觸點提供有價值的主動服務，提高駕駛安全性，建立可信任的情感聯絡。

隨著未來透過更多感測器來獲取人體相關資料，能準確把握使用者情緒狀態，在導航中提供有利於情緒安撫和安全駕駛的主動服務。

寫在最後

AI時代，語音助手本身將有機會成為唯一的服務主體而存在。

受益於語音能力的進一步進化，資訊與服務圍繞使用者而非介質持續流動。人對自然、情感、個性化的訴求比以往任何一個時代更為凸顯，語音體驗將更加實時多變。進化的另一面，使用者隱私與商業競爭將會影響這一理想願景的實現。

參考文章：

[1] 《2020年中國智慧語音行業研究報告》

[2] 《2019AI人機互動趨勢研究》

本文由 @Du Design 原創釋出於人人都是產品經理。未經許可，禁止轉載

題圖來自Unsplash，基於CC0協議