隨着技術的進步,如今移動支付的手段也早已呈現出日新月異的景象,從早前輸入繁瑣的密碼,現在已經有了更加方便安全的指紋與人臉識別。不過現在在智能手機上已經很常見的聲紋識別,卻很少被應用到支付領域。而在近日有消息顯示,谷歌方面已經開始着手在旗下產品中,落地這項“張嘴就能付錢”的語音支付功能。
據相關媒體的報道顯示,目前谷歌已經正在測試一項新功能,將允許消費者使用語音匹配(Voice Match)進行授權確認支付。而谷歌方面也證實,並不是所有的購買都會提供語音識別,現階段這項功能僅適用於APP內購與餐廳訂單,並不適用於谷歌購物(Google Shopping)。
按照該報道中的説法,這一語音支付功能原本計劃在今年I/O開發者大會上發佈,但由於疫情的原因只能跳過發佈直接開始測試。目前在位於Google Assistant (谷歌語音助手)的支付界面中,就能看到“Confirm with Voice Match”的選擇。
事實上,語音支付這項技術其實並不新潮,甚至於比語音助手所依賴的自然語言處理(NLP)更加古老。沒錯,語音支付與自然語言處理儘管説都與語音相關,但二者卻有着天壤之別,語音支付的本質是進行聲紋識別,但聲紋識別顯然並不等於語音識別。
而聲波傳輸是利用聲音作為傳輸方式的一種數據通信模式,比如我們説話的過程,就可以理解為把信號編碼成聲音的過程。而聆聽的過程,則是把音頻信號解碼成語言文字的過程,所使用的漢字與拼音之間的對應關係,其實就相當於是音頻協議。
但聲紋識別則是個性識別,需要通過提取語音中的聲紋特性,判斷説話的人是誰,也就是解決“誰在説話”的問題。而語音識別是共性識別,判斷的是説話的內容,解決“説了什麼”的問題。顯而易見,在語音支付中最重要的,是判斷説出支付命令的人是誰。
由於每個人的發聲器官在尺寸與形態方面大概率不會完全一致,因此這些差異也導致了發聲氣流的改變,進而產生了聲紋的差異。所以我們才能“未見其人,先聞其聲”,通過音色、音調和説話習慣,可以判斷聲音主人的身份,因此同理也能用算法提取語音信息中明顯的、抽象高維的聲紋特徵,並用深度學習來訓練模型,進而利用具備獨特性的生物特徵,來證明“我是我自己”這樣的命題。
事實上,使用聲紋識別來完成語音支付的過程很簡單。就是用户發出帶有確定命令的聲波,終端設備獲取這一聲波並轉化為會話(Session),並將具體的商品信息以及交易號發送到谷歌後台,其在服務器端匹配了聲紋信息後就能開始進行交易操作,最後再將完成交易的信息,推送到谷歌語音助手中。
而在谷歌此次確認測試語音支付之前,亞馬遜方面在去年秋天就已經開始允許用户使用語音命令在自家的Alexa上支付賬單,一旦用户使用類似“ Alexa,支付我的移動賬單”來批准交易,Alexa將使用Amazon Pay支付賬單金額,並通過用户註冊的手機號碼發送確認。此外,國內市場的天貓精靈也早已可以使用語音支付,根據阿里方面公佈的數據顯示,僅在去年雙十一期間,天貓精靈上就共有105萬筆訂單是通過説話的方式支付成功。
不過谷歌想要實現的,顯然並不僅僅是在自家Google Home智能音箱上使用語音支付,而是瞄準了適配場景更為廣闊的智能語音助手。不過谷歌能想到的,亞馬遜與阿里難道想不到嗎?在智能語音助手上全面接入語音支付,毫無疑問會大幅度提升用户的使用體驗,畢竟相比於人臉與指紋識別,聲紋識別的便捷性要高得多。
但亞馬遜與阿里選擇將這一功能侷限到智能音箱這種通常放在家中的設備上,其實極有可能是有一番深意的。語音相比於指紋或者面部信息來説由於有着可控性更低的因素,畢竟用户可以自主決定是將手指放在指紋識別模塊上,或將臉放在鏡頭前,但卻無法這樣控制聲音的傳播。
更為重要的一點是,指紋信息很難被採集,面部識別通常需要配備活體檢測,但是聲紋識別不僅很容易收集,同時也很難判斷用户在説出支付命令時的狀態。再加上如今AI技術已經全面擴散,通過深度學習模型、波形編輯工具,拼接出指定內容的語音數據,幾乎完全可以復刻出用户的聲紋頻譜。
並且語音支付的安全問題不僅僅只出現在客户端,服務端同樣面臨也有一定的風險。語音支付可以看做是一次數據交互,例如cookie機制所採用的是在客户端保持狀態的方案,而Session(會話)機制採用的是在服務器端保持狀態的方案,在用户第一次訪問服務器時會為客户端創建一個Session,並通過特殊算法算出一個Session的ID,用於標識對象。
然而由於語音支付並不是一次性行為,用户下次與服務器進行數據交互就需要通過SessionID來完成。然而,SessionID的實現機制導致了其可能會遭到劫持,比如説經典的XSS跨站點腳本攻擊、網絡嗅探、代理人劫持等不同攻擊模式,如果SessionID被劫持,黑客就能獲得目標用户的合法會話,那麼接下來就能像信用卡盜刷一樣掏空被盜者的錢包。
因此這或許也是谷歌自己坦言,如果反饋與性能都太過負面,該功能甚至可能不會向公眾推出的重要原因之一。因此在谷歌沒有解決至關重要的安全性問題之前,想要張張嘴就能完成購物體驗,或許暫時只能在智能音箱上得以實現了。