去年年末隨着iOS 14的上線,蘋果要求在App Store中上線的應用都必須增加“隱私標籤”,以符合“應用跟蹤透明度(App Tracking Transparency)”功能的要求。當時作為利益受損方,谷歌選擇了以長時間不更新應用的方式作為抗議,但最終在消費者對於隱私問題日趨重視的大勢下最終選擇了妥協,並且旗下的大批iOS應用均更新了隱私標籤。
不僅如此,在被問及公司是否會一邊計劃禁止第三方跟蹤Cookie,一邊採用其他方式代替,進而繼續追蹤用户的行為時,谷歌方面在近日也明確表示,一旦淘汰第三方Cookie,就不會建立替代標識符來跟蹤個人在網絡上的身份,也不會在產品中使用它們,並且也將不再推出“用於追蹤個人的任何技術”。
在外界看來,谷歌不進一步開發用於追蹤個人信息的相關技術,或許是因為“不為也,非不能也”,更加準備來説,是響應全球用户需求的順勢而為之舉。事實上在過去的十多年間,對於個人信息的追蹤構建了所謂“千人千面”的大數據體系,以及精準廣告生態。
在大數據時代,互聯網廠商將個人數據的匯聚、分析、整理,並深度加工,可以讓用户享受到更加個性化,更符合自身需求的服務。但大數據的B面,卻是一旦廠商知道了IP地址,就可以在自有數據庫中查找到你過往的搜索記錄,將曾經使用過所有的搜索關鍵詞都彙總到一起,清晰地描繪出你的用户畫像。
有了一副清晰的用户畫像,無疑就有了用户的姓名、年齡、健康狀況、工作性質、使用的設備、住址、興趣愛好等等,進而直接分析判定出你到底是一個什麼樣的人。再加上互聯網企業之間普遍的數據共享和信息買賣,個人用户在大型互聯網企業面前幾乎就成為了透明的。此前哈佛伯克曼·克萊因互聯網與社會中心研究員Hal Roberts就認為,谷歌廣告系統就是一種“灰色監控”工具。
顯而易見,在以劍橋分析醜聞為代表的一連串隱私泄露危機頻發的情況下,用户自然會對如今互聯網行業通行事無鉅細的個人信息追蹤感到反感。那麼既然谷歌不會繼續推出用於追蹤個人用户的任何技術,那麼這家數字廣告巨頭要如何繼續它的業務呢?事實上谷歌選擇了“Privacy Sandbox(隱私沙盒)”技術,允許廣告客户展示有針對性的廣告,但不會直接訪問用户的個人詳細信息。
據瞭解,谷歌希望通過Privacy Sandbox在Chrome中構建一個基於機器學習的跟蹤系統,將用户分為不同的興趣組,當需要向其推送廣告時,廣告系統可以在用户感興趣的列表投放相關廣告。這看上去是不是有一種很熟悉的感覺,沒錯,谷歌所謂的Privacy Sandbox,其實就是蘋果自iOS10開始使用的“差分隱私(Differential Privacy)”數據收集策略。
差分隱私是密碼學中的一種數學工具,其在2006年被微軟科學家Cynthia Dwork提出。據瞭解,差分隱私能夠在給數據添加噪聲的同時,一直計算隱私提升的程度,從而使得增加“噪音”的過程變得更加嚴謹,並且其可以對所有的數據查詢和分析過程進行約束,以儘可能減少隱私泄露的風險。
差分隱私想要實現的效果,是即使不法分子或其他廣告平台通過買賣等手段,獲得了1萬人的數據以及另外9999人的信息,也無法通過將兩份數據進行對比,進而定位到第1萬人的個人信息。這一作用機制確保了一個數據庫中每個單獨信息都不會被泄露,但數據庫整體的統計學信息卻可以被使用,即你獲取到的部分數據內容對於推測出更多的數據幾乎沒有用處,自然也就無法形成用户畫像,但是廠商還是可以通過數據庫來推測某一批用户的特徵。
無論是谷歌還是蘋果,亦或是其他採用了差分隱私策略的廠商,其實它們的做法基本上都是一致的,就是利用Hash算法、分段抽樣,以及數學噪聲注入等方式,儘可能多地瞭解特定的團體,同時儘可能少地瞭解其中的任何個體。但問題是這一技術效果出色,可是想要實現卻並不容易,如果添加的噪音太大數據就喪失了可用性,然而噪音也不能太小,否則就起不到保護隱私的作用。
更為重要的一點是,在現代的互聯網行業中,將海量數據收集起來很簡單,但是將之分門別類進行數據庫化,完成歸納整理可不是一件輕鬆的事。考慮到類似谷歌及Facebook等企業的僱員薪資不菲,幾乎所有的互聯網企業都會選擇將數據處理外包出去,例如向谷歌提供數據中心服務的外包公司,就是全球最為著名的人力資源公司Adecco。
谷歌內部員工對於數據隱私的謹慎程度雖然可以匹配公司政策,但外包員工要如何進行約束呢?此前蘋果Sir、亞馬遜Alexa、谷歌Assistant的“竊聽門”中,就曾曝光了這些企業將用户敏感隱私交給外包商處理的情況。即便谷歌要求外包商也需要使用差分隱私技術,但為了提供更有效的數據,大家認為外包商會為其加入多少的噪音呢?