萬維網的發明者,想把數據的全部控制權還給你
在移動互聯網時代,萬維網(WWW、Web)已經是一個較少被提及的古老名詞。不過,它仍然是人們在互聯網上進行透過文字、多媒體等方式交互的重要工具,也是現如今我們所知道的每一家頂級互聯網公司所依賴的核心技術。
然而在萬維網誕生31年後的今天,它的發明者,英國計算機科學家蒂姆·伯納斯-李,卻對運用萬維網技術構建商業帝國的公司們頗有微詞。
萬維網之父蒂姆·伯納斯-李做出了可能是人類科技史上一項非常重要的決定:讓自己的發明永久免費,任何人都可以使用。他放棄了因此獲得授權費等直接經濟收益的權利,但很顯然,有一部分更聰明的人在他的發明基礎上構建起了更具壓迫性,甚至構成了壟斷的商業模式——而這和他的想法背道而馳。
這些公司大肆攫取用户數據,讓用户成為了 Web 2.0 以及後來時代的“數據奴隸”。
有類似想法的,不止伯納斯-李一人。哈佛大學的肖珊娜·祖伯夫博士直接將這種商業模式定義為”監控資本主義“(surveillance capitalism):科技公司不惜一切代價海量收割用户數據,用它們對用户構建畫像,定製各類服務,並且推送廣告獲得收入。當然,作為從業者和對科技感興趣的人士,相信總有一些時候你也會有同感:這真的是互聯網應該有的樣子嗎?我在這個系統當中是受益者,還是被剝奪了一些東西?
伯納斯-李現在想要讓互聯網迴歸他認為應該有的樣子。
今年已經65歲的他,創辦了一家新公司 Inrupt,試圖推廣一種”數據自主權“理念,將數據的全部控制權重新交還給用户,但仍能夠讓用户正常使用各種基於互聯網的服務。
萬維網之父的數據自主權計劃在麻省理工學院的建制下,伯納斯-李最近幾年一直在研究如何從數據管理的角度,從根本上改變如今 Web 應用程序的工作方式。他們開發了一個名叫 Solid 的項目。
Solid 是 "social linked data" 的簡稱。這一項目包括一系列協議和工具,遵守 W3C 標準規範,提供如下特性:
- 真正的數據自主權:讓數據和使用數據的應用脱鈎 (decouple),確保用户能夠自由地選擇他們的數據存放的地點,以及誰能夠接入這些數據,控制數據授權的時長。
- 模塊化設計:避免平台鎖定,用户可以隨時帶着他們產生的數據,從一個平台遷移到另一個競品平台,在過程中不會失去任何數據和社交關係、
- 重複利用已有數據:開發者使用現有的數據,就可以創建新的應用或者改進老的應用。
Solid 的具體細節我們稍後敍述。但光有協議和工具不夠,伯納斯-李最近創辦了 Inrupt 公司,去吸引用户和開發者的注意,試圖從商業上證明 Solid 模式是可以行得通的。
伯納斯-李在 Inrupt 擔任首席技術官兼董事,約翰·布魯斯 (John Bruce) 是這家公司的聯合創始人兼 CEO。布魯斯之前是網絡安全公司 Resilient 的聯合創始人兼 CEO,這家公司已經被 IBM 收購。
Inrupt 的核心技術,同時也是目前 Solid 項目的核心技術,叫做 Pods,一箇中立、第三方的個人數據存儲庫 (personal online data stores)。
它的工作原理簡單來説是這樣的:當某用户使用接入了 Inrupt API 的應用時,他的個人數據就存儲到了一個 pod 裏。用户可以手動選擇對該應用授權哪些數據,也可以在不再使用該應用或遷移平台的時候,隨時駁回這些授權。根據授權數據的種類和多寡,應用可以為用户提供不同程度的服務。
但最根本的原則是,由於 pods 作為第三方數據存儲的存在,這些應用的開發者將無法完全提取並且出售這些數據。
伯納斯-李認為,Inrupt 的技術在醫療、金融、通訊、政府事務和媒體等業務形態上可以有很好的表現。
Inrupt 公司目前也開發了幾款產品,並提供了較為完整的文檔。這些產品包括:
- 面向企業的 Pods 服務器 Enterprise Solid Server,能夠在確保數據使用合規、用户和企業之間互信的基礎上,加強數據的使用,讓已經產生的數據能夠發揮新的價值。
- Solid 客户端庫,包括一系列能夠讓開發者將 Pods 以及未來其它 Solid 技術整合到自己應用裏的開源工具包。
- PodBrowser,一個開源應用,讓用户可以直觀查看和管理 Pods 裏數據。
除此之外,Inrupt 已經獲得了少數開發者的支持,已經有一些採用 Pods 技術開發的應用可以使用,
- Media Kraken,一個影評網站,用户可以在上面追蹤、評價和分享自己最喜愛的電影和列表。值得注意的是,它的註冊登陸界面直接詢問用户想要把數據存儲在哪裏,可選項包括 Solid Pods,或者直接存儲在瀏覽器裏,服務提供方不會提取這些數據。
- Darcy,一個正在開發中的分佈式社交網絡平台,功能和 Twitter、Facebook 有點像,但其工作模式的核心並非獲取更多用户數據來推送廣告。
- 產品是開源的,用户可以擁有和控制自己的數據。
- Liqidchat,一個採用 Pods 技術開發的簡單IM應用。
- OhMyPod! 和 Inox,兩款第三方開發者打造的Pods 管理應用。
可以看出,Solid 技術和 Inrupt 公司之間的關係,就是前者負責推進基於數據自主權理念的新一代開源 Web 數據存儲和使用技術,後者將其商業化,推廣給更多開發者、公司,最終讓更多的消費者可以受益。
伯納斯-李認為,在今天,用户和他們自己所創造(以及從自己身上被提取出來)的數據之間,存在一堵牆。人們對被提取了哪些數據缺乏感知,沒有控制權,也無法避免數據的提取者在數據市場上轉手交易這些數據。
目前,Solid 項目已經獲得了包括萬事達在內的一些世界頂級機構的支持。不過,我們熟悉的那些全球頂級互聯網公司還沒有對 Solid、Pods 以及數據自主權理念做過已知的公開表態。
在過去幾年裏,這些互聯網公司成為了歐美國家壟斷調查的對象。在去年的美國國會對谷歌、蘋果、Facebook 和亞馬遜四大科技公司的聽證會上,即使是那些對科技最為冷感的政客,都表示過對它們攫取並利用數據構建商業霸主地位和壟斷圍牆的擔憂。
現如今的互聯網已經演變成一種賽博朋克式的樣子,但伯納斯-李仍然是一位理想主義者。以一種中立第三方的姿態,他正在試圖推進數據自主權被更多人所接受。
但考慮到當今行業局勢,恐怕只有獲得那些頂級公司的支持——而這意味着它們賴以維持體量的商業模式可能要被徹底顛覆——伯納斯-李的理念才能夠得以貫徹,Web 才能夠被真正修復。
看到這兒,可能你忍不住要問,什麼是數據自主權?數據自主權是對數據主權 (data sovereignty) 的一個延伸,而數據主權並非一個最近誕生的概念。
2013年,美國司法部以調查恐怖組織為由要求微軟提供存儲在愛爾蘭服務器裏的用户電子郵件內容,遭到該公司拒絕。在後來的法庭鬥爭中,微軟最終大體上獲勝,奠定了國家語境下的數據主權概念,也即數據應遵守其所在國家地區內的法律和治理結構。
微軟 vs 美國司法部一案,對數據主權的保護的出發點是平台。而另一項近幾年興起的運動,則是從數據的創造者自身出發的。
一直以來,在澳大利亞、新西蘭、美國等國家,當地的原住民對於自己族羣的資源和權益格外珍重。比如石油、天然氣等在其它地區可以更輕鬆進行商業開採的地質資源,在原住民地區必須經過非常繁瑣的批准流程,以確保當地人民能夠享受到應有的權益。
在過去的半個多世紀以來,許多針對原住民族的社科調查不但沒有獲得他們的許可,也沒有向他們彙報,導致了刻板印象的強化甚至歧視行為。
2015年,原住民數據主權運動在澳大利亞興起,學術人士達成了一項共識:在《聯合國原住民權利宣言》的框架下,原住民族應該擁有對其人民的數據的控制權,可以決定這些數據如何被使用。2017年,世界上的第一支原住民數據主權保護機構 "Maiam nayri Wingara and Torres Strait Islander Data Sovereignty Collective"[1]正式在澳大利亞成立。
在這種原住民數據主權的邏輯下,任何來自於原住民族羣和地區的數據,無論是民間訪談錄得信息,還是從大自然中採集樣本,都需要經過原住民族羣的審批,並且在使用完畢後交還所有權,由原住民保存。
加州大學聖迭戈分校助理教授,原住民人類學家 Keolu Fox 表示指出:人們需要明白,數據也是一種資源。
而如果將這種數據主權的理念擴展到每一個人,就有了數據自主權的概念。(英文還是 data sovereignty,只是換了一個更符合場景的翻譯。)
原則上,每個人都可以(伯納斯-李認為應該)擁有對自己的所有數據的全部所有權和控制權。互聯網公司在為用户提供服務時,應該本着透明、責任和開放的原則,申明使用哪些數據、如何使用等,並向用户獲得充分的知情同意,而不是大部分網民現在所面對的,那種為了使用某款服務不得不同意提供方獲取一大堆權限的糟糕體驗。
更重要的是:用户應該能夠隨時能夠查看服務的提供者正在接入自己的哪些數據權限。如果一位用户想要駁回某些數據的權限,或者不再使用該項服務,希望完全刪除數據或者徹底阻斷服務提供者接入自己數據的能力——他應該能夠輕鬆地完成操作。
對於大部分人來説,這應該是一種用户和服務提供者之間更為理想的關係應有的樣子。不過很遺憾,在目前,在一些具備了網絡效應的公司面前(如 Facebook、Twitter、Google、微信等的超大型社交網絡平台和關鍵功能性質的公司),用户的話語權並沒有多少。受制於社會原因,他們往往不得不使用這些產品,也就只能將數據拱手交給它們背後的公司。
在用户數據權益保護方面,GDPR(歐盟一般數據保護規範)做的比較不錯。儘管流程稍微有些繁瑣,它至少為那些想要取回數據控制權,刪除自己數據的消費者提供了法律許可的渠道。
這是因為 GDPR 是在大型互聯網公司已然攫取了海量用户數據的基礎上,提供的一種制衡手段。
而通過 Inrupt,伯納斯-李想要創造一種全新的,從根本上開放、透明,更重要的是對用户更公平的數據授權和託管機制。