楠木軒

數據存儲兩模式各取所長 公共安全和隱私安全並非魚和熊掌

由 湯生 發佈於 科技

本文轉自【科技日報】;

巨頭打造抗疫工具,“中心化”與“去中心化”存儲引爭議

數據存儲兩模式各取所長 公共安全和隱私安全並非魚和熊掌

當前,新冠肺炎疫情在全球依舊呈蔓延態勢,對感染者與密切接觸者進行追蹤隔離,是防控疫情最為有效的措施之一。在此背景下,全球科技公司也加大力度投入到這場抗疫戰鬥中,蘋果與谷歌聯合開發了基於藍牙的一款追蹤工具,可用來對疑似接觸過感染者的用户發出預警提示。據外媒報道,日前,該技術工具已交付使用。

然而,針對藍牙追蹤工具所採集信息的存儲方式,國外出現了不同的聲音,一種聲音認為應採取“去中心化”存儲——記錄在用户個人設備中,另一種聲音認為應進行“中心化”存儲——放在中央服務器上。

這種藍牙追蹤工具是怎樣發揮作用的?兩種存儲模式的爭議點在哪裏?用户的隱私和數據安全風險對比如何?就此,科技日報記者採訪了有關專家。

無需定位 憑接觸信息記錄實現追蹤

使用藍牙追蹤工具後,一般來説,當兩個用户處於藍牙傳輸範圍之內,智能手機會自動交換並且互相存儲“滾動接近標識符”。“這個‘滾動接近標識符’可以理解為用户個人的唯一識別信息。公共衞生機構能夠從中解密出用户的所有接觸信息,從而達到密切追蹤的目的。”災備技術國家工程實驗室副主任、北京郵電大學網絡空間安全專業負責人辛陽解釋説,一旦出現被確診感染新冠肺炎的人,公共衞生機構會向14天內所有與該患者交換過“滾動接近標識符”的人,發送一套特殊確診秘鑰,告知其與感染者有過接觸。

據此可以看出,藍牙追蹤工具收集的信息類型主要為用户接觸信息,並不涉及具體的定位。該工具還設置了嵌套加密和動態變化功能來加強用户的個人隱私的安全性。

不過,藍牙追蹤工具的有效性還有待論證。“藍牙技術首先可能會帶來準確性問題。藍牙信號通常可以輻射約9米左右,遠大於通常認為的不會造成新冠病毒感染的2米社交安全距離。”復旦大學大數據試驗場研究院、上海市數據科學重點實驗室副研究員張帆認為,即使公共衞生部門通過設定包括空間距離、信號強度、接觸時長等信號交換閾值進行微調,一些準確性問題仍然需要近一步地技術完善。

同時,根據有關專家測算,在一定範圍內,需要有大約50%至70%的人同時安裝使用藍牙追蹤工具,數字追蹤才能發揮效果。在智能手機普及程度較高的美國,擁有智能手機的人口占比為81%,而在發展中國家,這個比例僅為45%。

各有利弊 數據存儲方式引發分歧

作為全球兩大智能手機操作系統提供商,蘋果公司和谷歌開發的藍牙追蹤工具,可作用於全球近30億智能手機用户。為鼓勵公眾參與,谷歌和蘋果公司強調了該項目的“自願”“分散化”“數據最小化”等隱私友好原則。

張帆指出,作為手機操作系統底層通用功能,藍牙追蹤工具能夠在更大範圍內實現疫情防控協同,如果各國公共衞生機構選擇加入和利用該工具,將有望實現跨國疫情防控協同。

那麼,此次引起熱議的“中心化”與“去中心化”存儲究竟是什麼?

“‘中心化’存儲是一種傳統的存儲方式,是把數據集中存儲在某個服務商的中心服務器上,如大型數據中心機房、雲存儲網絡等。而‘去中心化’存儲是把數據分散到用户手中,具有不可篡改、可溯源等特性,是一種分佈式數據體系。”廈門理工學院計算機科學與技術系主任洪朝羣教授解釋説。

目前,蘋果公司和谷歌聯合開發的技術並不支持數據的集中存儲,所使用的存儲環境是每個用户的手機內存。“與‘中心化’存儲相比,‘去中心化’存儲的優勢在於不需要特定的存儲介質,可以降低成本。數據被分成小塊存儲,即使泄露一部分,也不會暴露整體,安全性更有保障。”辛陽説,另外,該方案激勵用户貢獻出自己的閒置資源,理論上可擁有極大的存儲空間。

但辛陽也指出,由於是分塊存儲,處理完整數據時,需要對所有數據塊下載完成後進行重組,因此信息處理的最終速度取決於速度最慢的存儲端的網速。

“中心化”存儲由於把所有的業務單元部署到了同一個中心節點上,數據的存儲和控制處理可完全交給主機來完成,獨立的設備控制可展現出很強的處理能力。另外,這種存儲方式無需面對網絡分區導致連接受阻等問題,因此很容易實現高一致性和高可靠性。但同時,“中心化”存儲也具有造價昂貴、故障排除難度大、建設週期長等難以解決的弊端。

利用藍牙追蹤工具幫助疫情防控的方案公佈後,各國對基於該系統是否應疊加“中心化”功能而產生了分歧。瑞士、奧地利等國贊同谷歌、蘋果的“去中心化”理念;法國、英國則傾向於“中心化”;德國一開始表達傾向“中心化”意見,但隨後轉而支持蘋果和谷歌的技術方案。不過,傾向於“中心化”思路的國家,並沒有得到來自蘋果與谷歌的技術支持,這就意味着這些國家需要開發自己的存儲系統來使用藍牙追蹤。

辛陽認為,從用户角度來説,“中心化”和“去中心化”兩種模式的爭議點則主要在兩方面,首先是使用“去中心化”存儲需要佔用用户設備的軟硬件資源,在個人設備性能欠缺的情況下,可能會影響用户正常使用;另一方面,“中心化”存儲不可避免地會將用户信息進行集中統一管理,近年來頻發的黑客攻擊導致大規模數據泄露事件,也加劇了用户對於隱私安全的擔憂。

取長補短 疫情技術體系可兩方案並存

“‘中心化’與‘去中心化’兩種存儲方式有着各自的優勢和弊端,並不是非此即彼的關係,二者可以相互借鑑經驗,共同構成疫情防控的技術措施體系,實現更加優化的公共健康管理,以最小的隱私代價幫助人們重新迴歸正常生活。”張帆説。

在很多國家的疫情防控實踐中,既可以看到“中心化”模式的技術措施,也可以看到“去中心化”的技術手段。張帆指出,由政府部門發起的“中心化”數據管理平台,如我國的健康碼統一政務服務平台,集中了衞生健康、工信、交通運輸、海關、移民管理、民航、鐵路方面的數據,發揮了數據完整、準確的優勢,既可以服務於個體,同時也能夠為決策提供實時數據支撐。

同時,張帆認為,私營部門“去中心化”模式中,為保護用户數據安全而採取的相關措施如層層加密、標識符動態變化等,也可以被借鑑到“中心化”的技術路徑中,有助於不斷完善疫情防控技術體系。

“目前平衡這兩個方案,普遍採取的是自願原則,用户可以選擇是否將‘去中心化’後的數據存放在自己的設備中,如果願意,政府部門或方案推行者會給予一定的獎勵措施。”辛陽説,例如愛沙尼亞政府推行的“數字身份證”計劃,就是通過賦予公民免費乘坐公交車的權利而成功地覆蓋到近98%的人口。但同時,辛陽強調,這些數據應被最大限度進行加密存儲處理,並且限定只能由特定的機構使用。

洪朝羣認為,此類數據採集應在衞生管理部門的統一規範和規劃下進行,並向民眾公佈細節。數據存儲不管是集中還是分佈,都應得到監管,用於疫情防控而不是用於商業。