【鏈得得獨家】區塊鏈隱私計算,未曾開掘的大數據業態全新商機

【鏈得得獨家】區塊鏈隱私計算,未曾開掘的大數據業態全新商機

2019-04-25 13:12
來源:鈦媒體APP

原標題:【鏈得得獨家】區塊鏈隱私計算,未曾開掘的大數據業態全新商機

圖片來源@視覺中國

文|鏈得得,作者|大文

移動互聯網、雲計算和大數據等技術的快速發展,孕育併產生了各種新的服務模式和應用,例如打車、外賣等基於位置的服務,互聯網金融、小額貸款等基於徵信的服務等。這些服務和應用一方面採集用戶的相關信息,另一方面為用戶提供精準化、個性化的服務,給人們的生活帶來了極大便利。根據IDC發布的數據,截止到2018年底,中國大數據解決方案市場軟硬服總額達到388.8億元人民幣,並有望在2023年超過800億元人民幣,全球市場則將超過3000億美元。

數據時代,“隱私剛需”已存入現實社會

然而,這些服務所採集的信息中往往含有大量包括病史、收入、身份、興趣及位置等在內的敏感信息,對這些信息的共享、收集、發布、分析與利用等操作會直接或間接地泄露用戶隱私,給用戶帶來極大的威脅和困擾。因此,用戶隱私保護已成為人們廣泛關注的焦點。

去年5月《通用數據保護條例》(即GDPR)在歐盟範圍內正式執行。該條例規定,企業處理個人數據的業務流程必須在設計和默認情況下構建數據保護,這意味着個人數據必須使用假名(Pseudonymization)或完全匿名(data anonymisation)進行存儲,並且默認使用盡可能最高的隱私設置,以避免公開數據未經明確同意被使用。

為了應對日益嚴峻的隱私保護監管措施,科技公司不得不對自己的服務和隱私政策作出修改。以谷歌為例,其不斷修訂的隱私政策中除了在用語及措辭上具有很大的風格轉變,建立了用戶可以部分或者全部刪除自己的信息的體系,還向用戶提供視頻、示例、註解、鏈接跳轉等方式供用戶更進一步了解其隱私政策的整體條款、所收集的用戶信息、收集數據的目的、用戶的隱私控制項等,以保證實現用戶的知情權。

該條例無疑為蓬勃發展的大數據行業套上了沉重的枷鎖。對於數據提供方來說,數據的獲取、保存成本都會極大的提高,而保障數據的更正權和被遺忘權則需要更多的人工和時間成本。對於數據的利用方來說,使用範圍、使用方式都被限制在了很小的範圍內,更不論GDPR對其提出的匿名化、加密化的成本提升。

隱私計算的內部矛盾

除了外部因素之外,隱私數據的處理過程當中還面臨着三個內部矛盾:效率、安全、數據孤島。

安全方面,目前的大數據行業主要依託於可信第三方的計算服務。這些第三方包括主要應用於科研領域的超算中心和主要應用於商業領域的數據中心。大數據行業的高性能、高投入需求讓規模化、集中化的運算成為了市場主流,2011年起,我國規劃建設了255個數據中心,總設計服務器規模728萬台,承擔了我國大部分民用數據的計算服務。

但這些集中化、規模化的數據中心未免讓人心生疑慮:如何保障企業的“数字黃金”是安全的?就在今年2月,由於阿里雲代碼託管平台的項目權限設置存在歧義,導致開發者操作失誤,造成至少40家以上企業的200多個項目代碼泄露,其中涉及到萬科集團、咪咕音樂、51信用卡旗下51足跡、百度無人車合作夥伴ecarx等知名企業。

可信第三方不一定一直可信,而數據中心可能出現的問題也並不是空穴來風:我國網絡信息安全監管要求,經營增值電信業務的外商投資電信企業外資占股不得超過50%。這意味着外資企業若要在華提供公有雲服務,須與國內的雲服務企業合作,才能確保服務落地。網絡信息安全中雲計算是其中重要的內容,即外企進入到中國市場,須受到電信監管、牌照、數據安全等方面的政策限制。對外如此,對內也如此,第三方帶來的風險是不能被忽視的。

效率方面,在隱私信息的生命周期中,受益於二戰及其後軍事目的的密碼學發展,隱私的加密化、匿名化和脫敏技術都已經非常成熟,可以大規模應用在隱私獲取、儲存、流轉等環節中。但大數據時代的到來,讓隱私數據的處理成為了一個難題:大規模的加密數據處理一定會導致計算性能下降,而非加密數據處理又一定會導致隱私信息的泄露。

最後一點,隨着大數據技術的日益發展,企業間的數據孤島問題也愈發嚴重。隨着大數據產業的發展,政府、企業和其他主體掌握着大量的數據資源,然而由於缺乏數據共享交換協同機制,“數據孤島”現象逐漸顯現。

以保險行業為例,為了進一步吸引客戶,保險公司已經從過去的比質量、拼價格過度到“比個性”。各家保險公司都在“服務個性化”上下功夫,相繼推出了一些吸引客戶的創新服務方式。基於人工智能的定製化保險成為了市場關注的焦點:根據投保人的生活習慣、駕駛習慣、醫療記錄等數據為每個投保人生成針對性的保險服務。在這個過程當中,保險服務提供商希望獲得用戶的消費數據、駕駛習慣、醫療數據等。但鑒於數據可複製的特性,願意將自己企業獲得的數據進行分享的企業卻沒有幾家,無法獲得這些個性化數據的個性化保險也就無從談起。

針對這些問題,學術界和企業界都開展了大量的研究工作,並在社交網絡、位置服務、雲計算、大數據、智能醫療、智能電網、智能交通等方面提出了諸多具體的隱私保護方案。區塊鏈行業也出現了一些比較有代表性的項目,其中包括萬象區塊鏈、公信寶、ARPA等。

Layer2隱私計算的破局法則

其中,ARPA採用了Layer 2解決方案。ARPA聯合創始人兼CEO徐茂桐表示,ARPA是全球唯一的MPC可用的layer2計算網絡。Layer 2即數據鏈路層,是OSI參考模型第二層,位於物理層與網絡層之間,負責網絡尋址、錯誤偵測和改錯,以太網、無線局域網(Wi-Fi)和通用分組無線服務(GPRS)等都屬於Layer 2。

如麻省理工學院媒體實驗室数字貨幣計劃(MITDCI)的負責人Neha Narula所講,區塊鏈行業中Layer2的關鍵特徵是“計算被移除至鏈下,以實現隱私或節省計算資源的目的”。大數據行業中的計算一直有巨規模、多樣化、高增速的特徵,將所有數據上鏈進行計算,一方面讓儲存、通信成本急劇上升,另一方面也使隱私銷毀無法實現。

因此,Layer 2隱私計算的特徵是,鏈上僅僅作為賬本,對數據資產實現確權和記錄,實際上的計算全部發生在鏈下。鏈下計算的過程中,為避免數據泄露,計算過程往往會發生在TEE(可信硬件)中,或採用MPC的方式進行計算。ARPA採用的是MPC(安全多方計算,Secure Multi-Party Computation)技術。MPC是一種在無可信第三方的情況下,安全地計算一個約定函數的方式,也是电子選舉、門限簽名以及电子拍賣等諸多應用得以實施的密碼學基礎。MPC由我國目前唯一圖靈獎獲得者姚期智院士提出,其提出場景為百萬富翁問題:在沒有可信第三方的前提下,兩個百萬富翁如何不泄露自己的真實財產狀況來比較誰更有錢。MPC可以在保證各方數據安全的同時,聯合使用各方數據來達到特定的效果,從而充分發揮數據的價值。

多個持有各自私有數據的參與方,共同執行一個計算邏輯計算邏輯(如,求最大值計算),並獲得計算結果。但過程中,參與的每一方均不會泄漏各自數據的計算,被稱之為MPC,MPC可以在Layer 2上實現,而不用依賴於可信第三方進行計算。

這種模式的優勢在於,可以在協議層上解決上述的三個問題:安全、效率、數據孤島。

首先,安全方面,由於採用了區塊鏈技術,去中心化的架構可以避免將數據集中在第三方的服務器上。同樣,得益於MPC的引入,計算過程和結果都處於加密當中,並不會導致數據的泄露。

其次,在效率方面,ARPA聯合創始人兼CEO徐茂桐告訴鏈得得App,MPC在執行計算的過程中,的確無法避免密態數據計算必然產生的低效率問題。與明文數據計算相比,MPC的計算速度約為前者的百分之一到數百分之一,並且計算方越多,效率就會越低。但從實際使用的角度來說,這個速度已經足夠應對大多數的計算場景了:得出計算結果的時間從毫秒級上升到了秒級,對於大部分用戶來說是可以接受的。另一方面,雖然計算方越多,效率就會越低,但大多數的商用場景並不需要太多節點進行運算,所產生的效率問題也處於可以接受的範圍之內。

最後,在打破數據孤島方面,區塊鏈+MPC更有先天的優勢。金融機構在查詢徵信數據的時候,經過多家銀行和金融機構的協同計算,最終只會得出“是”或“否”的結果,過程當中無法獲得其他節點的數據,其他節點也無法獲得個人姓名等信息。

應用方式:促大數據業態全新轉變

ARPA聯合創始人兼CEO徐茂桐認為,區塊鏈+隱私計算的發展,必然會重構當前大數據行業的業態。

在傳統的業態中,企業想要利用數據,首先需要自己收集或購買其他來源的數據,然後利用規模化、集中化的數據中心提供的計算資源進行計算,最終得到結果。在這個過程當中,從第三方數據源購買或出售數據、通過第三方數據中心進行計算,都存在數據泄露的風險。以銀行貸款為例,銀行想要獲得申請人的徵信數據,首先需要查詢央行提供的徵信數據庫,還需要在銀行內部查詢申請人的資金流水和標籤,至於申請人是否還在螞蟻金服等互聯網金融服務提供商有不良信用記錄就無從查起了。查詢的過程發生在數據中心裏,存在較高的風險。

而被重構之後的業態中,企業可以直接通過MPC在保護企業數據的同時與其他節點進行聯合計算,從而將第三方數據源和數據中心從體系內排除出去,減少工作流程,從而達到降低成本、提高效率的目的。在該體系下,銀行可以直接利用MPC查詢其他銀行、金融服務機構,甚至個人提供的徵信數據,最終得到一份徵信報告,显示申請人在多少機構存在不良記錄,其他機構也無法獲取申請人的信息。

2018年信通院發布的《數據流通關鍵技術白皮書》中認為,多方安全計算對解決網絡環境下的信息安全具有重要價值。ARPA聯合創始人兼CEO徐茂桐告訴鏈得得App,ARPA依託其強大的技術團隊,正在與中國信通院合作編寫多方安全計算行業標準,將MPC性能、效率等關鍵指標進行規範,以促進隱私計算和區塊鏈行業的快速發展。

徐茂桐告訴鏈得得App,ARPA的目標是構建分佈式的商業社會,各行各業,甚至個人都能在保證隱私的前提下將自己的數據分享出來,最終創造更大的價值。(本文首發鈦媒體)

更多精彩內容,關注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App返回搜狐,查看更多

責任編輯:

聲明:該文觀點僅代表作者本人,搜狐號系信息發布平台,搜狐僅提供信息存儲空間服務。
開發 PC 隱私
閱讀 ()

投訴

本站聲明:網站內容來源搜狐http://it.sohu.com/?spm=smpc.content.nav.9.15547950851918j6oPHd,如有侵權,請聯繫我們,我們將及時處理

【辦公文具用品網購推薦】

※如何利用一般常見的「L型資料夾」達到廣告宣傳效果?

※專業客製化禮物、贈品設計,辦公用品常見【L夾】搖身一變大受好評!!

※客製專屬滑鼠墊悠遊卡套、透明證件套、手提袋,專業印刷設計廠商!