《數(shù)據(jù)安全法》正式實施:隱私計算開始群雄逐鹿
UCloud的安全屋作為上海普惠金融平臺開放數(shù)據(jù)流通的重要解決方案,為普惠金融提供了較好的數(shù)據(jù)安全管控的基礎(chǔ),而其中的關(guān)鍵就是“數(shù)據(jù)沙箱技術(shù)”。
所謂的“數(shù)據(jù)沙箱”,指的是一個虛擬環(huán)境,特點就是不能運行任何本地的的可執(zhí)行程序,不能從本地計算機文件系統(tǒng)中讀取任何信息,也不能往本地計算機文件系統(tǒng)中寫入任何信息。
那在這種特殊限制環(huán)境下,如何又讓數(shù)據(jù)充分的為下游所用呢?
這就是“數(shù)據(jù)沙箱”的魅力,結(jié)合云平臺和數(shù)據(jù)交換技術(shù),提供訪問控制、數(shù)據(jù)脫敏、安全審計、數(shù)據(jù)分級管理,在保證系統(tǒng)數(shù)據(jù)安全性的同時,實現(xiàn)數(shù)據(jù)價值挖掘。
舉一個例子,在UCloud的數(shù)據(jù)沙箱里,資源申請方通過數(shù)據(jù)沙箱對數(shù)據(jù)進行計算,得出所需計算結(jié)果,但卻不觸碰數(shù)據(jù)本身,嚴(yán)格確保數(shù)據(jù)的所有權(quán)和使用權(quán)分離。
這一解決方案因為符合典型的政府提供公共服務(wù)的特性,后來被運用在多個地方政府的大數(shù)據(jù)服務(wù)項目中。還有一個可想象的場景是,針對有跨境流通需求的數(shù)據(jù),也可以使用安全屋解決方案,在不流通數(shù)據(jù)本身的情況下,有限定地輸出計算結(jié)果,為數(shù)據(jù)安全流通監(jiān)管提供技術(shù)支持。
第二個場景,是醫(yī)療場景。大家知道,醫(yī)療數(shù)據(jù)具有很高的價值,比如可以用于醫(yī)?刭M、保險精算、AI診斷算法的訓(xùn)練等,是現(xiàn)代醫(yī)療、醫(yī)保體系都非常需要的數(shù)據(jù)源。
但和第一類可匯聚、相對簡單的公共數(shù)據(jù)來說,醫(yī)療數(shù)據(jù)的第一個特點是不可匯聚(可以簡單理解為,數(shù)據(jù)分布在不同醫(yī)院),在這種情況下,數(shù)據(jù)沙箱就無法解決問題了。
無法解決的原因很簡單,第一是醫(yī)療數(shù)據(jù)的隱私性極高;第二是,醫(yī)療數(shù)據(jù)的用途(保險精算、疾病研究)中對算法的復(fù)雜度要求不高,但由于是涉及生命的數(shù)據(jù),所以對精度要求極高,這一點用數(shù)據(jù)沙箱無法完美承載。
在這種進階需求的情況下,UCloud在安全屋解決方案中加入“安全多方計算”技術(shù),以滿足這一類場景的需求。
安全多方計算起源于1982年著名計算機科學(xué)家姚期智提出的的“百萬富翁問題”,簡單說,就是在假設(shè)第三方不可信的前提下,如何安全地計算一個約定函數(shù)的問題,這其中的基礎(chǔ)之一是密碼學(xué)。
考慮到篇幅,我們不再介紹更多的細(xì)節(jié),簡言之,安全多方計算上具有高度的數(shù)據(jù)安全,雖然在性能上會有一部分損失,但融合安全屋技術(shù)基礎(chǔ),可很好地滿足跨醫(yī)聯(lián)體協(xié)同的問題,所以正好和這個場景下的需求,很好的對應(yīng)起來。
第三個場景,是數(shù)據(jù)源。主要是多媒體影像的時候,這些數(shù)據(jù)的量很大,而且,一般都要引入AI算法,例如通過攝像頭采集數(shù)據(jù)后,再進行動態(tài)影像的抽取和識別,這種情況下計算的復(fù)雜度會很高,不適合對算力性能有消耗的多方安全計算,。
通過實踐積累,UCloud在安全屋解決方案中同時引入聯(lián)邦學(xué)習(xí)技術(shù)。
聯(lián)邦學(xué)習(xí),又名聯(lián)合學(xué)習(xí)、聯(lián)盟學(xué)習(xí),它的本質(zhì)是一個機器學(xué)習(xí)框架,能有效幫助多個機構(gòu)在滿足用戶隱私保護、數(shù)據(jù)安全和政府法規(guī)的要求下,進行數(shù)據(jù)使用和機器學(xué)習(xí)建模。
簡單來說,兩個機構(gòu)各有一部分?jǐn)?shù)據(jù),比如騰訊有社交數(shù)據(jù)、阿里有電商數(shù)據(jù),但是它們不能也不愿意把雙方數(shù)據(jù)進行合并,聯(lián)邦學(xué)習(xí),就可以通過加密機制下的參數(shù)交換方式,建立一個虛擬的共有模型,通過算法的分發(fā),在數(shù)據(jù)不移動,不泄露,也不影響數(shù)據(jù)合規(guī)的前提下實現(xiàn)共同分析。
同理,這種方式也適合不同的高?蒲袡C構(gòu),例如對醫(yī)療影像資料等具備很高科研價值的多媒體數(shù)據(jù)開放流通
簡而言之,UCloud安全屋從最初的數(shù)據(jù)沙箱技術(shù)演進為如今的三大技術(shù)平臺,服務(wù)客戶的領(lǐng)域也在不斷擴大,從政府、金融,到醫(yī)療、教育等。在這背后是各行各業(yè)對數(shù)據(jù)開放流通的態(tài)度在轉(zhuǎn)變,越來越多行業(yè)愿意通過成熟的解決方案擁抱開放,通過加速數(shù)據(jù)流通創(chuàng)造價值。
所以,在我們可以想見的未來,不僅UCloud的安全屋已經(jīng)從最早的單一的平臺發(fā)展到隱私計算系列三大平臺,彼此相輔相成,其它致力于隱私計算的企業(yè)也會延伸出更多的場景和解決方案,那么,究竟哪些從事隱私計算的企業(yè)會在市場上更有競爭力?隱私計算的商業(yè)模式和商業(yè)價值又有哪些可以進一步挖掘的空間呢?
3
群雄逐鹿
通過幾年累積,今年,隱私計算開始真正進入大眾視野。
無論是政策文件的密集發(fā)布,還是資本的扎堆入場,都在傳遞著同樣一個信號,那就是隱私計算這個細(xì)分領(lǐng)域已經(jīng)迎來了風(fēng)口。Gartner發(fā)布的報告顯示,到2024年,隱私驅(qū)動的數(shù)據(jù)保護和合規(guī)技術(shù)支出將在全球突破150億美元,也就是說將成為一個千億級市場。
事實上,目前隱私計算領(lǐng)域已經(jīng)形成了“一強四小龍”的初步格局,其中的“一強”是國內(nèi)較早研究、并應(yīng)用隱私計算、已經(jīng)有多個跨行業(yè)解決方案的UCloud,而“四小龍”分別指螞蟻金服、微眾銀行、翼方健數(shù)和華控清交。
2018年6月,華控清交由清華大學(xué)發(fā)起成立,創(chuàng)始團隊主要來自清華,公司首席科學(xué)家是清華大學(xué)金融科技研究院副院長兼區(qū)塊鏈研究中心主任徐葳,核心技術(shù)骨干則來自清華大名鼎鼎的“姚班”,而姚班的創(chuàng)立者就是我們前面說的提出多方安全計算設(shè)想的大名鼎鼎的計算機大牛姚期智,可謂根正苗紅。
螞蟻金服、微眾銀行和華控清交的重合之處在于,它們都布局在金融賽道;而翼方健數(shù)則走了與其他三家不同的路線,將業(yè)務(wù)重心放在對隱私計算同樣有較大需求的醫(yī)療賽道,前文也提到了,醫(yī)療場景對于多方安全計算、聯(lián)邦學(xué)習(xí)都有巨大的需求。
另一類競爭者是傳統(tǒng)的安全公司,他們可能從安全切入,確保整個數(shù)據(jù)的安全。
但是真正值得重視的,還是云計算背景的企業(yè)。即使如螞蟻金服、微眾銀行,其背后也是站著阿里云、騰訊云,至于UCloud則是國內(nèi)云計算第一股,以中立云而聞名。
為什么隱私計算離不開云計算?這是典型的場景倒逼。
云計算企業(yè)有三個比較突出的特點,其中首要特點就是——云計算企業(yè)在長期服務(wù)用戶的過程中,更加了解用戶的數(shù)據(jù)使用場景,有結(jié)合場景來開發(fā)產(chǎn)品的優(yōu)勢;
云計算企業(yè)開發(fā)隱私計算技術(shù)的第二個特點,是無論我們說的數(shù)據(jù)沙箱、多方安全計算、聯(lián)邦學(xué)習(xí)等中的哪一種,本身都是大數(shù)據(jù)技術(shù)的一種,底層都需要有數(shù)據(jù)的大量的存儲、分析、計算的能力,與云計算公司本身具有的計算、大數(shù)據(jù)、人工智能等技術(shù)具有很高的契合度;這是專門搞算法、搞安全的隱私計算創(chuàng)業(yè)公司所不具備的場景。
另外很重要的一點,就是我們前面談到的,數(shù)據(jù)要應(yīng)用,薄弱環(huán)節(jié)在于流通,但并不是說儲存環(huán)節(jié)就不需要安全能力,所以技術(shù)過硬的云計算廠商,本身具有安全能力的積累,這比某些專門做隱私計算的企業(yè),更有底層安全保障。
這個行業(yè)的規(guī)律往往是,從實際需求出發(fā)的技術(shù)創(chuàng)新最能切合實用。比如騰訊有大量社交需求,所以音視頻技術(shù)能力不斷得到強化,可以復(fù)用在文娛、游戲甚至是騰訊會議這樣的業(yè)務(wù)里;阿里有電商業(yè)務(wù),所以關(guān)注云計算,以及金融科技賽道科技創(chuàng)新,所以有了螞蟻金服;UCloud則因為創(chuàng)始人出身背景,一直追求差異化競爭等企業(yè)定位,非常關(guān)注云上數(shù)據(jù)安全,延伸到數(shù)據(jù)開放流通領(lǐng)域,就有了安全屋……所以筆者認(rèn)為,隱私計算賽道的下一個競爭重點,一定是有云計算背景的企業(yè)、垂直隱私計算研發(fā)的企業(yè)和傳統(tǒng)安全企業(yè)的“三國大戰(zhàn)”。
而這場大戰(zhàn)值得期待,因為這不是基于燒錢的營銷競爭,是實實在在比拼技術(shù)創(chuàng)新能力的競爭,這種競爭越激烈,我們技術(shù)進步就越快。
而這場競爭,離不開與商業(yè)模式的結(jié)合。
從目前看來,隱私計算至少有三種商業(yè)模式有待探索。
第一種商業(yè)模式,提供底層技術(shù)服務(wù)。就像UCloud用“安全屋”,為上海、廈門的地方政府提供政府?dāng)?shù)據(jù)開放的安全服務(wù),成為底層技術(shù)服務(wù)平臺,通過平臺服務(wù)費的方式來收費,這是最原始也是最確實的一種路徑。
第二種商業(yè)模式,是不僅僅做平臺,還把隱私計算技術(shù)拿出來產(chǎn)品化,其中既可以是像安恒這樣的安全公司,推出的數(shù)據(jù)安全咨詢服務(wù)體系等主打安全的產(chǎn)品,也可以像UCloud、百度智能云這樣本身有大數(shù)據(jù)分析和人工智能專長的企業(yè),把隱私計算+云計算+大數(shù)據(jù)/AI能力根據(jù)場景整合起來,形成類似深度學(xué)習(xí)平臺這樣的體系,從底層模型到開發(fā)套件、低代碼工具、云計算套餐等整合起來,為廣泛的生態(tài)用戶提供強大而靈活的應(yīng)用及二次開發(fā)能力,是大平臺”型模式,這種模式可以很好的解決第一種模式模板化的服務(wù)能力,是真正隱私計算的普及之道。
第三種模式更有想象力,就是做大數(shù)據(jù)交易平臺。2020年4月,《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》正式發(fā)布,為推進數(shù)據(jù)要素市場化改革指明了方向;今年3月,北京國際大數(shù)據(jù)交易所正式成立,深圳等城市也相繼發(fā)文規(guī)劃設(shè)立交易場所進行大數(shù)據(jù)交易。伴隨著《數(shù)據(jù)安全法》的實施,數(shù)據(jù)確權(quán)等問題開始有法可依,為保護數(shù)據(jù)資源的安全和可交易,提供了法律依據(jù),這是面向未來、高度有想象力的一種數(shù)據(jù)交易模式。
目前,大數(shù)據(jù)應(yīng)用的成功案例主要集中在歐美發(fā)達國家,國內(nèi)外大數(shù)據(jù)產(chǎn)業(yè)差距較大。但從應(yīng)用場景和社會數(shù)字化建設(shè)程度來說,國內(nèi)的后發(fā)市場擁有很多優(yōu)勢,是一個非常有潛力的市場。國內(nèi)蓬勃發(fā)展的大數(shù)據(jù)產(chǎn)業(yè),一定會讓中國的數(shù)據(jù)流通產(chǎn)業(yè)迎來更大發(fā)展機遇。受到市場需求推動的數(shù)據(jù)安全流通技術(shù)和產(chǎn)品,勢必會在挑戰(zhàn)和機遇中迎來快速發(fā)展的機遇,趕超全球先進的技術(shù)。
這是一個屬于技術(shù)創(chuàng)新和商業(yè)創(chuàng)新疊加的新時代,希望中國的隱私計算能找到自己的星辰大海。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞