3個互不相識的人,在不知道每個人具體工資的情況下,如何計算出工資平均值?
答案是,3個人把每個人的工資拆成3份,自己留1份,另兩份隨機發給其他2人,這樣整個網絡內就有9份工資碎片,每個人掌握其中3個碎片,對每個人的3個碎片求和,再對三個“和”求和,最后得出平均值。
這只是一個最簡單的隱私計算模型。在明文數據相互保密的前提下,隱私計算可以進行高效數據整合和計算,加速數據分享。這為打破數據壁壘、連接數據孤島和建立數據確權機制提供了新的技術。
9月1日,我國第一部有關數據安全的專門法律——《數據安全法》正式施行,成為數據安全保障和數字經濟發展領域的重要基石。該法明確提出,發展與安全并重,在強調數據安全的基礎上鼓勵數據應用和流通,同時鼓勵相關技術的研究與應用。
數據使用面臨重重障礙“數據孤島”頻發
數據作為新型生產要素的重要性急劇上升。同時,反復出現的數據安全與隱私泄露問題也愈發被大眾關注,數據使用與隱私保護之間的矛盾日益突出。
華控清交副總裁宋巍就談到,大量有價值的數據在公共機構手中,“藏在閨中人不識”。
同樣,互聯網采集了很多公眾數據,但《數據安全法》實施后,互聯網也不敢輕易“交出”數據,加劇了數據壟斷。
“五六年前,社會普遍對數據安全的要求非常粗放,只講最后的效果,而不談過程的合規與安全。但隨著《數據安全法》《網絡安全法》等一系列法規的出臺實施,這就好比在企業頭上懸著一把達摩克里斯之劍,讓企業在考慮開放或使用數據的同時,帶著深刻的合規安全擔憂,這極大地規范了市場行為,但從另一個角度來講,也加劇了數據孤島現象。”深圳洞見科技CEO姚明指出。
企業要想獲得數據怎么辦?宋巍說,兩家互聯網公司擁有的數據維度不一樣,因為沒有一個平臺可以推動數據互換,各自想要對方的數據,最后就去并購,反而加速了壟斷的形成。
“大家都是在想辦法收集數據,但很少想到怎么開放數據。”宋巍說,一邊是數據沒有派上用場,一邊卻需要投入重金存儲數據。
翼方健數首席科學家張霖濤也注意到,醫院科研人員需要數據時,常常到各個科室拿U盤復制,過程還需要科室領導、院領導層層簽字;醫院交換病歷或者影像數據,醫生之間各自打電話要樣本,整個過程也不是在系統或平臺上完成。
“可用不可見”新技術為數據協作護航
“數據市場將打破數據孤島的架構和平臺。”浙江大學求是講席教授任奎說,一個完整的數據市場,一般包括四個研究方向,數據脫敏、數據確權,數據溯源和數據定價,這些研究方向都與隱私計算密不可分。
何謂隱私計算?即兩個機構聯合建模為需求方提供服務,但數據的原文不會被各方看到,甚至不用出數據庫,做到數據“可用而不可見”,從而保護數據隱私。
“在不讓渡數據所有權的情況下,隱私計算可以推動數據治理從靜態走向動態。”姚明通過風控場景舉例:客戶想去A銀行借貸,A銀行也非常想知道客戶在B、C、D銀行的負債情況,但是客戶的信息對銀行來說都是高度保密的,銀行也不希望外部掌握自己客戶的信息。
基于銀行提供的歷史樣本數據,在各方原始數據都不出庫的情況下,通過隱私計算技術建立風險預測模型,A銀行得到的是一個風險評估結果,以評分或評級方式展現不同風險狀況。
同樣,政務數據可以服務于金融行業,基于隱私計算技術的政務金融聯合建模,能夠更幫助金融機構建立更精準的風控模型。
“過去,銀行對借貸申請主體做上門盡調,動輒幾百頁的資料短時間內根本看不過來。”姚明說,現在,隱私計算技術有助于打消數據合作方之間對于數據安全的擔憂和顧慮,進而增強銀行使用外部數據的能力,提升風控管理的效率和效果,促進普惠金融發展。
深圳星云的客戶也集中在金融等領域,公司創始人陳沫說,銀行在貸前、貸中、貸后都會有精細化運營,客戶在銀行貸了一筆錢,這筆錢其他銀行是不知道的,其他銀行只有借助外部數據才能進行風險預測,因此展開異業合作也是必然的。“比如,我去銀行申請一筆信用貸,銀行就會非常關注在工商、社保等方面的數據,那么銀行就可以判斷,發放多少貸款、客戶是否有逾期風險,等等。”
隨著數字化轉型的加快,過去銀行貸款的風控是離線的,需要兩天后才出報告,而現在是“秒貸”,這些都在倒逼銀行風控需要借助新技術來實現。
通過手機App下載了多個借款App,從不同的渠道進行了貸款的人對銀行來說,屬于高??蛻?,甚至存在欺詐,但銀行并不掌握這些數據,而是掌握在手機應用商店手中。“當然,不可能將這些數據直接給到銀行,只是經過用戶授權利用這些數據建模,銀行看到的報告是客戶畫像。”陳沫說,過去金融、互聯網等企業積累了很多數據,但較為封閉,數據只是為自己所用,而未來則是使用別人的數據,或給別人用數據。
“過去,你要把數據放在一個平臺上運行,交易中數據也就要給到別人、數據就可以被他人控制,而現在,通過抽取統計數據和模型使用,也可以保證數據不會被操作方看到。”張霖濤說。
站上新風口百億市場規模待發
隱私計算在金融、醫療等行業已經形成了一套相對成熟的應用機制。北京市大數據中心副主任、市經信局大數據應用與產業處處長唐建國舉例說,工商銀行北京分行應用金融專區,通過隱私計算,篩選出了高價值客戶名單,也可以像互聯網金融那樣,做到快速放貸、快速審核,降低交易成本,提供3.5%的年貸款利率產品。
他還表示,疫情防控期間,為助力企業復工復產,北京金融公共數據專區匯聚了200多萬市場主體,形成了20多億條數據,委托北京金控集團數據計算、授權經營,經過整理后的數據給金融、保險機構提供增值服務,如首貸中心面向沒有貸款經歷的中小企業提供融資支持,“我看到了可喜的成績,上萬家中小企業獲得了首貸中心的業務支持,將近400多億的金融產品”。
2021年,被業內稱之為“隱私計算應用元年”,微眾銀行和畢馬威報告預測,國內隱私計算系統的銷售和服務收入在三年內有望達到100億至200億元。
面對數據流通給隱私計算行業帶來巨大的商業機會,陳沫表示,行業已經探索出三種商業模式,第一種是銷售算力擴容;第二種是銷售牌照;第三種是技術服務。對星云來說,三者的營收相互持平。
一個新興的隱私計算產業鏈正在成形。在星云科技所在的深圳,匯聚了超過300家大數據企業,也已經形成了較為完備的大數據產業鏈,涌現出了諸如微眾銀行、深圳星云、洞見科技等一批區塊鏈與隱私計算服務企業。
而在9月,珠海市正式發布《珠海市關于加強隱私計算在城市數字化轉型中應用的指導意見》,成為國內首個以“隱私計算”命名的城市級政策文件。
■觀點
中國科學院自動化研究所研究員曾毅:
應建立更完善的
用戶“知情—同意”機制
試圖保護用戶數據,代價是犧牲其它方面,隱私計算在落地中還存在一些障礙。例如,它回避了一個關鍵問題,即用戶知情同意權,用戶是否同意把自己的數據,以模型的形式改善或服務于其他的企業和應用?如果沒有,這就違反了用戶知情同意權。這似乎是為了解決問題A引入了問題B,更完善的用戶“知情—同意”機制需要進一步建立。
同時,差分隱私是隱私保護中應用比較多的技術,但為了保護隱私而使模式識別率下降10%到30%,可能很多企業也會猶豫。