“兩個百萬富翁在街頭相遇,他們都想比較一下誰更有錢,但誰都不想透露自己到底有多少錢。如何在保護雙方隱私且不通過第三方的情況下,得出誰更富有?”
這就是著名的“姚氏百萬富翁問題”,由2000年圖靈獎得主、中國科學院院士姚期智在1982年提出,問題描繪的是當前大熱的隱私計算場景。在這一經典問題的基礎上,姚期智進一步提出了多方安全計算理論(Secure Multi-Party Computation,MPC),隱私計算技術體系也由此發展而來。
隨著人工智能、大數據等技術發展成熟,數據在當今世界扮演著日益重要的角色。“姚氏百萬富翁問題”更是直指隱私數據計算在金融場景應用中的重要性。現實中,金融機構掌握了大量敏感信息,對數據安全要求較高。同時,金融業信息化建設較早,是當前數據生態中場景相對清晰、數據交易需求巨大的買家。據《財經》記者了解,有銀行每年用于數據采購的費用就高達億元。
當前金融數字化浪潮更是將隱私計算推向金融發展的戰略高地。但如果不在源頭做好制度建設,則可能引發隱私侵犯的惡果。
清華大學國家金融研究院院長朱民指出,最新統計結果表明,歐盟地區8%的GDP從數據中產生。但數據的大規模流動,也帶來了數據泄露、濫用等風險。
近日,中國人民銀行行長易綱在香港金融科技周公開講話指出,此前已有大型科技公司未經允許收集并不當使用客戶信息,甚至出現客戶數據泄露事件,個人信息保護亟待加強。同時,易綱強調,要在充分保護個人信息的前提下,探索實現更加精確的數據確權,更加便捷的數據交易,更合理的數據使用,激發市場主體活力和科技創新能力。
如何在數據保護與合理使用之間維持平衡?業界對隱私計算寄予厚望。近日,首個隱私計算金融基礎設施已落地。這項被稱為多方安全計算平臺的技術由光大銀行和華控清交信息科技(北京)有限公司(下稱“華控清交”)聯合開發。
據平臺承建方華控清交團隊介紹,該平臺能夠使多個非互信參與方,在數據相互保密的前提下,對任意函數進行計算,實現“數據可用不可見,用途可控可計量”。
上線該平臺后,光大銀行得以聯合母公司光大集團旗下保險、信托、旅游等成員單位,開展客戶金融資產、消費偏好、風險偏好等數據的聯合統計與建模,加強集團內部數據互聯互通。
與以往業界落地的隱私計算應用不同,在該平臺上,光大銀行能夠自行建設隱私計算場景。“二者區別相當于App和操作系統。”光大銀行總行信息科技部副總經理王磊告訴《財經》記者,“這是金融業首個企業級數據流通基礎設施平臺,意味著隱私計算工程化取得突破性進展。”
技術平臺的落地只是大規模數據資產交易起步的一個支點。“數據大規模流通的基礎設施建設包括技術和制度兩個方面。”華控清交董事長張旭東對《財經》記者表示,相比技術,制度建設更加關鍵。此前,《財經》記者曾報道更高層面指導文件即將出臺,近期再度獲悉,該文件或將掃清數據確權難等數據資產化的障礙,為數據的大規模流通提供更進一步指導。
數據資產化被業界看作是實現數據規范應用的重要方向,隨著關鍵技術和相關制度的逐步完善,當今泛濫的數據交易將有望被導入正途。
什么是隱私計算?
根據中國信息通信研究院的定義,隱私計算(或隱私保護計算)是一套包含人工智能、密碼學、數據科學等眾多領域交叉融合的跨學科技術體系,實現數據的“可用不可見”,其中關鍵技術包括聯邦學習、多方安全計算、機密計算、差分隱私、同態加密等。
2021年8月26日,光大銀行多方安全計算平臺正式上線,首次讓姚氏理論從實驗室走上企業的生產線。
據悉,該平臺可以保障各企業原始數據在“可用不可見”“可控可計量”的前提下,規范開展數據共享與融合應用,實現跨企業間隱匿查詢、聯合統計、聯合建模等功能,可適用聯合營銷、聯合風控、統一授信、業務合規等多種場景。
以光大信托和光大銀行數據互通為例,光大銀行私人銀行客戶與光大信托的客戶同屬高凈值客戶,但此前受制于合規要求,兩大機構客戶信息無法互通。當前,依托多方安全計算平臺,光大銀行和光大信托正將各自的高凈值客戶信息進行聯合建模,挖掘出雙方不重合的那部分客戶,并針對這部分客戶開展聯合營銷獲客。這一過程中,雙方均無法獲知對方客戶數據。
據王磊介紹,前述平臺決策主要涉及兩個方面考量。首先是安全性。“多方安全計算是從底層的運算符號開始加密,自下而上層層加密,在多個主流技術方案里安全等級最高。”其次是計算性能。由于加密運算量大,業內盛傳多方安全計算存在計算效率較低、算力消耗大等缺點。對此,王磊表示,多方安全計算運算速度確實更慢,但性能差距并不顯著。“測試結果顯示,他們(解決方案的)性能是我們能接受的。”當前,該平臺能夠完成TB(太字節)級別的數據處理,王磊表示,對于數據共享來說,這個量級已經夠用。
值得注意的是,此前金融行業已有多個隱私計算應用場景落地。例如,螞蟻集團旗下螞蟻鏈推出了摩斯多方安全計算平臺,并依托該平臺推出了聯合營銷、聯合風控等應用場景,且在重慶富民銀行等金融機構落地。
不過,多位受訪者告訴《財經》記者,以往落地的隱私計算應用多是針對具體場景,相當于做了一個App,而光大銀行多方安全計算平臺類似一個可搭載多個App的操作系統,且設有通用編程接口,企業可根據自身需要開發新的場景應用。“將一個可編程可擴展的隱私計算平臺嵌入銀行生產系統,在業內尚屬首次。”華控清交副總裁、金融板塊負責人呂亞振強調。
此外,王磊向《財經》記者透露,除集團內部數據協同外,光大銀行正在與多個集團外部企業探討數據合作,未來可能共同開發聯合風控等更多應用場景。
實際上,有銀行業金融科技公司對《財經》記者直言,部分金融科技巨頭或許技術能力上沒有問題,但銀行對基礎設施建設的安全和合規要求非常高,決策過程中更傾向于純技術公司。
以光大銀行多方安全計算平臺部署為例,華控清交副總裁、技術負責人黃斌告訴《財經》記者,該平臺僅評審就耗時兩個月,除常見的“同城雙活”毫秒級無感切換等要求外,光大銀行對系統合規性組織了八次評審會議,對400余項評審項目一一過審。過程中,評審方幾乎把系統里每一段代碼翻出來檢查,操作系統版本必須是經認證版本,所有中間件必須在經認證的產品目錄內。王磊坦言:“從初始產品到真正部署,基本讓他們重新干了一遍。”華控清交團隊將這一過程形容為“扒了一層皮”。
張旭東表示,該平臺是當前業內唯一進入銀行生產系統使用的基礎設施平臺案例。平臺上線后,業界對此高度關注,多家金融機構就此與華控清交展開接洽。10月12日,該公司正式宣布完成5億元B輪融資,投后估值超40億元,投資方包括浦發銀行旗下浦信資本、中金公司等。
此外,據《財經》記者多方了解,當前工商銀行、交通銀行、農業銀行等銀行的隱私計算平臺項目也都在建設中。
光大銀行對隱私計算的探索始于集團層面的協同需求。作為一家金融控股集團,光大集團旗下擁有財富、投資、投行、環保、旅游、健康六大業務板塊,僅核心企業就有十余家。2018年,董事長李曉鵬提出構建財富E-SBU(光大生態協同戰略),希望加強集團各業務板塊間的業務協同,其中包括集團成員之間的數據互聯互通。
與此同時,近幾年國家對數據安全重視程度不斷提高,金融機構掌握了用戶大量敏感信息,其信息保護工作受到愈發嚴格的監管。“我們一直在思考,怎樣用一種好的方式,既實現數據互聯互通,又能保證數據安全。”王磊告訴《財經》記者。盡管是集團成員內部協同,但畢竟是兩個獨立法人,對于客戶信息、交易信息的傳輸共享,光大仍然保持慎重。2020年底,央行發布《多方安全計算金融應用技術規范》金融行業標準,為金融機構的數據安全流通提供了技術規范和指導。同期,光大銀行啟動了隱私計算平臺建設工作。
光大銀行探索隱私計算的歷程在當下頗具代表性。正如朱民所說:“數據本身并無價值,只有在使用時,數據才產生價值。”麥肯錫分析發現,2005年到2014年期間,跨境數據流動使全球GDP增長了約3%,數據流動所產生的附加值約為2.3萬億美元。為了挖掘數據資源背后的價值,各界都在自發探索數據共享流通的方式。
隨著數據流動規模不斷增長,與數據泄露相關的風險也逐漸暴露。近日,工信部通報了第20批,共38個存在超范圍索取權限、過度收集用戶個人信息等問題的App,涉及QQ音樂、騰訊新聞、小紅書、豆瓣等知名應用。中國銀保監會主席郭樹清曾在公開講話中指出,一些科技公司利用市場優勢,過度采集、使用企業和個人數據,甚至盜賣數據。這些行為沒有得到用戶充分授權,嚴重侵犯企業利益和個人隱私。近年來,各國均在立法加強數據保護,如歐盟的《通用數據保護條例》,中國的《網絡安全法》《數據安全法》《個人信息保護法》等。
數據流動與安全之間的矛盾日益突出,隱私計算被認為是解決這一矛盾的有效技術手段。從理論上說,隱私計算能夠在不暴露原始數據的情況下,實現數據的融合使用,即“數據不動價值動”。另一方面,多方安全計算等隱私計算技術能夠實現,精準控制數據融合使用的目的和方式,即控制數據算什么、怎么算,讓數據使用監管成為可能。
張旭東將數據的融合使用形容為開化工廠,若將不同化學原料不加監管混合使用,可能產生巨大的風險。2021年外灘金融峰會上,清華大學五道口金融學院院長張曉慧指出,一些大型科技公司,尤其是數字平臺公司處于算法支配地位,形成“算法霸權”,利用算法搞不公平排名、算法歧視(如大數據殺熟)、誘導消費者過度消費和承擔風險等,嚴重危害算法相對人也就是消費者的合法權益。她呼吁,對算法實施公開透明的監管。
實際上,數據監管或許已經不遠。據《財經》記者了解,華控清交已經與央行旗下金融科技子公司成方金融信息技術服務有限公司達成戰略合作,為后者提供隱私計算相關技術支持。張旭東指出,《數據安全法》第六條規定,各地區、各部門對本地區、本部門工作中收集和產生的數據及數據安全負責,意味著行業主管部門必須對該行業數據的使用目的和方式進行監管,“數據監管勢在必行”。
如何才能讓數據發揮出最大的價值?朱民認為,答案是數據資產化。“在市場經濟原則下,要更好地滿足數據技術對數據規模、維度、密度的要求,就必須把數據從‘資源’變成‘資產’。”
2020年,國務院發布《關于構建更加完善的要素市場化配置體制機制的意見》,將數據與土地、勞動力、技術和資本等生產要素相提并論,并提出“加快培育數據要素市場”。“國家提出把數據作為一種生產要素,就意味著數據可以作為一種資產。”光大銀行副行長楊兵兵對《財經》記者說道。
朱民指出,數據資產化面臨諸多難題,首先是數據的產權模糊,由此引申出了數據的隱私和安全問題,最后是估值和定價相對困難。此前,楊兵兵曾將數據資產化的三大必備要素總結為確權、估值和交易。
此前,業內針對數據的確權問題進行過激烈探討,但一直未能真正確定數據權屬。當前,將數據所有權與使用權、分配權等權屬分離,進而推動數據流動的構想逐漸占據上風。
朱民指出,數據資產化可以借鑒中國土地所有制改革經驗,將數據的所有權、使用權、經營權和分配權進行分離,不再爭議所有權,而是通過授權機制,僅交易數據的使用權。
張旭東亦告訴《財經》記者,應該淡化所有權,側重數據的控制權和使用權。
重慶市原市長、復旦大學特聘教授黃奇帆則認為,數據涉及管轄權、交易權、所有權、使用權和財產分配權等五項基本權利,各類主體基于自身在數據交易環節中的位置來行使相應權利。值得注意的是,黃奇帆認為,個人的基本信息和基于自身行為產生的各種數據,個人理應享有所有權。該類數據變現形成的收益,理應向個人分配。
據《財經》記者了解,即將出爐的高層文件將就數據確權問題給出更加明確的指導。
確權問題之后,另一個讓業界頭疼的難題是數據估值。朱民指出,數據價值很難用成本法來計算,而以收益法計算則要考慮權利金的節約、超額收益和增量收益等多重因素。以市場法估算數據價值需要每一個所有者、經營者、使用者和分配者都在其中公平地分享的一個權重,共同投資數據,共同分享長期收益。
黃奇帆則提出,應發揮市場在數據資源配置中的決定性作用,由交易的雙方根據數據的價值協商確定價格。
實踐中,對數據估值的探索早已在進行。2021年1月,光大銀行發布《商業銀行數據資產估值白皮書》,從成本法、收益法、市場法三大經典估值體系出發,探討數據估值。
近日,姚期智院士在以《數字經濟領域的核心科技》為題的演講中,首次介紹了數據要素定價理論與實現算法。該算法由姚期智領導的團隊研發,并由交叉信息核心技術研究院金融科技與監管科技中心團隊探索實踐。
另一方面,正如黃奇帆所說,業內期待市場在數據估值中起關鍵作用,即在流通中逐步完善定價。
楊兵兵曾建議,鼓勵合規數據交易的先行先試,同時逐步理清各類數據主體與相對應的權益,再全面構建和完善金融數據交易市場的體制機制與法律合規等框架。現實中,光大銀行當前每年都要花費近億元從外部采購數據。
王磊告訴《財經》記者,當前銀行采購的數據主要是公共數據,比較敏感的如個人數據屬于監管紅線,無法進行交易。此外,線下點對點交易存在諸如合規風險等系列問題,各方都在期待一個更高效、規范的數據要素市場。
針對數據流通環節,朱民提出了三種可能的商業模式,數據平臺交易模式、數據銀行模式和數據信托模式。其中,以數據交易所為主要形態的數據平臺交易模式當前已在多地實施。
2021年3月31日,基于“數據可用不可見,用途可控可計量”新型交易范式的北京國際大數據交易所(下稱“北數所”)揭牌成立。據悉,北數所將在推進底層技術創新的基礎上,以數據使用價值為基本交易對象,探索數據資產評估定價、交易規則、收益分配等流通機制。據媒體報道,北數所基于自主知識產權開發的數據交易平臺IDeX系統已成功上線,目前已實現與城市公共數據的聯通和共享,正同步推動行業數據、社會數據進場。
值得注意的是,數據資產化的探索很難一蹴而就。一位業內資深專家告訴《財經》記者,基于數據生產要素的產業發展需要一個過程,當前業界仍然處于早期探索過程中,數據產業未來將是什么形態,仍然存在很多變數。
(作者為《財經》記者)
本文來自微信公眾號“財經五月花”(ID:Caijing-MayFlower),作者:唐郡,編輯:袁滿,36氪經授權發布。