本文來自數據猿,作者/晴天。
1982年,姚期智教授給業界講了一個很好的故事:在沒有可信第三方的前提下,兩個百萬富翁,如何在不泄露自己真實財產的情況下,卻能準確地比較出誰更有錢?通過解決這個問題,多方安全計算走進了大眾的視野。
多個持有各自私有數據的參與方,在不泄露各自真實數據的情況下,共同執行一個計算邏輯,從而獲得計算結果。舉個簡單的例子,一位招聘專家同時面對兩位候選人的時候,在不違反前述就職單位對薪資保密的要求下,卻能通過多方安全計算得出誰的薪資更高,而在得知結果的過程中,不依賴于任何可信的第三方,這就是多方安全計算的實際應用。
多方安全計算技術框架圖片來源:隱私計算白皮書(2021)
2018年,中國信息通信研究院(以下簡稱“信通院”)發布的《數據流通白皮書》中對多方安全計算的重要意義給出了明確的說明:安全多方計算技術,可以確保在保護數據提供方的前提下,實現多方安全協同計算,并確保各參與方得到正確的數據結果反饋。安全多方計算拓展了傳統分布式計算以及信息安全范疇,為網絡協作計算提供了一種新的計算模式,對解決網絡環境下的信息安全具有重要價值。利用安全多方計算協議,一方面可以充分實現持有節點間互聯合作,另外一個方面又可保證密碼的安全性。
隨著大數據產業的蓬勃發展,數據的安全問題日益凸顯。《網絡安全法》、《數據安全法》、《個人信息保護法》等法律法規的相繼頒布實施,也在助推數據隱私保護進入了一個發展的新階段。尤其是《個人信息保護法》的落地實施,對個人數據信息也有了進一步的監管規范。
不管是監管層面還是企業、個人層面對于數據的保護意識都逐漸增強。隱私計算以及多方安全計算的出現,很好地解決了對于數據隱私保護的安全問題。同時,在充分確保數據隱私不被泄露的前提下,多方安全計算對于數據確權、數據結果的價值挖掘也具備相當重要的意義,對于助推數據要素的共享流通,更是起到了關鍵性的安全作用。
市場規模逐漸顯現,市場潛力還有待深度挖掘
從2020年開始,隱私計算火了,作為隱私計算的三大主流技術:多方安全計算、聯邦學習、可信執行環境也紛紛讓市場參與者們心動不已。
根據fortune business insights發布的數據顯示,2021年,全球隱私計算市場規模達15.7億美元,預計到2028年將達到177.5億美元,2021年~2028年的復合年增長率達41.5%。
而另據騰訊發布的《深潛數據藍海:隱私計算行業研究報告》顯示,目前中國隱私計算市場達到上億元規模,預計未來幾年將形成數十億規模的市場。樂觀估計,未來3年將達100-200億人民幣的空間,甚至將撬動千億級的數據平臺運營收入空間。
艾瑞咨詢發布的《2022年中國隱私計算行業研究報告》稱從商業模式及市場規模來看,目前隱私計算正值行業基建期,市場需求集中在基礎產品服務,數據運營服務將開啟“隱私計算+”的藍海市場。
報告預計:2022年~2025年是中國隱私計算基礎設施建設的關鍵時期,2023年將進入前“隱私計算+”時代。“隱私計算+”時代是在完善隱私計算基礎設施建設的前提下,行業用戶展開應用層差異化場景實踐的時期。商用實踐的聚焦點由“基礎產品服務”轉向“數據運營服務”。因此打造卓越數據智能產品將成為核心競爭力。
為什么隱私計算、多方安全計算的需求如此旺盛?隱私最大化,或許是助推多方安全計算的最大推手。從技術原理來說,多方安全計算是基于如不經意傳輸、混淆電路、秘密分享等密碼學的原理基礎,實現兩方或者多方的協同計算。在協同計算的過程中,原始數據不會被泄露,只有計算的結果可以被數據接收方獲取。而且大部分的結果獲取,也都是需要通過密鑰取得,因此具備了較高的安全性,可以充分滿足多個數據參與方對于原始數據不出庫,數據可用不可見的需求。
《2022年中國隱私計算行業研究報告》中明確指出:多方協同是多方安全計算應用實踐的一大特點,不同于其他類型技術,在商用實踐中,技術服務商除了提供平臺建設外,還會為客戶提供數據調用(尋找數據源)服務,且多方安全計算也經常需要兩方以上的參與者展開聯合計算,因此多方協同特性十分明顯。
基于這些優勢,多方安全計算已經在金融、醫療、政務等敏感性數據應用廣泛的行業,率先實現了數據加密技術與安全的完美融合,提供了解決數據安全、數據隱私保護與數據價值挖掘之間矛盾的新思路。
而且,多方安全計算在監管層面也獲得了一定的認可。中國人民銀行在《金融科技(FinTech)發展規劃(2019—2021年)》中就明確指出要構建適應互聯網時代的移動終端可信環境,充分利用可信計算、安全多方計算提升金融科技創新。可以說,多方安全計算的發展之路已初見雛形。然而面對種種機遇,多方安全計算的真正價值尚有補足的空間。
富數科技的相關負責人也曾向數據猿表示:現階段中國隱私計算市場規模空間尚可,市場收入主要來源于產品售賣或平臺建設方面,大量技術服務商的營收規模仍然處于億級以下水平。在金融機構聯合風控與政務數據開放這些當前隱私計算主流應用場景中,技術廠商的方案逐漸趨同,但隨著標準化產品、性能要求、場景需求復雜化等的出現,模塊輸出比例會有所下降。未來一段時間內,在生物醫療、能源制造、智能網聯等其他行業的落地與商業模式實現仍待開發探索。多方安全計算在未來的一定時間段內仍會是主流的技術輸出路線。
行業發展日趨完善,競爭格局尚未明晰
自2019年開始,我國隱私計算行業進入快速發展期,國內眾多廠商開始布局相關賽道,隨著行業客戶在應用層實踐的逐步加深,數據運營、算力加速等需求也不斷涌現。比如綜合型互聯網巨頭螞蟻集團、百度和網絡安全及大數據公司京東數科,人工智能廠商等企業賽道的參與者一起涌入隱私計算行業,同時也涌現出了如華控清交、藍象智聯、锘崴科技等大批垂類的初創企業。
據企查查數據不完全統計,2020年我國隱私計算行業新成立企業數量為71家,同比增長33.96%。截至目前我國隱私計算行業注冊企業或涵蓋隱私計算業務的企業超百家,其中,提供多方安全計算業務、產品或具備相關專利的企業超過80家。
2021年,中國信息通信研究院云計算與大數據研究所(以下簡稱“云大所”)發布的《隱私計算白皮書》中提到,從技術路線上看,多方安全計算的復雜度高、開發難度大,龍頭企業多致力于此,力圖打造以多方安全計算為底座的數據流通基礎設施,26%的企業布局了這類技術方案。
國內隱私計算平臺應用技術路線來源:中國信通院研究統計結果
互聯網巨頭、綜合IT企服廠商以及其他賽道企業的涌入,讓隱私計算領域魚龍混雜,其發展也充滿了一定的未知。由于目前隱私計算行業還處于早期發展階段,尤其是多方安全計算行業的發展方向還不甚明朗,因此未來的競爭格局也尚未可知。
在行業發展方面,目前我國也在積極推動由云大所牽頭,聯合行業領軍企業、專家制訂及修訂的行業發展標準。截至目前,已開展多批可信隱私計算評測,目前已有多款隱私計算產品通過該功能和性能評測,覆蓋了國內90%以上擁有隱私計算產品的重要企業。
根據信通院的官網顯示,目前已經制定并設立的關于多方安全計算的相關標準及評測有:《基于多方安全計算的數據流通產品技術要求與測試方法》、《隱私計算多方安全計算產品性能要求和測試方法》、多方安全計算基礎能力專項評測、多方安全計算性能專項評測等等。由此可見,從行業發展層面,多方安全計算領域已經充分引起了行業的廣泛關注。
除了行業對隱私計算領域以及多方安全計算領域關注度明顯提高之外,資本市場對于隱私計算領域的企業也格外關注。據已發布的公開資料以及某網站不完全統計,從2021年到2022年上半年,隱私計算領域企業融資共14家、融資21起。其中,2021年共有13起,2022年至今已有8起。其中,華控清交、洞見科技、數犢科技、藍象智聯、富數科技等都具備非常強勁的多方安全計算領域實力。
從已披露的融資金額來看,融資金額達到1億元以上的有華控清交(B輪,7億元人民幣)、數牘科技(Pre-A輪+A輪,3.08億元人民幣)、翼方健數(B+輪,3億元人民幣)、藍象智聯(A輪,約2億元人民幣)、锘崴科技(B輪,億元人民幣)。
從行業整體來看,目前隱私計算賽道的競爭者從數量上來說體量還不夠大,因此競爭格局也尚未完全明晰。但是,各個廠商已開始布局細分領域,以期在市場還未完全成形之前,搶占先機。從發展領域來看,目前多方安全計算應用較多的是在金融。據艾瑞咨詢《2022年中國隱私計算行業研究報告》顯示,預計2022年展開隱私計算投入的金融機構數量約是2021年的2倍或2倍以上(增量部分包括了在2021年處于POC進而在2022年正式投入應用的金融機構)。參與隱私計算實踐的金融機構數量的增加,也在一定程度上讓技術實踐廣度、深度實現同頻提升。
理想與現實的博弈,決不能讓技術“卡脖子”
只有技術跑贏市場,才能占得先機!但是不得不說,技術廠商們特別容易陷入一個怪圈,那就是將自身的技術優勢無限放大,或者夸大概念性成分,但是到實際落地應用的階段才發現,很多技術難題尚未解決,產品功能尚未完善,應用場景適配能力還有待提升等等,這顯然也是技術與市場的天然矛盾。
多方安全計算確實可以實現更高的安全性,但是同樣需要付出更高的計算代價。隱私計算之所以能夠獲得業界廣泛認可,究其原因主要是實現了密態數據的分布式處理,相比過去的數據脫密、去標識化等帶來了新的機會。
以同態加密技術為例,多方安全計算理論上可以實現任意函數計算,但是實際應用過程中往往效率過低。雖然滿足了數據的安全性、隱私性,但是復雜的算法本身也存在一定的黑箱,無法預防原始數據是否被投毒,也就保證最終運算結果的準確性。
也就是說,要想實現理想狀態下的安全、準確、高效,還需要首先解決一些先天的技術障礙,才能在商業落地上實現更快速地推進。雖然從數據以及真正的技術能力來看,多方安全計算依然有很多技術難點沒有突破,但是市場已經慢慢開始接受了這種新思路。
根據此前中國信通院調研數據顯示,目前大約44%的隱私計算產品已經進入到實施階段,占比進一步提升;處于研發階段的隱私計算產品占比19%,占比有所下降。雖然我們無從獲知,多方安全計算相關的詳細數據,但是這無疑是一個好的信號,證明隱私計算甚至多方安全計算的項目落地應用正在快步進入實施階段。
根據艾瑞咨詢調研顯示,產品安全&安全自證能力(81.8%)最受隱私計算實踐者關注,其次為產品性能(76.9%)和產品功能(69.6%)。基于對安全和性能的追求,行業用戶正在加深對隱私計算軟硬件結合技術方案的關注,越來越多的隱私計算廠商在軟硬件結合技術方案上展開布局。隱私計算甚至多方安全計算已經初步得到了市場的認可,那么下一步就是如何在技術上更新一步,拓展更大規模的用戶市場。
從數據安全保護,以及數據合規的角度來看,多方安全計算可提升的空間還有很多。
首先,多方參與計算的前提是保障各方提供的數據都是準確可靠的,但在現實中這未免有點理想化,那么如何確保參與方不進行數據投毒,或惡意造假?這算是對于各廠商的第一重考驗。
其次,由于多方安全計算是基于密碼學理論所進行的一系列運算,那么算力要求自然更高。尤其是當參與方數量超過一定規模的時候,如何提升算力就成了一道門檻。
多方安全計算訓練流程圖片來源:隱私計算法律與合規研究白皮書(2021年)
第三,即便是采取了加密的方式,也難保參與方可以通過多次回溯的方式獲得一部分原始數據的分布。那么如何在計算過程中,設置層層關卡,充分保障數據安全呢?
在發展的過程中,其實已經陸續有廠商提供了相應的解決方案。比如在安全保障的過程中,某頭部廠商搭建了一個密碼運算體系。在基礎操作層面,用密碼學協議替代常規運算,并在此基礎上重新架構、改造了基礎函數以此來為客戶創建一個完整的密碼運算體系。從而保證數據流通的安全性。
與此同時,億歐智庫《2021-2022中國金融數字化“新”洞察行業研究報告》中指出:在實際推進業務的過程中,由于隱私計算涉及多種技術算法、平臺產品、專有名詞,導致技術原理、解決方案等無法通俗解釋,難以與客戶形成高度同步。而這也使得用戶在購買隱私計算服務時會有所猶疑,不利于業務開展。尤其是多方安全計算,往往一個應用案例要接入多個參與方。不同的參與方,對于業務、算法、架構的理解也不盡相同,算力能力、資源能力也都各有參差,導致協同計算的過程中,推進效率受到一定的影響,也間接阻礙了項目的快速實施。
針對以上這些技術難點,數據猿也分別采訪了一些行業內的資深從業者,也分別從不同的角度給出了一定的技術解決可行性。
锘崴科技的CEO王爽教授在此前的采訪中就曾向數據猿透露:目前多方安全計算已經具有了一定的技術解決能力。比如在很早的時候,多方安全計算就已經可以同時支持加法和乘法的運算。同時,面對大規模的數據時,多方安全計算也能解決多方規模化數據的計算問題。以锘崴科技為例,在推進新藥的研究案例中,需要同時接入幾百家機構不同規模的數據源,锘崴科技可以通過自身的多方安全計算技術,融合多種其他能力如同態加密技術、可信執行環境等,不斷提升系統的穩定性,也能保證算法模型的準確性,數據結果的準確性。同時,通過區塊鏈技術進行全程存證,保證了數據的可追溯及審計。
當技術實現完全領先市場需求的時候,多方安全計算才能從真正意義上實現對市場的主動權。但現階段,除了在技術側仍要持續發力之外,還需要在更多的細分場景下進行嘗試,才能加速實現多方安全計算在更多領域的應用落地。
技術尚有突破空間,多方安全計算+或將成為一種新范式
雖然目前已有眾多廠商在不斷地通過提升基礎技術能力、算力能力、集成能力等積極提升多方安全計算的應用性能,但是不可否認,在實際落地應用的過程中,依然會遇到重重阻礙。
基于現階段多方安全計算的發展現狀,未來可能有一些重點方向是多方安全計算廠商,乃至隱私計算廠商的主要發展重點。
第一:多方安全計算需要不斷提升系統的穩定性、易用性以及安全性,提振多方安全計算技術的落地應用信心,以促使更多數據參與方主動愿意加入到多方安全計算中,整體提升數據保護隱私以及隱私計算行業的共同發展。同時,讓更多的機構及人員能夠以較少的人力成本、學習成本、經濟成本參與到多方安全計算中,以推動整個行業的健康快速發展。
第二:相比其他隱私計算技術,多方安全計算對計算的精確度以及參與方的規模都有一定的限制,未來還需不斷突破參與方的規模限制,不斷提升多方安全計算結果的精確度,以及不斷提升算力。同時,提升對惡意模型或共謀模型等的抵御能力,也將是未來一段時間,需要持續性加大投入力度破解的難題。
針對以上痛點,瑞萊智慧所提出的解決方案是:針對參與方數目不斷變大導致的計算效率低下,不是必然出現,但需要根據AI與密碼學協議進行co-design,并以AI設計為主導;畢竟AI是解決模型準確度(數據價值)的關鍵,且AI模型范式比密碼學可選方案豐富得多。當確實出現了因“參與方數目不斷變大導致的計算效率低下”,可以采用TEE/同網密態等方式進行規避。
針對性能問題,則可以在密碼、算法、硬件三個層面同時進行加速優化,包括密碼庫優化、模型壓縮、硬件加速等,比如瑞萊智慧目前的解決方案包括全同態加密的實現,通過編譯器驅動高效加密算法的優化,隱私保護下完成全流程建模,總耗時從日級別縮短到小時級別,領先業內平均水平數十倍。
第三:生態能力的融合,多方安全計算+,或許也將成為一種未來發展的可能性趨勢。隱私計算也好,多方安全計算也罷,都不是一門單一的技術,都需要同時融合多種能力,多種前沿技術才能不斷實現突破。生態能力的融合,與其他廠商進行技術及其他能力的互補,將會大大提升多方安全計算的落地實戰能力,也將不斷擴大多方安全計算可能實踐的更多場景。相比閉門造車而言,相信各大廠商也更愿意以一種擁抱開放,共同發展的心態,推動行業整理快速進步。
藍象智能CEO徐敏,對于生態能力方面也曾向數據猿表示:對藍象來說,首先從產品層面需要和生態伙伴進行整合。其次對整個銷售渠道的增強,對數據運營能力增強,對業務運營的能力增強,以及一些行業拓展,都是我們需要的,我們的目標和策略是跟更多人合作,推動行業成功。隱私計算是基礎設施,它強調的是在保證數據不出域、可用不可見的前提下數據價值的聯通能力。如果什么時候隱私計算本身行業不見了,但是出現很多通過隱私計算實現業務融合的行業,那時候我認為這個行業就成功了。
雖然現階段,多方安全計算還存在很多提升的空間,但是不可否認,作為隱私計算的主流技術之一,多方安全計算在數據隱私保護方面確實取得了階段性的突破,對于我國數據要素的流通共享起到了一定的促進作用。
而隨著越來越多的互聯網服務都需要依賴個人的隱私數據,可以預見,個人隱私保護也將成為多方安全計算一個重要的應用場景。未來,不止多方安全計算廠商需要在技術上不斷創新突破,行業整體還需要更進一步的政策指導、標準規范的快速落地,以及生態化能力的整體建設,才能推進多方安全計算行業更加健康有序地發展。然而,多方安全計算最終是以孤膽英雄單打獨斗破圈,還是成為尖峰部隊中的排頭兵突圍卻不得而知。但是不管最終是哪一種成功的方式,我們都希望多方安全計算能夠在數據要素流通的大生態中,發揮更大的價值和作用。