一、外部數(shù)據(jù)使用歷史
1、外部數(shù)據(jù)的定義
外部數(shù)據(jù)指為滿足業(yè)務(wù)發(fā)展從本行外部獲取的支持客戶營(yíng)銷、風(fēng)險(xiǎn)管控、管理決策、產(chǎn)品創(chuàng)新、運(yùn)營(yíng)優(yōu)化以及監(jiān)管合規(guī)的數(shù)據(jù)、分析報(bào)告及資訊信息等,包括但不限于采購(gòu)、合作等方式獲取的數(shù)據(jù)。常見的外部數(shù)據(jù)的主要類型有工商、海關(guān)、環(huán)保、公安等政府?dāng)?shù)據(jù),移動(dòng)、聯(lián)通、電信等運(yùn)營(yíng)商數(shù)據(jù),以及萬德、大智慧等一些數(shù)據(jù)公司的數(shù)據(jù)。
2015年之前,建行各業(yè)務(wù)條線已經(jīng)開始在業(yè)務(wù)層面上使用外部數(shù)據(jù),2015年后,建行成立中心后,開始更多地利用外部數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,做機(jī)器學(xué)習(xí)建模。
2、外部數(shù)據(jù)管理模式
2017年我行數(shù)據(jù)管理部進(jìn)一步建設(shè)外部數(shù)據(jù)管理組件,采用全行集中統(tǒng)籌的管理模型管理外部數(shù)據(jù)。主要有三大特點(diǎn):
- 一是集中管理,總行對(duì)外部數(shù)據(jù)的需求、預(yù)算、采購(gòu)、費(fèi)用執(zhí)行、數(shù)據(jù)接入和數(shù)據(jù)共享應(yīng)用全流程統(tǒng)一管理。
- 二是分行自主,分行區(qū)域性外部數(shù)據(jù)給予分行一定自主權(quán),允許自行采購(gòu)和費(fèi)用執(zhí)行。
- 三是充分共享,所有外部數(shù)據(jù)(包括區(qū)域性外部數(shù)據(jù))統(tǒng)一接入外部數(shù)據(jù)管理組件,全行共享。
3、外部數(shù)據(jù)引入和應(yīng)用模式
目前我行外部數(shù)據(jù)的接入和應(yīng)用模式分別有三種。接入的三種模式分別為互聯(lián)網(wǎng)、網(wǎng)絡(luò)專線以及本地化部署到數(shù)倉(cāng)中。外部數(shù)據(jù)應(yīng)用的三種方式包括,第一種是實(shí)時(shí)聯(lián)機(jī)查詢,是當(dāng)前主流的應(yīng)用方式,即外部數(shù)據(jù)管理組件發(fā)布外部數(shù)據(jù)服務(wù),業(yè)務(wù)組件在取得授權(quán)的情況下,實(shí)時(shí)調(diào)用服務(wù),基本都是嵌入業(yè)務(wù)流程或者模型中伴隨業(yè)務(wù)辦理調(diào)用。第二種是批量數(shù)據(jù)傳輸,一般適用于批量的一些企業(yè)公開數(shù)據(jù),根據(jù)下游業(yè)務(wù)組件用數(shù)需求,通過數(shù)據(jù)倉(cāng)庫(kù)按照制定頻率推送或者增量數(shù)據(jù)表。第三種是平臺(tái)自助查詢,主要面向業(yè)務(wù)人員,業(yè)務(wù)人員登錄外部數(shù)據(jù)管理平臺(tái),可通過平臺(tái)查詢整合后的企業(yè)公開數(shù)據(jù)。
4、外部數(shù)據(jù)嵌入信用卡業(yè)務(wù)全流程中
自2015年后,外部數(shù)據(jù)在大數(shù)據(jù)領(lǐng)域被大量應(yīng)用,在我行多個(gè)業(yè)務(wù)條線、多個(gè)產(chǎn)品及多個(gè)場(chǎng)景均發(fā)揮巨大作用。以信用卡業(yè)務(wù)為例,外部數(shù)據(jù)被應(yīng)用到信用卡生命周期的六個(gè)環(huán)節(jié)中:預(yù)審批、客戶識(shí)別、偽冒欺詐、審批、交叉銷售、風(fēng)險(xiǎn)預(yù)警。我們利用外部數(shù)據(jù)產(chǎn)出大量的規(guī)則或模型,包括申請(qǐng)反欺詐、交易反欺詐、交叉銷售、提升銷售模型等,這些規(guī)則或模型被廣泛應(yīng)用到客戶的全生命周期管理中。
5、聯(lián)合建模-數(shù)據(jù)融合應(yīng)用
前面提到的這種外部數(shù)據(jù)的應(yīng)用,更多的是單筆或者是批量的明文數(shù)據(jù)的查詢或者去做一些規(guī)則或做一些判斷,并沒有進(jìn)行復(fù)雜的融合雙方數(shù)據(jù)的學(xué)習(xí)建模。自 19 年開始,我們中心開始和外界進(jìn)行大量的聯(lián)合建模。聯(lián)合建模是銀行通過機(jī)器學(xué)習(xí)建模方式引入外部數(shù)據(jù)、探索新產(chǎn)品、新場(chǎng)景應(yīng)用的重要方式,通過與政府機(jī)構(gòu)、公共事業(yè)、運(yùn)營(yíng)商、頭部電商等可信外部數(shù)據(jù)源進(jìn)行聯(lián)合數(shù)據(jù)探索和數(shù)據(jù)挖掘,確保雙方數(shù)據(jù)安全、開展模型研發(fā),創(chuàng)新數(shù)據(jù)價(jià)值變現(xiàn)的一種外部數(shù)據(jù)應(yīng)用新模式。
聯(lián)合建模主要有兩種方式,第一種方式,我行提供樣本,首先對(duì) ID 去進(jìn)行加密,加工標(biāo)簽以及部分x變量,然后由我行的聯(lián)合建模人員攜帶數(shù)據(jù)到對(duì)方提供的一臺(tái)沙盒環(huán)境進(jìn)行建模,對(duì)方也會(huì)把他們的數(shù)據(jù)加載到這個(gè)沙盒環(huán)境中。第二種方式是對(duì)方來我們的環(huán)境進(jìn)行建模,一般是集團(tuán)內(nèi)較多。最早在2019年,我行與京東、人社部做過兩次聯(lián)合建模,與京東的合作是我們帶著建行的標(biāo)簽以及部分x變量到京東的環(huán)境,利用京東提供的客戶消費(fèi)支付、信貸行為等等數(shù)據(jù),構(gòu)建了一個(gè)針對(duì)潛在客戶的融信商務(wù)模型,通過這個(gè)模型對(duì)小微企業(yè)組、個(gè)體工商戶、年輕客群還有大眾客群去進(jìn)行信用評(píng)估。與人社部合作的模型主要是依靠人社部提供的企業(yè)、個(gè)人的社保繳費(fèi)信息等數(shù)據(jù),做社保評(píng)信用評(píng)分整體解決方案,解決方案里面包括客戶準(zhǔn)入模型,預(yù)警規(guī)則模型,測(cè)額模型等等??傮w來說聯(lián)合建模為我行創(chuàng)造了較大的數(shù)據(jù)價(jià)值和業(yè)務(wù)價(jià)值。
6、2022聯(lián)合建模整體情況
以2022 年為例,盡管經(jīng)歷了上海封控,我們依然借助于聯(lián)合建模技術(shù),產(chǎn)出了大量業(yè)務(wù)成果。我們支持總行的普惠部、數(shù)字化工廠,鄉(xiāng)村金融部、個(gè)人金融部等多個(gè)業(yè)務(wù)部門以及浙江分行、湖北分行等相關(guān)分行,開展聯(lián)合建模項(xiàng)目,共研發(fā)5個(gè)普惠金融模型,后續(xù)均投產(chǎn)使用。我們的合作方包括像銀聯(lián)、美團(tuán)等一些頭部企業(yè),還有像地方金融局,地方的數(shù)據(jù)服務(wù)平臺(tái)等單位。其中我們跟銀聯(lián)合作研發(fā)的商戶云貸-銀聯(lián)版模型是去年4月23號(hào)上線的,截止到去年的11月末,授信客戶數(shù)達(dá)到近21萬戶,授信金額超過800億元,貸款余額近500億。另外我們支持鄉(xiāng)村金融戶做的裕農(nóng)快貸=農(nóng)戶商戶貸模型和支持浙江分行做的浙信云代產(chǎn)品模型,均在去年四季度上線投入使用,總體碩果累累。
二、隱私計(jì)算早期探索(2020-2021)
1、隱私計(jì)算技術(shù)應(yīng)用背景
2020年國(guó)家戰(zhàn)略發(fā)展要求和企業(yè)自身的發(fā)展需求促成了隱私計(jì)算技術(shù)的出現(xiàn)。隱私計(jì)算為建行主要帶來了三點(diǎn)好處。
第一點(diǎn)隱私計(jì)算是一個(gè)創(chuàng)新機(jī)制,實(shí)現(xiàn)數(shù)據(jù)不動(dòng)價(jià)值動(dòng),該方式實(shí)際幫助建行提高了數(shù)據(jù)處理的安全性。因?yàn)槁?lián)合建模過程中,明文數(shù)據(jù)要出域,因此數(shù)據(jù)在行內(nèi)經(jīng)歷相對(duì)比較繁瑣的審批過程,通過隱私計(jì)算避免這種事情發(fā)生,有助于提高我們數(shù)據(jù)處理的安全性。
第二點(diǎn)是聯(lián)合數(shù)據(jù)應(yīng)用遵循最小必要價(jià)值,避免過度使用個(gè)人信息,隱私計(jì)算通過對(duì)算子和數(shù)據(jù)的管控,有助于實(shí)現(xiàn)該內(nèi)容。
第三點(diǎn)是可以避免合作方的數(shù)據(jù)濫用,可以限定合作方對(duì)算子和數(shù)據(jù)的調(diào)用,避免合作方超出授權(quán)或者未經(jīng)授權(quán)去使用我行的數(shù)據(jù)。
2、早期探索(建行-建信基金)
2019年開始,我們內(nèi)部開始嘗試部署FATE框架,并內(nèi)部選用一些樣例數(shù)據(jù)進(jìn)行測(cè)試。在2020年,因發(fā)展需要,建行與建信基金子公司通過隱私計(jì)算,實(shí)現(xiàn)雙方數(shù)據(jù)融通??傂泻突鹱庸靖鞑渴鸬囊慌_(tái)FATE計(jì)算節(jié)點(diǎn),并且利用總行跟子公司之間的核心網(wǎng)專線,打通雙方的聯(lián)通性關(guān)系。建行利用8億多客戶的1萬多個(gè)標(biāo)簽,基金子公司利用500多個(gè)特征標(biāo)簽,我們對(duì)雙方的數(shù)據(jù)進(jìn)行求交,求交后構(gòu)建模型。因受當(dāng)時(shí)的網(wǎng)絡(luò)專線影響,共構(gòu)建5個(gè)貨幣類基金的精準(zhǔn)營(yíng)銷模型,包含高凈值、臨界、流失、休眠、長(zhǎng)尾 5 個(gè)客群的secureboost模型。一般來說在建行單邊模型,可能選用500棵甚至上千棵樹來建模,考慮計(jì)算節(jié)點(diǎn)配置比較弱,雙方的專線帶寬不是很大,選用的15-30顆樹進(jìn)行建模。為了進(jìn)行AB test,我們分別構(gòu)建建行單測(cè)數(shù)據(jù)模型和聯(lián)邦學(xué)習(xí)模型,并對(duì)比模型效果。從技術(shù)層面上看,AUC、KS、top 5%的lift聯(lián)邦學(xué)習(xí)模型明顯優(yōu)于建行單測(cè)模型。從業(yè)務(wù)層面上看,聯(lián)邦學(xué)習(xí)模型的前 5% 客戶的客戶響應(yīng)率7.35%明顯優(yōu)于建行單測(cè)模型5.47%。該案例對(duì)我們具有重大意義,真正實(shí)現(xiàn)總行第一個(gè)端到端的打通的聯(lián)邦學(xué)習(xí),從理論到實(shí)踐的路徑。為未來我行與集團(tuán)內(nèi)更多子公司,以及更多的外部公司去開展基于隱私計(jì)算的數(shù)據(jù)合作,積累了寶貴的實(shí)踐經(jīng)驗(yàn)。
三、隱私計(jì)算需求井噴(2022-2023)
1、中心隱私計(jì)算框架部署
2022年,在FATE框架的基礎(chǔ)上,我們引入了新的框架,包括多方安全計(jì)算框架(MPC)。之前的FATE只能做聯(lián)邦學(xué)習(xí),有了MPC后,我們不僅可以做聯(lián)邦建模,還可以聯(lián)合統(tǒng)計(jì)分析、匿名查詢、聯(lián)合計(jì)算等等。這些新技術(shù)支撐了更多的業(yè)務(wù)場(chǎng)景應(yīng)用外部數(shù)據(jù)。
2、隱私計(jì)算業(yè)務(wù)場(chǎng)景
2022年后,建信基金提出了更多隱私計(jì)算新需求,內(nèi)部的合作單位也增加了很多,有建信人壽、建信信托、建信養(yǎng)老、建信財(cái)險(xiǎn)等公司,外部也有很多合作公司,包括美團(tuán)、銀聯(lián)、網(wǎng)聯(lián)、移動(dòng)、電信等。合作中共有四大類場(chǎng)景,第一類是聯(lián)邦建模,第二類是安全求交,第三類是匿蹤查詢,第四種是安全計(jì)算。
在 2022 年我們幫助建信基金建立針對(duì)非貨幣類基金的精準(zhǔn)營(yíng)銷模型,他們希望把更多的客戶從購(gòu)買貨幣基金轉(zhuǎn)變?yōu)橘?gòu)買非貨基金,因?yàn)榉秦浕鹣鄬?duì)基金公司可能獲取的經(jīng)濟(jì)效益更大,這次主要用到安全求交和聯(lián)邦建模。
我們幫助建行人壽建立代理人存量客戶精準(zhǔn)營(yíng)銷模型,同樣應(yīng)用了安全求交和聯(lián)邦建模等技術(shù),主要是把行內(nèi)的一些高凈值客戶通過求交方式傳遞到建行人壽。
建信信托是期望借助匿蹤查詢技術(shù)來查詢客戶在行內(nèi)的評(píng)級(jí)分布。
去年年底國(guó)家推出個(gè)人養(yǎng)老金業(yè)務(wù),總行與建信養(yǎng)老通過安全求交的辦法獲取養(yǎng)老一側(cè)的一些客戶,然后借助于行內(nèi)的精準(zhǔn)營(yíng)銷平臺(tái),對(duì)客戶去進(jìn)行精準(zhǔn)營(yíng)銷,促成客戶在我行辦理養(yǎng)老金業(yè)務(wù)。
美團(tuán)是我們持續(xù)合作的單位,最早是總行普惠部提的需求,希望借助于美團(tuán)數(shù)據(jù),融合雙方數(shù)據(jù)進(jìn)行聯(lián)邦建模,然后向美團(tuán)的商戶進(jìn)行快貸授信,所以我們做了多個(gè)模型,包括準(zhǔn)入模型以及額度模型。今年我們跟美團(tuán)的合作主要是精準(zhǔn)營(yíng)銷層面,對(duì)快捷支付客戶促活、激活的場(chǎng)景進(jìn)行聯(lián)邦建模。
另外我們與很多外部公司,包括建行的子公司、支付機(jī)構(gòu)、運(yùn)營(yíng)商、一些互聯(lián)網(wǎng)公司和頭部平臺(tái)等單位都在持續(xù)合作中,開展的業(yè)務(wù)場(chǎng)景非常多,包括反賭反詐、精準(zhǔn)營(yíng)銷、精準(zhǔn)風(fēng)控等。
四、企業(yè)級(jí)隱私計(jì)算平臺(tái)搭建
1、建行企業(yè)級(jí)隱私計(jì)算平臺(tái)建設(shè)
2022年我們搭建了隱私計(jì)算場(chǎng)景平臺(tái),它并不是一套企業(yè)級(jí)的平臺(tái),存在三點(diǎn)問題:
- 第一個(gè)問題是性能比較差,只有幾臺(tái)物理機(jī),對(duì)大數(shù)據(jù)量的隱私計(jì)算支持比較差。
- 第二個(gè)問題是這套平臺(tái)目前只有研發(fā)環(huán)境,沒有生產(chǎn)環(huán)境,并沒有跟我們行的調(diào)度平臺(tái),以及單筆服務(wù)的發(fā)布功能進(jìn)行對(duì)接,只能通過手工觸發(fā)去進(jìn)行建模或預(yù)測(cè)。
- 第三個(gè)問題是平臺(tái)中的部分流程,包括數(shù)據(jù)安全中客戶隱私授權(quán)、需求項(xiàng)目模型管理等功能,更多依靠手工操作,相對(duì)比較粗放。
所以我們今年期望通過搭建企業(yè)級(jí)的平臺(tái),補(bǔ)充上述不足。建設(shè)目標(biāo)是通過打造企業(yè)級(jí)的隱私計(jì)算平臺(tái),或者稱為數(shù)據(jù)共享安全計(jì)算平臺(tái),實(shí)現(xiàn)我們與外界數(shù)據(jù)可用不可見,開發(fā)更多的業(yè)務(wù)場(chǎng)景,激活數(shù)據(jù)價(jià)值,助力數(shù)字化業(yè)務(wù)發(fā)展。建設(shè)范圍是在保護(hù)各方隱私的前提下,去實(shí)現(xiàn)聯(lián)合查詢、聯(lián)合運(yùn)算、聯(lián)合建模等多種核心功能,支持不同機(jī)構(gòu)間的數(shù)據(jù)隱私共享及不同金融場(chǎng)景的應(yīng)用建模。我們最后也希望按照平臺(tái)化、場(chǎng)景化、標(biāo)準(zhǔn)化、生態(tài)化的思路,進(jìn)行技術(shù)研究、平臺(tái)建設(shè)、場(chǎng)景落地。
2、隱私計(jì)算平臺(tái)設(shè)計(jì)原則
隱私計(jì)算平臺(tái)的設(shè)計(jì)原則有四點(diǎn)內(nèi)容:
- 第一點(diǎn)是企業(yè)級(jí)架構(gòu)為基礎(chǔ)。全面整合聯(lián)邦學(xué)習(xí)、多方安全計(jì)算等技術(shù)路線,支持聯(lián)合查詢、聯(lián)合計(jì)算、聯(lián)合建模、存證審計(jì)等豐富功能,支持建行集團(tuán)內(nèi)外部各機(jī)構(gòu)快速部署,便捷使用。
- 第二點(diǎn)是價(jià)值創(chuàng)造為目標(biāo)。在打造平臺(tái)的同時(shí),通過積極探索新的業(yè)務(wù)模式來擴(kuò)展外部數(shù)據(jù)連接,解決數(shù)據(jù)供給側(cè)和需求側(cè)匹配的問題,推動(dòng)建設(shè)機(jī)構(gòu)間數(shù)據(jù)交易網(wǎng)絡(luò)與數(shù)據(jù)共享生態(tài),促進(jìn)數(shù)據(jù)有效融通,實(shí)現(xiàn)業(yè)務(wù)價(jià)值。
- 第三點(diǎn)是滿足監(jiān)管合規(guī)要求:遵守《數(shù)據(jù)安全法》、《網(wǎng)絡(luò)安全法》、《個(gè)人信息保護(hù)法》等法律法規(guī),遵照上級(jí)金融監(jiān)管單位的監(jiān)管要求,確保業(yè)務(wù)合法合規(guī),實(shí)現(xiàn)高等級(jí)數(shù)據(jù)安全。
- 第四點(diǎn)是基于隱私計(jì)算和密碼學(xué)底層算法,在確保“數(shù)據(jù)不出域”的前提下,實(shí)現(xiàn)數(shù)據(jù)“可用不可見”,充分發(fā)掘跨機(jī)構(gòu)數(shù)據(jù)在銀行風(fēng)控營(yíng)銷、監(jiān)管等場(chǎng)景的價(jià)值。
3、隱私計(jì)算平臺(tái)設(shè)計(jì)架構(gòu)
下圖是我行隱私計(jì)算平臺(tái)的整體應(yīng)用架構(gòu),最底層的數(shù)據(jù)層,接入行業(yè)的各種數(shù)據(jù)源,包括內(nèi)部、外部的一些數(shù)據(jù)源。算法層支持各類框架,支持各類計(jì)算范式,包括查詢、運(yùn)算、建模等等。服務(wù)層接入到行里面的模型管理平臺(tái)、數(shù)據(jù)管理平臺(tái)等。應(yīng)用層支持各種應(yīng)用,包括精準(zhǔn)畫像、精準(zhǔn)獲客、審批授信、智能風(fēng)控等。
4、建行集團(tuán)隱私計(jì)算創(chuàng)新和榮譽(yù)
這里主要介紹在過去幾年我們中心以及總行申請(qǐng)獲得的一些榮譽(yù),以及一些專利申請(qǐng)情況和一些課題。我們中心最早在 2020 年,就與建信基金合作,獲得了信通院的“星河案例”獎(jiǎng)。
5、建行集團(tuán)隱私計(jì)算未來發(fā)展方向
建行集團(tuán)隱私計(jì)算的未來發(fā)展方向包括以下幾方面:
一是加速落地更多數(shù)據(jù)融合應(yīng)用賦能金融業(yè)務(wù)場(chǎng)景,加速探索行內(nèi)外更多數(shù)據(jù)融合應(yīng)用場(chǎng)景,賦能風(fēng)控、營(yíng)銷等常見業(yè)務(wù)場(chǎng)景,以實(shí)現(xiàn)數(shù)據(jù)與金融業(yè)務(wù)場(chǎng)景的安全有效融合。
二是加強(qiáng)生態(tài)合作,與生態(tài)合作伙伴一起,共同推進(jìn)如互聯(lián)互通等行業(yè)生態(tài)建設(shè)。
三是持續(xù)技術(shù)投入和創(chuàng)新研究,依托建行量子實(shí)驗(yàn)室等前沿技術(shù)研究機(jī)構(gòu),持續(xù)在隱私計(jì)算領(lǐng)域投入技術(shù)研究力量。參與相關(guān)課題研究、標(biāo)準(zhǔn)制定、專利研發(fā)等,探索具備抗惡意攻擊、抗合謀攻擊、抗量子攻擊的隱私計(jì)算算法。
以上就是本次分享的內(nèi)容,謝謝大家。