中國民生銀行羅勇：聯邦學習技術助力銀行風控策略組合優化

利率市場化改革的深入和數字經濟的發展，促使越來越多的服務向數位化、線上化遷移，突如其來的新冠肺炎疫情更是加速了這一趨勢，銀行開始謀求業務的數位化轉型和突破。2021年《數據安全法》與《個人信息保護法》的出台，與《網絡安全法》一同形成了數據合規領域的「三架馬車」，監管政策強度日趨加大，銀行數位化轉型既要通過海量客戶行為數據準確識別客戶、營銷獲客、控制風險，又要確保客戶信息安全，符合數據使用的法律規定，數據的保護意識和對數據價值挖掘的需求之間的矛盾開始日益凸顯。

在此背景下，隱私計算技術逐步受到關注，Gartner在2020年和2021年連續兩年將隱私增強計算列為最重要的戰略趨勢之一，並預測到2025年，60%的大型企業機構將使用一種或多種隱私增強計算技術；2021年6月，麥肯錫在《Fintech2030：全球金融科技生態掃描》中認為，自動因子發現、知識圖譜和圖計算，以及基於隱私保護的增強分析將發揮更大的價值，並將其列為金融機構應關注的首要技術趨勢。通過多方安全計算、聯邦學習、可信執行環境等相關技術將數據價值連通，推動數據安全共享，在多方數據融合的基礎上充分發揮大數據所產生的價值，釋放數據紅利，正在成為各界實現數位化轉型、推動數據要素化發展的創新解決方案。

金融行業風控能力建設面臨數據難題

近年來，風險控制能力越來越成為金融行業的隱形門檻。信息不對稱，個人、企業用戶信用記錄缺失，人工核驗成本高，逾期客戶的風險識別困難等，都對金融機構管控風險帶來了很大挑戰。特別是近幾年金融業務快速發展，惡意欺詐、過度消費、重複授信等亂象浮現，並且手段越來越專業化、產業化、隱蔽化和場景化。而傳統風控手段因維度單一、效率低下、範圍受限等原因，越來越難以滿足複雜的場景應用需求。金融行業需要各個行業維度的數據去覆蓋各類業務產品與風控需求，從而能夠使業務人員及時準確地洞察不同來源與業務場景的風險行為變化。而大數據分析的風控手段又常常依賴於數據，但數據濫用又帶來了數據隱私安全問題。同時，並不是有越多的數據補充就越能有效提升風控能力。樣本缺失、數據質量不高、有效數據維度欠缺等問題，使得通過挖掘數據價值來提升風控模型效果與保證風控數據的可用性在雙向平衡性中進退維谷。

傳統的風險控制流程大致經歷了兩個階段——傳統風控和大數據風控。傳統風控偏向線下，包含人工審核環節，審核時間長，用戶體驗不太好；大數據風控偏向線上，依賴海量的數據，人工和機器審核相結合，支持批量和實時處理，用戶體驗較好。然而，隨著網際網路的高速發展，大數據風控同樣面臨一系列挑戰。

總體而言，數據不足，分享不夠。數據是大數據風控的血液。數據的可得性、全面性、準確性決定了大數據風控的生命力。金融機構可以在大數據風控的模型構建方面發揮主動性，也可以自己積累數據；同時，外部數據特別是網際網路、政務數據也不可或缺。但目前很多政務等外部數據保存在不同地方，聯通不夠，導致眾多的信息孤島。

數據保護意識和數據融合矛盾凸顯。隨著數據相關法規的陸續出台，個人隱私保護意識逐步增強，對數據的獲取和融合難度也逐漸加大。

易受到隱蔽化、團伙化的攻擊。大數據風控的數據來源和運營過程都在線上。網絡攻擊可以在任何時候、任何地點發動，難以預測，隱蔽性強。這就要求風控策略加快疊代速度、縮短周期，同時還要保證不損失風控精準度。

聯邦學習技術正成為解決金融風控問題的關鍵

上述問題是金融行業風控領域的常見問題，而隱私計算技術的應用正在成為這些問題的一個有效的技術解。隱私計算是面向隱私信息全生命周期保護的計算理論和方法，是隱私信息的所有權、管理權和使用權分離時隱私度量、隱私泄漏代價、隱私保護與隱私分析複雜性的可計算模型與公理化系統。它可以在保證數據提供方不泄露原始數據的前提下，對數據進行分析計算，實現數據在流通與融合過程中的「可用不可見」。其中，聯邦學習（Federated Learning）是一種多個參與方在保證各自原始私有數據不出數據方定義的私有邊界的前提下，協作完成某項機器學習任務的機器學習模式，在金融領域更具可用性。

一方面，聯邦學習技術可以在保護用戶信息不泄露的前提下將多元、多維度的數據納入聯合風控模型中，從而實現更精細的洞察，構建更精準的風控模型。另一方面，金融機構與外部機構之間也可基於聯邦學習技術，利用多維度數據建立聯合金融風險模型、擇優導流、共享黑名單等，在數據沒有離開本地的情況下，擴充多方特徵或樣本，提高模型效果（見圖1）。

在金融風控領域，聯邦學習技術主要有如下應用場景：一是擇優導流。可基於銀行風險標籤，和合作機構的客戶交易、瀏覽等行為數據構建聯合風控模型，提高消費貸、小微貸等信貸產品引流的客群質量，提升信貸審批通過率，把控貸款風險。二是貸前准入。可基於外部數據構建風控模型及風控規則作為信貸決策流的補充，提高貸前風控能力。例如，通過稅務、用電、發票等數據衡量小微企業的經營狀況及風險水平，促進普惠金融。三是貸中預警。可針對銀行貸款客戶，與外部機構共同構建貸中預警模型，量化違約概率，聯合監控貸中違約風險。四是聯合反洗錢、聯合反詐。即可與多金融機構共建反洗錢、反欺詐模型。五是黑名單共享。即可與多機構共享黑名單，而不泄露查詢客戶。

聯邦學習等新技術在銀行業的應用實踐

以某銀行的數據貸款產品為例，旨在展示銀行無需大範圍改變風險控制流程，但在最小樣本的前提下，基於聯邦學習、回溯推演等新技術，通過持續疊代的閉環，實現銀行風險控制策略組合的最優化，最大程度提升銀行的獲客精準度和客戶質量，有效降低銀行信貸產品的不良率和獲客成本。

聯邦學習技術的應用，實質上跨越了傳統多方信貸業務的數據壁壘，為風險策略優化提供了可靠的外部數據支撐。因此，結合聯邦學習的應用特點，風險策略優化應採用新的疊代路徑，以期充分利用外部數據價值。

新技術應用的價值體現，主要體現在以下幾個方面（見圖2）。

聯邦學習的技術價值：客戶KYC、精準畫像與智能導流。聯邦學習平台打通了行內與行外數據可信交換的安全通道，構建了銀行通用的數據產品庫，助力了銀行數位化金融轉型。基於此平台，可在銀行與政務企業、網際網路企業、其他機構之間架設安全的數據橋樑，提升數據安全及隱私保護水平；降低金融信息壁壘，激發業務創新；提升金融風險防範能力，促進行業健康發展。在聯合風控方面，可實現擇優導流、貸前准入、貸中預警、聯合反欺詐、黑名單共享等場景應用；在精準營銷方面，可實現獲新、高潛客戶挖掘、交叉營銷等場景應用。

大數據風險控制技術價值：風控策略可視化、可定製及可監測。銀行風控系統提供信貸業務貸前、貸中、貸後全生命周期的風控業務決策結果輸出，能準確識別客戶和風險，貫穿信貸業務全流程，提供一站式解決方案。一是實現風控數據特徵管理，包括風控策略配置、模型管理以及發布和測試管理等，同時可實現反欺詐策略、數據採集和管理，以及對風控中各類名單的管理；二是實現風控策略的實時調用和決策，以及支持全自動、半自動、人工審核方式；三是實現風控預警規則管理和預警處置；四是實現風控運營分析，滿足風控運營管理需求。在數據運營方面，聯邦學習技術具備完備的數據結構體系和完善的運營支撐能力，通過對資產、產品、渠道、營銷、風控等全方位的監控和預警，全流程監控報表，可視化前端展示，可實現風險及時預警、前瞻性預測，驅動業務和風控的優化和提升，滿足網際網路業務的高頻疊代需求。

交易日誌回溯技術價值：策略可回溯，決策有依據，效果可預估。傳統的風控流程往往以串行為主，導致流程節點靠後的規則缺乏充分的進件樣本進行分析驗證，策略的調整甚至下架主要依賴專家經驗。銀行風控系統創新性引入了並行化的風控規則設計，產品上線以來積累了大量數據樣本。基於回溯推演平台，可實現針對歷史生產數據的策略回溯功能，根據歷史積累的樣本和所有規則集的結果，推演不同渠道、不同客群、不同策略閾值的通過率、逾期率等業務指標的預期表現，實現效果可預估、調整有依據。可視化的前台展示為風險人員提供了包括預期通過率、拒絕原因、逾期率表現等在內的風險表現分析和相關報表展現，為風險人員的風險決策提供了便利。藉助於大數據的算力可實現決策流程中決策節點之間針對大量風險規則的自動尋優，尋找階段性最優解，並由風險策略人員通過回溯平台進行策略變更前後的全流程驗證，為智能化風險決策提供依據。通過此平台，可改變原有僅通過專家經驗進行風險策略疊代的現狀，實現風險策略的快速、智能化疊代，快速提高產品的通過率，提升導流客戶的使用率，從而加大合作機構的流量投放，提升機構合作意願，實現雙贏。

在保障數據可用不可見的前提下，聯邦學習技術的應用作為基礎能力，可以服務於銀行業務部門開展數位化產品創新，如與客戶開展銀企、銀政等數據智能決策方面的合作，核心企業集團總部與附屬機構、上下游企業開展數據共享等場景。在銀行數位化產品創新方面，基於閉環的風控能力，可以幫助銀行開展數位化信貸產品創新，提供數據交互、風險決策、貸後監控等底層技術能力；在與客戶開展數據智能決策合作方面，面向大流量平台、政府機構等，可以通過聯合建模的方式提供場景金融服務，有效利用場景數據拓寬獲客渠道和收入來源；在服務數位化轉型方面，可以為一些有數位化基礎的核心企業總部，提供金融科技賦能，輔助其整合集團與附屬機構、上下游企業的各類數據，實現企業集團內部的數據共享，提高內部管理效率，進而實現數據變現。

基於聯邦學習、回溯推演等新技術，通過持續疊代，風控策略組合不斷優化。經過ABTest生產驗證和投產部署，在風險管控上表現亮眼、成績突出。通過分析組合風控策略執行前後的有效數據樣本，比對前後不同風險維度數據，風險管控成效重點表現在以下三個方面。

資產規模快速提升。在整體流量不變的情況下，依託授信通過率大幅提升420%、件均授信增加10%、資產規模呈倍數增長。這在當下數據合規趨嚴的大背景下，降低了有效准入人均數據成本，在資產規模提升的同時，進一步壓降了無效成本的支出。

客群質量顯著提升。產品在授信准入時，除滿足風險規則外，也要滿足一些模型分數。綜合客戶模型准入率由17.17%提升到51.59%，傳統客戶模型准入率由26.58%提升到59.51%。此外，新增准入的客戶並非集中在通過線上的中低分段，而是在各高分段線性增加，表明客群質量在組合風控策略下有明顯提升。

較好捕捉風控規則。渠道引流通過率低的原因很大程度上是渠道方不知道銀行的准入規則，但在銀行准入規則不能泄露的情況下，前篩模型篩選後的客戶能否降低命中規則成為評判前篩模型的重要標準。目前前篩規則能夠較好捕捉客戶多頭申請和共債、收入過低、非銀機構借貸等維度的規則，這些維度規則的命中率平均下降20%。前篩規則實現了客戶精準畫像，增大了符合銀行准入客戶流量。

綜上，在新技術下，風險控制策略組合持續疊代優化，實現了精準捕捉客戶畫像、客群質量顯著增加和資管成效全面提升。

結論和展望

聯邦學習技術是在保障數據安全的前提下實現數據價值流通的一種重要技術手段。技術價值的凸顯和政策環境的助力，使聯邦學習技術在數據相關產業悄然興起。在算法協議不斷優化、硬體性能逐步增強之下，聯邦學習技術的可用性大大提升，越來越多的企業入局隱私計算的研發和產品化。金融機構利用聯邦學習技術可對運營商、政務、徵信等數據實現應用場景所需的價值融合，從而為用戶提供安全可信任的聚合金融服務。基於內外部數據合作，在聯合風控方面，可實現擇優導流、貸前准入、聯合反欺詐、黑名單共享等場景應用；在精準營銷方面，可實現獲新、高潛客戶挖掘、交叉營銷等場景應用。

在傳統的銀行風險控制流程基礎上，利用聯邦學習和回溯推演等新技術，通過持續疊代的閉環，實現在最小樣本的前提下風險控制策略組合的最優化，具有較強的可行性和推廣性。

作者系中國民生銀行生態金融技術總監