一、監(jiān)管政策要點梳理有哪些應(yīng)用場景?
通過和大部分金融機構(gòu)的溝通,我們發(fā)現(xiàn)目前大家普遍對金融監(jiān)管政策要點的總結(jié)強烈需求。尤其最近幾年持續(xù)強監(jiān)管導(dǎo)致內(nèi)控成本的增加促使銀行加大合規(guī)領(lǐng)域科技投入,結(jié)合起來就是要求通過系統(tǒng)建設(shè)來降低合規(guī)風(fēng)險和內(nèi)控成本,支持業(yè)務(wù)可持續(xù)發(fā)展。
但是通過流程再造,把監(jiān)管要點嵌入到金融機構(gòu)各個環(huán)節(jié),而且還能動態(tài)更新,需要一個強大的并且支持動態(tài)更新的外規(guī)庫以及對監(jiān)管政策要點的提取總結(jié),目前為止市場上暫時還沒有一家能做到。法詢金融通過多年監(jiān)管政策研究和數(shù)據(jù)積累,現(xiàn)正式推出相應(yīng)合規(guī)咨詢服務(wù)和法詢智庫系統(tǒng)API接口及植入式服務(wù)。
1、外規(guī)內(nèi)化的基礎(chǔ)性工作:制定和更新內(nèi)部流程
通過情況金融機構(gòu)都會將監(jiān)管要點嵌入內(nèi)部制度流程中并且嚴(yán)格實施。定期也有內(nèi)部審計去監(jiān)督執(zhí)行情況,并出具審計報告。
但是時間長了之后,包括業(yè)務(wù)部門員工、領(lǐng)導(dǎo)到行內(nèi)的管理層,都會逐步模糊化到底哪些是外部監(jiān)管要求,哪些是內(nèi)部的流程控制要求,哪些可以通過改進流程來做調(diào)整,哪些是不能調(diào)整的。
所以需要有一個獨立于內(nèi)部流程控制點的純粹外部監(jiān)管要點及管理系統(tǒng)。這套系統(tǒng)的內(nèi)容需要動態(tài)更新,保持和內(nèi)部流程的嵌入。
2、為何內(nèi)控要點必須和監(jiān)管要點分離?
內(nèi)部流程或者叫內(nèi)控要點需要和合規(guī)要點進行分離;內(nèi)控要點和合規(guī)紅線分離,對后續(xù)動態(tài)修訂公司流程,支持業(yè)務(wù)創(chuàng)新,理清合規(guī)邊界非常有幫助。需要讓管理層和內(nèi)控合規(guī)部門理解合規(guī)邊界在哪里,內(nèi)控邊界在哪里,因為二者的彈性空間完全不一樣。
3、內(nèi)部審計和合規(guī)風(fēng)險評估檢查工作
內(nèi)部審計和合規(guī)風(fēng)險評估檢查工作的主要任務(wù)之一是確保機構(gòu)運營的合法合規(guī)。其要求來源主要是監(jiān)管法律法規(guī)通知要求,自律機構(gòu)的規(guī)定等。對此審計部門和內(nèi)控合規(guī)部門需要建立外部監(jiān)管要點庫以及內(nèi)部控制庫并且進行不斷更新,在此基礎(chǔ)上進行相應(yīng)檢查以確保監(jiān)管要求得以落實。但監(jiān)管文件體系以及金融產(chǎn)品的復(fù)雜性決定了依賴于人工的模式必定會導(dǎo)致工作量巨大而且無法保證較高的覆蓋?;诜ㄔ冎菐斓耐獠勘O(jiān)管要點及管理系統(tǒng)則方便使用部門省去了自己梳理外部監(jiān)管要點的巨大工作量。
4、員工監(jiān)管要點學(xué)習(xí)培訓(xùn)手冊
對核心要點的梳理總結(jié)可以方便從業(yè)人員的學(xué)習(xí),查閱,知曉監(jiān)管紅線到底在哪里,并且參考設(shè)計內(nèi)部控制流程。我們可以協(xié)助銀行制作紙質(zhì)版監(jiān)管要點手冊。
5、業(yè)務(wù)系統(tǒng)嵌入,流程節(jié)點控制
我們的監(jiān)管要點根據(jù)每家機構(gòu)的不同需求分別制作,重新分類整合,設(shè)置個性化標(biāo)簽,嵌入業(yè)務(wù)流程中。
二、監(jiān)管政策要點和專業(yè)詞庫
1、政策要點如何動態(tài)更新?
雖然此前也有很多咨詢機構(gòu)做過類似的特定領(lǐng)域的監(jiān)管要點整理工作。或者金融機構(gòu)內(nèi)部也有類似excel的整理清單,但是沒有動態(tài)管理的系統(tǒng)支撐,會導(dǎo)致無法多部門多人協(xié)同,無法實時更新,無法展現(xiàn)不同監(jiān)管要求之間的關(guān)系和差異。
沒有一個T+0或者T+1實時更新動態(tài)管理的強大外規(guī)庫做支撐,監(jiān)管政策要點就是一個靜態(tài)資料,無法適應(yīng)快速變化的監(jiān)管環(huán)境。
法詢智庫不僅僅有一個專業(yè)且持續(xù)更新數(shù)據(jù)庫系統(tǒng),而且通過專業(yè)團隊和機器學(xué)習(xí)更新監(jiān)管文件分類,關(guān)聯(lián)關(guān)系,有效性識別,模糊檢索,確保外規(guī)庫最專業(yè)水平。通過內(nèi)部強大的系統(tǒng)管理平臺和40人的專業(yè)團隊進行內(nèi)容生產(chǎn)和動態(tài)維護。
憑借這樣的強大基因,我們再出發(fā),開始進行監(jiān)管政策要點的分析。
2、金融關(guān)鍵詞庫
此外法詢自建搜索引擎,維護更新自己的金融關(guān)鍵詞庫,最終將20萬關(guān)鍵詞庫和業(yè)務(wù)及流程相對應(yīng)。通過自然語言機器學(xué)習(xí),在模糊搜索、監(jiān)管政策要點篩查、內(nèi)部流程自動篩查、錯別字識別等領(lǐng)域進行廣泛運用。
這些最新技術(shù)的應(yīng)用形成了法詢強大的技術(shù)支撐,持續(xù)服務(wù)金融機構(gòu)客戶。
三、監(jiān)管政策要點結(jié)合NLP應(yīng)用
1、自然語言處理(Natural Language Procession,NLP)
作為人工智能的三大分支之一,自然語言處理是指用計算機對自然語言的等信息進行處理,包括對字、詞、句、篇章的輸入、輸出、識別、分理解、生成等的操作與加工,實現(xiàn)人機間的信息交流。
自然語言的處理的具體表現(xiàn)形式形式主要包括:文本分類、文本聚類、文本校對、信息抽取、語音識別、機器翻譯、問答系統(tǒng)、人機交互等。
2、監(jiān)管要點數(shù)據(jù)結(jié)構(gòu)
大部分監(jiān)管要點文本具有規(guī)范性、客觀性和權(quán)威性,監(jiān)管要點文本作為一種規(guī)范化的客觀性文本,在文本表意特點上:平實、嚴(yán)謹(jǐn)、直接、準(zhǔn)確,一部完整的監(jiān)管要點文本結(jié)構(gòu)上可劃分為:背景信息、結(jié)構(gòu)信息、正文信息三大部分。
背景信息包括:標(biāo)題、文號、頒布機構(gòu)、頒布日期、生效日期、到期日期、有效性等;
結(jié)構(gòu)信息包括:執(zhí)行主體、目錄、章節(jié)條款、附件、表格、聲明注腳等;
正文信息包括:監(jiān)管要點詞集、詞頻、詞粒度、詞性、語法狀態(tài)等。
3、模糊搜索及智能法規(guī)摘要識別
法詢自建的搜索引擎包含精準(zhǔn)搜索和模糊搜索,精準(zhǔn)搜索具備翻譯功能,而模糊搜索在基礎(chǔ)上領(lǐng)域具備互譯、近義詞、詞性等映射庫,運用端到端對應(yīng)、實體抽取、情感分析等系統(tǒng)對文章、詞向量進行分析。摘要部分利用seq2seq來建立文本模型,以及其中的注意力機制,運用特征工程選取關(guān)鍵特征,取得不錯進展。
4、專業(yè)精準(zhǔn)規(guī)則及數(shù)字化模型
法詢具備多個專業(yè)金融領(lǐng)域AI工程師,每一份資料都會有行業(yè)專家審閱并進行糾錯、打標(biāo)簽,并對相關(guān)標(biāo)題、文號、機構(gòu)進行編輯、補充、分類,然后使用數(shù)字模型進行擬合,實現(xiàn)模型推測和人工校對。不斷的通過更對數(shù)據(jù)調(diào)優(yōu)模型,達到智能推測的各項應(yīng)用。
5、AI神經(jīng)網(wǎng)絡(luò)和大數(shù)據(jù)支持
法詢在專業(yè)數(shù)據(jù)庫的支持下,充分調(diào)用詞嵌入模型連接nlp神經(jīng)網(wǎng)絡(luò),對內(nèi)容進行詞性標(biāo)注、命名實體識別、文本分類、實體聚類、QA等大量實驗,在gpu上縮短時間并逐級提高相應(yīng)準(zhǔn)確率,使得文章內(nèi)容、段落識別、實體抽取等一系列的準(zhǔn)確性大大提升,同時也會對PDF等文檔進行內(nèi)容識別,更好、更準(zhǔn)確、更相關(guān)的內(nèi)容展現(xiàn)給大家。
三、法詢提供一整套服務(wù)方案!
法詢提供的方案主要是:
1、外部法律法規(guī)數(shù)據(jù)庫系統(tǒng)
法詢智庫包括豐富的數(shù)據(jù)內(nèi)容(金融類法律法規(guī)、處罰案例、監(jiān)管動態(tài)、分類法規(guī)、金融類判決文書),具體服務(wù)方式分為API接口和植入式兩種方案,都能實現(xiàn)全行覆蓋,本地系統(tǒng)部署(提供源代碼或不提供源代碼兩種模式)。
并且我們還可以根據(jù)客戶需要,進行部分個性化定制功能開發(fā)和改造,法詢外規(guī)庫系統(tǒng)和本行行內(nèi)其他管理系統(tǒng)的銜接,以及法詢內(nèi)部管理模塊部分機器學(xué)習(xí)功能嵌入。
2、監(jiān)管要點拆分
基于法詢在金融機構(gòu)本地部署搭建的外規(guī)庫系統(tǒng),法詢協(xié)助進行監(jiān)管要點的拆分、分類體系搭建、分類標(biāo)簽、有效性識別、后續(xù)每周動態(tài)更新。
具體工程量按照機構(gòu)需要,選定特定領(lǐng)域做監(jiān)管要點拆分,為后續(xù)其他應(yīng)用場景服務(wù)。法詢提供一整套系統(tǒng)工作平臺支持,包括分析圖譜、要點拆分、關(guān)聯(lián)關(guān)系和分類邏輯。
3、流程梳理和外規(guī)內(nèi)化
基于法詢建立的外規(guī)庫系統(tǒng)+內(nèi)容+監(jiān)管要點拆分和分類,協(xié)助金融機構(gòu)打造包括包括內(nèi)部流程再造、和內(nèi)部流程嵌入和體檢、定期內(nèi)部郵箱信息推送、內(nèi)部系統(tǒng)超鏈接引用、風(fēng)控或者流程節(jié)點控制等應(yīng)用場景。
四、關(guān)于銀行如何建立自己外規(guī)庫和外部供應(yīng)商篩選?
1、如何衡量銀行業(yè)金融機構(gòu)法律法規(guī)庫的數(shù)據(jù)量?
金融機構(gòu)需要真正搞清楚怎么識別數(shù)據(jù)量,如何統(tǒng)一對比口徑:
經(jīng)過8年多時間的不懈努力,法詢智庫已經(jīng)包括了近10萬部金融相關(guān)法律法規(guī)(如包括監(jiān)管批復(fù),監(jiān)管處罰,監(jiān)管動態(tài)則接近100萬部)。如果把非金融類的法律法規(guī)也納入統(tǒng)計口徑,則可以再增加幾十萬部監(jiān)管文件。
我們在招標(biāo)過程中,部分銀行要求填寫具體每個頒布機構(gòu)對應(yīng)的法規(guī)數(shù)量,通過這種方式排除不相關(guān)的法律法規(guī),可以同一個口徑對比不同供應(yīng)商的數(shù)據(jù)。
同樣是銀保監(jiān)會發(fā)文,如果把部分行政批復(fù)混雜進去充數(shù)就可以達到10多萬法規(guī)數(shù)據(jù)(其中批復(fù)9萬);央行發(fā)文,如果把公開市場操作及各種公告放進去,也可以高達3萬的數(shù)據(jù)(但是實際意義的法規(guī)就幾千部)。
此外還有大量游離于規(guī)范性文件通知和監(jiān)管動態(tài)之間的文件,比如今天開了個會,明天做了表態(tài),后天出了個新聞稿。
關(guān)于確定法規(guī)數(shù)據(jù)量,筆者建議通過篩選10-20個關(guān)鍵詞,正文內(nèi)容及標(biāo)題進行檢索,對比不同供應(yīng)商的命中數(shù)量以及質(zhì)量。因為一個關(guān)鍵詞輸入進去返回結(jié)果可能就10-50個,可以把這50個法規(guī)都點開看看,有沒有混進去毫無價值部分,直觀對比具體的數(shù)量和質(zhì)量。
比如截至2022年2月,輸入“員工行為”,法詢智庫的返回結(jié)果是418條記錄,而且每條內(nèi)容能夠經(jīng)受住考驗。
2、如何識別法律法規(guī)庫的文件質(zhì)量?
質(zhì)量大概分為幾個層次:
(1)錯別字和格式錯亂,這個一般正規(guī)大型供應(yīng)商不太會出現(xiàn);但是小供應(yīng)商如果只是簡單用爬蟲會比較常見。
(2)法規(guī)附件是否完整,表格是否完整。大部分供應(yīng)商做不到對數(shù)萬個文件的附件做校驗入庫,表格進行規(guī)范。然而有很多文件表格才是正文的靈魂所在。
(3)法規(guī)之間的關(guān)聯(lián)關(guān)系,尤其是法規(guī)聯(lián)想及圖譜功能,目前市場上能做好的幾乎沒有。相對而言,目前其他供應(yīng)商可以把明確的法規(guī)引用做好,而法規(guī)聯(lián)想需要大量專業(yè)人員,疊加NLP技術(shù)支持才能逐步完善的一項工作。
(4)法規(guī)有效性識別。有效性識別實際是所有服務(wù)商的通病,根源是監(jiān)管機構(gòu)只有動力發(fā)文,但廢止失效往往嚴(yán)重滯后,所以導(dǎo)致大量法規(guī)實際已經(jīng)失效,但仍然在數(shù)據(jù)庫里面顯示為有效,這種唯一解決方案就是人工專業(yè)識別,加備注方便金融機構(gòu)從業(yè)人員自行判斷。
3、處罰案例
處罰案例雖然數(shù)據(jù)的獲取比較容易,但校驗數(shù)據(jù)錯誤,建立和法規(guī)的關(guān)聯(lián)關(guān)系,抓取金額,都需要消耗大量人工的工作。一行兩會一局8萬多的處罰案例,做了3年,最終才能形成一個像樣的產(chǎn)品。
比如光看數(shù)量,央行有18萬處罰案例,但是絕大部分都是和金融沒有關(guān)系,我們就需要做篩選,最終篩出來9000多和金融相關(guān)的處罰。
比如分類,我們需要根據(jù)非常有限的處罰案由,對銀保監(jiān)會2.4萬處罰案例做分類處理,抽離出500多個分類標(biāo)簽。
4、關(guān)于查詢
如果只是通用的做一個普通的開發(fā),通常銀行選擇外包方或者自己行內(nèi)提需求,也就是是法規(guī)名、文號、頒布機構(gòu)、正文內(nèi)容、頒布日期等字段查詢。
但是現(xiàn)實情況是用戶真要查的時候,很可能并不確定所查詢的關(guān)鍵詞對不對,這個時候?qū)Ψㄒ?guī)的標(biāo)簽、分詞處理等長年累月的基礎(chǔ)性工作至關(guān)重要,在這些基礎(chǔ)上才能有聯(lián)想和模糊查詢。雖然我們目前也只是在法規(guī)聯(lián)想匹配上做了很多工作,在模糊查詢這一塊做得也不夠好,但是相信2021年底能夠?qū)崿F(xiàn)相對精準(zhǔn)的模糊查詢(通過自然語言學(xué)習(xí),拆解關(guān)鍵詞做查詢結(jié)果模糊匹配)。
其他細節(jié)還包括比如移動端兼容、查詢響應(yīng)速度要控制在0.5秒以內(nèi),基本要求如果是靠譜開發(fā)機構(gòu)應(yīng)該都能實現(xiàn)(但筆者也見過至少3家銀行自建的系統(tǒng),就連這些基本要求都達不到)。
5、外規(guī)內(nèi)化和法規(guī)條款梳理
合規(guī)建設(shè)年,很多金融機構(gòu)又重提此前不斷嘗試但不斷失敗的“外規(guī)內(nèi)化”,本質(zhì)上是要將紛繁復(fù)雜的且動態(tài)變化的法規(guī)要求嵌入到內(nèi)部流程中,這需要兩項艱巨的任務(wù):
(1)能夠梳理出所有監(jiān)管要求(包括監(jiān)管要點清單),這個能涉及到上萬部各種文件,數(shù)萬個要點。梳理過程中也會遇到更新或者廢止,同時不同條款之間的關(guān)聯(lián)關(guān)系、勾稽關(guān)系也需要注意。單就這項工作尚未看到任何一家供應(yīng)商或者金融機構(gòu)能夠完成,包括我們自己也只是嘗試梳理了幾千部法規(guī)文件和不到2萬條監(jiān)管要點而已。
(2)內(nèi)部流程的再造
本質(zhì)上是需要根據(jù)業(yè)務(wù)流程和風(fēng)險控制,在法規(guī)和風(fēng)控所劃出的域里面來給業(yè)務(wù)做規(guī)范。現(xiàn)有流程肯定需要重新規(guī)劃,該合并的合并,該拆分的拆分,而且需要和法規(guī)條款進行重新比對,確保流程控制對合規(guī)風(fēng)險已經(jīng)做了足夠的控制,如果有剩余風(fēng)險應(yīng)該如何做應(yīng)對措施。
但是首先第一步,需要判斷這個流程到底可能觸碰多少合規(guī)要點,后續(xù)萬一更新了怎么辦?
之前之所以失敗,是因為從來沒有一個外部供應(yīng)商能夠把外規(guī)的要點梳理清楚,內(nèi)部不論是人力投入還是視野都遠沒有這個能力做這個事情。
6、能否通過AI實現(xiàn)法律合規(guī)基本問題的智能判斷?
筆者接觸過的銀行保險機構(gòu)至少有3家嘗試過,而且是真刀真槍真資源投入,很遺憾結(jié)果也是非常失望。
包括某中大型股份制銀行和深圳當(dāng)?shù)氐囊患覚C構(gòu)合作開發(fā)的智能合規(guī)機器人,選擇了一個非常聚焦的細分領(lǐng)域(僅針對零售的銷售環(huán)節(jié)),大幅度縮小范圍,確定對話場景,結(jié)果也只能是僅僅能用,但從監(jiān)管處罰角度看,缺失遺漏部分就可能產(chǎn)生巨大的風(fēng)險。要達到真正的業(yè)務(wù)合規(guī)判斷及審核,復(fù)雜度不在一個量級,還是對正確率的要求也更高,還有大量法律法規(guī)未明確的灰色模糊地帶。
我們雖然也在應(yīng)用NLP做法律法規(guī)的條款分析,梳理法規(guī)條款之間的關(guān)聯(lián)關(guān)系,做一些系統(tǒng)的初級判斷再人工識別,但我們深刻意識到至少在合規(guī)這個領(lǐng)域尚未不成熟,3-5年之后的時機或許更好。在自然語言技術(shù)成熟之前需要在數(shù)據(jù)積累,條款分析以及基本的自然語言學(xué)習(xí)技術(shù)方面做好準(zhǔn)備。
目前計算機技術(shù)取得了巨大發(fā)展,從易到難先解決了確定的重復(fù)問題執(zhí)行難題,但在像金融合規(guī)領(lǐng)域這種不確定情景下的決策和判斷,還無法替代人類智力的判斷。
關(guān)鍵詞: 銀行4萬監(jiān)管要點 金融機構(gòu) 自然語言處理