基于全行業(yè)數(shù)據(jù)的企業(yè)金融風險評分方法
【專利摘要】本發(fā)明涉及一種基于全行業(yè)數(shù)據(jù)的企業(yè)金融風險評分方法,步驟如下:S1、采集各個政府行業(yè)及金融機構的企業(yè)相關數(shù)據(jù),S2、把存數(shù)據(jù)倉庫的數(shù)據(jù)進行數(shù)據(jù)清洗比對,S3、建立企業(yè)基本特征庫,通過數(shù)據(jù)勾勒出每個企業(yè)的360°立體畫像,S4、把企業(yè)輸入到社會關系網(wǎng)絡模型,針對所有企業(yè)進行全網(wǎng)分析,建立企業(yè)關聯(lián)關系圈,S5、基于風險預警模型來對企業(yè)進行實時的風險預警,S6、基于企業(yè)信用評分模型對企業(yè)進行信用評分,S7、通過企業(yè)關系網(wǎng)和信用評分的結合,構建企業(yè)的信用地圖,所有構建的主體關系網(wǎng)上的企業(yè)的好壞都會對主體企業(yè)進行信用影響。本發(fā)明的方法降低采信成本與區(qū)域融資風險,提升區(qū)域預警防范能力。
【專利說明】
基于全行業(yè)數(shù)據(jù)的企業(yè)金融風險評分方法
技術領域
[0001]本發(fā)明屬于企業(yè)風險評估技術領域,尤其涉及一種基于全行業(yè)數(shù)據(jù)的企業(yè)金融風險評分方法。
【背景技術】
[0002]在針對金融機構信貸管理部和風險管理部走訪和調研,目前金融機構在為企業(yè)提供金融服務的過程中存在的諸多困難和不便,主要是對企業(yè)的相關信息很難采集,即所謂的“信息不對稱”,最終導致了銀行“惜貸”和企業(yè)“融資難”的問題。
[0003]目前廣泛應用的企業(yè)風險評估軟件,都是以企業(yè)的財務報表作為評估的基礎數(shù)據(jù),通過這些可信的財務基礎數(shù)據(jù),通過風控模型計算出企業(yè)的經(jīng)營情況。在中國很多中小企業(yè)融資難,必須得通過抵質押來獲得融資。建立面向中小企業(yè)經(jīng)營風險預警系列軟件,用來協(xié)助金融機構對中小企業(yè)授信決策與信用風險管理,非常必要。傳統(tǒng)的企業(yè)信用風險研究,主要以可信的企業(yè)財務數(shù)據(jù)為評估標準,而中小企業(yè)因財務報表信息品質較低,中小企業(yè)信用風險受到企業(yè)負責人的影響程度極高,財務報表信息可信度較低,常有內外賬不一致之情形。因此傳統(tǒng)的企業(yè)風險預測模型應用在中小企業(yè)上,勢必有結構上的偏誤,致使預測能力降低,勢必影響銀行授信據(jù)測,提高銀行的信用風險。
【發(fā)明內容】
[0004]為了解決上述的技術問題,本發(fā)明的目的是提供一種基于全行業(yè)數(shù)據(jù)的企業(yè)金融風險評分方法。該方法評價更全面,能有效降低信用風險。
[0005]為了實現(xiàn)上述目的,本發(fā)明采用了以下的技術方案:
基于全行業(yè)數(shù)據(jù)的企業(yè)金融風險評分方法,包括如下步驟:
51、采集各個政府行業(yè)及金融機構的企業(yè)相關數(shù)據(jù),對獲取的數(shù)據(jù)進行預處理,并且把數(shù)據(jù)存儲到HADOOP數(shù)據(jù)平臺;數(shù)據(jù)采集的內容主要包括企業(yè)基本注冊登記數(shù)據(jù)、企業(yè)在國地稅的財務報表以及納稅數(shù)據(jù)、企業(yè)水電氣數(shù)據(jù)、司法訴訟判決數(shù)據(jù)、各個政府部門的審批許可及處罰數(shù)據(jù)、動產(chǎn)不動產(chǎn)抵押、擔保情況等數(shù)據(jù);在數(shù)據(jù)采集的過程中,采用了底層系統(tǒng)對接和數(shù)據(jù)文件上傳的方式來進行人工采集;
52、把存數(shù)據(jù)倉庫的數(shù)據(jù)進行數(shù)據(jù)清洗比對,主要比對工作為:1.確定企業(yè)名稱基準,
2.檢出各部門不一致數(shù)據(jù);針對不匹配數(shù)據(jù),通過以下方法組合檢出:A通過工商字號進行模糊比對,B通過工商庫中負責人姓名查詢,C通過工商庫中組織機構代碼查詢,D通過工商注冊號查詢,E通過以上方式仍不能匹配上的數(shù)據(jù),如果數(shù)量不多,可以考慮通過人工進行比對;3.各部門確定名稱數(shù)據(jù)修改方案,4.建立數(shù)據(jù)一致性長效機制,5.企業(yè)組織機構代碼證申領一致性檢查,6.企業(yè)名稱變更一致性同步,7.企業(yè)組織機構代碼變更一致性同步;
53、建立企業(yè)基本特征庫,通過數(shù)據(jù)勾勒出每個企業(yè)的360°立體畫像,稱為企業(yè)畫像,系統(tǒng)主要從基本特質、行為偏好、履約能力、信用歷史、經(jīng)營管理、經(jīng)濟效益、企業(yè)關系、發(fā)展前景八個大類來建立企業(yè)基本特質庫;通過對企業(yè)畫像的構建,能夠準確對企業(yè)進行定位,明確這個企業(yè)是一家怎樣的企業(yè),在行業(yè)、地區(qū)中所處的位置如何;
54、把企業(yè)輸入到社會關系網(wǎng)絡模型,針對所有企業(yè)進行全網(wǎng)分析,建立企業(yè)關聯(lián)關系圈,關系圈涉及的維度主要為法定代表人、股東、高管、擔保、配偶維度,在關系圈建模的過程中,除了維度之外,還對關系設置了一定的權重;
55、基于風險預警模型來對企業(yè)進行實時的風險預警,預警維度包括登記變動、關聯(lián)風險、黑名單、人員異常、投融資情況等,通過關系網(wǎng)和風險預警的結合形成“全網(wǎng)預警”,當主體監(jiān)控企業(yè)關系網(wǎng)上的某家企業(yè)涉及到風險預警提示的時候,會通知主體監(jiān)控企業(yè)的風險類型基本以及影響度;
56、基于企業(yè)信用評分模型對企業(yè)進行信用評分,主要通過下面5個方面來進行評分:
I.資本實力:反映企業(yè)規(guī)模,資本,資產(chǎn)和人力資源及可持續(xù)性等資本要素,2.運營能力:反映企業(yè)運營周轉效率的資產(chǎn)質量要,3.盈利能力:衡量企業(yè)獲取收益和企業(yè)增值的能力,4.償付能力:衡量企業(yè)現(xiàn)金流及償付能力的財務指標,5.發(fā)展?jié)摿?衡量企業(yè)發(fā)展速度和增長趨勢的成長性指標;信用評分模型對各維度中的指標采用單變量回歸分析的方法,在分析自變量和因變量之間相關關系的基礎上,建立變量之間的回歸方程,并將回歸方程作為預測模型,來預測企業(yè)的各維度表現(xiàn);預測模型利用統(tǒng)計學邏輯斯蒂回歸模型進行判定概率預測,邏輯斯蒂回歸模型所采用的建模函數(shù)為BVn*Xn+ BCn =C;邏輯回歸方程構建完成后將根據(jù)二項式分布法進行方程參數(shù)估計,生成函數(shù)并判定概率預測結果,并且將概率預測結果轉化為百分制評分標準;
57、通過企業(yè)關系網(wǎng)和信用評分的結合,構建企業(yè)的信用地圖,所有構建的主體關系網(wǎng)上的企業(yè)的好壞都會對主體企業(yè)進行信用影響。
[0006]本發(fā)明的方法以各部門在日常監(jiān)管中所產(chǎn)生的業(yè)務數(shù)據(jù)與各平臺運營產(chǎn)生的數(shù)據(jù)為基礎,建立起資源共享、互聯(lián)互通的交互平臺,實現(xiàn)政府部門間的數(shù)據(jù)交互與共享,為社會誠信、商務誠信的建設提供支撐。通過對數(shù)據(jù)的清洗、比對、入庫、分析與挖掘,構建面向金融融資風險管理與控制的“金融信貸風險警示系統(tǒng)”,通過企業(yè)風險信用評價建模、擔保圈、關系圈的鎖定與追蹤關聯(lián)圈內與本企業(yè)相關的警示信息,降低采信成本與區(qū)域融資風險,提升區(qū)域預警防范能力。
[0007]本發(fā)明的方法通過整合政府部門間的企業(yè)經(jīng)營與信用信息,依托大數(shù)據(jù)技術與分析,著力打造企業(yè)信用信息云服務平臺中的“政府部門數(shù)據(jù)共享應用系統(tǒng)”與“金融信貸風險警示系統(tǒng)”兩大子系統(tǒng),在解決跨部門信息共享的基礎上,有效降低金融信貸風險與企業(yè)融資成本,并初步建立起企業(yè)信用評價體系,更好地服務于本地區(qū)域經(jīng)濟與重點行業(yè)扶持,并探索出全省企業(yè)融資風險體制機制新路子。
【具體實施方式】
[0008]本發(fā)明通過采集工商基礎登記數(shù)據(jù)、企業(yè)運營相關數(shù)據(jù)、政府部門榮譽處罰數(shù)據(jù)、金融機構信貸違約數(shù)據(jù)等涉及到企業(yè)相關的全行業(yè)數(shù)據(jù)。對所采集的數(shù)據(jù)進行清洗比對,并且根據(jù)預設的模型進行信用風險評估以及風險提示,具體包括如下步驟:
S1、采集各個政府行業(yè)及金融機構的企業(yè)相關數(shù)據(jù),對獲取的數(shù)據(jù)進行預處理,并且把數(shù)據(jù)存儲到HADOOP數(shù)據(jù)平臺。數(shù)據(jù)采集的內容主要包括企業(yè)基本注冊登記數(shù)據(jù)、企業(yè)在國地稅的財務報表以及納稅數(shù)據(jù)、企業(yè)水電氣數(shù)據(jù)、司法訴訟判決數(shù)據(jù)、各個政府部門的審批許可及處罰數(shù)據(jù)、動產(chǎn)不動產(chǎn)抵押、擔保情況等數(shù)據(jù)。在數(shù)據(jù)采集的過程中,采用了底層系統(tǒng)對接和數(shù)據(jù)文件上傳的方式來進行人工采集。
[0009]S2、把存數(shù)據(jù)倉庫的數(shù)據(jù)進行數(shù)據(jù)清洗比對。主要比對工作為:
1.確定企業(yè)名稱基準。2.檢出各部門不一致數(shù)據(jù)。針對不匹配數(shù)據(jù),通過以下方法組合檢出:A通過工商字號進行模糊比對B通過工商庫中負責人姓名查詢C通過工商庫中組織機構代碼查詢D通過工商注冊號查詢E通過以上方式仍不能匹配上的數(shù)據(jù),如果數(shù)量不多,可以考慮通過人工進行比對。3.各部門確定名稱數(shù)據(jù)修改方案。4.建立數(shù)據(jù)一致性長效機制。
5.企業(yè)組織機構代碼證申領一致性檢查。6.企業(yè)名稱變更一致性同步。7.企業(yè)組織機構代碼變更一致性同步。
[0010]S3、建立企業(yè)基本特征庫,通過數(shù)據(jù)勾勒出每個企業(yè)的360°立體畫像,稱為企業(yè)畫像。系統(tǒng)主要從基本特質、行為偏好、履約能力、信用歷史、經(jīng)營管理、經(jīng)濟效益、企業(yè)關系、發(fā)展前景八個大類來建立企業(yè)基本特質庫。通過對企業(yè)畫像的構建,能夠準確對企業(yè)進行定位,明確這個企業(yè)是一家怎樣的企業(yè),在行業(yè)、地區(qū)中所處的位置如何。
[0011]S4、把企業(yè)輸入到社會關系網(wǎng)絡模型,針對所有企業(yè)進行全網(wǎng)分析,建立企業(yè)關聯(lián)關系圈。關系圈涉及的維度主要為法定代表人、股東、高管、擔保、配偶維度。在關系圈建模的過程中,除了維度之外,還對關系設置了一定的權重,并且為了避免關系圈過于龐大導致難以判斷,針對一些弱關系,例如占有極少量股份的股東,監(jiān)事等進行了剔除,重點突出了大股東,法定代表人及配偶的關系。
[0012]S5、基于風險預警模型來對企業(yè)進行實時的風險預警,預警維度包括登記變動、關聯(lián)風險、黑名單、人員異常、投融資情況等。通過關系網(wǎng)和風險預警的結合,我們稱之為“全網(wǎng)預警”。當主體監(jiān)控企業(yè)關系網(wǎng)上的某家企業(yè)涉及到風險預警提示的時候,會通知主體監(jiān)控企業(yè)的風險類型基本以及影響度。
[0013]S6、基于企業(yè)信用評分模型對企業(yè)進行信用評分,信用評分模型稱為“五力”模型,主要通過下面5個方面來進行評分:1.資本實力:反映企業(yè)規(guī)模,資本,資產(chǎn)和人力資源及可持續(xù)性等資本要素2.運營能力:反映企業(yè)運營周轉效率的資產(chǎn)質量要3.盈利能力:衡量企業(yè)獲取收益和企業(yè)增值的能力4.償付能力:衡量企業(yè)現(xiàn)金流及償付能力的財務指標
5.發(fā)展?jié)摿?衡量企業(yè)發(fā)展速度和增長趨勢的成長性指標。
[0014]信用評分模型對各維度中的指標采用單變量回歸分析的方法,在分析自變量和因變量之間相關關系的基礎上,建立變量之間的回歸方程,并將回歸方程作為預測模型,來預測企業(yè)的各維度表現(xiàn)。
[0015]信用評分模型所指回歸模型為基于單個行業(yè)和單個分析維度所構建的概率預測模型,該模型利用統(tǒng)計學邏輯斯蒂回歸模型進行判定概率預測,使得評估結果科學,客觀,準確,有效。邏輯回歸模型所采用的建模函數(shù)為BVn*Xn+ BCn =C。邏輯回歸方程構建完成后將根據(jù)二項式分布法進行方程參數(shù)估計,生成函數(shù)并判定概率預測結果,并且將概率預測結果轉化為百分制評分標準。
[0016]S7、通過企業(yè)關系網(wǎng)和信用評分的結合,我們構建了企業(yè)的信用地圖,所有構建的主體關系網(wǎng)上的企業(yè)的好壞都會對主體企業(yè)進行信用影響。
[0017]應當指出,以上實施例僅是本發(fā)明的代表性例子。本發(fā)明還可以有許多變形。凡是依據(jù)本發(fā)明的實質對以上實施例所作的任何簡單修改、等同變化與修飾,均應認為屬于本發(fā)明的保護范圍。
【主權項】
1.基于全行業(yè)數(shù)據(jù)的企業(yè)金融風險評分方法,其特征在于,包括如下步驟:S1、采集各個政府行業(yè)及金融機構的企業(yè)相關數(shù)據(jù),對獲取的數(shù)據(jù)進行預處理,并且把數(shù)據(jù)存儲到HADOOP數(shù)據(jù)平臺;數(shù)據(jù)采集的內容主要包括企業(yè)基本注冊登記數(shù)據(jù)、企業(yè)在國地稅的財務報表以及納稅數(shù)據(jù)、企業(yè)水電氣數(shù)據(jù)、司法訴訟判決數(shù)據(jù)、各個政府部門的審批許可及處罰數(shù)據(jù)、動產(chǎn)不動產(chǎn)抵押、擔保情況等數(shù)據(jù);在數(shù)據(jù)采集的過程中,采用了底層系統(tǒng)對接和數(shù)據(jù)文件上傳的方式來進行人工采集;S2、把存數(shù)據(jù)倉庫的數(shù)據(jù)進行數(shù)據(jù)清洗比對,主要比對工作為:1.確定企業(yè)名稱基準,2.檢出各部門不一致數(shù)據(jù);針對不匹配數(shù)據(jù),通過以下方法組合檢出:A通過工商字號進行模糊比對,B通過工商庫中負責人姓名查詢,C通過工商庫中組織機構代碼查詢,D通過工商注冊號查詢,E通過以上方式仍不能匹配上的數(shù)據(jù),如果數(shù)量不多,可以考慮通過人工進行比對;3.各部門確定名稱數(shù)據(jù)修改方案,4.建立數(shù)據(jù)一致性長效機制,5.企業(yè)組織機構代碼證申領一致性檢查,6.企業(yè)名稱變更一致性同步,7.企業(yè)組織機構代碼變更一致性同步; S3、建立企業(yè)基本特征庫,通過數(shù)據(jù)勾勒出每個企業(yè)的360°立體畫像,稱為企業(yè)畫像,系統(tǒng)主要從基本特質、行為偏好、履約能力、信用歷史、經(jīng)營管理、經(jīng)濟效益、企業(yè)關系、發(fā)展前景八個大類來建立企業(yè)基本特質庫;通過對企業(yè)畫像的構建,能夠準確對企業(yè)進行定位,明確這個企業(yè)是一家怎樣的企業(yè),在行業(yè)、地區(qū)中所處的位置如何;S4、把企業(yè)輸入到社會關系網(wǎng)絡模型,針對所有企業(yè)進行全網(wǎng)分析,建立企業(yè)關聯(lián)關系圈,關系圈涉及的維度主要為法定代表人、股東、高管、擔保、配偶維度,在關系圈建模的過程中,除了維度之外,還對關系設置了一定的權重;S5、基于風險預警模型來對企業(yè)進行實時的風險預警,預警維度包括登記變動、關聯(lián)風險、黑名單、人員異常、投融資情況等,通過關系網(wǎng)和風險預警的結合形成“全網(wǎng)預警”,當主體監(jiān)控企業(yè)關系網(wǎng)上的某家企業(yè)涉及到風險預警提示的時候,會通知主體監(jiān)控企業(yè)的風險類型基本以及影響度;S6、基于企業(yè)信用評分模型對企業(yè)進行信用評分,主要通過下面5個方面來進行評分:.1.資本實力:反映企業(yè)規(guī)模,資本,資產(chǎn)和人力資源及可持續(xù)性等資本要素,2.運營能力:反映企業(yè)運營周轉效率的資產(chǎn)質量要,3.盈利能力:衡量企業(yè)獲取收益和企業(yè)增值的能力,4.償付能力:衡量企業(yè)現(xiàn)金流及償付能力的財務指標,5.發(fā)展?jié)摿?衡量企業(yè)發(fā)展速度和增長趨勢的成長性指標;信用評分模型對各維度中的指標采用單變量回歸分析的方法,在分析自變量和因變量之間相關關系的基礎上,建立變量之間的回歸方程,并將回歸方程作為預測模型,來預測企業(yè)的各維度表現(xiàn);預測模型利用統(tǒng)計學邏輯斯蒂回歸模型進行判定概率預測,邏輯斯蒂回歸模型所采用的建模函數(shù)為BVn*Xn+ BCn =C;邏輯回歸方程構建完成后將根據(jù)二項式分布法進行方程參數(shù)估計,生成函數(shù)并判定概率預測結果,并且將概率預測結果轉化為百分制評分標準;S7、通過企業(yè)關系網(wǎng)和信用評分的結合,構建企業(yè)的信用地圖,所有構建的主體關系網(wǎng)上的企業(yè)的好壞都會對主體企業(yè)進行信用影響。
【文檔編號】G06Q10/06GK105913195SQ201610276269
【公開日】2016年8月31日
【申請日】2016年4月29日
【發(fā)明人】吳華鋒, 陳晶, 蔡寧娜, 郭慶鋒, 朱勇, 余力榮, 夏俊偉, 云楓
【申請人】浙江匯信科技有限公司