無抵押貸款公司(抵押企業無diy貸款)
核心
正態分布+邏輯回歸+Fico建模
數據清洗(正則表達式)
獲取外部數據(政府公開信用數據,外購征信數據)
謹慎大數據黑天鵝事件,對歷史數據權重處理
信用評分人數百分比累計百分比違約率300~4992%2%87%500~5495%7%71%550~5998%51%600~64912%27%31%650~69915%42%700~74918%60%5%750~79927%87%2%800~850130%1%
揭秘銀行信用貸款風控術:風險評分模型成逆襲關鍵
風險評分
信用評分體系:評分系統包括個人信用記錄、個人財產與收入水平等評分
內部數據來自銀行掌握的個人履約能力、社交活動、行為偏好、銀行關系、信息齊全等;
外部數據來自第三方傳統征信、第三方互聯網征信、公安系統和電信數據等。
21世紀經濟報道記者獲悉,國內商業銀行的信用評分系統大多借鑒美國FICO評分系統,該系統根據信用償還歷史(35%)、欠款金額(30%)、信用歷史時長(15%)、信貸產品組合(10%)和新開立信用賬戶(10%)等指標進行評分。
對于信用評分,“不是說評分越高,那么給你的相應的額度就會越高?!痹擄L控人士表示,只能說比較重視。
數據清洗是風控模型的前提
信用評分的背后,則是風控模型。
一位消費金融高管表示,從風險模型來講,銀行發行信用卡需要填寫各種資料,比較繁瑣,審批需要人工、電核,后來演變到線上?!瓣P鍵是我們用什么方式讓這些盡量少得麻煩客戶,盡量準確地擋住欺詐人群。”其中,“要把握一個平衡的問題,風險成本不是說把握得越嚴,風險損失就越小,否則就沒有利潤?!?/p>
我們放貸款的風控中,最大的挑戰是防欺詐,信用風險倒在其次?!币晃怀巧绦辛闶劭偙O表示,信貸業務主要通過線下進行,審批環節會篩掉10%的客戶。最終還會通過模糊搜索模型再次篩選客戶。
前述資深風控人士認為,“從國外經驗看,目前風控仍然是經驗驅動數據,而且數據的技術含量不低于風控模型?!倍鴮嶋H上,目前國內金融機構過度重視風控模型,對于數據質量的重視程度不夠。
在風控模型設計中,“FICO標準流程中,數據清洗就有12個步驟,甚至是風控負責人來做數據整理工作?!彼硎?,否則模型會存在過擬合問題,將指標放入風控模型結果很好,但在生產過程中不穩定。
對于數據來源,前述高管表示,金融機構不是平臺性企業,其實數據鏈是斷的。有的地方多一點,有的地方少一點,飽和度不太一樣。要得到完整的客戶的風險的畫像,還是要多方的數據來源來拼合。
美國FICO評分系統簡介
美國的個人信用評分系統,主要是Fair IsaacCompany 推出的 FICO,評分系統也由此得名。一般來講, 美國人經常談到的你的得分 ,通常指的是你目前的FICO分數。而實際上, Fair Isaac 公司開發了三種不同的FICO 評分系統 ,三種評分系統分別由美國的三大信用管理局使用評分系統的名稱也不同。
信用管理局名稱FICO 評分系統名稱EquifaxBEACON*ExperianExperianPFair Isaac Risk ModelTransUnionFICO Risk Score, Classic
Fair Isaac 公司所開發的這三種評分系統使用的是相同的方法, 并且都分別經過了嚴格的測試。即使客戶的歷史信用數據在三個信用管理局的數據庫中完全一致, 從不同的信用管理局的評分系統中得出的信用得分也有可能不一樣, 但是相差無幾。
fico評分系統全球分布圖

FICO 評分系統得出的信用分數范圍在300- 850分之間。分數越高, 說明客戶的信用風險越小。但是分數本身并不能說明一個客戶是好還是壞,貸款方通常會將分數作為參考, 來進行貸款決策。每個貸款方都會有自己的貸款策略和標準, 并且每種產品都會有自己的風險水平, 從而決定了可以接受的信用分數水平。一般地說, 如果借款人的信用評分達到680 分以上, 貸款方就可以認為借款人的信用卓著,可以毫不遲疑地同意發放貸款。如果借款人的信用評分低于620 分, 貸款方或者要求借款人增加擔保, 或者干脆尋找各種理由拒絕貸款。如果借款人的信用評分介于620- 680 分之間, 貸款方就要作進一步的調查核實, 采用其它的信用分析工具, 作個案處理。目前, 美國的信用分數分布狀況見圖1。FICO 評分主要用于貸款方快速、客觀的度量客戶的信用風險, 縮短授信過程。FICO 評分在美國應用的十分廣泛, 人們能夠根據得分, 更快地獲得信用貸款, 甚至有些貸款, 可以直接通過網絡申請, 幾秒鐘就可以獲得批準, 縮短了交易時間, 提高了交易效率, 降低了交易成本。信用評分系統使用, 能夠幫助信貸方做出更公正的決策, 而不是把個人偏見帶進去, 同時, 客戶的性別、種族、宗教、國籍和婚姻狀況等因素, 都對信用評分沒有任何影響, 保證了評分的客觀公正性。在評分系統中, 每一項信用信息的權重不同, 越早的信用信息, 對分數的影響越小
FICO 評分系統得出的信用分數范圍在300-850 分之間分數越高, 說明客戶的信用風險越小,但是分數本身并不能說明一個客戶是好還是壞,貸款方通常會將分數作為參考, 來進行貸款決策,每個貸款方都會有自己的貸款策略和標準。
信用評分人數百分比累計百分比違約率300~4992%2%87%500~5495%7%71%550~5998%51%600~64912%27%31%650~69915%42%700~74918%60%5%750~79927%87%2%800~850130%1%
從上表中可以看到兩個規律:一是信用評分特別低和特別高的人占比都較少,大多數信用評分中等,大體呈現為左偏態的正態分布;二是信用評分分值越高,違約率越低。這個就是信用評分的核心價值所在,可以根據信用評分的高低進行諸如是否發放、貸款額度、是否需要抵押等重要決策。每種產品都會有自己的風險水平, 從而決定了可以接受的信用分數水平。一般地說, 如果借款人的信用評分達到 680分以上, 貸款方就可以認為借款人的信用卓著可以毫不遲疑地同意發放款如果借款人的信用評分低于,620分 貸款方或者要求借款人增加擔保, 或者干脆尋找各種理由拒絕貸款。如果借款人的信用評分介于620-680 分之間, 貸款方就要作進一步的調查核實, 采用其它的信用分析工具 ,作個案處理。
FICO 評分模型中所關注的主要因素有五類, 分別是客戶的信用償還歷史、信用賬戶數、使用信用的年限、正在使用的信用類型、新開立的信用賬戶。

(一) 信用償還歷史
影響FICO得分的最重要的因素是客戶的信用償還歷史 ,大約占總影響因素的35%支付歷史主要顯示客戶的歷史償還情況, 以幫助貸款方了解該客戶是否存在歷史的逾期還款記錄,主要包括:
(1)各種信用賬戶的還款記錄,包括信用卡( 例如 Visa Master Card American Express DiScover) 、零售賬戶(直接從商戶獲得的信用) 、分期償還貸款、金融公司賬戶、抵押貸款。
(2)公開記錄及支票存款記錄, 該類記錄主要包括破產記錄、喪失抵押品贖回權記錄、法律訴訟事件、留置權記錄及判決。涉及金額大的事件比金額小的對FICO 得分的影響要大, 同樣的金額下, 越晚發生的事件要比早發生的事件對得分的影響大。一般來講, 破產信息會在信用報告上記錄7-10 年.
(3)逾期償還的具體情況, 包括, 逾期的天數、未償還的金額、逾期還款的次數和逾期發生時距現在的時間長度等。例如, 一個發生在上個月的逾期天的記錄對FICO 得分的影響會大于一個發生在 年前的逾期90 天的記錄。據統計, 大約有不足,50%的人有逾期30天還款的記錄, 大約只有30%的人有逾期 天60以上還款的記錄. 而77%的人從來沒有過逾期 90天以上不還款的 僅有低于20%的人有過違約行為而被銀行強行關閉信用賬戶
最近幾個月的重大違約

(二) 信用賬戶數
該因素僅次于還款歷史記錄對得分的影響 占總影響因素的30%,對于貸款方來講 ,一個客戶有信用賬戶需要償還貸款 ,并不意味著這個客戶的信用風險高。相反地 ,如果一個客戶有限的還款能力被用盡, 則說明這個客戶存在很高的信用風險 ,有過度使用信用的可能 ,同時也就意味著他具有更高的逾期還款可能性。該類因素主要是分析對于一個客戶, 究竟多少個信用賬戶是足夠多的 ,從而能夠準確反應出客戶的還款能力。
總余額在循環賬戶總限額比

( 三) 使用信用的年限
該項因素占總影響因素的15%。一般來講 ,使用信用的歷史越長, 越能增加FICO 信用得分。該項因素主要指信用賬戶的賬齡,既考慮最早開立的賬戶的賬齡 ,也包括新開立的信用賬戶的賬齡 ,以及平均信用賬戶賬齡。據信用報告反映 ,美國最早開立的信用賬戶的平均賬齡是14 年,超,25%的客戶的信用歷史長于20年, 只有不足5%的客戶的信用歷史小于2 年
( 四) 新開立的信用賬戶
該項因素占總影響因素的10%,。在現今的經濟生活中, 人們總是傾向于開立更多的信用賬戶, 選擇信用購物的消費方式, FICO 評分系統也將這種傾向體現在信用得分中。據調查 ,在很短時間內開立多個信用賬戶的客戶具有更高的信用風險 ,尤其是那些信用歷史不長的人。該項因素主要包括
(1) 新開立的信用賬戶數, 系統將記錄客戶新開立的賬戶類型及總數 ;
(2) 新開立的信用賬戶賬齡;
(3) 目前的信用申請數量 ,該項內容主要由查詢該客戶信用的次數得出, 查詢次數在信用報告中只保存兩年;
(4) 貸款方查詢客戶信用的時間長度
(5) 最近的信用狀況, 對于新開立的信用賬戶及時還款, 會在一段時間后, 提高客戶的FICO 得分
( 五) 正在使用的信用類型
該項因素占總影響因素的10%。 主要分析客戶的信用卡賬戶、零售賬戶、分期付款賬戶、金融公司賬戶和抵押貸款賬戶的混合使用情況 ,具體包括 :持有的信用賬戶類型和每種類型的信用賬戶數
主要參考文獻
1、
2、
芝麻信用與FICO評分的差異
FICO評分是Fair Isaac公司開發的信用評分系統,也是目前美國應用得最廣泛的一種。FICO評分系統得出的信用分數范圍在300~850分之間,分數越高,說明客戶的信用風險越小,它采集客戶的人口統計學信息、歷史貸款還款信息、歷史金融交易信息、人民銀行征信信息等,通過邏輯回歸模型計算客戶的還款能力,預測客戶在未來一年違約的概率:
1.人口統計學信息:如客戶年齡、家庭結構、住房情況、工作類別及時間等;
2. 歷史貸款還款信息:即過去6個月或12個月的付款方式、逾期次數等;
3. 歷史金融交易信息:即過去6個月或12個月的平均月交易筆數、金額等;
4. 銀行征信信息:如過去12個月中新開的賬戶總數、所有賬戶的總額度、賬戶是否逾期等。
看,以上這些信息都是FICO評分模型的自變量,最終會通過邏輯回歸模型輸出最終分數。
阿里巴巴推出的芝麻信用分則是以大數據分析技術為基礎,采集多元化數據,包括傳統的金融類交易、還款數據,第三方的非金融行為數據,互聯網、移動網絡和社交網絡數據等,幫助貸款方從多個方面考察個體的還款能力、還款意愿,做出合理、全面的信用評分。
大數據風控的現狀、問題及優化路徑(總結侯暢、唐時達文章)
一、大數據風控發展迅速
(一)國外案例
Zest Finance公司開發10個基于機器學習的分析模型,1萬條原始信息,7萬個特征變量,5秒內完成。
Kabbage公司通過獲取企業網店店主的銷售、信用記錄、顧客流量、評論、商品價格和存貨等信息、以及在Facebook和Twitter上與客戶的互動信息,借助數據挖掘技術,把這些店主分成不同的風險等級,以此來確定提供貸款金額數量與貸款利率水平。
(二)國內案例
阿里面向社會的信用服務體系芝麻信用,通過分析大量的網絡交易及行為數據嗎,對用戶進行信用評估。
騰訊的微眾銀行推出“微粒貸”,風控核心通過社交數據與央行征信等傳統銀行信用數據結合,運用社交圈、行為特征、交易、基本社會特征、人行征信5個維度對客戶綜合評級,運用大量的指標構建多重模型,以快速識別客戶的信用風險。
二、當前大數據有效性欠佳的原因
(一)數據的質量問題
1.社交數據的真實性問題
Lending club 、facebook合作、宜信嘗試后,結論社交數據不可用。
(二)交易數據的真實性問題
刷單。
三、大數據風控的理論有效性問題
從IT技術層面論證大數據風控的實踐性案例已經很多,但是在經濟金融的理論層面、大數據風控還面臨一些問題需要解決。
(一)金融信用與社會信用的相關性不確定
線上與線下行為方式反差強烈。
(二)大數據對于“黑天鵝”事件的滯后性
(三)大數據收集和使用的制度問題
四、提高大數據風控有效性的路徑
(一)對于金融企業而言,要構建多樣化、連續化和實時性的基礎數據
1.多維度的收集數據,互聯互通,打破數據的孤島。
2.從供應鏈交易環節獲取數據。
3.積極布局“物聯網+”
獲取生產環節和使用環節的數據,如企業機器運行數據
(二)對于金融研究部門而言,可從經濟、金融等多個角度綜合論證大數據風控的有效性,為大數據風控提供理論支持
如大數據風控如何順應經濟周期的變化,如何從統計上論證過去的數據對于未來行為判斷的準確性,如何解決道德風險所帶來的不確定性。
(三)對于政府監管部門而言,要推動和完善與數據相關的制度建設
1.法律制度的建設,對數據的收集和使用予以法律上的保護
《個人信息保護法》
2.會計制度建設,對數據資產予以明確的計量
