2019-05-13
重點:
圖靈分與芝麻信用分的相關(guān)度為
2%
圖靈分與社交信用分的相關(guān)度為
0.2%
圖靈分與多頭借貸分的相關(guān)度為
0.7%
早年間,,借款人在申請貸款時,,金融機構(gòu)多是依據(jù)央行的征信系統(tǒng)來獲取個人信用狀況,但央行征信系統(tǒng)多是整合的銀行信貸類數(shù)據(jù),,其覆蓋人群也只占全國人口的65%-70%,,以此作為信貸風控的參考依據(jù)是不健全、不完整的,。
后來互聯(lián)網(wǎng)的發(fā)展產(chǎn)生了大量的數(shù)據(jù)記錄,,云計算為大數(shù)據(jù)的獲取挖掘提供了技術(shù)支持,一系列信息技術(shù)的發(fā)展對于完善我國現(xiàn)行市場的風控體系,、實現(xiàn)普惠金融提供了強有力的幫助,。
互聯(lián)網(wǎng)發(fā)展至今,其所產(chǎn)生的數(shù)據(jù)類型越來越龐大,,在取得授權(quán)的前提下,,可搜集獲取的數(shù)據(jù)源包括電商類、社交類,、消費類,、運營商類、網(wǎng)絡(luò)行為類等等,,也由此出現(xiàn)了一些針對性的信用評分類產(chǎn)品或平臺,,如51信用卡,主要基于用戶信用卡電子賬單的歷史數(shù)據(jù),,交叉驗證電商以及社交關(guān)系數(shù)據(jù),,判斷用戶的風險等級;再如基于QQ,、微信,、騰訊網(wǎng)、財付通等社交網(wǎng)絡(luò)的騰訊信用,,依據(jù)用戶的即時通信,、虛擬消費、電商交易,、游戲行為等畫像數(shù)據(jù),,得出基于互聯(lián)網(wǎng)行為的個人信用報告……
芝麻信用
以芝麻信用為例,,了解一下市面上傳統(tǒng)風控產(chǎn)品的信用評分模型。
芝麻信用是參考美國官方的信用評分體系“FICO”,,綜合考慮了用戶的身份特征,、信用歷史、履約能力,、人脈關(guān)系以及行為偏好五個大類,,加工、整理,、計算后得出用戶信用評分,,分值越高代表用戶的信用水平越好。
身份特征:指用戶的姓名,、年齡,、職業(yè)、收入等基礎(chǔ)信息,,及工商,、法院、學歷學籍等公共部門的有效數(shù)據(jù),。
信用歷史:過往發(fā)生的債務(wù)活動,,尤指在支付寶上的信用賬戶歷史、轉(zhuǎn)賬以及還款等情況,。
履約能力:用戶在各種信用服務(wù)中的履約表現(xiàn)情況,,例如通過關(guān)聯(lián)平臺租借的共享產(chǎn)品是否按時歸還。
人脈關(guān)系:社交網(wǎng)絡(luò)中好友的身份特征,、信用等級及互動頻率等,,作為評判個人信用等級的依據(jù),但目前社交的聊天內(nèi)容等還未納入?yún)⒖肌?
行為偏好:在購物,、消費等方面表現(xiàn)出來的具象的行為習慣,,帶有明顯的特征偏好。
芝麻信用的數(shù)據(jù)主要來源于其所處的行業(yè)領(lǐng)域,,“阿里體系”內(nèi)的數(shù)據(jù)是信息獲取的主要渠道,,正如前文所述的51信用卡、騰訊信用等,,數(shù)據(jù)獲取渠道及評分維度幾乎是市場上現(xiàn)有風控產(chǎn)品的架構(gòu)基礎(chǔ),,越來越趨同的風控產(chǎn)品該怎樣進一步完善金融市場的風控體系,填補數(shù)據(jù)獲取的縫隙,?
AI圖靈
AI圖靈是聚信立基于人工智能技術(shù)研發(fā)的一款全新的數(shù)據(jù)獲取及模型優(yōu)化的評分工具,。它通過獲取用戶的授權(quán)后掃描用戶的圖片,識別出圖片中的風景,、地點,、同框人物,、場景、商標,、文字等信息,,從中提取借貸、逾期,、股票、賭博,、不良嗜好等風險因子,,從用戶畫像、偏好,、事件,、風險等維度打上標簽,再綜合上萬個細分字段,,基于隨機森林+邏輯回歸算法,,經(jīng)過數(shù)據(jù)清洗,特征選擇,,模型訓練及參數(shù)優(yōu)化,,模型評估,最終生成用戶的信用分,。
首先,,AI圖靈創(chuàng)造性地開辟出了風控數(shù)據(jù)的新來源。不同于市場上現(xiàn)有產(chǎn)品的電商數(shù)據(jù),、運營商數(shù)據(jù),、社交數(shù)據(jù)等,它基于用戶的圖片數(shù)據(jù),,可以是社交軟件的相冊圖片,,可以是云盤/網(wǎng)盤存儲的圖片,可以是用戶的本地相冊,,實現(xiàn)了對非結(jié)構(gòu)化數(shù)據(jù)的獲取應(yīng)用,,同時保證了數(shù)據(jù)的真實性和客觀性,不會存在“刷信用”的行為,。
其次,,AI圖靈從圖片中提取出的評估指標,不僅僅有常見的個人基礎(chǔ)信息,、行為偏好,、消費習慣等信息,更多是側(cè)重于風險相關(guān)的表現(xiàn)因素,,部分指標如下:
相關(guān)度測評
1,、綜合分
以芝麻信用為代表,,從綜合分的角度和AI圖靈進行相關(guān)度實測,其測評結(jié)果如下:
上圖中可以看出,,兩者之間的相關(guān)度在 2% 左右,,這就意味著兩者之間的數(shù)據(jù)重合度很低,同為大數(shù)據(jù)下的風控產(chǎn)品,,兩者之間并不存在嚴重的同質(zhì)化傾向,。
2、單方面分
除綜合分外,,市場上的信用分還可以細分為社交網(wǎng)絡(luò)分,、多頭借貸分等具有針對性的信用評分。AI圖靈在綜合分方面的低相關(guān)度,,在單方面分方面的表現(xiàn)如何,?為避免某些誤解,在此將選擇的社交網(wǎng)絡(luò)分和多頭借貸分的代表性產(chǎn)品在測評過程中隱去名字,,直接用分的名字代替,,以這兩款產(chǎn)品來反映市場的平均情況。
如上圖所示,,AI圖靈和市場上社交網(wǎng)絡(luò)分的相關(guān)度在 0.2% 左右,,和多頭借貸分的相關(guān)度在 0.7%,這兩個數(shù)值遠低于和綜合分的測評,。這表明,,即使在細分領(lǐng)域,AI圖靈的數(shù)據(jù)源,、模型評估指標等都比較新穎,,和市場重合度很低,屬于全新的角度,。
聚信立的AI圖靈可以說是開創(chuàng)了全新的數(shù)據(jù)來源,,是現(xiàn)有風控市場上數(shù)據(jù)的補充和擴展。對于大數(shù)據(jù)風控而言,,數(shù)據(jù)的量級,、數(shù)據(jù)的有效性等都是衡量風控模型的必要指標,但是橫向來看,,數(shù)據(jù)的維度會是今后風控產(chǎn)品越來越難跨越的挑戰(zhàn),,維度越豐富,畫出的用戶畫像才能越清晰立體,,對用戶風險的判斷才能越精確,。
目前,基于深度學習的圖靈分比早前版本基于機器學習的圖靈分有顯著提升,新版圖靈分的KS有效值可達到 35%,,近期將完成測試面向市場,!
產(chǎn)品信息咨詢:021-54890256,[email protected]