這是一個(gè)金融機(jī)構(gòu)欲言又止的領(lǐng)域。
隨著互聯(lián)網(wǎng)消費(fèi)金融的興起,不依賴線下營業(yè)網(wǎng)點(diǎn),僅通過線上實(shí)現(xiàn)展業(yè)放貸,這一“輕模式”不僅快速推廣開來,也受到資本市場等的追捧。
一位騰訊資深風(fēng)控人士表示,互聯(lián)網(wǎng)消費(fèi)信貸的特征一是“快”:線上化、非接觸、場景化、秒批秒放。二是“白”,客群缺少征信信息。他表示,以2016年來看,估算消費(fèi)信貸市場規(guī)模約為6.6萬億,其中不良信貸規(guī)模超過2000億元。
與傳統(tǒng)銀行信貸相比,互聯(lián)網(wǎng)信貸呈現(xiàn)不同的特征。此前,央行總行金融市場司副處長、百行征信顧問唐磊此前接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)表示,互聯(lián)網(wǎng)金融和消費(fèi)金融機(jī)構(gòu)產(chǎn)品模式比傳統(tǒng)金融機(jī)構(gòu)更為復(fù)雜。如較常見的循環(huán)貸、聯(lián)合貸等產(chǎn)品,前者給予借款人一定額度可多次借貸,后者為多家機(jī)構(gòu)聯(lián)合給借款人放貸。互聯(lián)網(wǎng)貸款呈現(xiàn)小額、快速、高頻特征,市場上存在大量秒批、十幾分鐘就要放款的產(chǎn)品。新金融展業(yè)對征信數(shù)據(jù)的查詢速度要求較快,有的互金機(jī)構(gòu)要求服務(wù)器毫秒級反應(yīng),數(shù)據(jù)期限T+1隔日信息。
這使得互聯(lián)網(wǎng)金融類機(jī)構(gòu)以不同的模式從事展業(yè)。上述風(fēng)控人士表示,大數(shù)據(jù)風(fēng)控三要素中,數(shù)據(jù)決定了風(fēng)控的天花板,決策引擎決定了接近天花板的程度,計(jì)算平臺決定了研發(fā)的效率。
需要搜集哪些數(shù)據(jù)?
包括傳統(tǒng)銀行、持牌消費(fèi)金融機(jī)構(gòu)、互聯(lián)網(wǎng)金融機(jī)構(gòu)等,均已大量從事互聯(lián)網(wǎng)信貸。21世紀(jì)經(jīng)濟(jì)報(bào)道記者根據(jù)各互聯(lián)網(wǎng)信貸產(chǎn)品的用戶借款協(xié)議、隱私協(xié)議等梳理,這些線上放貸的產(chǎn)品所需要的數(shù)據(jù)一般包括個(gè)人信息、手機(jī)設(shè)備信息、征信信息、聯(lián)系人信息等。
互聯(lián)網(wǎng)巨頭中,包括百度、阿里巴巴、京東、小米等一般將互聯(lián)網(wǎng)信貸產(chǎn)品的隱私權(quán)協(xié)議與母公司賬戶體系打通,利用其在體系內(nèi)手機(jī)的數(shù)據(jù)核算個(gè)人信貸額度。
螞蟻金服的“花唄”要求讀取支付寶、銀行、商戶等留存的姓名、證件類型及號碼、聯(lián)系電話及地址、支付寶賬戶信息、履約情況;芝麻信用等信用報(bào)告;政府機(jī)構(gòu)、司法機(jī)關(guān)及公共事業(yè)單位、行業(yè)組織(法院、中國互聯(lián)網(wǎng)金融協(xié)會)等的信息,如訴訟信息;關(guān)聯(lián)人姓名及聯(lián)系方式等。
百度“有錢花”與百度賬號體系打通,收集的個(gè)人賬戶信息包括:設(shè)備信息、設(shè)備位置、設(shè)備連接、設(shè)備狀態(tài)、日志信息、位置信息、唯一應(yīng)用程序編號、本地存儲、Cookie和匿名標(biāo)示符等工具。其中,設(shè)備信息包括硬件型號、操作系統(tǒng)版本、設(shè)備配置、唯一設(shè)備標(biāo)識符、國際移動(dòng)設(shè)備身份碼IMEI、網(wǎng)絡(luò)設(shè)備硬件地址MAC、廣告標(biāo)識符IDFA等。設(shè)備位置信息包括:通過GPS、藍(lán)牙或WIFI信號獲得的位置信息。設(shè)備連接信息:瀏覽器的類型、電信運(yùn)營商、使用的語言等。設(shè)備狀態(tài)信息包括:設(shè)備傳感器數(shù)據(jù),設(shè)備應(yīng)用安裝列表。日志信息包括:使用情況、IP地址、所訪問服務(wù)的URL、瀏覽器的類型等。位置信息包括:IP地址、GPS、Wi-Fi接入點(diǎn)、基站等信息。
部分互聯(lián)網(wǎng)金融機(jī)構(gòu)則強(qiáng)制要求App讀取某些權(quán)限,否則無法正常打開App或提示可能無法正常使用。
如小米貸款A(yù)pp要求獲取設(shè)備信息(IMEI、MAC地址)等。其收集的信息包括設(shè)備信息、應(yīng)用信息、位置信息、登錄日志信息等。設(shè)備信息包括:IMEI編號、IMSI編號、MAC地址、序列號、MIUI版本、安卓版本、屏幕顯示信息、設(shè)備輸入信息、設(shè)備制造商信息和型號名稱、網(wǎng)絡(luò)運(yùn)營商、連接類型、硬件使用情況(電量、設(shè)備溫度等)。應(yīng)用信息包括:應(yīng)用列表、狀態(tài)記錄、應(yīng)用ID、SDK版本、系統(tǒng)更新設(shè)置。位置信息包括:地區(qū)、國家代碼、城市代碼、移動(dòng)網(wǎng)絡(luò)代碼、移動(dòng)國家代碼、小區(qū)代碼、經(jīng)緯度信息、時(shí)區(qū)設(shè)置和語言設(shè)置。登錄日志信息包括:Cookie、IP、網(wǎng)絡(luò)請求、臨時(shí)消息、標(biāo)準(zhǔn)系統(tǒng)日志、錯(cuò)誤崩潰信息。其他信息包括:環(huán)境特征值(ECV)(小米賬號、設(shè)備標(biāo)識、鏈接WiFi產(chǎn)生的信息和地理位置)。
招聯(lián)金融App要求必須讀取存儲空間、撥打和管理電話權(quán)限。在數(shù)據(jù)搜集上,包括在央行征信、公安、公積金、社保、稅務(wù)、民政、物流、通信運(yùn)營商、電子商務(wù)平臺、互聯(lián)網(wǎng)社交平臺等平臺上查詢個(gè)人征信、財(cái)產(chǎn)信息、聯(lián)絡(luò)方式、關(guān)系人、資信情況、就業(yè)情況、收入情況、婚姻情況、學(xué)歷情況、工作地址、居住地址、位置數(shù)據(jù)、通信行為、通訊信息、互聯(lián)網(wǎng)使用信息、互聯(lián)網(wǎng)使用行為等。
中原消費(fèi)金融App要求必讀讀取設(shè)備信息權(quán)限、設(shè)備存儲權(quán)限、定位信息等。收集的數(shù)據(jù)包括:在白騎士大數(shù)據(jù)、鵬元征信、芝麻信用、中智誠征信、北京集奧聚合、上海誠數(shù)等平臺查詢身份信息、行為信息、交易信息、設(shè)備信息等。
剛剛在港上市的51信用卡搜集的數(shù)據(jù)包括:導(dǎo)入銀行賬單、手機(jī)號、瀏覽器和手機(jī)信息、IP、訪問日期和時(shí)間、軟硬件等特征信息;身份信息、聯(lián)系地址、職業(yè)信息、聯(lián)系人聯(lián)系方式、歷史借貸情況、設(shè)備及位置信息、通話記錄及短信記錄等。
用戶畫像標(biāo)簽
搜集數(shù)據(jù)的目的,在于獲取用戶畫像。
京東金融明確提出,收集用戶身份信息、銀行卡信息、手機(jī)號、個(gè)人基本信息、身份信息、財(cái)產(chǎn)信息、交易信息及行為信息、瀏覽信息、關(guān)注信息、軟件信息、設(shè)備信息等,進(jìn)行數(shù)據(jù)分析以形成用戶畫像,用來展示用戶感興趣的產(chǎn)品或服務(wù)信息。
21世紀(jì)經(jīng)濟(jì)報(bào)道記者調(diào)查獲悉,在擁有全面、海量數(shù)據(jù)的基礎(chǔ)上,金融機(jī)構(gòu)會對數(shù)據(jù)進(jìn)行分類。一般而言,互聯(lián)網(wǎng)機(jī)構(gòu)和金融機(jī)構(gòu)會通過豐富和全面的標(biāo)簽體系,采用成千上萬個(gè)動(dòng)態(tài)或靜態(tài)字段信息。
例如:平安集團(tuán)大數(shù)據(jù)平臺中的數(shù)據(jù)規(guī)模高達(dá)8.5PB,單個(gè)用戶數(shù)據(jù)標(biāo)簽達(dá)20000個(gè)。
騰訊的用戶畫像中,標(biāo)記在每個(gè)用戶身上的標(biāo)簽人均2000多個(gè),大概可以歸類為賬戶數(shù)據(jù)、交易數(shù)據(jù)、商戶數(shù)據(jù)、QQ平臺數(shù)據(jù)、微信平臺數(shù)據(jù)、安全平臺數(shù)據(jù),日均計(jì)算量達(dá)到1.5萬億次。不過,騰訊旗下微眾銀行的微粒貸,用于風(fēng)控的標(biāo)簽此前不超過40個(gè),在近期增加兩個(gè)與郵箱相關(guān)的標(biāo)簽后,也僅有42個(gè)。
通過這一標(biāo)簽系統(tǒng),將散亂無章的數(shù)據(jù)整理為清晰分層、邏輯清楚的結(jié)構(gòu)化數(shù)據(jù),從而可以被大數(shù)據(jù)風(fēng)控模型所用。