互联网金融产品如何利用大数据做风控? - 诺米粒 - 2024最新贷款口子论坛
登录 or

互联网金融产品如何利用大数据做风控?

本题已加入知乎圆桌 » 欢迎来到风控时代,更多「风险控制」讨论欢迎关注。
现在互联网金融行业例如微众,搞金融产品都是想用大数据来做风险控制,这个怎么玩的呢?
已邀请:
匿名用户

匿名用户 白米Ⅲ级

赞同来自:

互联网金融产品太多,这里以P2P网贷为例,从风控涉及的相关环节分别来尝试讨论。


销售环节:
了解客户申请意愿和申请信息的真实性
适用于信贷员模式,风控关键点:
亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位。

审批环节
进行基本信贷政策的核查,主要是核实申请信息、证件资料、是否伪冒申请。
系统会审核剔除不符合基本信贷政策要求的客户,例如有严重不良征集记录的,内部已经有违约记录的,或者近期有较大风险被纳入关联黑名单的,不符合监管政策要求的客户。经过基本审查后,不同的申请人会依据客户信息的分类,被自动分发到不同的信贷流程中,这种不同的流程一般会根据客户的分类、申请额度的高低、是否新客户、是否存量等客户等因素进行设计 ,从而进入具体的审核环节。审核环节会采取系统审核和人工核查两个交互部分,审核不能过,有疑问的,或者通过的才能分别进入后续的环节,包括拒绝、退回补充调查、退回补充资料、通过、有条件通过等。
适用于信贷工厂模式,风控关键点:
1、客户填报信息的逻辑校验。客户填报信息包括其填写在申请表上的申报信息,以及提供的资质证明文件中的信息。欺诈客户由于编造了全部或部分信息,很可能在自行申报的相关信息中存在不符合常理的情况。利用互联网大数据提供的位置服务,能够将客户填写的地址信息定位为地址位置坐标,并与客户常用物流地址位置坐标进行比对,如果发现客户提供了一个距离过大的地址,则该地址信息存在虚假的可能性;针对移动端渠道,比如PAD,可以定位互联网客户的具体申请位置,与申请信息中填写的地址信息或职业信息进行对比验证;还可以收集客户填写申请过程的行为信息,如填写了多长时间、修改了几次、修改了哪些内容,这些信息项可以成为申请欺诈模型的变量或是申请欺诈策略的重要规则。
2、客户填报信息与公司自有存量客户信息的逻辑校验。比如:多个申请件填报的单位电话相同,但对应的单位名称及地址不同,批量伪冒申请件的可能性就很高。
3、外部信息的对比校验。恶意的申请往往会隐瞒对其不利的事实 ,如负债、公司运营存在问题、等待处理的法院执行信息等,通过爬虫抓取互联网上申请人的企业经营信息、法院执行信息可以核实申请人自身的真实资质。

授信环节
进入评分规则引擎的客户,会按类型走到不同的细分模块,以适应不同的细分模型,包括不同的产品、不同的行业、不同的客户群,如车贷、消费贷、抵押贷、个人经营贷等。
风控关键点:
不同类型的借款申请调用不同的信用评分规则引擎。
根据用户授权许可自动抓取的数据:
个人信息,抓取用户在互联网上留下的电商购买数据、搜索引擎数据、社交数据(微博/人人网等)、信用卡账单邮箱信息、学信网信息等多个维度的数据,得到有关个人性格、消费偏好、意愿、学历等的个人信息。
商户信息:抓取商户的电商交易数据(物流、现金流、信息流数据),电商的经营数据(如访客量、交易量、用户评价、物流信息等)。
最后通过特定模型转化为个人授信评分数据与商户授信评分数据。

附:大数据授信数据来源图


贷后存量客户管理环节
存量客户授信调整是存量客户管理中的重要一环,多种经营手段最终都会涉及授信客户的调整,不重视授信额度的管理,很有可能造成风险的快速上升,将引入端的“好客户”变成存量端的“坏客户”也是有可能的。
风控关键点:
1、违约情况观察,比如是否发生早期逾期,连续多期不还欠款、联系方式失效等
2、信息关联排查,比如存量客户中是否有与新增的黑名单、灰名单数据匹配
小微商户的存量风险管理过程中,可以从数据合作方获取商户交易流水信息,对其交易流水进行监测预警,对于突然出现的资金流入、流出,不符合经营规则的交易流水下滑情况,正常营业的大额交易等,均可以触发预警;通过大数据实时监测,一旦在外部数据监测过程中发现客户的严重负面信息、公安违法信息、法院执行信息、税务缴税信息、行业重要新闻、借款人社交关系网中的重大负面情况、借款人的网络浏览行为、资金支付结算情况等,可以及时触发预警。

贷后逾期客户管理环节
还款意愿差和还款能力不足是客户逾期的主要原因,这个环节主要涉及逾期客户管理与失联客户管理
风控关键点:
1、催收模型、策略优化。不同客户对于不同的催收手段的不同反应,可以通过大数据来挖掘规律。比如对于一个几乎无上网记录的客户,发送电子邮件进行催收,一般达不到触达效果,采取语音提醒可能效果更佳;对于一个微博控、知乎控,同样内容的催收还款提醒文字,通过微博、知乎私信发送比通过手机短信发送的效果更好。
2、失联客户识别与修复失联客户信息。比如,与外部电商拥有的客户物流信息进行交叉核实,发现客户申请贷款时间提供的联系方式 与近期网购中使用的联系方式均无法匹配,则可能意味着客户更新了联系信息,这时就可以主动发起与客户的沟通及联络,避免客户失联的发生;对于失联客户,互联网积累的大量关联信息,能够为摸清客户的工作、生活、社交网络提供帮助。

资金流动性管理环节
流动性风险是P2P网贷平台的主要风险,跑路P2P网贷平台的一个重要原因就是发生了挤兑。大数据下的流动性管理其实是实时BI的一个应用。传统BI数据T+1,大数据是实时BI。
风控关键点:
整合平台所有借款端与投资端两端数据,从以下两个维度进行
1、资金维度
2、业务维度
更多细节见之前的一个回答
P2P平台流动性最重要的指标是什么?

放款环节
放款环节是防止账户接管与资金挪用的关键环节。
风控关键点:
指定账号资金划转与定向支付。比如,客户出于培训进修的学费借贷,在申请过程中就要求客户事先提供学校的相关账号。

小结


P2P大数据风控模型构建路径

梁川 白米Ⅲ级

赞同来自:

由于互联网金融涉及货币发行(比特币)、第三方支付、投资理财(网络银行、保险、基金、证券、财富管理)、信贷(P2P、众筹、网络微贷)、征信等等,各个领域的风控策略并不尽相同,不能一概而论,下面讨论只能涵盖了常见的风控策略。

个人认为“大数据”除了强调数据的海量外,更重要的在于用于风控的历史数据的广度和深度,其中:

数据的广度:指用于风控的数据源多样化,任何互联网金融企业并不能指望依据单一的海量数据就解决风控问题,正如在传统金融风控中强调的“交叉验证”的原则一样,应当通过多样化的数据来交叉验证风险模型。以下的风控策略也如此,可能对同一风险事件采用了多种策略。

数据的深度:指用于风控的数据应当基于某个垂直领域真实业务场景及过程完整记录,从而保证数据能够还原真实的业务过程逻辑。

一个关于数据深度典型的反例:第三方支付貌似有丰富的真实交易记录,但由于大部分场景下无法获取交易商品的详细信息及用户身份,在用于风控时候价值大打折扣。

回到题主的话题:互联网金融产品如何利用大数据做风控。大致有如下一些常见方法:

1、基于某类特定目标人群、特定行业、商圈等做风控

由于针对特定人员、行业、商圈等垂直目标做深耕,较为容易建立对应的风险点及风控策略。
例如:
针对大学生的消费贷,主要针对大学生人群的特征
针对农业机具行业的融资担保。
针对批发市场商圈的信贷。

2、基于自有平台身份数据、历史交易数据、支付数据、信用数据、行为数据、黑名单/白名单等数据做风控

身份数据:实名认证信息(姓名、身份证号、手机号、银行卡、单位、职位)、行业、家庭住址、单位地址、关系圈等等。
交易数据/支付数据:例如B2C/B2B/C2C电商平台的交易数据,P2P平台的借款、投资的交易数据等。
信用数据:例如P2P平台借款、还款等行为累积形成的信用数据,电商平台根据交易行为形成的信用数据及信用分(京东白条、支付宝花呗),SNS平台的信用数据。
行为数据:例如电商的购买行为、互动行为、实名认证行为(例如类似新浪微博单位认证及好友认证)、修改资料(例如修改家庭及单位住址,通过更换频率来确认职业稳定性)。
黑名单/白名单:信用卡黑名单、账户白名单等。

3、基于第三方平台服务及数据做风控

互联网征信平台(非人行征信)、行业联盟共享数据(例如小贷联盟、P2P联盟) FICO服务
Retail Decisions(ReD)、Maxmind服务
IP地址库、代理服务器、盗卡/伪卡数据库、恶意网址库等
舆情监控及趋势、口碑服务。诸如宏观政策、行业趋势及个体案例的分析等等

4、基于传统行业数据做风控

人行征信、工商、税务、房管、法院、公安、金融机构、车管所、电信、公共事业(水电煤)等传统行业数据。

5、线下实地尽职调查数据

包括自建风控团队做线下尽职调查模式以及与小贷公司、典当、第三方信用管理公司等传统线下企业合作做风控的模式。
虽然貌似与大数据无关,但线下风控数据也是大数据风控的重要数据来源和手段。

白米Ⅲ级

赞同来自:

你所处地理位置可能不仅仅决定你的肤色、口音、饮食习惯。随着Fintech的发展,地理位置还能决定你能从金融机构借到多少款。IT技能的成熟,让LBRM(Location Based Risk Management)体系成为金融机构判定用户风险水平的重要工具。
什么是LBRM风控体系?地理坐标决定你的贷款额度
随着Fintech近年来的飞速发展,各类IT技术,系统布置日臻成熟,Fintech公司的重心也进一步转移到了业务发展上。对于Fintech公司而言,大数据无疑是将金融与技术相互结合起来的重要工具之一,也是技术驱动发展的重要手段。
从客户的日常活动范围可以推断出客户所处的生活环境,消费物价,以及工作地点等等信息,无疑可以在一定程度上反应出客户的信贷能力。由此我们提出了LBRM(Location Based Risk Management)的理念, 即基于位置信息的风险管理应用。
具体来看,地理位置信息主要包含两大特征:集(jìng)群(tài)与轨(dòng)迹(tài)。

集群特征:
早在远古时期人类便学会相互合作狩猎,形成大大小小的部落。而现代人不论是出于对基本生活设施,医疗卫生等物质方面的需求,亦或是对社交娱乐,择偶多样性等方面的精神需求,人类总会聚集到大大小小的城镇内。这种集群是现代社会自然而然地形成的,比之行政区域划分更有意义,比如上海右下角的南汇地区,不论从语言文化还是生活习俗等方面都与上海市区有很大的区别。


轨迹特征:
客户在不同时间的位置数据所展现出的日常活动范围以及移动轨迹,可以很好的反应出客户的工作,生活等方面的信息。比如上图的客户,我们结合获取位置信息的时间以及当地的建筑物信息,可以很快地判断出左边是客户的起居场所(多为晚上和早上获取到位置信息),而中间则是客户的工作地点(多为白天和下午),右上角则可能是客户下班后去采购建材了,右上角的建筑物是个建材市场。
基于位置信息这两大特质,通过位置信息可以很好地分析出客户真实的工作,生活等情况,从而在反欺诈,尤其是甄别中介包装,伪冒资料等方面有着得天独厚的优势。其次当出现一些地域性较强的信用风险事件时,也可以及时的做出风险策略调整。
从风险管理的全视角,位置信息也有非常重要的作用,如下表所示:

我们的LBRM策略实践初探:对地理区域进行风险画像
位置信息的获取主要有以下四种渠道:WIFI定位,IP地址,GPS定位以及运营商基站定位。下图所示为我们省呗客户在注册时的位置分布,可以明显的看到我们的客户主要集中在沿海地区,直辖市及各省省会,而这些地方也是我们省呗目标客群的聚集地。
数据基础:省呗APP遍布全国的海量用户

LBRM风控体系在省呗风险管理上的实践
实践一、对欺诈用户的识别
场景1:伪冒/中介包装(依据省呗真实案例改编)
随着互联网的普及,各种欺诈手段也不断流传开来,信用包装便是其中的一大类。好多人资信档案看着有房有车,收入稳定,其实只是各种信用包装,甚至是冒用他人资料。

上图为某信用包装公司的互联网小广告
伪冒、中介包装案例:客户张某某(局部放大图1号)今年8月来申请省呗,资信档案显示客户为某名校本科学历,户籍所在地为北方某城市,工作在上海,同时在上海还有套房贷,且各家征信机构的信用记录都良好。但定位则显示客户所在地为嘉兴,且几个紧密的联系人(局部放大图2-8号)也都在嘉兴,客户因出差而在嘉兴的概率较小。经系统预警,综合排查后确认为该客户伪冒客户。

场景2:网络中介(或称线上中介)代办(依据省呗真实案例改编)
遇到经济问题的客户往往会通过各种不同渠道寻找借款机会,尤其是涉及赌博,吸毒等违法行为的客户。其中通过线上中介进行借贷的客户,随着互联网的发展也在逐年递增。相比通过线下中介借贷的客户,此类客户往往逾期后难以收回贷款金额,还款意愿也就相对较低,相对风险也就越高。

在某宝上搜索小额贷款可以找到大量的中介
网络中介代办案例:客户华某某,在北京某地使用水果手机注册,注册完成后不久即在沈阳登陆,并申请贷款。首先,该客户短时间内位置变动过大,从北京到沈阳用了不到1小时。其次,申请所在地与客户资信所提供的住所地址不符合,且客户本人的手机归属地也在沈阳。第三,客户连续多次在沈阳地区申请贷款。各种迹象表明客户疑似为网上中介代办,贷中管制后确认为中介代办。

实践二、信用风险识别

上图为省呗在全国范围内收集整理的风险点
根据我们统计,全国高风险聚集点数量排名前三的分别为福建,江苏以及河南,如下图所示。这个结论与我们之前在风险管理上累积的经验所得也一致,相信广大风险从业人员也都知晓。

上图为全国三大高风险地区
有别于传统针对个人的客户画像,省呗的LBRM完善了各个区域的区域画像,并将不同地域划归到不同的风险层级。

上图为我们在华东地域的信用分区展示,其中不同颜色表示不同的信用等级
我们根据不同地区的实际风险表现结合当地可支配收入,最低工资等,将不同城市,不同区域划分为不同的风险等级。通过这种基于位置的打分结合申请人的其他资信情况,做出更加精确的信用评分。此外,我们还会根据一些特殊的事件调整相应区域的风险管控,例:东北特钢违约,微商管制等。
地理位置信息是互联网金融在基于大数据来进行风险管理过程新增的一个比较重要的数据变量。和其他风险变量一样,它也不是完全不能通过技术手段来做假,以蒙蔽大家的征信策略;但在结合了LBSRM及既有多个变量后,使得客户画像更趋真实、更趋完善,更让信用包装、作假者的马脚在大数据面前更容易现形。最后,套句我们风险人员常用的话来说,道高一尺魔高一丈,能否真正做到道比魔高,还是要靠自身在风险控制上的专注度和专业能力。

京东白条 白米Ⅲ级

赞同来自:

大数据风控的话题实在是炙手可热,有不少人如巫术一般的崇拜大数据,觉得大数据的魔棒一挥,各种问题迎刃而解。也有人说这个是纯属炒作概念,凭着热度来忽悠一波热钱进入接盘。
这犹如小马过河一般的评论,使得任何一个有兴趣投资大数据金融领域的投资者心存疑惑,大数据这玩意儿究竟价值何在,水又有多深?
其实大数据风控和传统的评估角度并没有本质的区别。互联网金融产品,和做其他任何商业产品一样,都是为了解决把什么东西(产品)提供给什么人(客户)才能最赚的问题。
利用大数据做风控只是通过发挥互联网的优势,利用新的原材料和与其相匹配的技术手段,帮助互联网金融产品提高风险管理&赚钱的效率。

举一个很简单的例子,比如某个老太太准备摆摊卖水蜜桃。
首先她要有货,整来一堆大桃子进了仓库。一看这些桃子有大有小,产地还不一样,总不能卖一个价钱。老太太挠挠脑袋,按照若干指标分好,首先按照产地分,这是阳山的水蜜桃,那是南汇的桃儿,再一堆儿是平谷的桃儿;再按照大小分,一个桃一斤多的一堆,一个桃半斤的一堆,还有一堆个头忒小的再堆一堆。然后想想这不同采摘的时间按说品质也有区别,不过光按照产地和大小分就分出来九堆桃子,仓库堆满,再分就分不下了。
信用估值的方法类似与老太太分桃子的等级,按照大小,产地,采摘时间,可以把桃子分成N个分类。信用评价也是一样,可以用不同的指标来划分客户群体。按照传统的方式,光按照流水银行流水,通话,就可以抽样出职业,年收入,收入变动情况等一些传统指标(通常是几个或者十几个),对用户进行评估和授信。
而到了大数据手中,这信用估值的指标可以达到更大的量级。传统评估可能仅限于用户提供的少量资料和一些调查获得的信息。大数据评估可以获得到用户的更多信息,比如电商浏览和购物,平时交易流水的多少,交易发生的时间,用户交易的地点,以及任何和用户信用略有关系的其他指标。整个参与到信用评价中的指标可能多达上千个。
在获得了数千个指标之后,这些指标彼此正交,如老太太按产地和大小两个指标组合,对桃子分了三六九等一般。依据这数千个指标正交之后会产生的上亿的组合(数据可不象桃子那样占地方),可以对人群进行极为精密的划分,以划分的结果进行建模,会得到比传统手段更加精准的模型。

分好桃子,老太太又伤了脑筋,我分了这么多种桃子,我该咋定价呢?前几天看市场上桃子卖三块,感觉没平谷的甜,个头也没半斤的大。这我就按照这个做样本,不大但甜的卖五块,大个不甜的卖四块,又大又甜的我卖个七八块。
然后老太太推个三轮儿,装了九筐桃子,准备出去卖了,第一天去了菜市场,一堆大妈光捡便宜的买,大桃儿一个都没卖出去。老太太痛定思痛,大桃儿定价各减一块。
第二天推车去了写字楼附近摆地摊,一堆白领吃了午饭出来买水果,净拣大个儿的买,小桃儿这回无人问津了。
在进行了评估之后,金融企业需要根据不同渠道对应的客群设计对应的产品。大数据依据对于人群的精密描绘,为金融产品定制提供了更加灵活的可能性。金融企业可以根据客群的不同,制定更加有灵活性的产品,从而实现更高的利润。就如老太太不必一天天的测试不同地方什么桃子最好卖。尽量让每个客户面前,都放着这个客户所在客群分类中最合适的桃子。

第三天老太太想了想,装了一车大桃儿来到写字楼,没想到刚支好摊,来了两个小骗子,给了一百假纸币买了俩桃,随后,遇到城管,连桃儿带车都被扣了……
在金融产品上线运行之后,欺诈问题往往会浮现出来,形形色色的中介防不胜防,好不容易过了中介羊毛党这关,说不定那天突发的系统性风险又会找上门来。对于以往的评估手段,因为获得的信息面相对还是较小,对于欺诈用户难以应对,在黑产中可以轻易做出银行流水和通话记录。一个在现实中欺诈不已,但是在信用上清白且优质的人可以凭空制作。但是对于大数据风控评估来说,所用的评估指标来自生活的方方面面,伪造记录无异于重新投胎,使得欺诈难以实现。
最后一点,对于金融天灾一般的系统性风险,大数据模型因为对人群的精密分类,因此在异常信息上也格外敏感,在产品运行中,会得到比以往更多更丰富的反馈信息,可以在系统性风险发生之前就给出足够的预警,给了金融企业躲灾的可能性。

后来,买桃子的老太太在大数据咨询师的帮助下,建立了互联网桃子企业,终于成为桃子界的一匹独角兽,这就是后来的事情了 : )

本文作者:ZRobot金融科技公司研发负责人 张晨

白米Ⅲ级

赞同来自:

具体大数据风控的方法论不细说,谈谈个人对大数据风控的理解:

提一个问题:数据资源是稀缺的么?
答案:只看当下,则数据资源必然是稀缺的,但长远看时过剩的。为什么这么说?

当前数据资源稀缺的原因:
  1. 拥有成体量的有价值的数据信息的公司很少(BAT等寥寥几家)
  2. 数据孤岛:各家拥有优质数据资源的公司组建了牢不可破的数据封闭体系,并不能很好的互通。
  3. 数据变现的模式还不成熟,玩法刚刚建立。(金融领域风控模型对数据的应用算是比较领先的)
  4. 数据整合模式不成熟,缺乏大的平台型数据公司。造成有价值的数据过于分散,接入成本高。(征信公司的出现有希望改善目前的情况)
  5. 由于第3,4点,造成的部分拥有优质数据的小公司,并不能高效的利用自己的数据资源来获利,缺乏共享的动力。
  6. 很多小公司即使自己不能很好的利用数据,但都意识到了数据是宝贵的资产,不会轻易给出。部分小公司也开始学习大公司,开始了整合各方数据为己用。

综合以上几点,我们可以发现目前的行业现状是:
几家大公司独自吃着自己锅里的,同时提防着别家来抢。有的大公司看到小公司碗里的肉不错,说要和小公司合作,但模式尚不能说很完善,有可能最后两个人都吃不到(数据的价值不能通过合作而变现,或合作成本过高)。部分数据平台开始张罗场子,要搞共享,多赢,标准化,暂时还没看到结果。

那为何又说数据长远看是过剩的呢?

举一例,如果依靠数据,各家公司如何判断一个人是孕妇?
  • 百度可以通过某个账号经常搜索的关键词来判断(例如生孩子疼不疼?)
  • 阿里可以通过某个账号的年龄,性别,消费信息,商品点击来判断(是否点击查看过母婴类产品,但没购买,是否购买过孕妇类产品,结婚几年?)
  • 腾讯可以通过微信里的聊天记录判断(加了哪些群?讨论哪些话题?朋友圈分享了哪些内容)
  • 小米可以通过其在手机里安装的哪些APP来判断(例如母婴类app)

我们可以看出:未来时代的数据无处不在,证明一个事实可以有很多种办法,各家均各显神通,并不存在唯一的,垄断性的数据壁垒。以往的大公司的数据神话就会破灭。

最终的格局:YY一下,可能是某几家大型的数据公司,分领域垄断了整个国内的数据市场。数据本身成为了标准化的商品,可以被低成本的接入,销售,使用。以芝麻信用为例,依托于阿里体系内的数据位基础,输出芝麻信用分。同时以标准化的方式接入各类数据,最终再以某种商业化的方式做输出(不只芝麻分一个维度哦),成为征信市场数据的入口和出口。

无良 白米Ⅲ级

赞同来自:

回来填坑,相关:P2P审核→征信产品经理→脱线。
这个回答想从借款人(风控对象)角度谈一谈大数据and风控。

1大数据
审题:所谓的大数据,实际上是有关借款人线上数据的集合。如果在线下年代,这些数据可能散落在县官、亲戚朋友之间,集市上,当铺里等等。但是现在这个时代,那就可能存在各类网站的账户信息里。但是这里有一个最重要的点,就是所有的这些数据一定是围绕着借款人的,也就是风控对象,其他的数据,相对而言都是没有任何意义的。
那这些数据又分哪些呢?
(1)官方或类官方数据
你说自己不网购、不订外卖、不玩任何应用甚至连手机都是最原始那种,那是不是你是没有大数据的?错。
公安系统、法院、失信、工商、社保、学信等也都是有数据的。
储蓄卡、信用卡、贷款等虽然你自己没有往外披露,也还是在记录着你的信息的。
官方数据目前有一个综合评估信用情况的资料,就是信用报告,包含了你申请信用卡或贷款时填写的个人信息、你的信用卡使用情况、贷款情况、刑罚记录、固话欠费记录等。
(2)个人账户数据
当然,你的储蓄卡账户数据也是你自己的数据。
但这一类主要想说的是,由你自己私人行为产生的数据。比如你的购物数据、社交数据等,这些相关信息保存在你的京东或淘宝或微信QQ等各种平台上你的账号里,平台有相关权限的人可以直接拿到这部分数据,比如,各种根据你行为进行算法计算后的兴趣推荐等等。
(3)其他民间数据
你不常用的平台账号发过的信息,或者别人发布过的包含你资料的信息,甚至各种新闻报道,你参加比赛的结果公示等等。

那为什么叫大数据呢?因为通过某些关联点可以把所有这些数据关联聚集到风控对象下。姓名、身份证号码、手机号码、工作居住地址等,身份证号码、手机号码是重要的点,你的银行卡是不是都有预留手机号?你APP的账号是不是都是手机注册的?你支付是不是经常用支付宝而支付宝又实名认证了?等等。理论上讲,只要有关联点,数据就已经关联起来,只剩拿不拿得到的问题而已 。至于大数据的专业分析,在此不讨论。

2风控
审题:对于借款人来讲,相关机构想做的风控是哪些方面的呢?风控,直白解释就是风险控制,假如我们把钱放出去,会有哪些风险呢?这个人讲的事情是不是骗我的?这类事情我是不是该借钱?借给他能不能还得起?
这样大致就分出了风控类型。
(1)反欺诈
你提供给借款机构的资料是不是真实的?你的身份证照片、流水、工作证明是不是假的?你联系人是不是诈骗为生的?你是不是诈骗集团包装的客户?
(2)还款意愿
你是不是信用卡老是逾期?你同学朋友是不是说你欠了钱?你的房租是不是老是欠着后面才交?
(3)还款能力
关于还款能力主要包含:收入、支出、资产、负债。你每月的工资?你的消费数据?你房产、车产等?你的信用卡、贷款等。
(4)其他风险点
你从事的是不是高危行业或者诈骗事件常发区?你所在公司是不是刚刚报道了巨额亏损面临倒闭?你是不是有一些不良嗜好比如滥赌?你近期是不是卖车卖方永久出国?你是不是其他同类公司都不想贷而丢过来的劣质客户?你是不是父母手术急需高额手术费(有点无情但真的不会贷给你)?你在其他民间借款机构是不是也有借款并且逾期严重?你借钱是不是为了还以前的贷款?

所谓风控,就是控制所有可能导致你不还钱的风险点,你的资料是假的不行,你的资料有隐瞒不好,你的资料真实但是不够标准不好,你还款习惯不好不行,你当下有巨大财务危机不行,等等。

那最后了,怎么用大数据做风控呢?首先,先要有数据,然后自然是把风控相关点用大数据方式筛出来。然而,我们肯定不会在网上留下所有信息,所以,传统的风控方式实地也好电话也好等等都还是有用的,不要太迷信。

——————————————————华丽丽的分割线——————————————————

占坑,十个赞了就答~

白米Ⅲ级

赞同来自:

10月5日,更新完毕

——————————

现在提大数据风控的文章,大都是讲个幌子,一点实质内容都没有。

今年早些时候因为工作的原因,对这方面有点兴趣,某次跟一位老师谈到大数据风控的时候,听到一些大数据风控的实际例子,我在这里给大家分享一下。

我们来看一下传统的信贷风控模式,贷前,贷中,贷后三部分中最看重的是贷前,而对贷中贷后并不是非常注重。

而这样的思想在互联网金融上是绝对要不得的。互联网金融的客户什么牛鬼蛇神都有,其降低风险的主要手段其实并不是完善而大量的数据收集、统计和分析。

而是风险的分摊。

这也是金融行业最简单的贷款风险控制手段。如果我做十笔就可能会亏一笔,那我每九笔的利润至少要能摊平这一次的亏损。

大数据的使用对于确定盈亏出清利率提供了相对合理的手段。

似乎这样就已经可以了?只要事先选择合理的利率和合适客户就解决问题了?

可惜事实总比你想的更奇葩。数据是靠谱的,分析却可以不靠谱,人却可以更不靠谱,这点我不多说,大家都明白。

互联网的大数据在这一点上是比不上传统的信贷风控手段的。

那位和我聊天的老师在这一点上说的很有意思。

他说,互联网金融做的客户,多半是银行不想做不愿做的,它们只是捡了别人不要的东西,哪天银行真想要了,买来就是。

诚然这里面多少有些一厢情愿,不过前半句倒是事实。从一开始,互联网金融就选择了传统信贷所难以下手的市场。谨记这点便引出了为什么我要在前面说,互联网金融绝对不能放松贷中和贷后的风控。

而恰巧,大数据能帮互联网金融做到的最棒的部分,还就是贷中和贷后。

关于贷中管理,这位老师讲了一个很有意思的案例。

他提到有某家金融机构,使用大数据监控某个区域内企业的流水,如果某段时间流水出现了异常,那么他们就会派人去调查具体发生了什么事。

这种方法在现行的传统风控手段中也是很常规的,但大数据给我们带来的便利除了降低人力成本,更主要的是可以发掘更多的判断依据。

尤其在借款人有意隐瞒目前经营状况的时候,一些经营外的数据就有可能产生意义。

举个简单的例子,如果借款人有打算跑路了,那除了现金流的变化,也会有些其他的变化,比如购买旅行箱,订机票,国外相关网站的浏览。

而在贷后方面,大数据的介入除了给我们提供分析手段,更方便了我们对于客户需求的发掘。或许在以后,银行可以为个体提供更为贴心和前瞻性的服务,而这些也是大数据应用的重点。

关于大数据的前景:

大数据目前不一定是单独一家企业可以掌握的,以后也不一定。

目前出现的对大数据的应用情况是,用户数据的采集和共享。
在未来的一段时间内,因为法律法规不健全,必然会出现严重侵犯个人隐私的商业行为,而大数据会不会因此受阻,我个人是抱悲观态度的。

大数据会有用,但首先要降低金融服务的成本。无论数据如何,最终还是需要人。而人的成本只会越来越高。
以上是我对大数据应用的一点思考。可能不完全切题,欢迎讨论。

薛洪言 白米Ⅱ级

赞同来自:

千万不要迷信所谓的大数据风控,尤其是现在。大数据风控是个很好的概念,也是所有贷款类企业的理想,但理想与现实总是差着十万八千里。
大数据风控的核心点在于有效数据的数量和质量,问题恰恰就在这里。理想状态下,存在超级部门,可以构建完整的大数据平台。现实情况却是,有效数据散落在各个角落,成为信息的孤岛,没有任何一方有能力把数据整合起来,包括央行征信中心,目前也只是信贷数据,工商水电税收海关诉讼等其他部门的数据压根整合不了。
至于很多互联网企业吹嘘的大数据,就更扯了。阿里、苏宁、京东等电商的购物数据金融价值相对高一些,基于你购物的习惯、档次判断你的信用层级;其他腾讯的社交数据金融属性就差一些;百度的搜索数据就更差一些。除了这几家巨头,一般的小P2P平台,哪来的大数据?都是扯淡罢了!

Sherry Zhang 白米Ⅲ级

赞同来自:

我来说点实际的。之前采访过一位智能信贷公司的数据决策总监。他是这么和我说的:
其实现在做互联网金融风控的,只要稍靠谱的,数据源都差不多。
比如公司的【内部数据源】包括——在自有平台的用户借贷记录,用户申请时的行为数据,还有内部或行业间共享的黑名单、灰名单等。
【外部数据源】有比较常见的八家个人征信机构(雪梨酱注:2015年1月,央行开始允许芝麻信用等8家机构开展个人征信业务)还有就是互联网那金融平台有时会对接一些用户银行卡的字段数据,在用户授权的前提下,会把这个卡的信息和银联的相关数据去比对。
但是这位总监觉得,大数据风控的核心点在于:对数据的理解有多深。做大数据风控的人对数据要极其敏感,因此他们会花很多时间在变量上。
他向我举过两个例子。
第一个是和电商合作做变量的例子:他们可以通过这些合作看到用户订票的信息、机票的信息,比如公务舱、经济舱这些信息——这本身其实也能说明一个人的基本经济情况。
但是他们会做得更细,会继续做一些叠加或衍生。比如他们会不看公务舱和经济舱的区分,而看飞行每公里的消费单价。因为公务舱和经济舱的价格也会波动很大,有的时候经济舱也有特价票、公务舱也会有优惠活动,所以他们会看每公里的消费金额。
第二个例子是流水话单。他们可以基于同一份电话单,做出很多不一样的变量。比如说用户是否跟某某类的店打过电话?打电话的频次怎么样?趋势怎么样?
如果用户经常跟贷款中介打电话,或者银行催收中心打电话,那用户应该相对比较缺钱,或者是曾经有过违约的历史。
相反,如果用户经常给花店打电话买花,说明用户可能是个“好人”;如果经常给婴儿店打电话,说明他可能有孩子,有孩子的话一般比较稳定、也靠谱一些。
他们会花非常多的时间去衍生这些变量,因为它更直接地反映了这个人的消费行为。当然,也有些时候,这些可能是无用功,有时甚至90%做出来的变量都没有用,但试错筛选出哪怕只有不到10%的可用变量,最终风控效果才是最重要的。
所以,总监觉得,做风控模型这事儿,一方面是个比较“蓝领”的事儿,因为工作需要做得非常细致。但另一方面,是做模型有时也比较“艺术”,因为这是一个比见仁见智的事情。
以上。
有兴趣的小伙伴请读全文:读秒任然:大数据风控中,怎样判断你是不是一个“好人”? - 知乎专栏
匿名用户

匿名用户 白米Ⅲ级

赞同来自:

互联网理财行业呆的时间不长,几点拙见是我目前的看法,供参考。

目前的互联网金融行业,所谓的大数据风控主要针对于网络借贷(P2P),这里的P,指导意见明确提出是个体的意思,即包括个人和企业。
那么,问题就演化成,面对个体和企业的借款需求,平台如何利用大数据做风控来减少坏账率。
相对于前面几位大神的观点,我可能要提出更悲观的观点,中国的大数据风控在征信系统还未全面建立起来之前,都是扯淡,在相对特定的封闭生态圈或群体,可能会存在相对稳健的大数据来做风控。
原因是多方面的:包括但不限于
1、征信系统:a,建立时间晚;b,接入渠道少;c,数据本身就不怎么完善可信
2、我国金融体系成熟程度:一个只发展极短的受严格管制的金融市场,还没有足够的数据积淀。
3、国人的基本信用观念及素质低下。

那么,现阶段,网贷平台在做大数据风控时有哪些出路呢,我觉得有以下几种:
1、根据特定的封闭领域的大数据做风控,但具有资金掌控权作底牌。比如
淘宝的电商贷:电商的应收账款一般在支付宝要停留7天左右,若电商提出融资需求,可以根据电商的各项经营数据决定贷与不贷,贷多少,一般贷款额度不超过电商3天累计应收账款。阿里的风控表面上是基于电商各项经营数据的判断,实质是拥有对回款的实际掌握权,说白点,你不还钱,7天押在支付宝里的钱你就别想拿了。这种风控模式也只能在包括阿里、京东等大型电商平台的生态圈里能够铺开了,但有复制性吗,没有。
2、特定的封闭领域的第三方做担保。比如
江苏的开鑫贷。开鑫贷拥有国开行和江苏国资的双重背景,融资对象仅限于江苏省内精选的小贷公司推荐的优质借款人(或中小企业),由小贷公司为本息安全对付做担保。平台实质是将风险全抛给了小贷公司,而小贷公司由于资本金的限制,也愿意将债权转让给开鑫贷,轻资产运行。实质是小贷公司利用几年积累的大数据来做信用输出。这种风控模式只能够有政府牵头统筹各方资源与意愿的情况下才会成功,开鑫贷的背景功不可没,有复制性吗,没有。还有类似的是陆金所的稳盈安逸系列,借靠平安全牌照金融体系的大数据,平安旗下的担保公司做担保,没有足够的实力是复制不了的。

如果把前面几种称作硬风控,即能通过相关手段保证款项损失率接近于零。其实这算不上真正的大数据风控。
真正的大数据风控,体现的是风险定价,即10个借款人,1个坏帐,则平台从9个借款人中赚取的利润必须覆盖该坏帐。但这其实是个伪命题,如下:
平台利润=贷款利率-资金成本-运营成本-风控成本(包括坏帐及损失拨备)
平台利润想提高,就必须增大贷款利率,但相对也意味着坏账率更高,得不偿失。而且政策层面也不鼓励高利。运营成本在目前行业跑马圈地的时期,根本下不来。风控成本与贷款利率有一定正相关性,而且平台为了提高安全性也不会降低。因此目前唯一可以降的只有资金成本了,2014-2015的网贷收益率下降见证了这一点。但资金是嗜血的。。所以最后就是各个变量间的博弈了,呵呵。
下面就是所谓的真正的大数据风控,属于软风控,体现的是风险定价的属性,只要平台的利润能覆盖贷款损失,余额尽可能多,就可以延续。

3、特定人群的大数据风控。比如
大学生消费贷,大学生相对于中国其它阶层具有更好的信用及个人素质,较高的消费需求,因此,这部分市场竞争也较为激烈。平台会根据大学生的学校,学历,网购频率及金额,信用卡消费及还款情况,来决定其还款能力及还款意愿。同时记录其家庭住址,身份证号,手机号,父母姓名及联系方式,关系圈等信息,确保在极端情况下能通过告知父母,朋友等方式进行催收,但此种催收方式的合规性目前还有待商榷,毕竟侵犯了个人的声誉及隐私。总体来说,特定人群的大数据风控,坏账比率会相对降低,风险定价合理的话,平台会有一定的盈余,有一定可复制性,但贷后还要依靠催收来解决,而且催收行业目前还没有监管层面的认可及指导意见。类似的还有房屋装修消费贷款,购房首付消费贷款,汽车消费贷款,旅游消费贷款,甚至整容消费贷款等,都瞄准特定人群的产品,有一定经济基础,而且大多设计成分期付款,避免集中兑付的还款压力。
当然,在前面几种对于借款人的审核中,都会尽量多的要求借款人提交基本信息资料作参考,包括人行征信报告,个体基本信息,消费信息,关系圈及联系方式等,这是基础。
其它大数据风控欢迎补充。

讲了这么多,只是想给那些整天讲大数据风控牛叉,万能,能颠覆银行的人清醒下,没你想的那么简单,路还很长,别被表象迷惑了。

白米Ⅲ级

赞同来自:

以下对大数据风控进行一个简要抽象概括,希望有所帮助:

风控三大核心:反欺诈、还款意愿、还款能力

大数据:以API接口、网络爬虫、批量购买、设备抓取、用户提交等形式获得的数据

使用大数据解决风控问题就是:
通过以API接口、网络爬虫、批量购买、设备抓取、用户提交等形式抓取数据判断用户是否欺诈以及他的还款意愿和还款能力

实现方法:决策引擎、决策树、逻辑回归等

举例:
用户入场数据抓取
设备信息抓取 >>> 第三方API接口验证设备黑名单、IMEI信息----a
通讯录抓取 >>> 决策引擎(通讯录个数、通讯录异常字符、通讯录号码异常识别)----b
用户身份信息验证 >>> 身份API公安接口认证、学信网认证、照片人脸识别、银行卡验证----c
用户行为数据 >>> 填写时间、修改次数、跳出次数、分享情况----d
用户运营商数据 >>> 爬取用户六个月通话记录----e
用户电商数据 >>> 爬取用户历史至今电商交易数据----f
......----g

数据清洗
(略)
数据建模
反欺诈:对a.b.c获取的数据进行Y/N判断,命中则拒绝
还款意愿、还款能力:d.e.f.g获取数据进行Logistic建模OR决策树建模

模型验证
(略)
模型开发
(略)
模型投产
(略)

以上!

白米Ⅲ级

赞同来自:

自己的一些思考,当做梳理知识了。
题主所说的是用大数据做风控。从算法模型上来说,正如许多答主所讲,这个大数据模型具体怎么操作价值不菲,行外人无法轻易得到这么机密的信息。因此我尝试从风控理念出发回答这个问题。

大数据风控在金融业领域的提出,就不得不提到它与传统风控模式的比较。
传统信贷模式下:金融机构对客户的资质评价多依赖于客户提供的申请材料。
大数据风控最终希望达到的效果是:申请材料的简化并不意味着金融机构不再需要更多信息,而是这些信息不再从申请人本人处获取,而是从人们生活轨迹中发掘有信贷价值的数据,依此进行风险管理(正与互联网产品追求用户体验的价值观不谋而合)。数据的来源上面的答案写得非常详细,包括社交、征信、消费、地理位置、行为等,不再赘述。

目前,大数据可以从以下几个方面帮助互联网金融的风控:
1、信贷准入
在产品设计环节,将贷款申请人的互联网数据作为重要的信贷准入标准,作为衡量还款能力和还款意愿的重要辅助数据。比如,关联的社交账号必须有一定数量的好友,正常使用非死号。贷款发放机构还开始接入第三方征信机构的互联网信用数据(虽然还非常不成熟)。

2、产品定价:
根据贷款申请人的互联网数据进行评分,分数更高的申请人将能够申请更低利率或更高金额。

3、客户群管理:
其实别说大数据,如果仅仅能做到客户数据的系统整理和分析,就已经可以完成很多事情。传统银行的数据很多,但质量参差不齐,几十年的数据储存系统也不是说变就能变,不同数据库之间的联系也很弱。但如果互联网金融机构能够利用大数据的优势,描绘用户画像,清楚用户的消费喜好和生活轨迹,就能推断不同客户群体的这些互联网行为和最终还款行为的相关性,进行系统的客户管理。
设想,如果能分析各群体客户的违约率(贷款机构的风险成本)和群体愿意接受的贷款金额和利率(贷款机构的收益),就能够对整个机构的盈利有更好的把控能力。说到底,风控就是平衡风险成本和收益。

4、贷中及贷后的动态监测。
这是大数据风控相对于传统风控的优势之一。对于传统风控模式下的贷中、贷后管理来说,对一笔贷款的追踪和监测需要耗费很多人力,查看固定资产状况啊,亲自和贷款人定期沟通看是否有异常情况等等。但大数据的使用可以减少部分的成本。如比对贷款申请人的IP地址有无异常,通过互联网交易数据监测贷款人的公司/店铺是不是正常经营等,并且对不同类型的客户使用不同的催收策略。

5、贷款用途控制。
随着线上支付的完善,我们能在互联网上买的东西,使用的服务越来越多。这也就意味着,每个这样的服务/产品提供商都有潜力成为线上贷款的入口,而大数据就是背后的功臣。花呗就是一个很好的例子。
用传统风控的角度来看,这种类型的贷款能够很好的控制贷款用途(花呗的钱只能用来淘宝,不能用来炒股买房)


上述几点并不是互相完全独立的。正如我们发现大数据在互联网时代贯穿贷款流程的前、中、后期,并为风控提供了新的思路。虽然目前很多互联网金融模式其实根本还是线下模式搬到线上去做,审核贷款的方式和理念与传统银行无异(比如宜信)。但我还是非常期待几个大玩家在这个方面的表现。

网叔 白米Ⅲ级

赞同来自:

去掉概念包装,最核心就一条:看你有没有信用卡。
匿名用户

匿名用户 白米Ⅲ级

赞同来自:

基于线下多年的数据,其实是可以改造fico决策引擎的,用于国内也有一段时间了,真正的作用于分析,并用拟合的算法得出一定的参量,这套模型目前已经成功在生产环境内运作,虽然决策的变量各有不同,但设计模型的思路基本都是一致的,阿里小贷在用,芝麻评分在用,闪银在用,量化派在用,51信用卡在用,宜人贷极速借款也在用,各家都有擅长和偏重的数据爱好。
阿里的aliyun引擎,51信用的tdms引擎,宜信的shadow引擎,不都工作的挺好的吗,但你要问我具体怎么设计,这至少值300万,我为什么要告诉你。

怕被老大看到,匿了

白米Ⅲ级

赞同来自:

你兄弟姐妹、你朋友、你哥们找你借钱你会借吗?借多少?借多久?互联网能掌握比你更准确的数据吗,那大数据能对个人放款起到作用吗?融资不是玩感情,适当的有点用,说什么颠覆性的模型就是然并卵。应该是基于特定逻辑下的辅助工具而已,适当提高效率,降低坏账率是有点可能的。

白米Ⅲ级

赞同来自:

风控的核心是要准确预测每一笔借款违约概率。显而易见,这需要量化的工具,也就是模型。假设x代表与借款人相关的各类数据,y代表是否违约(1=违约,0=未违约),则我们需要找到一个函数f,使得f(x)=y。我们先介绍一下x,y,f在国外的情况。以美国为例。
x ,y:在美国,人们一般在上大学的时候就会拥有人生中第一张信用卡。这样等到后续买房(房贷)买车(车贷)的时候,就已有了不短的信用历史了。美国有3家征信公司(Equifax,Experian,TransUnion)。基本上所有银行,贷款,金融机构都会上传信用数据给这3家公司,包括借款,还款,逾期等数据。征信公司会对原始数据做清洗和处理,进而产品化和商业化这些数据。这些提供数据的公司同时也是数据的使用方。 任何公司都可以买到脱敏的具体到个人的信用历史数据,用作分析和建模。由于征信公司能够以处理完的字段形式输出数据,在美国,x一般是小而精的。小是指一般一个人的征信数据实际大小不大。精是指这类借款、还款、违约的历史数据,对于风控建模来说,会是最有用的一块数据,因为历史借贷信息实打实地反映了一个人的信用情况。
f:如果有了非常新鲜的鱼,简单地蒸一下就会非常美味。同样的道理,由于大多数美国人已经有了足够的信用历史数据,通过这些数据来预测一个人未来的违约概率,这里所用到的模型也不用很复杂。一般情况下,简单的决策树和一些回归类的模型已经能够解决90%以上的问题。非常有意思的是,类似FICO这样的公司的商业模式就是提供生成f的能力,也就是基于3家征信公司提供的数据,提供一个比较标准化的信用分给银行和金融机构。
如上所述,美国的征信体系包括了数据提供方(同时也是使用方),数据整理存储方(3家征信公司),和提供数据分析解决方案的第三方(例如FICO)。整套体系经过几十年的演变进化,已经成为了一个生态。

我们所说的"大数据"并非指绝对的样本量的巨大,而是把常规的信贷征信数据以外的信息统一称为"大数据"。目前看来,由于美国的征信生态体系已经比较完善,其它非信贷类数据在风控建模里的应用实际上比较有限,在大多数情况下锦上添花多过雪中送炭。例如美国最大的P2P公司LendingClub早年曾经尝试只基于Facebook的社交数据来决定是否放贷。试了一段时间发现不行后,还是回到了征信数据为主,其它数据为辅的体系。目前LendingClub只考虑给FICO信用分640分以上的借款人放贷。
在美国,相比全面替代基于传统征信数据的风控模型,大数据能够起到的作用可能更多的会在某个特定用户群体上的性能优化。例如,我们发现FICO分在580-600分这个区间的用户的逾期率是15%。这是比较高的风险,大多数银行和贷款公司是不做这个群体的, 因为需要覆盖这么高的风险所需要的利率可能高于他们的业务允许范围了。然而,15%的人违约的反面是85%的人还是会还钱的。 如果能够通过技术手段利用一些征信数据以外的数据,来提高这个群体里好人vs老赖的识别度,从平均15%违约率的群体里把相对比较好的借款人(比如违约率是5%)挑选出来,则这个群体瞬间就可以做了。已经有一些公司看到了这样的机会,也已经开始利用大数据建模做这类银行服务不到的客群了,比如最近比较火的ZestFinance。

记得我们前面所说的,风控的核心就是能够产生一个f(x),用来量化违约概率。理想情况下,最好f(x)=y。这里就有一个鸡和蛋的问题。没有足够的y就做不了分析,所以除了一些很明显的信息外,我们是不知道什么样的x对于预测y会有帮助,也就是说在没有足够样本之前是很难确定该收集哪些数据的。反过来,如果有y的样本够了,但一开始就没有意识到应该存哪些x,这些样本的意义也会很有限。这个问题在那些几乎没有信贷记录的白户客群上尤其严重。最终的解决方法只有不停地做测试,收集x和y,迭代x。相对于资金成本,时间成本更大。例如下图所示,用户在网页上填身份证的耗时实际上与这个人的风险是相关的。很快的人很有可能是直接复制粘贴。而填的很慢的人很有可能是记不住自己的身份证号。这两种情况下,欺诈的可能性都会高一些。

目前国内的云图征信是专门做大数据风控这一块儿的,但他们对接的主要是银行和供应链中的核心企业 http://www.yuntucredit.com

白明 白米Ⅲ级

赞同来自:

互联网金融的本质其实还是金融,风险控制是金融的命脉。我觉得互联网金融平台对融资企业的风险控制呈现多样化,可以举几个例子:
1、通过更多的大数据,降低风险。比如京东和阿里,他们掌握网贷公司的所有在线销售数据和线上的商店的生杀大权。企业的违约成本会很高,又有大数据做支撑所以这两家的风控会比较好。
2、通过更多独家数据来降低风险。江苏有家P2B网贷平台叫开鑫贷(和当地的小贷公司合作),主要是信息撮合,由于开鑫贷是国有背景,之前小贷公司的财务系统就是他们开发的。这样一个优势再加上有国开行的背景,现在很受欢迎。
3、通过大数据的挖掘和分析降低风险。比如人人贷,有利网。这两家也是积极倡议央行开放个人的征信系统的两家公司。主要是挖掘独立第三方信息,降低违约风险。
由于互联网金融是普惠金融,如果平台不掌握贷款人全面的数据来做决策使得坏账风险一定会上升。互联网金融企业还是根据自己的优势来选好方向把控风险,我觉得这是很有必要的。目前出现了如神州融一类做大数据风控的平台,神州融做大数据风控的模式就是通过大数据整合,全面挖掘出相关信息作风控大数据风控无非就是数据全面挖掘,来进行可靠决策,以此降低风险。

[已重置] 白米Ⅰ级

赞同来自:

大数据风控即大数据风险控制,是指通过运用大数据构建模型的方法对借款人进行风险控制和风险提示
互联网金融大数据的采取渠道主要是通过对流量较大的平台以及同类大平台上的数据进行挖掘,并建立信用评级发放金融产品,其次便是一些互联网金融公司主动将数据贡献给第三方征信机构,再对这些征信数据进行分享,不过值得注意的是,这只是一部分的数据,并不是每家企业都愿意将数据无条件风险的。
大数据风控利用数据分析和模型进行风险评估,依据评估分数,预测还款人的还款能力、还款意愿、以及欺诈风险,能够有效的减少投资人的投资风险,在一定程度上有利于保护投资人的资金安全。

在P2P风险控制层面,在P2P企业中谈及风控,大家都会不约而同地说用大数据来做风控,但再去细问,大多数都是语焉不详,这既有商业机密的考量,但更重要的原因是大数据挖掘的能力不足大致的,大数据真正的技术含量和价值体现在提取和利用上,而不在于对数据的占有。

目前国内的数据大多处于独立孤岛,很难形成由共享而成的数据链和数据网,而这恰恰是大数据风控所需要的。

白米Ⅲ级

赞同来自:

说句实话,其实没办法,现阶段做不到,大数据与风险这种东西在目前金融系统下其实有着决定性的缺陷,再怎么做也是没办法的
匿名用户

匿名用户 白米Ⅲ级

赞同来自:

 1、基于某类特定目标人群、特定行业、商圈等做风控。由于针对特定人员、行业、商圈等垂直目标做深耕,较为容易建对应的风险点及风控策略。
2、基于自有平台身份数据、历史交易数据、支付数据、信用数据、行为数据、黑名单/白名单等数据做风控。
 3、基于第三方平台服务及数据做风控 互联网征信平台(非人行征信)、行业联盟共享数据(例如小贷联盟、P2P联盟) FICO服务、Retail Decisions(ReD)、Maxmind服务。
4、基于传统行业数据做风控 人行征信、工商、税务、房管、法院、公安、金融机构、车管所、电信、公共事业(水电煤)等传统行业数据。
 5、线下实地尽职调查数据
包括自建风控团队做线下尽职调查模式以及与小贷公司、典当、第三方信用管理公司等传统线下企业合作做风控的模式。线下风控数据也是大数据风控的重要数据来源和手段。

要回复问题请先登录注册

var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();