科技网

当前位置: 首页 >智能

听起来很性感的大数据风控为什么会被污名化

智能
来源: 作者: 2019-04-05 22:24:04

监管对“数据驱动”风控模型的质疑并非全盘否定,而是对其“概念化”、“空心化”趋势的警示。大数据风控成了背锅侠,背后本源是业界的浮躁——投机钻营,抢抓现金贷风口,盲目寻求快速做大规模,实则忽视风控。

大数据驱动的金融科技行业,正承受着业务和心理上的两重压力。

业务上, 支付宝年度账单 事件让公众对个人数据信息使用心生敌意;心理上,大数据行业更承受着来自监管的质疑。

曾被誉为Fintech中最具革命性技术的 数据驱动 风控模型,直接被泼了1盆冷水。《关于规范整理 现金贷 业务的通知》中明确要求 谨慎使用 数据驱动 的风控模型 ,而包括上海在内的各省市近期转发文件中,对上述要求再一次强调。

监管层已洞察到消费信贷行业乱象,充斥着以 数据驱动 为名、实则无风控、以高利率覆盖高坏账的市场主体。

大数据风控作为一个新生事物,目前还处在摸着石头过河的阶段。麻袋理财研究院认为,监管对 数据驱动 风控模型的质疑并非全盘否定,而是对其 概念化 、 空心化 趋势的警示。大数据风控成了背锅侠,背后本源是业界的浮躁 投机钻营,抢抓现金贷风口,盲目追求快速做大规模,实则忽视风控。

1、大数据风控是如何被 污名化 的互联时期效率为王,大数据、人工智能等技术日益成熟,让高效的量化风控有了更多的想象力。

但另一方面,很多机构用大数据概念拔高品牌,机构间的竞争更加重了大数据概念的滥用。 伪命题 、 大忽悠风控 也成了监管和业内常有的批评声音。

大数据风控 概念被滥用,已构成三大误区:

1、用 大数据风控 掩盖无风控之实。

2、缺少自主风控能力,完全依托第三方征信数据平台。如趣店曾对芝麻信誉的依赖。

3、把大数据或大数据模型等同于风控。

这其中,现金贷行业用 大数据风控 掩盖无风控之实问题非常突出。

麻袋理财研究院认为,大数据风控特别适用于小微资产(现金贷、消费贷、小微企业贷),这类资产主要风险是还款意愿,因此大数据风控90%的价值在于反欺诈。大多数现金贷的风控逻辑就是,根据用户提交的信息,在第三方征信平台跑一遍数据,剩下全部交给二元好坏模型进行风险定价。

二元好坏模型的价值在于量化定价,包括授信额度、期限、利率等,主要工具是评分卡。如Lending Club把借款用户分为A1-G5共35个级别,对应由低到高的不同利率。而小额超短时间现金贷(类似于payday Loan)以随行就市为基础,判断全部通过拍脑袋决定,但原则是用超高利率覆盖风险。由于在本金中预先扣除了高额砍头息,所以超短时间现金贷可以不风控,甚至用户不还钱也没关系。

真正的大数据风控要求高,难度大,既需要大量有效数据,又需要精密可靠的模型,还需要经过时间的检验。目前业内鱼龙混杂,很多公司要末缺数据,要么缺技术,要么缺实践。为避免大数据风控成为空谈,需要行业自律与监管层共同努力,避免大数据风控被污名化。

2、大数据风控核心问题在哪?除概念化的品牌包装致使的污名化趋势,大数据风控被质疑有其内在的原因。

(1)数据质量问题

影响大数据风控的有效性,重要原因是数据的真实性不高,包括社交数据和电商交易数据。

1、社交数据的真实性问题

虚拟社交行动与现实世界中存在较大偏差,大部分实质上可归结为感性的 秀炫晒 ,那末机器根据预先设置的特点参考提取数据,难以构成对象的真实用户画像。美国的Lending Club和Facebook曾进行过相干合作,结论是社交数据有效性欠佳。

2、电商交易数据的真实性

我国电商行业发展中都遇到过严重的刷单现象,导致交易数据严重失真。

(2)大数据风控有效性问题

1、孤岛数据的融会问题

大数据用于风控、营销的本质差异在哪里?营销可以管中窥豹,如果有人在京东上面买了1本考研资料,那末可以从这个行为判断出这人准备考研。但是如果仅仅通过这一个维度的数据,就判断这人是一个好人,这可能很难。

必须要收集这个人在多个角落的数据,接近360度都是一个好人的时候才能判断。所以大数据运用在风控最大的挑战,就是不能像营销一样可以为所欲为地管中窥豹,必须要搜集尽量全的数据才能洞悉一个人,才能给一个人下结论。

但是,这360度全方位的数据,包括金融数据、消费数据、行动数据等等,从小数据到大数据、从静数据到动数据、从薄数据到厚数据,搜集起来绝不是那末容易的。

由于新兴的消费金融机构目前被排除在央行征信体系以外,所以大数据风控多以互联行动数据为基础。而目前任何一家大数据风控提供商都难称得上维度全面,芝麻信誉、腾讯信誉也都只是基于阿里、腾讯在络交易、社交等行动数据优势。

实际上,业内用以判断信贷风险的数据可分为强变量数据,如信贷、工商、社保等来源于传统金融机构和政府数据;和商品生产、流通、消费环节中产生的中变量数据;和互联社交等弱变量数据。那些只以单一维度弱变量数据为基础的大数据风控有效性不佳。

2、系统和数据没经过压力测试

1)业务激进致使风控模型没有验证调整的时间

良好的计划对公司业务管理至关重要。计划首先应明确公司是处于扩张业务、管控业务还是精简业务的整体战略,然后对公司内外部的资源和竞争优势进行分析,最后设计出符合公司预期的产品。

信贷是周期性的,科技也是有周期的。消费金融行业发展过程中存在对某一类资产蜂拥而上、风口期过后又迅速退出的问题。基于互联思惟大干快上的进程中,由于缺少业务规划,适用于业务扩张期的大数据风控模型会被过度地学习数据中细节和噪音,比如模型上线以来25岁的用户都是优良用户,因而25岁作为标准进入决策引擎,明显缺少逻辑,这就是机器学习中的 过拟合 问题。实际上在情况变化之前是没有办法发现问题的,而互联思惟没有给予模型足够的调整时间,终究造成有效性欠佳。

2)没有经过经济周期的检验

Capital One的风控模型曾把是不是申请了入学贷款作为重要风控指标,因为学生在更高学历毕业后,常常获得较好的工作,是潜在优良客户。但次贷危机把这个逻辑打破了,风控模型突然失效,由于名校毕业生也面临失业。

现实世界免不了黑天鹅事件,黑天鹅事件却是在大数据预测规则之外,一旦出现会冲击大数据风控模型的基本假定,进而影响大数据风控的有效性。从这个角度上说,大数据风控是没法预测的。传统的风控技术已历三十年、5十年周期的迭代。但是大数据的检验成效现在看不了。没有经过经济周期的检验正是大数据风控被质疑的核心问题。

3、正确理解数据驱动的风控模型并合理使用由于能有效降低成本、提高效率,帮助把金融服务覆盖到更多人群,大数据风控对普惠金融不可或缺。作为未来消费金融行业的重要着力点,如何正确理解 数据驱动 的风控模型,并公道使用呢?

(1)正确理解 数据驱动 ,必须基于业务逻辑相对于 数据驱动 的,应当就是 业务驱动 或 信贷逻辑驱动 ,他们的区分就是 数据驱动 往往关注的是 相关关系 ,但 业务驱动 更多关心的是 因果关系 。

在信贷业务中, 常用的因果关系有 通过收入评估推断偿债能力,能力越高风险越小 、 通过历史的信贷记录来判断,记录越好风险越小 等。

这些朴素的金融逻辑与潜伏风险之间是存在着很强的因果关系,因此在绝大多数传统的金融机构,都是通过对此类判断来推断借款人的风险。这些规则是被千百年来人类社会的实践所验证过的。而只要严格的依照类似的规则来对借款人进行审核,借款人的风险会在一个可控的范围内。但这些信息对在很多互联实时的场景中获得难度大,本钱高。

近年来随着大数据、人工智能等技术被神化,和数据获得成本,难易程度等多方面的缘由, 相干关系 逐渐被应用到风控审查的流程中,通常 相干关系 指的是那种通过数据分析发现的某些与风险相干的指标,但难于被业务或金融逻辑所解释的关系,如前述 25岁 的例子。这个可能就是被质疑的 数据驱动 了。

因果关系 和 相干关系 其实各有优缺点,一个稳,一个准。两者结合可以更好的增进业务的发展,同时对相关关系的深入研究,来发现其中的因果关系,可以更好的促进我们对借款人行动的理解,将其转化为 因果关系 。麻袋理财研究院认为,探索传统的逻辑回归加机器学习而构成的整合式运用的方法是王道。

(2)端正大数据风控应用理念,不能盲目崇拜算法风控不但仅是大数据模型,风控更应该是一个完全的闭环体系,大数据模型对于风控管理是非常重要的,但它只是其一。风控体系包括很多层面,例如贷前、贷中、贷后全面的风控系统的搭建,包括新产品上线的风险评估、渠道管理、反讹诈人工调查,还有操作风险管理、资产管理等都是风控体系中非常重要的环节。

对算法、大数据风控的盲目崇拜和错位运用,是极大的误区。

基于 了解你的客户 的原则,不同的客户群体、消费场景、产品设计所面临的风险点是不同的,没有一套风控模型可以包打天下;风控体系搭建非一日之功,数据驱动也非一针见效的灵丹妙药,需要不断的迭代、优化,小步快跑。

所以不要在这个领域里面对新鲜的算法盲目崇拜乃至直接移植,还需要更多的从业者一起去探索和再创新。

(3)把大数据风控作为传统风控手段的补充基于以上两点得出的结论是,信用风险评估的强相干数据还是金融数据,互联行动数据为基础的大数据风控只是一个补充,不能够完全替换传统的信贷风险管理。麻袋理财研究院认为,大数据风控可以从数据纬度和分析角度提升传统风控水平,是一个必要的补充,可以让传统风控更加科学严谨,但是不是取代传统风控的模型和数据。

(4)建立完善的风控模型管理制度业内对风控模型,一般会经历几个阶段才会进入业务应用:模型研发、模型验证、模型评审、模型校验、模型运用监测。每一个流程都会对模型的正确运用产生很重要的影响。

决不能由于 互联思维 大干快上而把流程简化成模型研发和模型部署两步,这不是 不谨慎 ,是草率。

同时建立完善的风控模型档案制度。模型文档的完全和流程的可追溯,是业务持续运行,下降风险的重要保证。

4、小结麻袋理财研究院认为,对 数据驱动 风控模型的质疑并不是全盘否定,而是对其 概念化 、 空心化 趋势的警示。大数据风控是背锅侠,背后本源是业界的浮躁 善于投机,力求捉住业务风口,盲目寻求快速做大规模,忽视风控。

金融讲求的是稳而不是快,讲究的不是抓住机会而是不出错,金融领域最具竞争力的不是暴利而是延续稳定盈利。

业界基于互联思维,寻求每次都能踩准台阶,但是在每一个台阶上站的都不稳,以至于一次次寻觅更高的台阶。大数据风控是唯一能够满足需求的风险管理方式,但行业连走完一个完全模型管理流程的时间都没给。拔苗助长,用完就扔,这种情况值得反思。

要为大数据风控正名,首先必须真的在做大数据风控,正确认识大数据风控与传统风控的关系,业界需要探索传统业务逻辑加机器学习而构成的整合式运用的方法。

更多精彩内容,关注钛媒体号(ID:taimeiti),或者下载钛媒体App

第一时间获得TMT行业新鲜资讯和深度商业分析,请在公众账号中搜索「钛媒体」或「taimeiti」,或用扫描左方二维码,便可取得钛媒体逐日精华内容推送和最优搜索体验,并参与活动。

文章写的好,但你这文章也要泼冷水。大数据本来就是滥用,本人就是支付宝滥用大数据的直接受害者,支付宝给阳光保险推行产品,没有经过我同意就让阳光保险获得了我号,现在是没事就骚扰,对阳光保险的骚扰行为的指责络可谓泛滥。贵学院?认为支付宝做大数据是不知道还是故意为之呢?在本人更换号后,阳光保险还是轻易通过骚扰本人,新号码使用多月,除刚好在收到骚扰前改绑支付宝外没有任何操作,乃至没有告知亲属,那末请问阳光保险是如何知道的本人新号并且发起骚扰的?贵学校?为支付宝乃至大数据正名,能否出来解释一下?

21:37 via h5

我们会向您的号发送验证码,请查收并按提示验证您的号。如果您没有收到短信,请留意垃圾短信拦截

经检测,你是“钛媒体”和“商业价值”的注册用户。现在,我们对两个产品因进行整合,需要您选择一个账号用来登录。无论您选择哪一个账号,两个账号的原有信息都会合并在一起。对给您造成的不便,我们深感歉意。

小儿感冒药该如何选择
小儿感冒该做什么检查
小儿甲型流感好治疗吗

相关推荐