大数据应用 消费金融大数据智能风控体系应用

编辑:光环大数据 来源: 互联网 时间: 2017-11-14 14:05 阅读:

 

 

近年来,伴随互金、消金等业务形态的崛起,个人金融信贷业务范围逐步扩展至新场景、新客群,探索出了新模式、新通道。与此同时,作为金融的“本质”的风险控制面临了前所未有的挑战。

尤其是在网贷、消金领域,新形势下风控命题迟迟无法破题,导致大量积聚的风险正在蚕食着行业健康、可持续发展的基石,主要表现在以下几个方面:

●积聚政策性风险。在风控领域缺乏真正有效的解决方案的情况下,大量机构被迫“超高利率”来弥补风控的不足,也引来了监管部门对“现金贷”等业务的强力整顿。

●倒逼客户回流传统机构。曾几何时,高举“效率为王”,以急速放贷为突破口,给行业带来了几缕新气。然而,过高的利率、妖魔化的催收,正在倒闭客户远离这个行业。

●造成行业社会价值极大削弱。“好人不敢来”、“坏人里面挑好的”成为常态,新金融与“普惠”的初衷渐行渐远。

与此同时,大数据、人工智能技术逐渐成熟,行业看到了彻底解决风控症结的新路径、新方法、新技术。为此,构建新形势下的新一代智能借贷风控体系以有效识别风险、降低风险,如何有效依托场景、创新性使用新技术、平衡风控的效率与效能,打造新型的智能风险控制系统成为我们这个时代风控人的核心使命。

本项目以“内外部大数据的应用”、“实时风控技术的落地”、“智能化风控体系的搭建”和“云化风控系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能风控解决体系,项目落地后取得了较好的效果。

周期/节奏

项目的整体分为两个阶段,第一阶段为实施部署,持续了16.5周,具体分为:方案制定、接入准备、系统测试、软件实施、验收测试、系统上线等6个阶段,于2016/3/21项目开始到2016/6/30结束。第二阶段为上线运营,跟进了12周,从2016/6/30开始到2016/9/30结束。具体项目排期如下:

客户名称/所属分类

项目名称《某城商银行消费金融场景大数据智能风控体系》。

以下为所属分类选择:

1.风控行业

风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失。总会有些事情是不能控制的,风险总是存在的。做为管理者会采取各种措施减小风险事件发生的可能性,或者把可能的损失控制在一定的范围内,以避免在风险事件发生时带来的难以承担的损失。

2、大数据技术服务

基于大数据特点:数据量大、类型繁多、价值密度低、速度快、失效高等,结合金融行业特点,从大数据的思路出发,提供从数据到技术到业务再到决策和战略部署的整体解决方案服务,为企业和消费金融业务带来从量到质的过程。

任务/目标

银行现有风控体系面临数据应用范围扩展、风控决策效率不匹配场景需求,本项目旨在达成如下目标:

1)探索非金融体系数据的应用:现有风控体系基于央行征信报告设计,内部数据集成项目正在进行过程中,时间不可匹配业务,外部数据(征信数据除外)尚未有接入经验;

2)提升风控决策效率:传统风控系统单笔订单审批时间超过半小时,但消费金融场景客户填写资料后就在现场等,需要做到“实时”或“准实时”放贷;

3)尝试风控体系自动化优化:需要针对消费金融场景独立构建分析体系、风控体系自优化等内容;

4)探索风控系统的云模式:以消费金融业务为试点,探索风控系统云化的可能性。

挑战

本项目整合了数尊的三个核心产品:BOX(数尊宝)、BOL(数据连)、BOD(数尊塔)等三个产品,分别用以实现外部数据的接口及调度管理、内外部数据的任务/算法/运维管理、智能化决策引擎系统等三大主要功能,三个产品针对消金场景而设计。

尽管数尊拥有丰富的三个自有产品的实施经验,但仍然面临了以下三个方面的挑战:

1)认识层面:客户方对云化、外部数据的应用存在疑惑,也缺少经验,部分人员存在认识不清、不敢推动、不知如何推动的情况;

2)数据层面:内部数据存储于多个系统,存在多口径、格式等多个方面的问题;外部数据样式多变、项目执行过程中持续增加了多个接口(相应接口的字段也都有增减);

3)项目预期:对新业务的业务量预估值过高,对系统性能提出了超高水平的要求,导致系统部署方案进行多次调整。

实施过程/解决方案

本项目基于公司已有的外部接口管理平台、内外部数据实时处理平台、智能决策平台,采用多项成熟的外部数据处理标准、构建超过2000+内部风控决策规则,并且通过人工智能算法对决策流关键要素(如:字段、规则、评分卡)进行自动的监控及预警。

项目紧密结合新金融风控的特点、客户特点、以友好的体验方式,提供给客户一整套易用、灵活以及较彻底的拜托传统IT的束缚的智能化风控决策系统。

从如下项目构架图可以看到整个项目包括大数据接入平台(BOX)、大数据中间件(BOL)、智能决策平台(BOD)3大部分。

1.大数据接入平台

项目基于公司现有的BOX系统,整合已经接入30+以上外部数据供应商的数据接口,实现对央行征信、运营商数据、银联数据、电商数据、政府数据等2000+维度的字段的集成和实时调用。

另外,BOX系统采用了先进的数据路由的理念,对同一字段实现了“主­从­备”多数据源调用的动态优化,同时,也支持业务人员基于字段响应时长、字段覆盖率和字段成本等多维度指标,对数据调用策略进行界面化配置。

所涉关键功能包括:

1)数据接口变更的界面化配置。实现对接口HTTP、调用参数、覆盖字段、字段返回值等内容的前台维护和界面化配置。

2)数据调用路由,确保数据的稳定性。实现对多数据源的动态调用策略,封装了成本优先、覆盖率优先、按比例设置主从等多个策略。

3)外部接口原始数据的切片式存储和检索。实现对外部接口原始数据的存储和检索,以及数据的维护。

主要解决的问题:

1)解决外部接口持续增多、数据口径/逻辑不稳定所带来的频繁变动的问题。

2)解决外部数据调用需要兼顾“稳定性”和“节费”的问题。

3)解决调用来的原始字段存储的问题。

2.大数据中间件

大数据处理中间件(BOL)主要用以实现内部自有数据的实时同步、内部数据的复杂算法处理、内外部数据的交叉比对、外部实时清单数据的加工处理等4个方面需求。

BOL使用了目前最先进的流处理技术和实时处理机制,支持在10ms以内实现个人客户标签的抽取、数据的交叉比对等内容,极大的降低了业务界面客户等待的时间。

BOL综合采用了JVM存储、内存数据库和分布式缓存的方式,形成了数尊面向金融应用场景独有的数据存储结构,兼顾系统的动态性、高可用、高可扩展性。

BOL支持客户通过前台定制SQL的方式形成“任务”,通过触发和手动两种方式激活任务,实现对数据表操作、数据复杂加工处理、内外部数据的交叉验证等功能。同时,BOL支持基于xml方式的外部大数据计算平台的复杂模型的导入,从而为整个系统提供了大数据智能的数据基础。

所涉关键功能或技术包括:

1)流处理技术

BOL基于SparkStreaming搭建了流处理核心技术。通过创造性的应用和改造SparkingStreaming提供的丰富的API,实现内存的高速执行引擎,实现了丰富的“流式、批处理和交互式查询”应用。

2)通用算法平台结果文件的兼容和实现

通过XML解析器解析SAS、SPSS、阿里机器学习平台产生的模型结果,实现了对离线建模结果的兼容和算法应用

3)CEP策略的承载

内置复杂时间处理模块,用以提供提供基于时间跨度和滑动窗口的事件处理模式,极大的丰富了风控系统应对风险的能力。

4)第三方数据标准化及入库管理

内置30+第三方数据源接口、入库任务、常用加工处理任务,可供随时实现对外部数据的调用。

主要解决的问题:

1)解决海量数据挖掘的计算效率问题

某城商银行存量客户近1000万,项目使用了这批客户3年内的交易流水数据、APP登录、客服等维度的全数据,每天增量数据超过1G,这样的海量数据计算不可能由单台服务器完成,而是需要多台服务器同时计算,且最大化地使用服务器资源。

2)解决动态风险预警信息及时传递给决策流的问题

针对基于行为触发规则的场景,BOL基于实时数据的计算,捕捉动态风险信息并主动推送给决策流系统。

3.智能决策平台

智能决策决策平台(BOD)是智能风控决策中心平台,用以对借款人进行准确、实时的风险量化评估、进而提供基于订单的风险决策建议;

BOD为客户提供【一站式】风控决策流的开发、发布与部署的平台,提供【无需编码】【拖拽式】的决策流界面,【一键式】决策流上线部署和下线停用,提供基于数尊项目经验的“2000+内置的规则和100+评分卡”的强大知识库。

工作机制:接收到业务系统的借贷决策请求后,BOD向BOL发起数据请求,BOL通过调用外部字段(BOX)、整合内部字段完成数据组织;BOD获取数据后按决策流节点需求计算出节点结果,持续进行后续多次调用。

BOD为客户提供全流程闭环数据管理,为数据化运营提供了基础。BOD提供了风控业务相关的“前台”和“后台”报表50余张,帮助客户全面分析进件情况、指标、模型、决策流的整体情况和效率。

BOD基于历史数据,运行后台封装的算法策略,统计后台算法策略的违约率,作为字段、规则、评分卡等决策要素的效能优化的依据。

所涉关键功能或技术包括:

1)规则引擎

BOD兼容流模式和规则模式,基于风控应用了实现了大量的逻辑优化,实现了引擎核心与Java内核的完美融合。

BOD内置了规则优先序自动优化的智能程序,用以自动节省规则流中规则执行的优先序以及节省数据成本。

2)知识图谱

BOD基于“字段­规则­评分卡­决策流”之间的内部数据关联关系,使用知识图谱的方式,提供可供配置的四类要素效力的指标监控和预警。

BOD依托客户的身份主键信息进行了普遍的实体化,支持基于本人、联系人、交易方、身份证、手机号、地址、学校、邮箱后缀、工作单位、QQ等借款人ID的关联关系展现,从而帮助客户方专家人工识别欺诈、信用风险的团体特征。

3)机器学习算法

BOD内置了包括GDBT、RNN、CNN、DNN等30+算法,仅需简单勾选即可跟踪风险动态,通过实时捕捉风险变化对决策流要素优化方向给出建议。

主要解决的问题:

1)决策流页面化全面配置的问题

决策流全流程页面化配置,全局“托拉拽”式组织,有效解决了传统引擎难用、不会用的问题。

2)人工智能和专家智能的融合的问题

基于个人关联关系,在复杂网络智商通过无监督算法实现分团和网络全局风险特征抽取,并基于规则和模型融合专家研判持续迭代和优化模型、发现欺诈模式。机器+专家研判持续强化机器识别能力。

结果/效果总结

1)风控效率提升。上线新系统及模板规则后,有效防控欺诈客户、降低信用风险,消费金融业务逾期率下降21%。

2)风控时间有效缩短,有效适配场景需求。线上放贷周期由1小时最短降低到1分钟,有效提升在客户触点的竞争力,审批时长的缩短直接提升了渠道推广人员的积极性。

3)IT­风控权责分离和模型自动化能力带来大量成本节省。风控模型变更不再需要IT排期,风控人员即可完成修改并热部署实时生效;风控模型调整周期缩短,更高效应对信贷风险,提升风险应对能力。针对项目场景,整体系统节省的人工审批成本、软件开发成本、IT维护成本,经核算,整体节省成本约458万/年。

企业介绍:

1)数尊信息科技(上海)有限公司(以下简称数尊),是“华院数据”基于大数据核心能力、面向信用评估和风控领域孵化的子公司,专注于个人与中小企业信用风险的评价服务。数尊已成功完成两轮投资;

2)数尊总部设立在上海,在西安设有研发中心,在深圳、杭州等地设有办事处;

3)数尊擅长于多维权威数据源的整合和综合洞察,以“用数据推动风控和信用服务”为使命,致力于帮助企业提升个人客户的信用服务和风险控制能力,并立志成为中国最专业的数据化信用服务解决方案提供商;

4)数尊已覆盖了超过8亿的个人客户信用评价,并对近1亿客户实施过个人信用的场景化辅助应用;

5)数尊优势:

●汇聚了来自中国科技大学、复旦大学、上海交通大学、西安交通大学等顶级学府的顶尖人才,组建了国内一流的金融智能算法和技术团队,其中硕士及以上学历员工超过80%,团队具备大数据、金融、互联网等行业的丰富经验;核心成员均具有十年以上面向个人客户的金融风险控制模型、系统、整体解决方案服务的经验或管理经验或数据处理经验;

●数尊所深度整合的数据来源合法、操作合规、应用合理,可以为金融机构提供丰富有效的外部数据资源;

●截止目前,数尊已经为国内300多家银行、保险、消费金融公司、其它互联网金融机构提供大数据智能风控服务,在行业享有一定的知名度和美誉。

 

  大数据时代数据分析师数据挖掘培训互联网数据分析师,就选光环大数据培训机构!

 


大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。 更多问题咨询,欢迎点击------>>>>在线客服

你可能也喜欢这些

在线客服咨询

领取资料

X
立即免费领取

请准确填写您的信息

点击领取
#第三方统计代码(模版变量) '); })();
'); })();