01

案例企业

上海汽车集团财务有限责任公司(以下简称上汽财务)是上海汽车集团(A股代码:600104)所属的非银行金融机构,于1994年5月在上海成立。上汽财务经过多年持续快速发展,目前已形成汽车金融、公司金融、投资融资三大业务板块,走出一条“创新引领未来、和谐共创价值”的产融结合道路。

逻辑回归算法原理_逻辑回归模型_逻辑回归算法

面对数字化转型给金融行业带来的巨大挑战与机遇,2020年,上汽财务成为行业内首家成立数据业务部的公司。

从2021年开始,上汽财务制定了一系列持续保持行业领先地位的数字化转型战略和实施路径,力争在商业模式、成本效率和客户体验等多方面带来新突破。在具体实践上:

一是大力推进数字基建。引进HADOOP、图数据库等技术,启动技术中台、数据中台、业务中台、人工智能平台的建设;

二是推进数字人才队伍建设。通过建立内部见习培训制度和外部引进相结合的方式,初步建设一支具有复合型背景的数字化人才队伍;

三是推进数据应用。实现大数据、人工智能在汽车金融、公司金融、投融资业务的全面应用,充分释放数据要素生产力,努力培育公司新兴数字核心竞争力,提高公司市场响应速度,增强市场竞争力,保持公司在汽车金融和财务公司行业的领先地位。

02

项目背景

随着国内消费信贷的快速增长以及上汽财务个人汽车消费信贷业务的持续发展,反欺诈的重要性越发凸显,反欺诈已成为各金融机构贷前风控的重中之重。与此同时,宏观经济环境的快速变化也给汽车金融个人贷款欺诈风险管理带来了新的挑战。

当前,金融机构在应对欺诈风险时普遍存在如下问题:

第一,欺诈手段多样。欺诈手段层出不穷,地域范围、集中贷款产品类型、车型、客群等都在不断变化,传统的反欺诈模型数据维度单一,无法有效识别复杂场景下的欺诈风险。

第二,反欺诈模式固化。反欺诈模式传统且固化,往往采用评分卡叠加专家规则实现,模式较为僵化,无法满足不同业务模式下的反欺诈风控需求。

第三,策略迭代周期长。反欺诈策略迭代调整周期长,从模型角度看,往往需要经历样本选择、数据清洗、模型研发评审、上线等流程,经过一段时间的表现后再次评估,难以快速响应快速变化的外部环境,且每次迭代都需要重新部署和开发,成本较高。

逻辑回归算法原理_逻辑回归算法_逻辑回归模型

面对以上汽车金融风险,上汽财务数据业务部牵头负责模型开发,由个人金融部作为落地部门,旨在通过构建汽车金融反欺诈风险评估体系,运用模型化的风险分级策略,搭载反欺诈策略智能迭代机制,实现精准防范欺诈风险的同时,能够灵活进行风控策略调整,适应外部环境风险波动变化,满足不同业务场景下的反欺诈风控需求。

逻辑回归算法原理_逻辑回归模型_逻辑回归算法

反欺诈风险评估体系建设项目于2020年10月正式启动,经过一年的数据摸索评估,于2021年10上线完全自主的反欺诈风险评估体系初版,应用反欺诈概率风险模型、基于图数据库的关系网络等进行反欺诈风险识别;2022年7月,上线双层反欺诈风险分级策略,基于原有反欺诈模式进行重组迭代,形成一套基于树状模型的粗调和精调两种反欺诈风险策略模式;2022年8月,从各个角度的反欺诈模型集群建设完成,新增无监督学习模型、概率图传播模型和图神经网络欺诈模型等;2022年9月,研发智能自学习迭代策略机制并投入试运行,整个体系基于不断变化的环境而持续迭代和升级。

03

解决方案

(1)多维模型集群

借鉴集成模型思想,通过多技术、多算法、多维度的方式提高反欺诈模型的识别能力,建设全方位模型体系。

逻辑回归算法_逻辑回归算法原理_逻辑回归模型

从技术看,集成运用有监督学习算法、无监督学习算法和图算法三大技术,突破单一技术模式的技术壁垒。有监督学习算法使用了传统的逻辑回归算法、梯度提升算法等机器学习算法,也包括基于神经网络的深度学习算法等;无监督学习算法的引入主要目的是弥补反欺诈场景下的标签问题;图算法则主要用于挖掘贷款和客户之间的关系,形成一套基于关系网络的反欺诈识别能力。

从算法看,通过搭建多视角、多算法集群汽车金融反欺诈风险评估体系,高维模型集群弥补了传统反欺诈手段单一的缺陷。

在有监督学习层面,构建基于逻辑回归模型的欺诈概率风险识别、基于概率图传播模型的欺诈传播风险识别。

有监督学习更多是基于已有标签形成较强的模型区分性能,但欺诈客户的标签认定存在挑战,例如部分有欺诈风险的客户在认定时被掩盖在大类信用风险中、部分客户在申请流程中填写不规范的瑕疵被错误认定为欺诈客户等。

为了解决这个问题,使用无监督学习算法,依赖更高的数据量、更少的标签,将客户与整体客群进行横向对比,从客户与有欺诈标签的相似性角度识别有欺诈风险的客户,发现有异常特征的客户。在无监督学习层面,使用孤立森林、One-class SVM和自编码器等多种学习模式。

在图的层面,考虑到只看单一欺诈客户容易忽视掉客户之间的关系,而欺诈行为往往组织之间存在关联性,因此通过数据库能力构建多种不同基于图关系的模型,例如基于一度和二度关系的欺诈识别规则、概率传播模型以及基于图神经网络的欺诈风险识别模型等。

多维度与多算法的视角相辅相成,不同算法接受的数据不同、对客户的评价维度自然有区别。有监督学习更多是基于客户的资质和行为进行评估,无监督学习则是横向比较客户与其他客户之间的差异性从而找到异常客户,图网络则更关注客户与客户之间的关系、识别客户之间的集体关联。

(2)风险分级策略模式

除了技术部分之外,项目对架构实现全面升级。相较于传统评分卡+规则的模式,多维模型集群能够从更全面的视角去评估客户风险,关键在于如何将模型通过一套有效的方法集成起来,将结果既能够清晰的反映客户的风险水平,又能帮助业务人员理解模型结果。

对此,项目实现基于树算法的模型化双层反欺诈风险模型评估体系,在这个体系下,所有的特征都被集合成树状分类。树状分类下设两套风险评价体系,风险精细层基于树叶节点输出精细化的客户风险评价,风险汇总层通过动态归并叶节点输出合并后的风险分级,形成细分和粗分的两套客户风险分层分级策略,实现反欺诈策略的模型化。同时,由于树模型的可解释性较强,模型本身可理解性较强。

逻辑回归模型_逻辑回归算法原理_逻辑回归算法

相较于传统打分及固定阈值的策略模式,基于模型的多维度可差异化风险分级策略,能够更加敏捷迅速地适应风控策略调整和经营方向的变化,满足不同业务场景下的反欺诈风控需求。

(3)策略智能迭代机制

为了解决形势快速变化以及迭代周期过长的挑战,项目采取集群模型架构上基于风险波动平衡自学习原理的反欺诈策略智能迭代机制。

自学习模型往往使用在以营销为主导的场景,通过特定算法实现资料数据的模型更新,但风控场景比较严谨,自学习模型对于风控体系的严谨性和稳健性来说都有挑战。

通过树状模型体系,设置一套不断滑动的滑窗,平滑由于外部环境风险波动带来的整体客户风险等级不稳定因素,实现模型迭代。这套历史回溯机制无需人工进行干预,能够自动捕捉风险趋势并作出调整的能力逻辑回归算法,反映最新的风险形势和欺诈特征并作出适应性的调整。

动态评估从风险经营角度讲,是对规模和风险两者之间的权衡,这种权衡在不同时间点下有不同的诉求。如果一味追求规模、往往会对风险把控不足;如果在风险上进行过分收缩,则会影响到整体业务的经营。通过在自学习机制上进行一套自迭代的动态策略的评估方式,基于历史数据形成优化权衡的策略切点,避免风险波动对业务产生较大影响,从而实现平滑、长周期的风险管理。

逻辑回归模型_逻辑回归算法_逻辑回归算法原理

未来,反欺诈风险评估体系将持续在数据扩充、算法升级、精度提升三个方面实现升级:

数据扩充:在不断变化的形式以及新增渠道和场景下,充分运用不同类型维度数据,有利于对整个模型的能力提升。同时,在当前的数据使用规范下,通过联邦建模获取外部数据针对性识别汽车金融欺诈风险。

算法升级:更多的数据形态有待发掘,从算法角度考虑进行补充,例如针对历史序列数据使用序列模型进行更好的预测,基于历史结构化、半结构化的文本、图片、视频数据,利用多模态方法识别隐藏在数据中的风险。

精度提升:欺诈标签仍然存在挑战,通过利用自然语言处理技术等对历史文本进行挖掘,优化建模目标客群认定方式,制定更加科学的风控策略,提升反欺诈体系对于欺诈风险的识别精度。

逻辑回归算法_逻辑回归算法原理_逻辑回归模型

04

价值与效果

反欺诈风险评估体系的建设为上汽财务带来如下价值与效果:

第一,有效提升欺诈风险识别效率。自2021年10月上线以来,上汽财务汽车金融反欺诈风险评估体系累计使用百万级人次,服务于汽车金融个人贷款贷前审核场景,覆盖年百万级客户规模的贷款审批,平均秒级响应速度,满足业务场景的响应速度,有效提升欺诈风险识别效率。

第二,自动调整节省策略迭代人力。反欺诈策略智能自学习迭代机制的试运行上线,标志着上汽财务汽车金融反欺诈风险评估体系具备了自动捕捉风险趋势并作出适应性调整的能力,有效节省策略迭代部署产生的开发人力。

第三,提升自主风控的数字化实力。基于图技术、机器学习算法和无监督算法的大数据智能反欺诈体系,接口响应迅速、欺诈客户识别精准、模块运行安全稳定,为业务平稳运行提供强有力的风控保障,大幅提升自主风控的数字化智能水平及实力,为行业反欺诈实践提供借鉴。

第四,提升客户精益化管理水平。从客户管理角度看,基于树算法的双层反欺诈风险分级,通过输出客户双层风险分级策略,实现反欺诈策略的模型化,更加敏捷灵活地进行自动审批策略调整和经营应对,满足不同业务场景下的反欺诈风控需求,提升客户精益化风险管理水平。

逻辑回归算法_逻辑回归算法原理_逻辑回归模型

05

经验借鉴

通过搭建反欺诈风险防控体系,上汽财务总结如下实践经验:

第一,针对欺诈标签难以准确认定的问题,通过采取监督与无监督算法相结合的模式进行应对。其中,有监督学习主要是通过业务专家标定的欺诈样本学习欺诈特征;无监督学习则是不依赖认定的欺诈标签,而是从数据特征中发现异常。

第二,针对欺诈团伙性相关数据稀少、对客户贷款之间关系发掘不足的问题,通过构建构建图关系、图神经网络进行应对。从关系网络的角度发现客户之间的风险,通过各类图节点关系、发掘风险线索;同时,采取图神经网络算法,通过算法设计和运算优化逻辑回归算法,发掘隐藏客户之间的联系及风险。

第三,针对复杂模型解释应用自迭代困难的问题,针对业务定制化设计组合架构进行应对。通过设计叠加了业务经验规则的模型算法,融合多个复杂模型;同时,增加周期性自迭代以及策略自动化生成机制,帮助业务自动调节风险应用策略。

逻辑回归算法_逻辑回归模型_逻辑回归算法原理

限时特惠:本站每日持续更新海量设计资源,一年会员只需29.9元,全站资源免费下载
站长微信:ziyuanshu688