京东支付研发负责人唐志雄:多角度谈京东白条

原创
开发 大数据
京东(金融)白条是大数据应用一个很好的实例。京东618大促后,京东白条的知名度再次提升了一个高度 ,大家对它的关注点也随着增加,例如它和我们的信用卡分期有何区别、为什么说白条是基于大数据的一款产品 、当面对交易风险又是如何控制等。带着这些问题,51CTO记者对京东云平台首席架构师、京东支付研发负责人唐志雄进行了专访,看他是如何多角度去分析大数据的应用和整体风控架构设计的。

京东(金融)白条是大数据应用一个很好的实例。京东618大促后,京东白条的知名度再次提升了一个高度 ,大家对它的关注点也随着增加,例如它和我们的信用卡分期有何区别、为什么说白条是基于大数据的一款产品 、当面对交易风险又是如何控制等。带着这些问题,51CTO记者对京东云平台***架构师、京东支付研发负责人唐志雄进行了专访,看他是如何多角度去分析大数据的应用和整体风控架构设计的。

【受访者简介】

[[140698]]

京东支付研发负责人

唐志雄京东5年级别的骨灰员工,曾负责过京东财务、交易、支付、虚拟资金、结算等核心系统。京东金融成立后加入到金融研发团队,现在负责京东消费金融(京东白条)和京东保险两条业务线的技术研发工作,对电商、互联网金融等新兴领域有丰富的经验和独特的理解。

【采访内容】

51CTO:您一直说白条是基于大数据的一款产品,能具体讲一下吗?

唐志雄:京东白条从诞生之初就充分利用的大数据的力量,它和传统的信用卡相比,不需要填写繁琐的申请表单,不需要各种证明,通过用户的各种行为数据,我们就能评估用户的风险程度。具体来讲,主要在用户授信和交易风控两个方面:

授信是从千万用户从中识别哪些是优质用户哪些是风险用户,将优质用户引入进来,将风险用户拒绝门外,这就得充分利用数据的力量来挖掘了,它是一项庞大而且持续投入的事情,也是规避消费金融坏账的***的防火墙。

当用户引入之后,如何保护用户资产安全,又如何识别用户有往劣质用户的趋势转变,也是需要有很强的发现能力。如何发现?还是需要大数据的充分应用加上运营人员经验的积累,业务我们不能未卜先知,但是通过数据我们能发现规律,比如大家常见的:喜欢晚上作业、购买高单价商品、收货地址不明确、喜欢用极速达等。所有这些都是数据告诉我们的。

51CTO:除了京东内部的数据挖掘分析之外,京东体系外的数据是通过什么方式搜集到,又是如何存储的呢?

唐志雄:外部数据的搜集是对费京东体系用户需要享受白条服务的一个补充,搜集方式有很多种,可以购买也可以合作,实际上外面的数据的含金量是要打折扣的,我们需要花费一些精力来做数据校验(真伪),数据清洗等。关于存储是多级存储,***级肯定是利用我们的大数据存储中心,一般是在京东云上。清洗和检验之后会放在白条的自己的数据环境中。

51CTO:您觉得在金融领域,会有哪些大数据的应用呢?

唐志雄:现在互联网金融非常火爆,互联网公司开始渗入金融,金融公司开始要做互联网,这里面大数据的应用也许是将来发展的一个方向。举几个例子:

1、个人征信领域

目前国内除了人行的征信没有别的权威机构,但是人行征信仅限于个人在特定金融机构的信贷行为数据,而且还不够灵活,所以这时候阿里跳出来说要做芝麻信用,京东也要做白条分。为什么是这两家要大力度去做,因为电商领域留下了用户大量的真实的行为数据,通过这些数据是完全可以分析用户的职业、家庭情况、消费水平、兴趣偏好等,对用户的信用评估更全面准确。

2、保险领域

比如刚刚开放费率的车险市场,如果有精确的用户驾驶行为风险评估,就可以将保险的费率差异杠杆拉的更大,比如很优质的用户可以达到4折或者3折的保费,而风险高的驾驶员则可能需要2倍甚至更高的保费,这样做更是保护那些具有良好驾驶习惯用户的利益。其他的保险例如运费险也一样,经常退货的用户和很少退货的用户不一样的是一样的保费。

3、投资领域

大的电商是能感知到市场消费的晴雨表的,哪一类商品的热销或者滞销的数据也能间接反映上游的企业的发展状况,从而可以决策是否对哪些公司进行投资等。 类似的场景还有很多,以前大家也许还在畅想阶段的事情,目前就是各大有实力的数据公司真正去挖掘商业价值的时候了。

51CTO: 对于京东白条来说,交易风险控制是不可缺的。在设计交易风控技术架构的过程中,是否遇到过一些难题?后续的解决方案又是什么?接下来面临哪些挑战?

唐志雄:白条是一个信用产品,在交易风控上面我们确实碰到过较多问题,比如规则过于简单误拦率较高,随着数据量的增加和规则的增加系统性能跟不上等。然后就是大家都在摸索和研究,针对“坏人”的特征判别是个持续学习的过程,一开始避免不少误判,但是后面就会有经验了,识别率也在不断提升。 为了降低这个学习的代价,我们就做了分区隔离,一条风控规则的校验首先是在隔离区运行的(用现在的话来说是旁路检测),然后不断是调试和更新规则的过程,直至***规则组合包的识别率达到了我们的要求之后才切换至正式环境,这种措施最有效的降低了误拦的风险。 要说到挑战,主要还是精准识别会带来系统复杂度的提升,复杂度的提升会降低系统的性能,但是我们又必须保证系统的性能对用户体验的影响,这是我们要必须克服解决的挑战。

51CTO:实时风控的规则包在风险发生前制定好等用户触发,或者事件发生之后在把问题总结列入规则包。基于对大数据分析,规则包是怎么进行计算,并且实施的?

唐志雄:交易的规则包只是一种人工干预的策略,简单类比就像数学里面的函数一样,而各种风险的大数据分析是另外一套独立的系统,分析出的结果可以直接应用于我们的策略,就像函数里面的各种常量。上次我的分享里面提到的规则包的改进主要是由原来的串行计算升级为并行计算,处理性能有大大提升,这个在规则包数量的增加后变得尤为有效。

51CTO:在设计白条系统架构时,从用户和商家角度分别是怎样考虑的?

唐志雄:用户永远是所有产品的主角,为了提高用户体验,我们在做系统设计时,就围绕着用户的问题永远是***优先级考虑的,在与用户有关的授信激活、消费与还款环节上,我们在系统构件上就要确保系统的稳定与高性能,用户的数据永远不能丢失,同时还做了大量的细节改进,今年618的消费量是去年双11的四倍,但是我们却保持了99%的成功率,这就是一个例证。从商家的角度,我们要打破传统的模式,传统模式上一家信用卡要与商家进行促销是很费时费力的,大多是银行与商家洽谈,以折扣的形式呈现给用户,效率较低且形式单一。而白条则不同,商家可以自行参与各种营销模式,比如什么商品/服务什么时间能享受白条哪种形式的促销(N元购、免息、满减等),费用承担比例等,都是系统直接控制的,用户消费后,费用也是实时看浏览的,这对商家来说提供了更大的便利性,也对刺激销售提供了更大的空间。

51CTO:京东是采取哪种机器学习模型?这样的选择是由哪些因素来确定的?

唐志雄:京东白条有单独的数据分析和建模团队,大多是一些数学高手,我们主要用的几种模型:随机森林,lasso回归,文本主题模型,贝叶斯网络GBDT等。还有比较传统的,聚类算法,逻辑回归等

51CTO:在未付款或正在分期付款期间,针对出现问题的商品,用户在退换货的这个过程从技术实践上经过哪几个环节处理?

唐志雄:京东白条对京东商城来说,就类似于一家信用卡银行的角色,商品本身的售后问题由商城来处理,如果发生退款,白条有相应的逆向流程,退回的金额会自动冲抵待还的本金+手续费,不知道你是不是想问退款时的计息规则?这里面的细节又很多了。

小结:

“白条”这种创新的支付方式,使京东在618大促期间大大提升了在线支付的成功率,而且带来了更多新的用户,增加了用户黏度。与此同时,它给消费者也带来了更好的购物体验:支付更加便捷,还能满足高层次的消费愿望。相信无论是消费者还是电商平台,都希望今后“白条’的额度能够提升,并且有更加灵活的额度调配方式。但这个愿望可能面临着一个非常大的挑战:目前国内消费信息不完整,个人信用难以预估。就这个问题京东采取了积极的应对方式,据悉,京东已经开始与大数据分析公司ZestFinance合作,计划将这种用户网购习惯构建成一套完善的个人信用体系,从而让京东白条技术得到进一步的完善和发展。

责任编辑:王雪燕 来源: 51CTO
相关推荐

2015-11-03 15:00:09

技术周刊

2015-10-27 14:52:00

技术周刊

2015-07-21 15:03:56

技术周刊

2015-11-16 09:33:29

京东白条资产证券化

2015-04-03 17:04:13

2011-12-28 15:16:33

Sencha开发者负责人

2011-09-26 10:38:11

Windows Ser开发

2015-04-10 17:23:04

XToolsCRM

2012-02-01 10:38:42

网银信息安全网络技术

2013-09-11 09:59:00

2010-05-31 14:42:14

SVN与CVS优缺点

2017-02-22 16:55:29

移动·开发技术周刊

2017-03-13 15:48:06

实践录京东金融金融科技

2014-12-05 15:37:06

2012-09-26 13:44:52

Android谷歌阿里云

2014-05-21 16:04:38

面试面试规则

2010-04-02 16:44:59

无线局域网故障

2018-08-14 12:59:00

大数据

2017-05-10 23:27:08

京东企业采购 JD-Busines

2019-02-07 11:27:52

实践录京东金融金融科技
点赞
收藏

51CTO技术栈公众号