新网Logo
首页>互联网热点>

360数科首席数据科学家沈赟:数据决定模型算法的天花板

登录 注册

360数科首席数据科学家沈赟:数据决定模型算法的天花板

  • 来源:网络
  • 更新日期:2020-09-01

摘要:【TechWeb】9月1日消息,日前,在“2020第二届中国零售金融发展峰会”上,360数科首席数据科学家沈赟就“白户风险”、“身份伪冒”、“中介风险”、“传销风险”、“黑户风险”、

【TechWeb】9月1日消息,日前,在“2020第二届中国零售金融发展峰会”上,360数科首席数据科学家沈赟就“白户风险”、“身份伪冒”、“中介风险”、“传销风险”、“黑户风险”、“恶意欺诈”、“借新还旧”七大欺诈场景,给出了针对性技术解决方案。

据沈赟表述,针对主动式欺诈,360数科凭借GBST等自研算法,不断优化FTG自适应反欺诈特征体系,在千万级别黑名单库、黑中介库以及数亿白名单库的数据支持下,搭建起涵盖超过18亿关系节点和200亿关系边的金融知识图谱。在全场景反欺诈方面,基于位置、设备、推荐、联系人等关系,360数科建立起关联网络,并利用社群发现、风险传播等无监督算法发现黑产团伙、识别潜在和新型欺诈威胁。利用LBS网格化特征、App2Vec特征等技术加工手段,360数科还提升了深度学习算法的敏感度与精度,挖掘了模型算法的灵活性,即时拦截中介及黑产风险,从而实现有效实现反欺诈。截至2020年6月30日,360数科由于欺诈造成的坏账率为0.2%。

沈赟表示,对于数据科学如何赋能信贷业务,360数科已实现从获客、贷前、贷中到贷后的全生命周期风险管理,有效抵御欺诈攻击。在此过程中,每个阶段都需要大数据与人工智能技术的参与,这也是金融科技区别于传统金融机构的最大原因。

同时,沈赟进一步表示:“反欺诈需要辨别出以骗款为目的黑色产业,在这方面,我们通过构建关系网络,以知识图谱等形式找出风险点。同时,还会维护诸如黑中介电话号码库之类的数据库,通过社交关系网络,找到与黑中介关联上的人,并认作潜在的欺诈风险。”

沈赟称,“针对风险较高客户,我们会提前采取拒绝、调额、调价等风控措施。此外,在实际业务中,我们还会在多个贷中时间点对用户进行重新评估,来预测其多头可能变化的情况。”

据介绍,360数科在贷后环节制定了不同的催收的策略,通过对用户去进行客户和分群,来制定相应的催收方式。沈赟表示,“我们从积累数据,从数据当中去挖掘各种各样的特征,使用机器学习的模型去学习,不断去优化调整这个模型,从而促进业务的发展。从这个角度讲,数据决定了模型算法的天花板。反过来,在业务发展后,我们也可以获得更多的有标签、有指导意义的数据及模型,这是一个不断正向的循环,是整个的建模、数据模型以及业务三者有机的一个融合。”