• 找新知
  • 找课程
  • 找服务/产品
  • 找LIVE
  • 找活动
  • 找新知号/店
新知一下
海量新知
1 6 0 0 8 4 0

电商羊毛党套路多,半监督机器学习可以做什么?

同盾智能风控 | 同盾科技-专注于智能风控和分析 2019/10/09 14:05

“你永远不知道你屏幕对面的对手是谁,他可能是个熊孩子,也有可能是只狗”,移动互联时代给我们带来生活便捷的同时,也增添了一些未知和风险。

新知图谱, 电商羊毛党套路多,半监督机器学习可以做什么?

正如电商企业以吸引新用户,提高运营指标为目标的营销活动,吸引而来的可能是真正的用户,也有可能是羊毛党。而对于电商企业无法逃避的一项难题便是如何有效的“抓住”羊毛党,最大限度的发挥营销推广资金价值

小盾在《“砍价”裂变活动有坑,别让618成为黑产狂欢夜》中曾提到,根据技术成分的高低,羊毛党大体可以分为三类:散户、稍懂技术的、拥有专业黑产技术能力的。而这之中,后两种无疑是获利最大,且对商家威胁最大的。“当你一旦从事黑产获取爆发式的利润,你很难再会去从事其他行业”,丰厚的利润促使该部分群体不断地更新技术,去试探并攻破商家的风控规则,导致商家难以应对,需要投入大量的人力、物力保证良好的风控效果,那么如何提高风控效率,高效应对强对抗的风险攻击呢?

所谓知己知彼,百战不殆,在寻找有效的风控方法前,我们需要了解这部分羊毛党的作案特点是什么。

技术型羊毛党的作案特点

术型羊毛党的主要作案方式有批量养号后通过众包平台接单实施欺诈行为、开发软件或编写脚本寻找商家漏洞并实施欺诈行为等,虽然方式多样,但万变不离其宗,技术的实质在于自动或半自动实现批量操作行为,进而提高黑产作案效率,实现规模化效益,而这也就必然导致黑产在某些维度上出大量的相同或相似,形成一定的关联,聚集成一定的团伙性网络。

这些相似或相同可能体现在账号信息维度、行为信息维度或设备及网络信息维度。

  • 账号信息维度,如所有的账号注册日期相同、昵称相似(如均为*HL)、收获地址相似(如均为广东省深圳市龙岗区坂田街道A栋等。
  • 行为信息维度,如所有的交易金额总额相似(如均为200—209任意数字)、交易发生时间相近(如均为凌晨2:00—2:30任意时间)、交易路径相同(如均浏览并关注3家店铺后购买)等。
  • 设备及网络信息维度,如所有设备的Wi-Fi信息相同(如Wi-Filist相同)、设备的分辨率相同、IP3相同、APP使用版本相同等。

新知图谱, 电商羊毛党套路多,半监督机器学习可以做什么?

那么利用什么方法可以有效其识别该部分黑产,并保证高覆盖、低误杀呢?小盾向你推荐电商羊毛党的识别利器——半监督算法产品。

高效识别欺诈团伙——半监督机器学习

1. 什么是半监督机器学习

半监督是介于有监督与无监督之间的机器学习,利用少量黑标签和无标签数据(通常黑标签与无标签数据万级,其中黑标签数据为千级),结合专家业务经验及数据挖掘技术,并通过特征工程全面提取欺诈特征,基于输入的特征组合进行聚类分析、图关联分析等,进而识别欺诈团伙。

新知图谱, 电商羊毛党套路多,半监督机器学习可以做什么?

半监督同有监督机器学习的区别在于,有监督需要大量的黑白标签数据(通常黑白标签数据十万级,其中黑标签数据万级),而半监督相比对标签数量需求较低,但有监督对个体欺诈行为的识别具有较强的优势,半监督更适合团伙型的欺诈行为识别。

半监督同无监督的区别在于,无监督不需要黑白标签数据,相比之下半监督有一定的需求,但无监督更适合相似群体的挖掘,即识别出的群体可能为欺诈团伙,也有可能为正常团伙,而半监督识别的团伙性质更加明确。

新知图谱, 电商羊毛党套路多,半监督机器学习可以做什么?

半监督算法的核心在于欺诈特征的提取,即需要对账号信息、行为信息、设备及网络信息进行特征衍生,结合业务经验、数据挖掘技术等抽取高质量的特征并定义特征权重。欺诈特征的提取直接决定了风险识别的准确率及覆盖率。

2. 半监督机器学习的优势

半监督机器学习的优势主要在于其对风控工作效率的提升,具体表现在三个方面:

  • 新型风险的检测

传统的风控手段主要基于已知的黑产攻击模式,进行风险规则设计,或基于已知标签的训练数据,进行模型开发,而正如前文所说,高额的利润刺激黑产不断变化演进,绕过现有的风控手段,风控人员需要不断更新现有规则体系,或基于新的训练数据不断的优化模型。这一方面造成风控的严重滞后,同时也增加了风控人员工作负担,影响工作效率。

例如风控人员已知一种简单的黑产攻击模式为,程序自动执行同一IP下1天内进行10次交易,风控人员利用规则或学习模型将该类交易拒绝,但当黑产将同一IP下执行10次交易降低为5次时,原有风控手段便失去效用,风控人员需要分析并发现黑产行为的变化,然后通过调整规则或优化模型予以拦截。

而利用半监督机器学习,无论黑产将同一IP下执行交易的次数变为几次,这种自动化的批量行为总会表现出聚集性并被快速有效的识别出来,而且半监督识别团伙时并非基于单个特征相似或相同,而是基于多维特征或特征组合,即在某个维度下相似或相同可能属于正常用户,但多个维度下出现不正常的聚集,那么其为风险欺诈行为的概率就非常之大。这也使得半监督机器学习可以保证高准确、低误杀。

  • 有效的识别伪装

传统的风控手段往往基于单个事件进行风险识别,但黑产技术的不断演进包括模仿正常用户行为的能力,使得风控人员从单个事件或维度上来看,很难甚至无法判断其为正常行为或欺诈行为,极大的增加了风控的难度,造成大量的漏杀。

而半监督将事件进行关联分析,避免孤立的分析,更加有效的识别伪装。例如黑产通过群控技术操作大量真机进行欺诈活动,从单个事件来看,其设备与水平面成80度角摆放,设备各项信息也并无异常,但当和其他事件进行关联时,发现所有的设备均与水平面成80度角摆放,且所有的设备的网络信息属性一致,那么我们有很大的概率可断定其为风险攻击事件。

新知图谱, 电商羊毛党套路多,半监督机器学习可以做什么?

  • 多维信息的综合应用

传统风控手段特别是策略引擎,在进行风险防控时,对同一场景的风险往往需要配置多条规则进行风险拦截,少则十几条,多则上百条,这极大的增加了风控规则的管理难度,当黑产攻击行为发生变化时,需要同时对多条规则进行更新及优化,而半监督机器学习,基于多维信息的综合应用,输出风险识别结果,降低风控规则的人工维护与管理成本,使得风控工作更加快捷高效的完成。

3. 半监督与传统风控手段的结合

半监督机器学习较传统风控手段拥有自己独特的优势,但并不代表半监督可以取代传统风控手段,半监督适合欺诈团伙挖掘,传统风控手段适合个体欺诈的挖掘;二者更像是相互补充、相辅相承的关系。相互结合,既可提高风险识别的覆盖率,也可提高风险识别的稳定性。

新知图谱, 电商羊毛党套路多,半监督机器学习可以做什么?

同盾半监督机器学习的应用

对电商营销薅羊毛场景,同盾半监督产品已具备实时与批量风险检测能力。客户提供账户、行为、设备及网络维度相关信息,数据经过营销薅羊毛检测引擎可输出实时或批量风险检测API结果。批量风险检测结果可用于风险事件分析,输出团伙ID、团伙风险分、风险原因及风险详情字段,可支撑专家策略规则设计;实时风险检测结果可直接应用于决策引擎,与专家策略规则共同对风险进行处置,实现风险覆盖最大化。

此外,为保证风控效果,同盾半监督算法产品会结合客户业务场景,个性化建模,保证风险识别覆盖率及准确率,目前综合多家电商营销薅羊毛场景的半监督风控效果,同盾半监督产品批量风险检测较传统风控可实现额外30%+的风险覆盖,实时风险监测可实现20%+的额外覆盖,精确度均95%+。

当前互联网数据泄漏时有发生、黑产技术不断成熟发展,在经济收益考量下,黑产攻击往往表现出有组织的团伙化行为,这为半监督提供了丰富的应用空间,同盾科技也将持续深耕半监督算法产品,针对不同场景,帮助企业有效应对欺诈风险,为企业发展保驾护航。

相关推荐

更多“电商”相关内容

新知精选