商业欺诈检测难识别?Arcade Analytics全覆盖!

读芯术 2019/03/27 14:42

全文共 3120 字,预计学习时长 6 分钟

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

欺诈检测,指的是识别企业内实际或预期欺诈的过程。

电话公司、保险公司、银行和电子商务平台是使用大量数据分析技术来防止欺诈的行业例子。

在这种情况下,对于每个企业来说,都面临着巨大的挑战:善于检测已知类型的传统欺诈,通过搜索众所周知的模式,以及善于发现新的模式和欺诈。

我们通常可以根据以下方面对欺诈检测进行分类:

· 主动和灵活的

· 手动和自动化的

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

为什么欺诈检测很重要?

根据普华永道2018年发布的一个经济犯罪调查显示,欺诈涉及数十亿美元的业务,并且每年都在增加:在他们调查的7,200家公司中,有一半(49%)经历过某种形式的欺诈。

大多数欺诈涉及手机、纳税申报、保险索赔、信用卡、供应链、零售网络和购买依赖。

投资欺诈检测可以带来以下好处:

· 及时对欺诈活动做出反应

· 减少欺诈活动的风险

· 减少欺诈造成的经济损失

· 认识易受欺诈影响的弱势账户

· 增加企业股东的信任和信心

一个高明的欺诈者可以破解基本的欺诈检测技术,因此,开发新的检测策略对任何企业都非常重要。欺诈检测必须被视为一个复杂且不断发展的过程。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

阶段和技术

欺诈检测过程以高级数据概述开始,目的是发现数据集内的一些异常和可疑行为,例如,我们可能会有兴趣寻找奇怪的购买信用卡的行为。一旦我们发现了异常,必须认识到它们的起源,因为它们中的每一个都可能是由于欺诈引起的,也有可能是由于数据集中的错误或只是缺失数据。

这个基本步骤称为数据验证,它包括错误检测,错误的数据纠正,以及缺少数据填充。

清理完数据后,可以开始真正的数据分析阶段。分析完成后,必须验证,发布报告和将所有结果以图形的形式展示出来。

总结一下,检测过程的主要步骤如下:

· 数据采集

· 数据准备

· 数据分析

· 报告和结果陈述

ArcadeAnalytics非常适合这种情况,因为它是一个工具,允许创建具有吸引力而有效的报告,通过在复杂仪表板中的不同小部件之间划分数据,以非常简单的方式共享特定分析的结果。

主要小部件是Graph Widget。它允许用户直观地查看其数据集中的连接并找到有意义的关系。此外,可以连接同一仪表板中存在的所有小部件,以使它们彼此交互。通过这种方式,我们将能够在结果仪表板中看到图形、数据表和传统图表小部件之间的双向交互。

它将根据对应的主要小部件的部分数据集计算图表分布,使最终报告动态和交互。

但这并不是全部,Arcade对于数据分析过程中的几种技术非常有用。

数据分析通常依赖于利用统计方法和人工智能技术的自动化过程,这些技术通常被分类为监督和非监督技术。

在统计方法中,我们可以使用:

· 数据处理

· 统计参数计算,与特定领域相关

· 模型和概率分布

· 时间序列分析

· 实体的聚类和分类,以便在数据之间找到关联和模式

Arcade提供了多种工具来执行单系列和多系列分析,利用高效的全文搜索引擎和反向索引,确保在计算整个数据源的统计参数和分布时具有良好的性能。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

信用卡分布

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

全球交易/订单分布

此方法可用于识别统计分类和推断规则:这些规则可用于定义基于规则的分类器,使用If(满足特定条件)和Then(适当类别)规则的监督学习算法。

此外,Arcade为时间序列分析提供了很好的支持:通过使用时间轴功能,你可以以图形的形式查看数据以及它随时间的变化情况。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

通过这种方式,我们可以通过利用时间过滤窗口来分析特定项目或实体之间的关系何时出现,从而将时间分析缩小到特定和可定制的范围。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

然后,你可以通过放大和缩小来与此分析进行交互:通过更改粒度,可以从更宽的视图开始执行简单的时间自上而下的分析,这有助于第一眼看到事件如何随时间分布。

显然,在每个视角中,你都可以随时间来回移动。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

除了统计方法之外,它可能有助于放在自动化流程旁边,例如:

· 数据挖掘。

· 模式识别。

· 机器学习和预测,以实施主动规则。

实际上,这些无监督的方法不需要欺诈性交易的样本,因此,在所有没有事先知道交易类别的情况下或者当我们想要扩展这些类别以识别以前未被发现的欺诈时,他们会变得有用。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

人机 交互的重 要性

通常在这种情况下,我们可以遇到欺诈分析的概念,通常将其视为自动分析技术和分析技术与人机交互的组合。事实上,我们无法摆脱领域专家与用户的互动主要有两个原因:

· 大量误报:实际上并非所有被检测为欺诈行为的交易都是欺诈行为。通常,基于最佳算法的检测系统导致过多的误报,即使它们能够识别实际欺诈交易的高百分比(高达约99%)。因此,必须验证所有结果,以便从第一个结果中排除误报。

· 由于算法的复杂性而导致计算时间过长,特别是在预测场景中:当算法执行时间由于复杂性而呈指数级时,单片执行不是一种好方法,因为它可能需要大量时间来进行大输入。因此,采用渐进方法,包括通过将特定分辨率模型和自动计算与人类交互相结合来减少所请求的计算时间。在计算期间向系统设计者提出中间结果,然后他们决定分析必须以渐进方式进行。通过这种方式,可以省略整个执行分支,从而在性能方面实现了良好的增益。

对于这两个目标,需要一个可视化工具。由于已经显示的功能和图表模型的表现力,Arcade Analytics非常适合这些任务。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

图表视角如何提供帮助

图表透视图在欺诈检测用例中非常有用,因为正如我们已经说过的,大多数计算都依赖于模式识别。然后我们可以使用这些模式来查找和检索我们正在寻找的所有异常行为,而无需编写复杂的连接查询。Arcade基于以下方面提供对不同图形查询语言的支持:

· 模式匹配方法:Arcade完全支持Neo4j提出的Cypher查询语言和OrientDBSQL查询语言的MATCH语句。当我们需要依赖多种模式来检测欺诈时,这是一种很好的方法。

· 图遍历方法:使得探索图表和任何实际感兴趣的信息变得非常简单。Gremlin是这类语言的一个很好的例子。

此外,Arcade Analytics最具吸引力的功能之一是它允许用户从关系数据库中查询数据,以便在其中轻松地将数据可视化为图形并探索其中的连接,无需任何迁移,只需几个简单的步骤。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

现在,让我们来看一个被认为是传统欺诈检测系统经常忽略的潜在欺诈活动的非常常见的模式,以及Arcade Analytics以何种方式帮助我们分析与该特定模式匹配的所有实例。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

第一方欺诈检测

首先,让我们来定义第一方欺诈检测是什么。根据definitions.uslegal.com,我们得到以下定义:

“第一方欺诈是指个人或团体通过开设无意还款账户而在自己账户上实施的欺诈行为。第一方欺诈申请人使用合成身份证明,或者他们通常通过在申请表上向债权人撒谎或使用虚假或代理地址来歪曲其真实身份。第一方欺诈与第三方欺诈或身份欺诈不同,因为在第三方欺诈中,欺诈行为人使用另一人的识别信息。第一方欺诈包括预付款欺诈、破产欺诈、友善欺诈、应用程序欺诈和睡眠欺诈。”

在过去几年中,基于身份盗用的第三方欺诈数量正在减少,而虚假身份和虚假个人信息的案例正在增加。

我们可以假设许多不同的场景可以被归类为第一方欺诈检测,从最简单的到最复杂的。

以下可以是一个简单的例子:

约翰史密斯开设了一个新的信用卡账户,将其信用额度最大化,默认值,然后消失得无影无踪。在这种情况下,史密斯使用自己的凭证,在他的联系数据中有微小的变化,故意欺骗信用卡公司。

但我们也可能遇到一个由两个或两个以上组成欺诈团的人组成的团体,其中有一些合法的联系信息,如电话号码和地址。

这些数据被合并以创建几个合成身份,环成员将使用这些身份来打开欺诈帐户。因此,这个新账户可以使用信用额度、信用卡、透支保护、个人贷款等。

这些账户通常用于定期购买和及时付款,因此,由于观察到的,负责任的信用行为,银行会随着时间的推移增加循环信贷额度。

有一天,账户协调他们的活动,将其所有的信用额度最大化并消失。

然后,可以将此环模式检测为可疑行为,并且如果及时识别和验证,则可以避免重大损失。

以下是Arcade中匹配此环形图案的示例图形实例:

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

可以通过特定查询在数据中查找此模式,将其加载到Arcade Analytics中并由人类专家进行深入调查,以防止此类欺诈。

总之,我们可以说Arcade Analytics可以通过覆盖整个过程中的不同角色,在复杂的欺诈检测系统中做出有效贡献。

新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

编译组:安然、卢佳琦

相关链接:

https://dzone.com/articles/analysis-report-and-results-presentation-of-fraud


新知图谱, 商业欺诈检测难识别?Arcade Analytics全覆盖!

读芯术
+ 关注

更多新知