IEEE ICDM 2023 数据发掘研讨顶会闭幕,网易易盾名列前茅

IEEE ICDM 2023 数据发掘研讨顶会闭幕,网易易盾名列前茅

近来,数据IEEE ICDM 2023 图学习挑战赛决赛满意闭幕。发掘本次比赛由蚂蚁集团与浙江大学联合主办,研讨易盾旨在经过深度图学习,闭幕处理社区发现和团伙发掘等危险问题。网易

历时 4 个多月,名列经过初赛、前茅复赛、数据决赛“三级赛制”的发掘比赛和专家评选,网易易盾数据发掘团队在该项使命中,研讨易盾以归纳方针第一名的闭幕成果打败来自海内外的数十支部队,在 Adjusted Rand Score (ARI) 点评方针上到达 0.5006,网易 大幅抢先第二 (0.425)/三名 (0.368) 对手,并于技能辩论阶段凭仗办法立异性、名列工业运用价值等方面的前茅优异体现,斩获大赛仅有一项一等奖。数据

IEEE ICDM (IEEE International Conference on Data Mining) 是全球抢先的数据发掘研讨会议之一,与 ACM SIGKDD 和 SIAM SDM 同列为数据发掘范畴的三大尖端世界会议。ICDM 供给了一个展现原创研讨成果的渠道,研讨规模横跨数据发掘与人工智能范畴,包括算法、软件、体系和运用程序等,招引了很多来自相关范畴的研讨人员和运用程序开发人员参会。

“社区发现”与“团伙发掘”。

本次赛题主题“社区发现”是网络科学范畴的一个重要问题,其首要方针是将给定的图网络区别红若干个相互衔接、内部联系严密的社区,然后提醒网络中存在的躲藏结构和方式。图学习有助于改善社区发现的作用。

社区发现在交际网络分析、生物信息、风控、引荐等范畴有着广泛的运用,例如在风控场景中,将类似用户区别为社区有利于黑产追寻。但是在实践事务中,黑产追寻和团伙发掘使命常常面对缺少很多的符号数据的困难,因而社区发现办法变得尤为重要。

当今交际网络和互联网的快速开展,使得网络中的节点数量和衔接联系快速增长,这也导致了社区发现和团伙发掘问题变得愈加杂乱和具有挑战性。在这种布景下,深度图学习开端被运用于社区发现和团伙发掘,它能够主动学习网络中的高档表征,然后进步社区发现和团伙发掘的作用。

将预练习模型运用于社区发现和团伙发掘是一个相对较新颖且具有挑战性的问题。该使命的难度较大,需求更多的深化探究和研讨。为了鼓舞研讨者在这个范畴运用预练习模型相关技能,本次比赛供给了一个渠道,旨在鼓舞参赛者探究预练习模型在社区发现和团伙发掘中的运用潜力。

“团伙发掘”与“数字内容风控”。

在本届比赛中,网易易盾深化研讨了联系图谱中的社区向量化技能,并创始一种颇具实用价值的欺诈团伙检测算法 ——Risk-DCRN, 经过社区预区别和社区向量化两阶段管道办法,完成了大规模图网络上稀少标签数据条件下欺诈用户集体的高效精准辨认。

差异于业界关于该问题场景的惯例处理办法,该办法的 contribution 首要体现在针对真人做弊场景的绝佳适配,当“人机辨认”被“真人”挑战时,因欺诈者与正常用户的行为鸿沟含糊,业界所运用的图深度学习向量化算法普遍存在表征陷落问题,导致样本 Embedding 倾向于映射至同一特征子空间内,约束了节点表征向量的区别才能,然后影响了终究的网络聚类功能。

为此,易盾数据发掘团队针对该垂类场景,精心设计了一种依据对偶相关性衰减网络 (Dual Correlation Reduction Netework,DCRN) 的稠密子图自监督深度图聚类结构 (如下图所示), 运用于从社区预区别成果中进一步经过稠密危险子图向量的类似性聚类,终究精确发掘出潜藏于巨大联系网中的 346 个欺诈团伙。

该结构包括 2 大模块:。

一、Graph-Distortion: 类似于在 NLP 范畴研讨者经过会随机 mask 掉必定份额字符,网易易盾依据类似性矩阵值小于 0.1 将其置 0 来结构掩码矩阵,使得模型从节点的不同上下文街坊中学习到更丰厚的特征表达。

二、DICR (Dual Information Correlation Reduction): 从样本及特征视角都考虑了相关性的下降,这样能够过滤冗余信息,在潜在空间中保存更显着的特征,然后学习到高区别度的表征,防止溃散,进步聚类功能。

本届大赛要点聚集于事务安全范畴中最经典的团伙检测问题,刚好与网易易盾当时深耕的事务方向严密符合。现在,大规模图深度学习及社区发现等前沿立异技能正在助力网易易盾智能风控拓荒新的商业化增值空间,并于游戏、交际文娱等职业均完成了技能成果事务转化,屡破游戏外挂工作室、交际引流欺诈团伙等集体作案危险,在客户服务层面取得了很多成功实践。网易易盾以体系化的数字内容风控技能为客户供给完成长效运营的根底安全保证。

这也是近半年来,网易易盾数据发掘团队继 AIWIN、数博会等威望赛事获奖后,再次摘得世界研讨尖端会议主办的大数据与 AI 结合的比赛冠军。

未来的浪潮是 AI,AI 的底层是大数据。网易易盾正在用一项又一项厚实的研讨成果夯实 AI 技能在数字内容风控职业的立异运用,认为客户发明更高价值。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等方式),用于传递更多信息,节约甄选时刻,成果仅供参考,一切文章均包括本声明。

Source: 焦点

IEEE ICDM 2023 数据发掘研讨顶会闭幕,网易易盾名列前茅》的相关评论

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注