一项针对数百万条网络帖子的机器学习研究发现了五类基本用户类型,其中包括专爱反驳他人的“抬杠型用户”
在如今碎片化的网络环境中,识别喷子、谣言散布者等有害账号的难度前所未有。
以往识别恶意账号的工作,大多聚焦于分析他们发布的内容。但我们近期研究表明,更应关注他们的行为方式。
我们研发出一套仅依靠行为模式,即用户与他人的互动方式,而非发布内容来识别潜在有害网络用户的方法。相关成果已在近期ACM网络大会(The Web Conference)上发表,并荣获最佳论文奖。
不止看“说了什么”
传统识别不良网络行为的方法通常分为两类:一是分析内容(用户言论),二是分析社交关系(关注与被关注关系)。
这两种方法都存在局限。
用户可以轻易绕过内容检测:刻意隐晦措辞,或在不使用明显敏感词的情况下传播误导信息。
而在海外社交平台上,社交关系分析并不适用——用户间没有明确的好友关联,社区按话题而非社交关系组建。
我们希望找到一种难以被钻空子的有害账号识别方式,最终确定:聚焦行为,即用户如何互动,而非说了什么。
让AI读懂网络行为
我们的方法采用逆向强化学习技术,该技术常用于自动驾驶、博弈论等领域,用于解析人类决策逻辑。
我们将其改造适配,用于分析社交媒体用户行为。
系统会观测用户行为:发帖、评论、回复等,并从这些行为中推断出驱动其操作的底层策略。
在针对海外社交平台的案例研究中,我们分析了6年间590万次互动,划分出五类截然不同的行为人格,其中一类尤为突出——抬杠型用户。
认识“抬杠型用户”
研究中最令人意外的发现,是海外社交平台上存在一类以反驳他人为主要目的的用户。他们专门寻找机会发表对立评论,尤其在争论场景中主动抬杠,发完评论便离开,从不等待回复。
这类用户在新闻、国际新闻、政治等政治相关板块最为集中。有意思的是,在同样偏政治、曾被封禁的支持特朗普论坛中,他们反而很少见。
这一规律恰恰体现出行为分析能发现内容分析遗漏的深层逻辑:在支持特朗普的论坛内,用户高度抱团一致,只对外部群体释放敌意。这也解释了为何传统内容审核难以治理这类社区。
足球迷与游戏玩家
研究还发现了意想不到的关联:讨论话题完全不同的用户,行为模式却高度相似。
足球板块与英雄联盟电竞板块的用户,行为特征惊人一致。
根源在于两类社区的本质属性相同:粉丝都会狂热支持特定队伍、紧盯赛事、激烈讨论战术与选手表现、庆祝胜利、复盘失利。
两个社区都形成强烈的部落式身份认同:维护主队、批评对手。
无论是争论英超战术,还是英雄联盟英雄,两类社区在回复时机、对话顺序、情绪语气等互动模式上完全一致。
这一结论挑战了主流观点:人们常将网络对立归咎于信息茧房,但我们的研究显示,行为模式可以跨越话题边界。让用户分裂的,往往不是讨论内容,而是互动方式。
不止用于识别喷子
这项研究的价值远不止学术层面。
平台管理员可借助行为模式,在用户发布大量有害内容前,就提前识别出高风险账号。
与内容审核不同,行为分析不依赖语言理解,也更难被规避——改变行为模式远比修改措辞困难。
该方法还能助力设计更有效的反谣言策略:不只盯着内容,而是引导更良性的互动模式。
对普通网民而言,这项研究也提醒我们:在网络上,如何互动,和说了什么同样塑造着数字身份,也同样影响着他人。
在网络空间持续面临操纵、骚扰、对立等问题的当下,将行为分析与内容审核结合,才更有可能打造更健康的网络社区。
关闭