虚假账号不断进化，AI能筛选的还是有限

首页 Instagram 作者：coolfensi 2022年03月18日热度：1378 评论：0

时间：2022-3-18 17:32 热度：1378°

　　你的社交平台拥有多少个粉丝？

　　一千？一万？还是更多？你知道其中存在多少个“僵尸粉”吗？

　　近日，据美国权威科技媒体The Information引述研究机构Ghost Data的报告称，2020年，Instagram平台的僵尸账号占比为7.9%，到目前已经攀升至9.5%。Instagram的阅读用户已经增加到了十亿人。根据上述比例，Instagram平台上现在大约有9500万个僵尸账号。

　　有媒体评论指出，如此规模的“僵尸账号”，让Instagram成为下一个互联网行业打击假新闻、假信息和政客营销的重要阵地。

　　为什么这么说，恐怕得看看“网络水军”在近些年的“杰作”。2021年，至少有18个国家在选举中遭遇了线上操纵和虚假信息策略，包括德国联邦总统选举期间社交机器人活跃和垃圾新闻频出等。

　　显然，治理“网络水军”已成为全球难题。而由于其分散、量大兼具技术隐蔽性，对其的治理更需要讲究专业化和智能化。此时，人工智能也派上了用处。

　　道高一尺，魔高一丈，虚假账号与AI的斗智斗勇

　　从创建应用软件、官方网站或内容传播平台，到生产具有实质性内容的图像、视频或文字，通过或真或假或自动地与用户交互，虚假账号已经越来越“真实”。就在去年，有研究表明，连人工智能都可以被用来生成复杂的点评信息，而这些虚假的点评不仅机器无法检测出来，就连人类读者也分辨不出来。

　　虚假账号不再“虚假”，整个社交网站都面临着潜在却严重的冲击。智能相对论（aixdlun）分析师颜璇梳理了三种智能“鉴粉”方式，分别囊括了用户行为、内容和情感特征三种形式，试图解决这一问题。

　　首先是用户行为特征的分析。这种方式大多依托于爬虫技术，即通过主动爬取特定微博或者论坛的主体相关的注册行为、社交行为、转发与评论等行为,从而进行多维特征向量刻画。同时，有研究者还采用了隐马尔可夫模型来对用户行为进行建模，利用模型参数来对用户行为进识别和分类，毕竟“僵尸”掉进了“植物”里，总是有区别的。

　　这主要是利用账号之间的社会关系来识别那些“僵尸号”。而面对这种方式，水军们也“与时俱进”，比如一些职业差评师的账号在注册行为上就无懈可击，他们的账号一般会同时配备有身份证、用户手持证件照、实名手机号码卡、实名银行卡等，还能通过作弊软件骗过实名认证系统。即使是微博里的“僵尸粉”，也会存在一些粉丝关系。

　　第一种方式被“见招拆招”，AI也不得不拿出第二种方式，即对内容特征的分析。基于内容分析的识别技术主要从发帖内容本身切入,建立“僵尸粉”、恶意或者美化信息等本体模型,同时建立敏感语义库，通过语言特征统计区分虚假账号。

　　但是，由于语义领域的不统一性，同一本体在不同领域，甚至同一领域都会存在很多象征意义的现状，比如用户在讨论某手机时，提到“这手机的上网速度真快”，“快”是一种夸赞，如果说“这手机耗电速度真快”，“快”又变成了一种批评。因此，内容特征模型在不同的情况、平台上都会有较大的变化，这也造成了AI分析内容特征进而识别“僵尸粉”的通用性较差的问题。

　　如此来看，基于单一特征对虚假账号进行识别还是比较困难的，因此，AI也不得不开始思考第三种方式。第三种方式源于第二种方式，即对内容中情感特征的分析。

　　有研究者通过分析推特内容中的情感，发现在线社交网络中的内容创建、传播与证券市场波动、期货商品价格及国家、社会重大事件之间有着紧密的联系。这也表明情感倾向是社交网站内容中的重要特征。

　　而水军也往往带有强烈的感情色彩（好评或差评），针对单个发帖的情感倾向性，AI可以设定一个阈值，若对某个主题发表的正面或者负面帖子比例超过设定阈值,，则认为该用户为水军。

　　但是，用于虚假账号监测的内容和情感特征的融合，属于比较明显的特征，而忽视了隐藏式的异常用户，比如用户上传与文字内容没有任何关系的图片，抑或者用户评论情感与用户打分不匹配等新特征。

　　当网友对水军开始麻木，活着的水军其实已经死了

　　事实上，网络水军要想操作舆论，只需要错开发帖时间、编辑同一核心的不同文字内容就可以了，虽然这样做的成本会高一点，但是具体操作起来也不是什么高难度的事情。如果有人真心实意想要给某个作品一个差评，人工智能还真不能立即判断出他是真实用户还是水军。

　　那我们就拿这些虚假账号没办法了吗？

　　新浪微博里首个突破一亿粉丝的女艺人，我们不会真的相信是有一亿个人关注了她；一部好电影上映，众口皆碑下也不会有人在意零星几个差评；百分百好评的商品，消费者也会对其持有怀疑；疫苗事件后，网民对调查记者的呼唤，其实是一种自我保护……不得不说，中国的舆论形成和监督机制正在翻新，水军操纵舆情的力量也越来越弱。

　　以最近的疫苗事件为例，在事件刚爆发时，也不乏一些别有用心的人，整理出一些儿童因疫苗残疾的图片，却不做任何文字说明，引起了许多人的恐慌和愤怒，但是笔者在其中还是发现了许多比较理性的言论，表明疫苗的不良反应也是客观存在的，这类危言耸听的做法反而会阻碍健康疫苗在国内的普及。

　　目前，网上对疫苗流向的追问，有关人员的责问，各种po文有理有据，也是众多网友理性思考后的结果。

　　所以，尽管虚假账号的痕迹越来越隐蔽，但网民们的理性和成熟也在不断加快，更多网民也不再盲目轻信，反而会批判式地去看待每一个舆论观点，从情绪化到更加理智，从感性到理性，社交软件上的观点已经越来越多元化，网络水军也越来越难以左右舆论走向。