脸书电商--脸书刷赞
今年3月底爆发的剑桥分析(Cambridge Analytica)丑闻闹得沸沸扬扬,除了该公司不当取得脸书8,700多万用户的个资而受人挞伐,这家公司以投放假新闻、来影响美国政局的作法更遭人非议,甚至剑桥分析后来因此侵犯隐私争议,而宣告破产。为何剑桥分析就算违法也要蒐集脸书资料,它如何利用这些脸书个资来左右广大民意、甚至影响美国大选?
剑桥分析如何取得海量facebook个人资料?
其实剑桥分析自2013年成立以来,就不断在蒐集个人资料。该公司前CEO Alexander Nix曾公开表示,剑桥分析跟地政机关等不同单位购买个人资料,而个人资料范围则涵盖车辆资料、购物资料、礼金卡资料、会员明细,甚至还包括你看的杂志、去做礼拜的教堂。
然而,剑桥分析能够取得大量脸书用户个资的关键源头,得从2010年谈起。当年4月,脸书开放了 Graph API 1.0,这是允许第三方业者、外部App开发人员来取得脸书用户在脸书平台上活动资讯的API,只要经用户授权后,第三方就能存取用户个资、数位足迹和个人喜好等,但更重要的是,开发人员还能一併取得这些用户好友们的各种资料,而不需要进一步获得这群好友的授权。这个API的权限设计,就是让剑桥分析后来能够取得大量脸书用户资料的关键。
因为剑桥分析取得海量脸书个资的关键,与剑桥大学的心理学系教授Aleksandr Kogan有关。他在2014年时开发了一款心理测验App名为thisisyourdigitallife,自己付款,透过Amazon群众外包平台Mechanical Turk,找了27万名脸书用户来玩这款心理测验App。
只要有300个赞,电脑就能比你的配偶更了解你
不过,光有海量资料还不够,剑桥分析为了要精准投放假新闻来影响投票决定,还必须先了解选民的个性才行。在选举操作上,人格特质分析理论和技术早已相当盛行,剑桥分析自己也有一套预测选民特质的心理分析方法。
不过,2015年刊登在美国国家科学院院刊(PNAS)的一篇研究论文,引起了高度关注,更成了剑桥分析能够影响美国大选的关键理论参考。史丹佛大学电脑科学家Michal Kosinski和剑桥大学心理系研究员Wu Youyou联手,在2014年展开一项人格分析预测研究,想要利用电脑技术自动判断人格特质,来和人类自填问卷的传统作法相比较。
这项研究虽然以1980年代出现的传统心理学OCEAN五大人格分析为基础,但这两位学者改用脸书按讚资料来建立一套自动归类和预测人格特质倾向的模式,不只相当新颖,他们以电脑预测人格特质的作法,还比过往研究,更贴近自填问卷的结果,甚至有极高的预测准确度。
在这项研究中,研究员总共找来86,220名志愿者参与,请志愿者做 100道心理测验题,并依此评定他们在IPIP五大人格量表中的分数。IPIP是以传统心理学OCEAN人格分类法,将人格分为以下五类:开放性、严谨性、外向性、亲和性,以及神经质。参与测验的志愿者,在每一性向都会得到一个反应其程度的分数,比如开放性2.1、严谨性4.2等。
有了IPIP性格分析的分数后,研究员再请这群志愿者,玩一款脸书心理测验App:myPersonality,经授权后取得他们脸书「讚」的资料,特别是他们对哪些人、事、物和议题按讚,比如跑步、跳舞或欧巴马等,而研究人员也把讚的数量纳入考虑。接著,研究人员列一个矩阵,将这些结果以0和1来表示。举例来说,假设1号志愿者对欧巴马按讚,那麽对应的数字就是1。
有了这些数据和先前IPIP五大人格量表的分数,研究人员将志愿者分成两群,把90%的志愿者资料作为训练资料,建立数套LASSO线性回归模型,然后以这些资料来训练、优化模型。而其馀10%志愿者的资料,则作为验证用的实验组,用来检验这些预测模型的准确度,而不列入训练模型之用。
之后,研究人员根据其馀10%志愿者脸书讚的数据(也就是从他们对哪些人、事、物按讚),来回推、预测这些人的IPIP五大人格分数。同时,研究人员也请这10%志愿者的关系人,包括同事、家人、同居人和配偶等,来预测这些志愿者的IPIP人格量表分数,然后再将电脑的预测结果,与这些关系人的预测相比,最后也跟志愿者自填的数据比较,来看是电脑预测的比较准,还是实验组的朋友的预测比较准。
研究结果发现,使用越多按讚资料来建立的模型,人格预测的准确度也越高。甚至,一个人只要蒐集到65个按讚纪录,模型预测的准确度就和他的朋友一样,若是蒐集到300个按讚记录,电脑对实验者的人格预测,则会和他的配偶一样准确。也就是说,这套模型只要蒐集到300个以上的按讚记录,就能比另一半更了解你。除此之外,这份研究报告还发现,这些模型对于一个人生活状态的预测,也能有不错的外部效度,也就是更擅长预测一个人的药物使用倾向、政治立场和身体健康等。
这项研究一公布,作者之一的Michal Kosinski马上接到两通来自脸书的电话,一通是要对他提起诉讼,另一通则是要聘请他替脸书工作。这正好反映出,脸书对这份研究的高度重视,暗示不来帮我工作,我就要告你。
这项研究不只引来脸书关注,先前那位剑桥大学教授Aleksandr Kogan也曾希望取得Michal Kosinski的授权,让他使用这套分析技术,但Michal Kosinski拒绝了。不过,Aleksandr Kogan后来还是以类似原理,来分析自己从thisisyourdigitallife心理测验中、所取得的脸书用户资料,而这套人格特质的预测模型,最后也随著用户个资,一起落入剑桥分析手中。
剑桥分析取得大量脸书个资后,也将新技术结合自家旧有的分析技术,加强OCEAN人格分析效用,来进行精准行为投放。剑桥分析前CEO Alexander Nix在2016年时说道,自家公司的人格模型,能给美国每位成年人建立人格档案,「而且每个档案都有4、5千个资料点」。他也表示,当时剑桥分析已建立美国2亿2千万个选民的档案。
掌握了这些选民每一个人的情报之后,剑桥分析就能进一步开始针对不同区域和对象,来散播假消息,包括透过脸书、Twitter、YouTube或搜寻引擎广告等,来试图影响美国大选选情。