欢迎来到CL境外营销平台,平台经营Instagram、Facebook、YouTube、TIKTOK、Twitter粉丝、点赞、播放量服务、客服微信:coolfensi 24小时在线欢迎咨询购买!
公告:
欢迎来到CL境外营销平台,平台经营Instagram、Facebook、YouTube、TIKTOK、Twitter粉丝、点赞、播放量服务、客服微信:coolfensi 24小时在线欢迎咨询购买!

Facebook境外推广--脸书刷观看量

首页 Facebook   作者:coolfensi  2022年10月13日  热度:53  评论:0     
时间:2022-10-13 22:05   热度:53° 

NewsFeed 是不是来的

2004年,Facebook 面世,两年后的9月份,NewsFeed 面世,与此同时面世的还有MiniFeed(个人静态)。今年是 NewsFeed 上架二十周年了,这10年里,Facebook 是是不是一步棋一步棋把 NewsFeed 打造成了日收入几百亿美金的钱款牛的?不管你对这充满著贪著的难题感不屑一顾,再说我颇感浓厚兴趣。

今天他们都早已生活习惯了把相片、文本等内容主动撷取给挚友,但当时 Facebook 上架了那个机能时,引发了广泛的争论,关注点就是个人隐私难题,采用者认为我发的静态是不是能让别人看见呢[1]?采用者始终时不时批评和示威,又禁不住继续采用,Facebook 就这种在争论声中增加了起初的个人隐私控制,比如暗藏自己的静态,而 NewsFeed 就这种秉持了下来。看来,小扎真是一个撩妹剑客,看破了采用者们嘴上说不要,身体却正直的外在。

随着采用者们慢慢地圣戈当斯区了下载挚友的分(xuan)享(yao)了,2009年,Facebook 加上了赞(like)机能(FriendFeed 在2007年发明者了赞按键,FriendFeed 后来于2009年被 Facebook 收购,并将赞那个机能资源整合进来),开始依照炙手可热程度对 Feed 重次序,一切顺利,这又引发了采用者们的反叛,因为大家早已生活习惯依照时间次序写作。

充斥这么多争论,为什么 Facebook 始终秉持做浓厚兴趣feed?从数据上看,平均值每一采用者每晚待看的可说有1500条之多,但平均值每一采用者每晚只能写作300条;从商业角度,将 Feed 次序交予天主的作法,非常有利于商品化且有辱采用者新体验,公用网页能采用许多骗术吸引采用者关注,然后明目张胆发电视广告。

10年来,NewsFeed 有许许多多的改良,甚至每晚圣戈当斯区会与此同时布署许多演算法版进行AB试验。但 EdgeRank 是这条强化插值之路上的一个举世闻名建筑。他们能将 NewsFeed 次序策略依照 EdgeRank 分为 PreEdgeRank 黄金时代、InEdgeRank 黄金时代、PostEdgeRank 黄金时代。

EdgeRank 演算法

EdgeRank,顾名思义,就是对边(Edge)进行次序(Rank)[2]。

别看今天 Facebook 各种高大上,又是深度学习又是人工智能,要知道,在 EdgeRank 提出之前,FB 也是有过刀耕火种黄金时代的,FB 的首席产品官 Chris Cox 谈及早期 NewsFeed 是这种说的[3]:

In the beginning, News Feed ranking was turning knobs. Turn up photos a little bit, turn down platform stories a little bit.(起初,NewsFeed 次序就是在主观拍脑袋,给相片加点权重,给平台静态消息降点权重)

a photo might be worth 5 points, while joining a group was worth 1 point (把相片权重定为5,把加群权重定为1)

国内演算法工程师们听到这些,想必都要会心地笑了:原来 FB 也是从那个黄金时代走过来的。但 Facebook 不同的是,这只是暂时的情形,他们早已走到更高级的阶段了。

Serkan Piantino 在2010年左右领导并开发了第一版 EdgeRank 演算法[4]。下面说说大名鼎鼎的 EdgeRank 是是不是回事。

EdgeRank 主要有三个因素在起作用:

  • 亲密度(Affinity Score)

  • 边的权重(Edge Weight)

  • 新鲜程度(Time Decay)

想象一条内容诞生后,途经什么路径流动到你的面前?

  1. 然后经过你那个朋友(或者你的关注源)的介绍,到了你家门口,你一开门(登录)就可能看见它;

  2. 内容不多时,开门一个一个寒暄可能还行,它们也等得起,也无所谓先来后到,内容太多时,就得考虑个先来后到了。

这三个步骤,就大致刻画了 EdgeRank 的思想了,其实还是很简单直接的。

亲密度对应了第二个步骤背后的思想,那么多人介绍过来,他们当然要优先照顾更喜欢的人了,亲密度的量化要考虑平常里你和那个朋友走动是否频繁,连接是否紧密。主要考虑下面几点:

  1. 你们连接的强度,点赞之交,还是评论之交,或是私信之交,连接方式不同,强度就不同;

  2. 你们连接的频繁程度,一日百赞,还是百日一赞,差别也很大;

  3. 你们有多久没有建立连接了,一年没有了,关系自然就更淡了;

  4. 亲密度是单向的,也就是说你对朋友的亲密度,和朋友对你的亲密度可能不一样哦。

你看,看似神秘的 EdgeRank 演算法,其实跟大家不太待见的鸡汤居然意思是一样的,是不是觉得它竟然如此平易近人?

最后,新鲜程度,也是一个符合直觉的自然假设:NewsFeed 总是青睐 New 一些的 Feed,新的可说总体上更可能得到采用者的临幸。FB 用了一个类似指数衰减的函数来量化静态的新旧程度。

三个分数,最终用相乘的方式共同作用于每一条可说的分数,用于次序和筛选。

那个次序方法的确是很简单,基本上只考虑了社交方面的因素,而没有考虑太多内容本身对采用者吸引力。

从公开的资料看 EdgeRank,并不是什么高深的演算法,它只是量化了三个主要因素,然后主观地相乘,而没有任何目标强化思想在背后,根据 Facebook 披露的消息看,早期的 EdgeRank 的确没有引入机器学习,所以根本称不上是智能的演算法。

为什么 EdgeRank 这么有名?因为它是在F8开发者大会上公开介绍过的,经过一知半解的媒体渲染,变成了一个神秘高深的存在。

后 EdgeRank 黄金时代

2011年之后,Facebook 内部就不再提 EdgeRank 演算法了,因为采用者数和电视广告主的飞增,导致 NewsFeed 的次序演算法必须要更上一层楼。如今月活跃超过10亿采用者,约2000万的公用网页,移动设备贡献了大多数流量,复杂的上下文因素,必须引入机器学习才能 Hold 住整个场面。

在原来 EdgeRank 的基础上,更加细致地定义了不同层级的亲密度。用深度神经网络理解图片内容和文本内容[5],从而能知道相片中的物体是不是采用者感浓厚兴趣的,能知道可说的讨论话题。随着产品插值,也加入了更多产品特征,诸如写作时间长短、视频内容、链接内容等,取关、暗藏一个源。前前后后一共考虑了10万+的变量(模型的特征空间应该会更高),如果还依照原来的方式去调节权重,显然既不科学又很低效。

从 Facebook 的机器学习应用博客页面能看到,2010年之后就开始逐渐有机器学习方面的文章出现了[5]。

相关资料显示[6],2011年之后的 NewsFeed 次序演算法,全面转向了机器学习,用强化理论来决定每一因素的权重,将人从繁杂的策略量化中解放出来。

在被机器学习接管后的 NewsFeed,许多地方都更加细致。

用机器学习预估可说的质量[7]。通过构造了一份问卷调查,访问了若干采用者来收集数据,用收集的数据构建了一个机器学习模型,用于 NewsFeed 次序时预测一条静态的质量,将预测的质量分数作为最终次序的一个特征。用树模型构造离散特征,结合最常见的LR模型预估电视广告点击率[8]。

仅举几例:

  • 团队发现有85%的暗藏可说操作来自5%的人,经过与这些采用者沟通才发现,原来这5%的人把暗藏当作邮件里的标记已读了,对喜不喜欢的可说只要看过就会点击暗藏。

  • 对于悲伤的事情,采用者可能关心但不会点赞的。

  • 对于有些点赞,采用者可能并不是真的感浓厚兴趣,只是点赞狂魔发狂而已。

  • 采用者写作一篇长帖子,读到一半不读了,也并不能说明他对这篇帖子不屑一顾。

这些 case,都让他们开始关注到机器学习和数据的局限[9]。

于是,在演算法团队之外,Facebook 搭建了一个遍布全球的人肉评测小组。人肉评测小组不是简单地对演算法筛选结果进行喜欢/不喜欢的标注,而是会非常深入地阐述为什么喜欢/不喜欢演算法筛选结果,而且会与工程师详细交流评测结果,因为这种人肉评测方式能有效地拆穿数据说谎,让产品远离一味追求提高数据指标的怪圈。

如何衡量采用者真的感浓厚兴趣那个难题也许远远没有最终答案,为什么?因为人的非理性占据了绝大多数时候,而不一致性又是非理性的最重要表现,根据心情不同,采用者有不同的感浓厚兴趣的标准,而且这些标准也许还是相互矛盾的。

NewsFeed 的配套设施

NewsFeed 存在的前提是要依赖采用者建立大量的社交联系,这种才会出现信息过载,因此 NewsFeed 的一个重要的配套设施就是你可能感浓厚兴趣的人(People you may like)推荐系统。

这是一个他们在产品形式上比较熟悉的推荐系统,它是一套大规模矩阵分解演算法[10],利用已有的协同矩阵为你推荐你可能想建立联系的新Item,包括采用者、app、公用网页等。

NewsFeed 还有另一个配套设施,也是它为什么每晚能吸金几百万刀的原因:电视广告系统。Facebook 的电视广告形态多样[11]:

  • Suggested Page (你可能喜欢的公众页)

  • Page Post (公众号帖子推展)

  • Suggested App (你可能喜欢的应用)

  • Video Ads (视频电视广告)

现在,每一次 NewsFeed 调整演算法都会引来电视广告主们的示威,他们都是在 FB 上拥有公用网页的商业机构。

在以前,FB 鼓励这些商业机构花钱投电视广告增加粉丝,彼时的 NewsFeed 演算法允许随意发电视广告(以原生的可说形式)。而现在,FB 严格限制商业电视广告和普通采用者的触达。商业机构感觉自己被耍了,花钱买粉之后却不能发原生电视广告,无独有偶,根据微博 CEO(@来去之间)在微博上的披露,现在微博企业号也是被限制博文达到粉丝 feed 次数的[12]。

据国外某专门做 NewsFeed 推展的公司追踪,1000个公用网页的50000条内容以原生方式触达采用者的比例,从2012年16%降低到了2014年的6.51%,降了一倍还多,这当然也可能因为采用者平均值关注的公用网页增多了[13]。

世界上最遥远的距离,就是:手握大把粉丝,却不能随心所欲地曝光自己的产品。

当然,所有的公用网页们,不要灰心,并不是没有办法,NewsFeed 的电视广告系统大门永远向你们敞开。

对 NewsFeed 的展望

具体 NewsFeed 会是不是发展,无法预测,但能肯定的有三点:

  1. NewsFeed 的演算法会始终进化下去。

  2. NewsFeed 团队把人和演算法的关系处理得更好,从数据驱动(Data-Driven)到数据启示(Data-Informed)。

  3. 越来越多的 Feed 型产品会效仿 NewsFeed,加入到浓厚兴趣feed的潮流中去。

本篇完。敬请期待下一篇《Pinterest 的 Smart Feed 架构与演算法》。

[1] https://en.wikipedia.org/wiki/Criticism_of_FacebookNews_Feed_and_Mini-Feed

[2] http://edgerank.net/

[3] http://marketingland.com/edgerank-is-dead-facebooks-news-feed-algorithm-now-has-close-to-100k-weight-factors-55908

[4] https://research.facebook.com/serkan-piantino

[5] https://research.facebook.com/publications/machinelearning

[6] http://www.dailydot.com/technology/facebook-news-feed-algorithm-edgerank/

[7] https://www.facebook.com/business/news/News-Feed-FYI-Showing-More-High-Quality-Content

[8] https://pdfs.semanticscholar.org/daf9/ed5dc6c6bad5367d7fd8561527da30e9b8dd.pdf

[9] http://www.slate.com/articles/technology/cover_story/2016/01/how_facebook_s_news_feed_algorithm_works.html

[10] https://code.facebook.com/posts/861999383875667/recommending-items-to-more-than-a-billion-people/

[11] http://zhihu.com/question/20553088/answer/78721851

[12] http://weibo.com/1111681197/D0qNcDlcc

[13] http://techcrunch.com/2014/04/03/the-filtered-feed-problem/


本文为系列文章之一,包括:

  1. 为什么应该关注浓厚兴趣Feed?http://mp.weixin.qq.com/s?__biz=MzA4OTk5OTQzMg==&mid=301747344&idx=1&sn=e34dbb820115995eac7502c98e894e05rd

  2. 说一说 Facebook 的 NewsFeed(本篇)

  3. Pinterest 的 Smart Feed 架构与演算法

  4. 通用浓厚兴趣Feed的技术要点


作者简介:陈开江@刑无刀

  1. 2013年之前在新浪微博搜索部和商业产品部任资深演算法工程师,先后负责过微博反垃圾、基础数据挖掘、智能客服平台、个性化推荐等产品的后端演算法。

  2. 2012-2013领导翻译了《机器学习:实用案例解析》一书。

  3. 2013年末加入传统媒体公司车语传媒,任演算法主管,负责从零打造公司转型产品考拉FM的个性化推荐系统,如今个性化推荐已成为考拉FM与其他FM之间最大差异化特性。

  4. 2015年初,离职创业,公司拿到IDG和晨兴资本的天使投资,产品几经调整,如今专注在用视频撷取购物经验,App名称:边逛边聊。