YouTube刷观看量 --油管新闻
Google现在将原本应用在Gmail和Android上的智能回复功能(Smart Reply)扩展到YouTube Studio上,供创作者能够更方便地与观众交互。目前这项功能还只支持英文和西班牙文,但Google提到,由于使用单一跨语言的模型,因此能够简化扩展至其他语言的过程。
智能回复是运用人工智能技术,产生回复消息建议选项给用户,用户能够直接使用或是修改,以快速回应来讯,Google提到,由于YouTube创作者会在视频下收到大量的回复,而且观众可能来自不同的社群,智能回复功能协助创作者回应观众的评论,以及进行讨论等交互
不过,应用在Gmail和Android的智慧回复模型并不能直接搬到YouTube上使用,因为电子邮件的用语通常更为正式严谨,YouTube的评论存在更复杂的语言切换模式,并大量地使用表情符号,且观众对缩写、惯用语以及标点符号使用习惯不一致,这些原因都让Google在YouTube中添加智能回复功能充满挑战。
最一开始Google在Inbox应用程序中提供的智慧回复,是使用递归神经网络逐字对输入的电子邮件进行编码,并使用另一个单词等级的递归神经网络以解码可能的回复,Google提到,这种方法的计算成本很高,因此后来Google设计了一个检索系统,通过搜索预先定义的建议列表,找出最适当的回应,就能以更少的计算达到相同的功能。
这个检索系统让Google得以将智能回复功能扩展到Gmail,并且也成为了当前YouTube中智能回复的基础,不过,过去的智慧回复系统依赖单词等级的预处理,这种方法只在有限的语言以及较严谨的写作风格有用,但YouTube中存在太多表情符号、ASCII艺术和语言切换等异质内容,因此Google决定在YouTube使用案例中,不在编码文本前进行任何预处理,而研究也证明,Transformer网络能够对字符长串行进行建模,并获得与基于单词的模型相同的品质。
虽然这个初步结果,对于处理带有表情符号或错字的评论,有很不错的性能,但是因为Google是以字符长串行直接进行建模,比单词还要长得多,因此运算也更复杂,使得模型预测速度无法用于生产环境中,后来Google借鉴信号处理模型WaveNet中的膨胀技术,在神经网络的每一层都缩短一点字符串行长度,最终在运算速度和品质中取得平衡。
Google没有为每种语言都训练单独的模型,而是训练一个跨语言的模型,Google提到,单一跨语言模型能够更好地处理YouTube评论中语言混用的情况,并使得模型能够利用一种语言中常见的元素,来理解另一种语言,而且只用一个模型,就能够简化维护和其他后续的工作。
目前这个模型已经能够支持英文和西班牙文,但是其灵活性也能够扩展支持其他语言,这种特性在Google还没用平行语料库训练模型就已经出现,把模型对英文评论这是一个很棒的视频的回复进行分群,阿拉伯文、英文和西班牙文相近的回复,在图表的距离相当接近,不同语言但意义相似的回复,会在图表中出现跨语言的聚类。