编者按:假新闻引起的后果不断在美国发酵。Facebook和Google成为了众矢之的。这两家流量黑洞也在努力对自己的引擎进行修补以平息公众的怒气。之前Google已经针对网页搜索出现的虚假内容进行了处理,但是即时新闻和视频搜索仍然是漏网之鱼。彭博社这篇文章聚焦了Google针对这些邪恶独角兽的努力。

Facebook有假新闻的问题。Google有邪恶独角兽的问题。

根据一位前高管的说法,“邪恶独角兽”(Google工程师杜撰的说法)是指有关含糊话题的未经验证的文章,里面充满了谎言。它们时不时会在网上冒出来,设法出现在Google的搜索结果里面。在理想世界里,Google的搜索算法应该强行让这些假的、有害的生物出现在搜索结果很靠后的位置,靠后到被深深埋葬在web的海洋之中,几乎没有人能找到它们。

问题是这个:这些独角兽(不,这跟高估值的初创企业没有任何关系)被设计为凭空浮出水面。而在发生了突发新闻事件之后,比如发生大规模枪击事件之后,Google的引擎并没有足够的信息可以推广。正如Jonathan Swift曾经写过的那样,谎言满天飞,真相在后面一瘸一拐。

营销公司Propecta的搜索专家Nate Dame说:“一旦事件刚开始发生,一切都是新的。没有系统供算法来过滤真相和现实。”

10月1日拉斯维加斯枪杀事件发生后,好几个帐户似乎在共同努力往Geary Danley身上泼脏水,把他错误地认定为枪手,并谎报他的政治关系。当时还没有现成的网页或视频传播Danley是无辜的消息,也缺乏查证过的信息,Google的算法于是就奖励谎言,把不准确的推特、视频和帖子放到了搜索结果的顶部。一个月后,当Devin Patrick Kelley在得克萨斯州Sutherland Springs开枪打死26人时,YouTube视频和推特错误地给他贴上了“antifa”的标签,这是激进的反法西斯抗议者的代指。这是不对的,但Google在显著位置显示这些帖子。

Google搜索高级主管Pandu Nayak表示,在拉斯维加斯枪击事件之后,搜索方面的新策略“实际上工作得很好”,但对Danley的误认是个值得注意的例外。Nayak说:“这个问题不算大,不过我们绝对应该预计这一点,但结果我们没有。”

这是这家公司已经很熟悉的头痛问题。多年来,Google不断在跟垃圾邮件发送者、内容农场以及所谓的搜索引擎优化专家进行类似的搜索结果排名之争并取得了胜利。但是,这些最新的网络操纵者通过盯上Google一个略有不同的地方而造成了更大的破坏,这个地方就是即时新闻和视频结果。

他们利用了Google的一个弱点,这个弱点削弱Google主要价值定位:也就是提供可信的在线信息。当Google对其搜索引擎和庞大的视频平台进行调整,优先把即时和时效性内容变成新闻目的地时,漏洞就出现了。

Nayak说:“错误信息的提供者利用了这些手段使我们的系统复杂化。”

为了跟这个问题作斗争,Google正在对大多数人首先查看突发新闻web结果的地方进行重新调整,他们以前所未有的方式对展示“头条新闻”Google从Twitter抓取的精选帖子的Google Carousel进行精心策划。Nayak说,该公司正在制定方法来限制新闻事件中的虚假内容,但拒绝透露具体细节。 Google也在对视频搜索进行翻修,把YouTube上有关新闻事件的结果限定为经过验证的渠道,并让算法更侧重于这些渠道上。

但靠这些解决方案就能够战胜那些顽固的邪恶独角兽吗?

Google负责搜索公众联络的Danny Sullivan说:“面临的挑战之一是这些小道消息传得太快了。我不知道现在这种消息是不是比过去多。我感觉是这样的。”

Sullivan多年来曾经是Google搜索最重要的编年史作者,也是经常对Google提出批评的人,直到今年10月Google雇用了他。今年4月,Sullivan写了一篇博客,里面详细描述Google最近出现的错误——比如错误的选举结果,质疑犹太人大屠杀是否存在的搜索结果等——并称之为“有史以来最大的搜索品质危机”。当月晚些时候,Google推出了若干旨在解决这个问题的改革措施,其中包括针对模糊查询优先考虑新闻媒体这样的可信网站。

去年美国大选后,Google开始寻求对搜索进行修复。这不是什么新问题。过去,Google的工程师在疫苗和气候变化之争中看到出现了一些丑陋问题。当相信儿童疫苗有危害的人开始写博客发文章时,可靠的来源就变得寡不敌众了;医生没有太多时间去写博客上说明注射疫苗的好处。但事实在网上是找到的,所以Google开始调整搜索结果,为给权威来源分配更多权重。但是事实证明,围绕着新闻所产生的混乱是一场更难应对的挑战。

原因之一是Google已经给搜索结果增加了更多的实时信息。2014年,公司将其新闻结果向个人博客等非新闻出版物开放。一年后,作为将搜索转化为新鲜资讯和直接答案这一更广泛努力的一部分,Google与Twitter达成交易,在查询结果中靠前的位置显示推特内容。

于是一些批评者就在想:为什么该公司就不能将时效性结果限定在已证实的来源上面呢?

Google则担心将网站群缩小到可信网站可能会扼杀web上的小众群体。Nayak举了一个例子:一位不知名的嘻哈艺术家的粉丝可能会对只在小博客上出现的信息感兴趣。他说:“权威来源不会照顾到大家的所有这些长尾兴趣。”

还有,审核新闻来源是一项不受欢迎的任务。批评人士抨击Google和Facebook将特定出版物而不是其他归类为新闻。这是Google的搜索部门非常不愿意涉足的政治泥潭。

做这一行的Dame等人认为,Google通过增加更多的机器学习已经使得这个实时信息问题变得更糟了。在这些系统中软件被受训为自主学习,这与严重依赖收到链接数等因素来定网站权重的搜索算法有所不同。由于这些系统是通过手头的数据来学习的,所以他们更擅长提取与特定搜索词相关的网站,即使其准确性尚未得到证实。

但Google CEO Sundar Pichai今年十月在接受采访时说,机器学习是一项重要工具:“我同时也认为,随着时间的推移,其他试图攻击你系统的不良分子也会利用机器学习,所以我认为用机器学习来做更多的事情是一样重要的。”

在过去的一年中,Google还与多家事实核查机构展开合作,对新闻结果进行认证。这件事在德州枪击事件发生后浮出水面。一开始有关Kelley的虚假内容泛滥使得Google的自动完成功能(基于常见查询提供的搜索建议)在人们搜索他的名字时会提示“antifa”。然而到了周一时,这些搜索生成的排名靠前的结果都是来自经过事实核查的网站(如Snopes)以及解除这两者关联的其他消息渠道(当然,那时候阅读这些新闻的人已经少很多了)。

在YouTube这里,这个问题依然存在。在那里搜索同一个词,一周后搜索结果的第一页除了列出来自CBS新闻、福克斯新闻的视频以外,还有来自阴谋者的视频片段。其中一个是在枪击几个小时后制作的。一个男性声音声称他有“一百项证据”证明枪手是“极左翼份子”和“antifa”。那声音继续说:“如果你喜欢这个的话,务必给我点赞、发表评论或订阅。我一直都在做这些事情。”

但其实他没有。 “The Patriotic Beast”这个YouTube帐号在自己的频道上只发布过两个其他视频,加起来的浏览量还不到500。但是星期天的视频在一天之内就获得了数万的浏览量,这主要是因为它被安排到Google搜索的显著位置。

YouTube副总裁Johanna Wright表示,该公司正在对查询响应进行彻底改变。今年3月,YouTube增加了一个“Top News”板块,内容都是来自于经过验证的渠道,同时还将更多这样的视频放到了YouTube主页上。Wright说:“这些内容我们看得还不够。”展望未来,她表示YouTube将更多地倚重在册登记的新闻机构。但Wright同时也说说YouTube并不想就此抛下YouTube那些无足轻重的发帖者不管。

而且挤走新的较小的创作者对业务并不好。Google需要防止YouTube上的明星转投到Facebook、Amazon或其他地方,搜索有望带来巨大回报是一根大大的胡萝卜。Matt Jarbo以制作YouTube视频为生,他每天都要发布大约三条视频,涉及一系列的主题。在得州枪击案发生的那个星期天,他录制了一段29分钟的视频,里面讲述了关于Kelley的web文章。鉴于这个话题的性质,他特意关闭了在视频中投放广告的能力,但是说这类新闻相关的内容有助于为他那些能来钱的视频带来受众。

除了用关键词填充网页以外,Jarbo说获取关注还有其他一些手段: 描述要详细;针对视频标题和标签,要使用朗朗上口通俗易懂的用词。 为了扩大在YouTube的受众面,他会经常跟踪Facebook和Google上的热门话题以获取灵感。 他说:“讨论这些东西好像有点见不得人。但这就是他们想要的。这就是你要玩的游戏。”

原文链接:https://www.bloomberg.com/news/articles/2017-11-16/inside-google-s-struggle-to-filter-lies-from-breaking-news

编译组出品。编辑:郝鹏程。

如何对付假新闻?谷歌在“权威内容”和“小众消息”的选择上陷入两难

发表评论

电子邮件地址不会被公开。 必填项已用*标注