1号风向 | 注定不一般,谷歌助力「原创报道」C位出道
2019/9/30 20:31:15传媒1号-1号风向 传媒1号

    

     今天是「1号风向」第176篇文章

     1号按

     现在是新闻爆炸的时代,某个主题的原始报道会成为焦点,进而产生更多的后续报道或是转载,而带来这些焦点的原创新闻却在短暂的曝光之后,被后续大量出现的内容淹没。对此,谷歌将使用算法对网络内容进行排序,并以各种方式组织这些内容。谷歌表示,它已经对算法进行了修改,以突出显示「原创报道」,并让它在搜索结果的顶部停留更长时间。

    

     图片来源:Search Engine Land

     本文围绕一份采访内容展开,通过GEN与谷歌的新闻副总裁Richard Gingras的交谈内容,以了解该算法将如何工作,以及人类将在这一过程中扮演何种角色。更重要的是,本文讨论了相关问题和潜在的意想不到的后果——谷歌如何对新闻媒体进行排名和评级?谷歌对「信誉良好的来源」的标准是否有利于大型新闻媒体,从而加剧出版商之间的不平等?

     关键词:原创报道;信息爆炸;Google;算法;新闻媒

     原文来源 |Medium

     原文作者 |Ana Lomtadze

     原文发表时间 |2019年9月19日

     译者 |刘蔚蔚

    

     图 / 谷歌的新闻副总裁Richard Gingras解释了新搜索算法的广泛含义

     图片来源:Google Image

     GEN:一段时间以来,新闻机构一直要求提高谷歌搜索排名的透明度。为什么要花这么长时间来改变搜索算法,并优先考虑「原创报道」?为什么做出这个改变?

     Gingras:理解和承认原创报道一直是谷歌的首要任务,并将继续如此。在谷歌从事新闻工作的10年,现在的技术水平比过去更加成熟。我们学习、与记者讨论、发展新的模式、进行实验和测试。这建立在谷歌搜索过去的基础上,并且始终是一个正在进行的工作。

     我们拥有来自世界各地的世界级工程师、产品经理组成的团队。他们对自己的工作充满激情,并违背既定的目标、原则和道德规范。这是至关重要的,因为我们的排名判断必须是合理和站得住脚的。

     同样重要的是,要认识到这不是一个任何人都可以简单修复的「问题」——这不是缺少「if, then」语句或需要消除的bug。我们的努力是一个持续的进步,我们了解一个新闻故事,然后使用这些输出来正确地服务于我们在全球范围内的的用户。

    

     图片来源:Google Image

     处理原创报道的第一步是理解一个不断发展的故事的变化,并理解本质——附加的基于事实的报道?分析?评论?新媒体?还是其他?表示原创报道的「信号」是什么?还是原始报告的组成部分?它有一些或许多引用吗?这些引语与其他故事是唯一的还是多余的?是否有进一步的「事实」信息和(或)相关分析?是否有其他当事人的过错?

     不久前,我问一位优秀的新闻编辑——我们如何识别原创报道?他笑了笑,回答道:「这是我们花了很多钱买的东西!当然,这既不是可检测到的信号,也不是质量的保证。事实上,能够描述原始报告的定义是很棘手的。它对不同的编辑和编辑室在不同的阶段有不同的含义。人们说当你看到它的时候你就知道了,因此,你怎么把它转化成一个算法呢?」

     我深入研究这个细节,是为了缩小新闻业与我们这些管理和发展算法系统的人之间相互理解的差距,使得更多的新闻作品得到充分的放大。我们的目标是为用户提供最好和最有帮助的结果集。

    

     图片来源:FoneArena

     GEN:承认原创报道是一回事,「确保它在那里停留更长时间」是另一回事。谷歌算法如何在源源不断的新故事中保证这一点?

     Gingras:在某些情况下,一份原创报道被确定,我们需要确定如何最好地对其进行排序和呈现。在无查询的feed环境中(谷歌News、Discover等)与及时搜索查询(头条新闻)、不及时搜索查询(更长期存在的有机结果)非常不同。每一种都代表着新鲜和权威的不同和复杂的变化。

     典型性的人物在一个突出的位置停留的时间会随着故事的时间和发展而变化。这个故事的核心主题是持久的,还是随着其他内容的覆盖而改变?这个故事是由于它的报道被认可,还是因为你在质疑它?搜索的方式能够增加结果放置在页面上的可见性,给予它们更多的保质期,来确保可发现性的原创报道实例。

    

     图 / 自本世纪初以来谷歌是如何改变其算法的

     图片来源:Fifty Five and Five

     GEN:你指出「对于原创报道没有绝对的定义,也没有一个绝对的标准来确定一篇文章的原创程度」,那么,新算法将如何处理这种模糊性?谷歌的原创报道「必须满足」哪些标准?

     Gingras:和往常一样,我们将探索「有用的信号」,测试它们,并评估结果。我们与编辑和记者进行了多次讨论,征求他们的意见。我们非常谨慎地分享特定信号的信息,因为系统不断地参与和改进。在我们自己的分析之外,我们的努力的有效性将由其他人来判断。

    

     图 / 谷歌主导着美国搜索引擎市场

     图片来源:Medium

     GEN:评分者对于消息来源的准则强调了「新闻奖」(尤其是普利策奖)等标准。谷歌的新算法可能会无意中有利于大型、成熟的媒体,从而加剧出版商之间的不平等。你将如何减轻这种风险?

     Gingras:新闻奖项是一个标准,但只是众多标准之一。长期以来,它们一直是我们的评分指南的一部分,不应该被解释为明确信号。最近对指南的更新特别增加了原创报道作为独立于任何奖项的高质量新闻的另一个特点。

     此外,评分者并没有对故事进行实时评分,也没有对故事进行排序。我用了「公平和公正」这个词。我们满怀激情地相信,互联网已使人们能够获得更广泛的访问。我们满怀激情地相信,无论是对小型出版商还是大型出版商、传统出版商,还是本地乃至全国的数字原住民,都要做到公平公正。

     为了强调我之前提到的,这不是一项已经完成的任务。我们的系统会随着时间的推移而进化和改进。记者和出版商的工作做的是非常重要的,我们致力于帮助用户获得高质量的新闻,给他们一个对于故事或问题更深的理解,帮助他们理解这个世界并与之对话。我对新闻业的首选定义是,为公民提供成为好公民所需的工具和信息,目标是将用户连接到成为好公民所需要的工具和信息。

    

     图片来源:Search Engine Journal

     GEN:谷歌雇佣了大约1万名被称为「搜索质量评分员」的第三方人员,他们将对新算法提供反馈,以便进一步改进算法。你能告诉我们这些评分员的选拔过程和培训情况吗?如何将评分中的偏差最小化?

     Gingras:首先,我们非常清楚搜索质量评分者做什么和不做什么。评分者不会直接影响排名。评分员是用来提供一个一般的人类评估,我们的排名系统提供了结果。当然,评分员的反馈也被用于我们的机器学习系统中作为标签。

     在评分任务中,评分员根据内容的专业性、权威性和可信性来评估结果完成搜索内容的程度,并评估结果的质量。评级并不直接用于我们的搜索系统给特定的页面或网站任何类型的「评级」或「评分」。相反,评级帮助我们理解我们的系统在多大程度上满足了搜索的整体需求,并作为学习的例子。

     至于评分员本身,他们都是一般人,通常在家工作。它们分布在世界各地和几乎所有的美国州(48个州),受雇于我们合作的供应商公司。

     要被录用,评分员必须通过供应商管理的测试,测试表明评分员对我们167页的评分指南有深刻的理解。供应商也会定期评估评分者,以确保他们理解我们的指导方针,并与他们合作。

     我们的评分指南提供了一个所有评分者都必须遵守的共同标准。指南是我们对搜索目标的定义。而且,评分指南是公开的,任何人都可以阅读,这就提供了透明度。

    

     图片来源:Boostability

     GEN:谷歌如何围绕评级实践透明度?新闻机构能知道他们的评级是多少吗?他们能挑战它吗?

     Gingras:我们以三种方式实践透明度:一、我们传达的政策和原则,指导我们的算法工作(评分准则);二、我们在操作的安全性和风险范围内尽可能详细地解释我们的方法。三、我们的结果都供人们评估。我们还与学术研究人员合作,支持他们的分析。

     谷歌有意开发的系统,以消除任何个人对我们的算法结果的偏见。没有人决定谁去哪里。我们创造系统来防止这种情况的发生。这就是为什么我们有评分程序。这就是为什么我们有我们的内部诚实的结果政策,阻止我们中的那些参与搜索和新闻工作的人与他们的排名上的个人第三方接触。我们致力维持公平和公平的制度,向用户提供他们所需的优质资讯。

     GEN:如果谷歌承担新闻机构评级的责任,例如信托计划和新闻信托计划,会扮演什么角色?为什么不把新闻协会整合到这个过程中呢?

     Gingras:谷歌的信息收集和数据建模的目的是为谷歌的搜索结果提供动力,而不是让用户了解出版物的新闻特性,这需要业界的努力。

    

     图 / 「记者信任倡议」是由「记者无国界」组织、法国新闻社、GEN和欧洲广播联盟共同发起的,旨在制定一个自我监管的解决方案,以支持媒体的道德行为和透明度

     图片来源:Medium

    

     图 / 这个信托项目是由顶级新闻公司组成的财团,由获奖记者Sally Lehrman领导,为新闻业制定透明度标准

     图片来源:Medium

     GEN:算法的改变只适用于英语报道还是所有语言?搜索算法突出显示的文章会自动翻译吗?

     Gingras:它适用于所有语言。根据用户的浏览工具,他们可能能够自动翻译文章。此外,一些出版商在自己的网站中嵌入了翻译文章的选项,以使他们的内容能够更广泛受众的访问。

     GEN:Facebook还在为优质资源(即新闻机构)开发一个评级系统。您是否与其他平台进行过讨论,以避免开发不同的评级系统?

     Gingras:谷歌在开放网络平台上运行搜索引擎。我们不是一个专有的社交网络。我们的动机和操作方法与社交网络非常不同,我们也应该被以不同的方式看待和评估。

    

     图片来源:Medium

     GEN:搜索引擎优化(SEO)是出版商吸引新读者的一种方式,但如果出版商决定建立某种付费墙,他们的内容就有可能没有特色。你如何处理这个问题?您与出版商合作了解广泛变化的订阅模式是什么?

     Gingras:几年前,我们与几家出版商合作,研究搜索用户与出版商付费墙之间的互动。由于这项研究,我们终止了第一个免费点击系统,转而采用灵活的抽样方式,出版商可以决定每月向搜索用户提供多少篇样本文章。因此,在过去几年里,无论新闻出版商向搜索用户提供多少免费内容,所有付费内容都在搜索中被完全索引。最后发现,付费内容和非付费内容之间没有排名区别。

     GEN:谷歌与新闻机构合作的下一步是什么?你还能提到哪些未来的计划?

     Gingras:我们的首要目标是尽我们所能为新闻业建立一个强大的可持续的生态系统。我们正在与世界各地的新闻机构广泛合作,并在新闻模式的各个方面进行合作——从通过订阅谷歌提高读者收入,到我们在新的地方新闻模式中进行的实验,再到为记者开发分析研究工具。

     尽我们所能推动新闻行业的三个关键方面的创新:提升和加强高质量的新闻,发展商业模式以推动可持续增长,并通过技术创新赋予新闻机构权力。

    

     1号结语

     从本文来看,谷歌宣布更改搜索算法,将把原创的新闻报道搜索排名靠前,并在结果中突出。不过,谷歌提到,他们对于原创报道还没有绝对的定义,会随着他们对于新闻故事生命周期的了解而改变。毕竟,如何用算法来明确「原创报道」,谷歌对此的回答还是模棱两可。

     谷歌试图通过这样的改变,提升原创报道呈现的重要性,让人们可以更深入新闻故事的来源。但是,究竟会产生什么明确的后果,谷歌也不确定。有人说,谷歌此举会从根本上改变数百个网站的运营模式,这给予了很多科技公司接近「原创报道」的手段。但是,对于谷歌这次的改变来讲,它是否真的会产生真正的积极还需要站在更多的出版商和读者的角度,了解他们想要的是什么,才能够更好地遇见前景。

    

    

    http://weixin.100md.com
返回 传媒1号 返回首页 返回百拇医药