编者按:本文来自微信公众号”刺猬公社“(ID:ciweigongshe),作者金凯娜,36氪经授权发布。

从没有任何一个时代比如今这般更让媒体人如履薄冰,内部变革困难重重、外部环境动荡更迭、核心生产力更存在被彻底颠覆的可能性。正如海水覆盖着海底千沟万壑,让表面平静蔚蓝一样,在社会环境看似平缓的变化下,同样掩盖着无数的阵痛、失败和探索。

但我们相信,任何变革和进步的根本,只会发生在生产力和产业的深入结合上,新闻行业也一样。鉴于此,我们做了关于AI+News的专题报道,希望通过观察人工智能在新闻领域的应用,引起自己和读者对当下的环境的思考。这是该专题的第一篇,围绕国内这一领域展开。

不论是在缺席了众多硅谷大佬的世界互联网大会上,还是邀请了学界和业界众多名人的腾讯网媒体高峰论坛,“人工智能”出现频率都相当之高,成为了当之无愧的热点。清华大学教授彭兰在媒体高峰会议上曾提到未来媒体三大特征的描述,分别是“万物皆媒”、“人机共生”和“自我进化”。

我们观察了这一年里国内媒体运用人工智能的情况,看了看它和学界预测还有多远。

写作机器人:快速、模板化

国内运用写作机器人的媒体不多,以腾讯、今日头条和新华社为主要代表。

腾讯用得最早,15年9月,腾讯财经用机器人Dreamwriter发布了一篇关于8月份CPI的稿件,题名为《8月CPI同比上涨2.0% 创12月新高》。稿件分为两部分,第一部分是数据本身,第二部分是各界人士对数据的的分析解读,之后,dream writer持续发布新闻稿件,根据《中国新媒体趋势报告2016》数据显示,今年三季度,腾讯财经机器人写作文章的数量达到了4万篇。

新华社紧随其后,去年11月18日,推出写稿机器人“快笔小新”。

“快笔小新”操作简单快捷,输入一个股票代码,再点一点鼠标,就能产生一篇财报分析。其真容和电脑里的普通程序并无差别,虽然写出来的内容并不完美,但胜在快速。新华社的体育部和《中国证券报》也采用了“快笔小新”,不同部门的业务需求版块不同。除了这几个版块外,其他部门还没能得到应用,机器人写作范围限于财经、体育等领域,体裁也不多,只有快讯和财报。

今日头条则借用了奥运这场东风,推出了自己的“xiaomingbot”,也算是火了一把。微信公众号“极客公园”曾发表文章夸了夸“小明”,说和国内的第一代写稿机器人——腾讯的“dreamwriter”相比,“小明”的写作水平已经进入了第二代,特征是在数据库更新的两秒之内,即可生成新闻稿并发布;同时,“小明”的样式较多且能够进行自适应——能够根据赛前预测和实际赛果的差异调整新闻生成的语气。

仔细看这三家的写作机器人,可以发现国内的人工智能还停留在比较初级的应用阶段,多以财经、体育新闻为主,体裁上基本局限于快讯、短讯和财报。

除了知道这是一篇由机器人写的稿子外,没有太多的惊艳之感。不过话虽如此,写作机器人的存在还是扩大了新闻的广度,让信息的流动变得更加自由,用户也因此有了更多的选择空间。

克莱·舍基曾经在《未来是湿的》里面提到,由于社会化媒体的扩张,如今的游戏规则变为了“先出版,再过滤”,也即,不管是什么新闻,无论价值大不大,都是先发布后再进行判断,而非原先的审核权掌握在编辑手里,“先过滤,再出版” 。

但目前写作机器人带来的改变似乎不够明显。

部分原因在于,现有写作机器人主要做的是改变数量,而非质量。头条实验室的负责人李磊这样评价小明,“张晓明最大的意义在于,面对奥运会同时举行的上百场比赛的综合赛事,可以观察到每一场比赛报道,无论这场比赛多么冷门和不重要。在传统新闻理论中,某些冷门比赛乒乓球的小组赛的报道价值不大,但实际上依然有可观的阅读量。”

同理,一家不怎么出名的上市公司财报可能是投资人和股东热切关心的新闻,但对内容生产方(某一媒体)而言,它则是长尾——只有那么一部分人在阅读,并非主流需求。面对这种内容会出现两类情况,一为长尾内容因其不够大众而被抛弃,二为该媒体定位垂直领域,专注生产此类长尾内容。

以前因为人力不足或“关注度不够”而被迫抛弃的新闻资讯,现在可能正被机器人生产。读者的选择因此变得更多,也更为自由了。AI+News弥补的正是人们关于新闻的长尾需求。

智能化推荐:看得见的改变

只写了长尾的新闻还不够,在很多情况下,用户不知道媒体发布了这类新闻,智能化和个性化的推荐则显得尤为重要。和写作机器人的特定领域比起来,智能化推荐或许是每个用户都能切身体会到的。

在个性化推荐方面,天天快报、今日头条和百家号都在不断尝试。

今日头条的广告词是这样说的,“你关心的,才是头条”,也就是根据用户的个性需求将内容推送到首页上。在今年的互联网大会上,CEO张一鸣讲述了他和一个哈佛学生聊天的故事,那个学生通过今日头条在波士顿看到了长沙当地政府欲进行人才引进的新闻——他回过长沙,长沙的留学生关注了政府引进人才的新闻,机器便把这个新闻推荐给了他。

百度则在五六年前开始布局人工智能,在百家号上得以运用。在百家号上线半个月时,百度介绍说,他们是“千维”刻画用户群体,用户登陆后,搜索的数据都会被记录,相关的内容监测会出现在搜索框的下侧,进行垂直刻画。如果有人多次搜索了“芦荟”、“多肉”,那么下次一篇关于多肉植物种植的文章会推荐到页面首页。

这实际上是一种数据积累和维度刻画:一个人长期使用某APP浏览新闻,该用户的阅读数据就会被不断反馈进数据库,用户画像就逐渐清晰。同时,随着用户数量的增加,通过相似点描绘可以将人不断地分群,进行群体分发,再加上之前累积的数据,通过算法运算完成智能化的推荐。

科技公司走在媒体前面了?

不论是写作机器人还是智能化推荐,可以发现,除了新华社,更多的是互联网科技公司,腾讯、百度、今日头条……阿里巴巴虽然没有在明面上使用嫡系产品中参与媒体平台的竞赛(当支付宝生活圈正式上线后则不好说),但它也入股了第一财经周刊,共同成立了媒体实验室推出了“DT稿王”,百度、腾讯在这方面的投入更是只会多不会少。

BAT各自拥有平台,紧随着技术发展的他们天然具有投入大量人力物力进行研究的基因。百度通过搜索记录,腾讯则有社交软件作为依托,阿里巴巴则在消费这一环占据了制高点。

相比之下,国内的大多数媒体则缺乏用户数据这一环的先天优势,也不能和用户进行良好地反馈。少数较为出色的媒体客户端或许在自己平台上拥有不少忠诚用户,但这更多是“为变而变”,而非自身主动和技术的结合。

当时代从互联网进入移动互联网之后,纸媒和门户网站就先后转型移动端,除开内部管理的变化,这样的转型大多体现在将文章发布在微信、微博和今日头条上,更进一步的是使用符合新媒体语态或根据不同平台有针对性的进行内容创作。几乎没有媒体成功的做出自己的平台。

或许有人会问,为何美国的《纽约时报》、《洛杉矶时报》以及《华盛顿邮报》都能推出自己的写作机器人,并且运用人工智能的水平高于国内的媒体?这和版权以及新闻市场有密切关系。 

国内媒体的文章在门户网站时代是以打包价成批包给门户网站进行发布的,这给给门户网站带来了流量,却没有给自己带来什么太多好处。同样的事情也发生在现在。而国外报纸一早就进行了付费阅读服务,很少有免费的渠道,对新闻价值的概念比国内更强。

另一边,《洛杉矶时报》、《华盛顿邮报》等背后都有强大的报业集团,在商业化的引导下,不仅网站、付费阅读早早开展,技术的培训和算法的研发都在同步进行。此外,亦有科技公司为其提供技术支持。叙事科学(Narrative Science)就是一家专门研究如何把数据通过算法转化成文字的过程。

记者会被取代吗?

以写作机器人为代表的人工智能是否会取代媒体从业人员?这是大多数人都关心的问题。

实际上,不管是新华社的“快笔小新”还是《华盛顿邮报》的Heliograf,目前都没有涉及任何大规模裁员问题,写作机器人的存在,更解放了记者的劳动力,让他们能将精力集中于新闻更深层级的挖掘和思考。

这些新闻之所以能由机器人产生,更多的原因是新闻生产和采访的脱离,《华盛顿邮报》相关负责人曾这么形容奥运会赛事,“奥运会期间有近 330 项奖牌赛事,很多报道其实都是结合现场数据的套话。”美联社和腾讯都选用机器人承担财报工作,实际上是因为这些文章对数据的准确度和速度要求很高,人类对这两项不怎么在行。

实际上,被收购后的《华盛顿邮报》还增加了140名记者,行动总监杰里米·吉尔伯特称,“找到精彩的消息来源,发现有趣的故事,对事物进行分析,这是我们希望优秀记者聚焦的事情,我们希望让人讲述只有人能讲述的故事。”

所以,现阶段大可放心让人工智能去做那些“枯燥无聊”的工作,媒体人能从简单的重复中解放出来,去找寻真正重要的内容。不是所有的热点都能够通过数据发现,总有黑天鹅事件在算法的意料之外。

而从某种意义上说,以后更有可能是,记者发现、采写一个热点,再让机器人去引爆它。发生在2002年的影片《聚焦》的原型故事,对于当下的状况有着丰富的借鉴意义。

这个故事讲述的是《波士顿环球报》的一个独立调查小组调查天主教牧师性侵教区里的孩子的案件,从一个案件中往回追溯,发现天主教牧师的性侵涉及多人,时间长达数年。在追查中,整个小组进行了查找牧师名录、留存的剪报,以及不懈地采访后,最后突破重重困难最成稿,并发布在了互联网博客和纸媒上,引起了巨大轰动。

现在看回去,整个故事最难的部分在于发现和坚持这个选题,马丁·伯恩在法律专栏上看到“牧师涉嫌卷入性侵丑闻”后被告知法官已经封存了法庭现场记录,随后他意识到这是一个大新闻——这正是目前人工智能和智能化推荐所不能及的地方,发现一个优秀的选题。

目前,国内AI+News的发展依旧处在较为缓慢的时期,没有进行大规模、较频繁地应用,仅机器新闻仅发生在资讯整合(财报、比赛资讯等)上,且暂未参与到新闻生产的流程中去。我们离人工智能距离被真正应用于新闻领域,还有着不小的距离。

在人工智能和新闻的结合上,国内媒体到底做得怎么样了?

发表评论

电子邮件地址不会被公开。 必填项已用*标注