feedback

意见

反馈

back-to-up

回到

顶部

大型裁员现场,究竟谁笑到了最后...

数据侠

颜安琪   2018-12-24

对媒体来说,这是最好的时代,也是最坏的时代。数字化使万物皆媒介,人工智能技术也正与传统媒体表达融合,并加速了媒体行业的洗牌。当下,“机器会否取代文字从业者”成为了业内关注。

AI时代:新闻业的谢幕与重生

两周前,知乎被爆出大裁员,敏感时期,人心惶惶。

出现裁员的不止社交媒体,全球大众媒体裁员潮早已悄然发生。5月,《芝加哥论坛报》为了“重组新闻编辑室,使之更适应数字化”,进行裁员;7月末,《纽约每日新闻》也宣布裁员,并且形式更加猛烈,不仅编辑团队规模缩减一半至45 人,总编也难于幸免。

《纽约每日新闻》被裁团队还在官方Twitter发起了表情包,最后还不忘跟上一条Twitter账户如何更改密码的跳转页面,之后这些内容都很快删除。

图片说明:《纽约每日新闻》离职团队发出的表情包之一;来源:网络

有分析认为,《纽约每日新闻》裁员主要是因为广告收入下降过快,负担不起高昂的人力费用;并且,除了Facebook等社交媒体冲击外,很多竞争媒体已经采用机器人来撰写短消息,加速了媒体行业的洗牌。

图片说明: 68%的美国成年人会从社交媒体上获取新闻资讯;来源:皮尤研究中心《2018美国社交媒体新闻使用情况报告》

 

《环球日报》早在2017年1月份就预测:人类99%的智力劳动都将被人工智能取代,最保守的估计也在45%以上。李开复博士在《人工智能》一书分享会上,亦发表过一段警世之言:“不仅仅是重复性的工作会被取代,很多白领工作也将在10年内被取代,包括记者(媒体人)这个行业。”

另一方面,资深的业内人士笃信人工智能将主宰未来的新闻业。彭博社总编辑John Micklethwait认为,AI技术将对新闻业的未来起到决定性作用;自然语言处理服务公司Narrative Science预计,到2020年前后,90%以上的新闻报道都将由机器来完成。

而就在前不久,畅销书《自营销互联网方法:内容营销之父手册》作者、美国内容营销研究院创始人Joe Pulizzi在社交媒体上预言:“未来10年,大部分内容将由软件制作,未来20年,人类会好奇为什么我们浪费这么多时间在内容创作上,未来只会发生这些。”

所以,机器取代人类的阵痛期已经来了吗?

AI写作的大历史

机器参与新闻工作,最早可以追溯到2001年,谷歌启用机器选编新闻,实现个性化新闻推荐。随后,2012年年末,《华盛顿邮报》启动了名为“truth teller”的实时新闻核查项目。

但严格意义上的机器自动化生产新闻,即用一套软件或算法语言,自动采集数据,然后撰写成人类可读的信息内容,是由美联社开创先河。2014年,美联社率先引进Wordsmith 程序进行公司财报类新闻编写。随后,中外媒体纷纷引入自动生成新闻技术。

图片说明:Wordsmith使用美联社编辑手册撰写的上市公司财务报告,从数据到产出内容的展示

随着国际上诸如《纽约时报》的Blossom、《洛杉矶时报》的智能内嵌模版、《卫报》的Open001、路透社的Open Calais、《华盛顿邮报》的Heliograf等一系列智能写稿程序的出现,国内也试图在这一领域展开探索。

腾讯于2015年8月率先推出Dreamwriter写稿机器人,其写作的经济数据类报道稿件已经达到人工采编水平,随后在奥运期间每天写作百篇新闻稿的今日头条xiaomingbot和能够写作财经新闻的第一财经DT稿王等科技与媒体巨头的产品纷纷出现,直至今日,无论是大众媒体、广告公司还是科技公司,智能写作产品已司空见惯。

图片说明:部分媒体写稿机器人应用情况 图片来源:亿欧网

 

尽管机器人写稿的历史并不算长,但“一个会写作的机器人”一直贯穿于人工智能研究的整个发展历程。早在1948年,世界第一台可运行程序的计算机曼彻斯特Mark1的“处女作”,就是科学家克里斯托弗·斯特雷奇编写的一个写情诗的小程序。它能根据简单的语法规则,从一个小型的浪漫词汇库中选择词汇,创作一些轻松的爱情诗。

如果说斯托弗·斯特雷奇编写的“罗曼蒂克小程序”,更多是为生活调剂,那么,媒体使用机器写稿则有着实实在在的目的:提高效率,同时更好地监测读者,吸引增量用户。

2017年8月份四川九寨沟地震发生时,中国地震台网公测的“地震信息播报机器人”仅用时25秒就全球首发了585字的地震速报。而且信息量很大,包含了参数、震中地形、热力人口、周边村镇、周边县区等信息,同时附上了5张图片,这样的高效恐怕是人工难以达到的。

图片说明:中国地震台网“地震信息播报机器人”所发布的地震速报;来源:刺猬公社

 

机器写稿的另一个目标,是为听众量身打造内容,吸引更多潜在读者。美联社战略企业发展部高级副总裁Jim Kennedy说过:“传统报纸只是惯于根据时间段的不同定制内容,但互联网科技的迅猛发展和新闻的持续循环,实时更新内容,烘托现场感才是提高订阅量的良方。”美联社也在这点上广泛实践。比如,体育编辑就尝试通过机器写稿,为赛事双方的支持者分别提供针对性的新闻,提高读者参与度。

图片说明:内容生产的基本流程

 

那么,机器写作,究竟是如何实现的?哥伦比亚大学新闻学院Tow 数字新闻中心曾以“叙事科学”公司的机器人(算法)新闻为例,“解剖”了机器写稿的5个步骤。

  • 首先,读入大量结构化和标准化数据,实现大量积累。

  • 其次,测量数据中的“新闻性”。算法会监测和比对历史数据,一旦发现“反常”,例如以上各数据种类中出现的“最高纪录”或“最低纪录”,或者在财经新闻中,股价或汇率变化高于或低于预期,算法就认为此数据具有“新闻性”。

  • 再者,根据“新闻性”找出合适的报道角度,如果存在多个角度(框架),算法会结合“新闻性”给各个框架打分(1~10分),然后选择使用得分最高的框架。

  • 然后,将报道角度与数据中的具体事实相匹配,即所谓“故事点”,如球员名字、得分等,以支持该框架。

  • 最后,生成报道文本,并从自然语言角度进行润色。让算法生成的枯燥文字变得有趣、可读,这也是技术含量最高的一步。

图片说明:机器内容生成所需要的支持

 

原第一财经首席数据科学家、DT稿王研发团队的汤开智博士表示,目前机器写作的运用主要有三类:

  • 首先是基于数字进行事实陈述,并进行简单分析的文章,比如二级市场的监控、体育赛事的简讯。

  • 其次是根据每类稿件的信息要点,对信息进行针对性的提取,再根据不同的规则,组合写成的单点内容。

  • 第三类是单点内容的关联生成,此类稿件能弥补单点内容信息量单一的缺点,并为受众生成更有深度、更立体、更综合的稿件。

机器写作的应用

如今,除了媒体,机器写稿也在文学和智能营销领域得到广泛应用。

文学方面,除了广为熟知且已出版诗集的诗人微软小冰。2016年,由日本公立函馆未来大学团队提交的由人工智能所创作的小说作品《机器人写小说的那一天》,还在1450篇参赛作品中瞒天过海,闯过“星新一奖”的比赛初审。

图片说明:微软小冰出版的诗集《阳光失了玻璃窗》以及机器人Musio创作的2017年日本最畅销小说

尽管这篇小说并非人工智能原创,而是程序根据数据库里的细节、情节、台词、角色、环境描写等各种既定元素,重新排列组合后的作品,但也算机器人文学创作的一个进步。

智能营销领域,阿里妈妈的AI智能文案和蓝色光标的iDataBot都是业内的先锋。

在2018年6月份的戛纳国际创意节上,阿里妈妈发布了“AI智能文案”产品。主要是结合淘宝、天猫的海量优质内容与自然语言算法,把创意像公式一样“推导”出来,让“创新”稳定的发生。

其背后的技术逻辑,是基于深度神经网络的sequence2sequence模型,融合了注意力机制、位置编码、copy机制等,实现对商品逐次生成文案。

具体的生成流程是,阿里妈妈的AI智能文案首先从上亿几乎覆盖了淘宝所有类目和商品的文案样本中,清洗出数百万规模的高质量训练样本。再通过对位置信息进行编码,改变每个词生成时的概率分布,实现长度可控。最后,结合质量控制模型,拟合人对生成结果的判断。随着数据的不断积累,质量控制模型对结果的判断会更加准确,同时可以更好地指导生成网络的迭代。

对于外界广泛热议的“机器会否取代人类”,阿里妈妈团队的看法是,智能文案生成的内容,都是基于对人类所创造的海量优质内容深度学习的结果,智能文案的主要目的其实也是为了帮助更多人,降低优质内容生成门槛,释放大量劳动力,实现最大化的营销效果。

当然,不管是写稿件还是营销文案,大量的数据,是机器人写作的基础。

另一边,数字营销集团蓝色光标于2018年12月19日也在企业内部发布了iDataBot营销数据平台,帮助营销人来撰写营销策划案。

传统策划案的制作需要10-15个工作日的时间,但60%的时间是用在筹集资料、搭建框架方面,只有40%的时间是花在商业、营销、创意等需求的探讨上,时间效用分散得比较大。

蓝色光标集团数据分析高级经理张新华告诉DT君:“iDataBot2.6 Basic 版本,只需要输入相应Brief,10-15分钟即可智能生成一份完整的包含结果数据图表及解读结论的PPT,为营销人员完成最终的营销策划案节约大量的精力,可以让他们把更多的精力花在需要创意策略思维的事情上,如洞察、创意以及客户沟通等方面。”

蓝色光标集团助理总裁章夏表示:“iDataBot营销平台有技术更有行业观点,帮助营销人更省时省力地完成策划案撰写,使其有更多时间聚焦在有价值的工作内容中,提高工作效率,帮助客户创造品牌价值,帮助品牌价值获得相应的增量。”

而在被问及“AI写手会否取代人类文字工作者”时,很有意思的是,蓝色光标的团队观点出现了些许“分歧”。数据团队认为,目前的人工智能还处于“弱能工智能”发展阶段,并且AI写作的短板在于它是在不断学习历史规律,想要在创意方面取代人类还有待时日。

产品团队则认为,一切皆有可能。“其实AI写作可以分为四个象限:X轴从左至右为理性到感性;Y轴由上至下是个性到机械型。理性方面来看,就程序化的分析来说,人类肯定会被机器取代。理性偏个性方面,要考虑机器的知识度,比如iDatabot,原来只能对应一类产品,现在可以对应多类。‘感性+个性’方面,在拥有足够多数据基础上,再把思维模式化,完全可以实现。‘理性+个性’方面,相信将来也可以通过技术实现。”iDataBot产品总监洪磊说。

文字从业者的突围

机器跟文字工作者之间的关系是一种分工协作的关系。机器能快速处理突发事件的信息,它的优势在于能够精准高效地进行信息抓取、实时监控、快速报道。但缺点是,没有思考力,所以,写作模式固定。

那么机器最终会否取代文字工作者?华盛顿邮报首席信息官Shailesh Prakash强调,“应用Heliograf系统并非是让人工智能替代记者这个职业,而是让新闻编辑变得更有效率,通过把像不断播报选举结果之类的任务移交给人工智能之后,原先负责这类新闻的记者就可以被解放出来,专注于那些需要人脑进行思考的任务。”

对此,今日头条人工智能实验室总监李磊亦持相同意见,“我们做新闻机器人的目的并不是取代新闻记者,而是帮助记者创作出更高质量的内容。”

总之,机器写作一定会取代“机械”地工作的文字工作者,但随着人工智能的全面袭来,对于文字工作者来说,或许,专栏作家、畅销书《认知盈余》作者克莱舍基对媒体幸存者的建议,也值得思考:

第一,要擅长理解和表述数据;

第二,了解如何将社交媒体应用于新闻编辑;

第三,通过团队协作和尝试新鲜事物来竭尽所能地积累新闻编辑经验。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing003并备注“数据社群”,合作请联系datahero@dtcj.com。

 

 

分享这篇文章到