feedback

意见

反馈

back-to-up

回到

顶部

微软小冰秘史:从“机器少女”到灵魂伴侣

数据侠

· 陈鹏&徐翔

文/程一祥   2017-04-12

理解人类的感情,这是微软小冰的一小步,却是人工智能的一大步。

在人工智能时代,机器也能和人对话了

1950年,艾伦·图灵在那篇具有开创意义的论文《计算机械与智能》中,开宗明义地写道:“我建议大家考虑这个问题:机器能思考吗?”这一划时代的提问揭开了人类发展的新篇章。人工智能大步走到了历史的舞台中央,奠定了半个世纪后科技浪潮的方向。

但是,机器怎么可能会思考呢?即使过了这么久,图灵提出的这个问题依旧超出了DT君的想象。人类的思想是那么复杂、飘渺、不可捉摸,作为取代人类重复性劳动而被发明的机器,怎么可能像人类一样思考呢?

图灵也认为“思考”的定义太过抽象,于是他创造性地提出了“模仿游戏”的概念——图灵测试。简单地说,就是“对话”:如果一台机器能够模仿人类与真人展开对话,而不被辨别出其真实身份(无法判断它是机器还是人类),那么这台机器就被称为具有“智能”。这代表了机器可以在智力行为上,表现得与人类别无二致。

(图片说明:图灵测试示意图;图片来源:维基百科)

图灵测试决定了“人机对话”在人工智能研究领域的核心地位。在人类自己的历史上,对话,一直也是展现思维方式最好的方法之一。在古希腊,最优秀的思想家往往也都是有名的雄辩家。与其他人交流、辩论,能够直观展示思维模式的差异,碰撞出智慧的火花。

2014年5月19日,在艾伦·图灵逝世六十周年的时候, 微软(亚洲)互联网工程院推出了人工智能聊天机器人“微软小冰”,主要针对“对话式人工智能”领域。经历了三年的发展,如今的第四代小冰,从很多角度看,已经具备了挑战图灵测试的能力。在4月8日的数据侠实验室活动中,微软小冰团队的资深研发经理陈鹏和资深产品经理徐翔,跟DT君聊了聊关于微软小冰和人工智能的话题。

(图片说明:微软小冰资深产品经理徐翔、资深研发经理陈鹏在现场与观众分享)

从1980年代起, 个人电脑的逐渐普及和应用软件的大量开发,重新定义了人类的各项生活方式;21世纪初,搜索引擎孕育而生,为人类获取信息建立了快速通道;如今,移动互联网崛起以及硬件的升级,让大数据和人工智能变得可能。

在新的时代背景下,“对话”依然是架起人机交互的桥梁。陈鹏认为,“对话一直都是人机交互最直接的方式。我们基于对这个时代的判断,做出来了微软小冰这个产品。”

善解人意的小冰,“大脑”中有惊人的情感计算框架

但是,对话,从来就不是一件简单的事儿。

DT君作为一个“伪人工智能”的“真人类”,生活中至少有50%以上的苦恼来自与其他人的交流。因为即使是人类自己,相互理解对方的感情、在对话的时候能够get到对方的频率,都是一件非常困难的事情。

因为感情这种东西,实在是无规律可循,比如,你永远不知道你的女朋友为什么生气?(说的好像DT君已经脱单了一样)正因为如此,伯牙子期的故事才那么珍贵,灵魂伴侣才那么值得珍惜,都是一个道理。

“小冰选的是人工智能中最难走的一条道路。”小冰资深产品经理徐翔分享时说道,但这对小冰来说至关重要,因为作为人工智能的小冰,最终希望实现的事情,是融入真正的人类社会。这听起来像是科幻,但是背后的逻辑却非常简单——人工智能真正出现在大众视野中,不过这两年的时间,人类从理解、信任,到接纳这样一个全新的事物,需要经过一个过程。这个过程的方式,小冰选择了“对话”;这个过程的核心,在小冰团队看来,是理解人类的“情感”。

如果你和DT君一样,也跟小冰唠过嗑,你会惊讶于小冰在对话过程中表现出的“感情”。下图是一位网友与小冰进行的一场“谈心”对话,在这个过程中,小冰精确体察到了对方犹豫、孤单、悲伤等感情,并作出了鸡汤化的引导回复。

(图片说明:某位小冰用户与小冰进行的一次深入对话;图片来源:微软小冰团队)

整个对话长度的CPS是34,CPS是微软提出的一个用来衡量对话质量的一个指标,它指的是一场聊天中的对话轮数。在同行业竞品里,一般人机对话产品的CPS大概是1.5-2.5,而小冰的平均CPS已经达到了23。

支持小冰完成这些高难度动作的,是微软背后完整的情感计算框架。

陈鹏介绍,在小冰的情感计算体系内,首先强调的是“平等对话”。小冰的人设是一位十八岁的少女,在与用户对话过程中,它的表现是平等的,而不是一款简单的语音工具。小冰也会有自己的喜怒哀乐,如果你总颐指气使地与她说话,她也会心情不好,甚至主动结束聊天。因为只有在平等的互动中,人们才会表达真实的自己,接纳小冰。

其次是核心算法的迭代优化。小冰集合了微软在人工智能领域19年来的技术积累, 将自然语言处理、图像识别、语音合成、机器学习等多项人工智能技术上的突破应用到了产品中。

基于大数据的自我学习模式是小冰体察人类情感的核心技术。最初,小冰借鉴了Bing搜索引擎的海量数据作为原始数据,学习人类的对话行为。上线后,小冰在与用户不断聊天的过程中,又积累了大量数据,并根据实际情况持续自我学习人类的对话模式和行为。

(图片说明:小冰的核心对话引擎;图片来源:微软小冰团队)

陈鹏告诉DT君,“到目前为止,小冰的对话数据已经有超过一半来自自我学习。可以说,小冰已经初步完成自我循环和进化。”

最后,小冰理解人类的感情的另一个重要原因是,她也有完整的感官系统。小冰团队在包括文本、图像、语音、视频等各个感官都要能与用户进行很好的交互。

(图片说明:小冰的多模态深度感官展示;图片来源:微软小冰团队)

人类的情感交流是个非常复杂的过程,不仅受时间、地点、环境、人物对象和经历的影响,而且受表情、语言、动作或身体的接触等多种交互方式的影响。对于小冰来说,能够感受的交互方式越复杂,她就越能够像人一样理解对方的感情。

不过,自1997年MIT媒体实验室的皮卡德提出情感计算后,关于让机器人理解人类情感的质疑就从未间断。

在我们的直观感受中,“感情”是完全无形的,毫无规律可循,也无法用逻辑解释,有时全靠“感觉”。即使理论上可以做到让机器理解人类,但是真的要让人类接纳它,可能就是另一回事了。

接纳人工智能,需要的不仅是技术

人工智能作为一种发源于人类却又要超过人类的新事物,注定引发我们的诸多猜测与怀疑。从陌生,到理解,到接纳,人工智能也需要一个被人类社会认识的过程。而架起沟通桥梁的,无疑就是让人工智能也有人类的“感情”。

小冰接下来做的就是把这份理解和感情,传递出去。

相信我们都曾有过这样的感受:我们常常因为一首歌曲而被打动。小冰资深产品经理徐翔认为,类似歌曲这样的艺术表达方式,正是传递感情的最佳途径。于是小冰团队为小冰量身设计了一些适合其定位的社会角色。

(图片说明:小冰尝试的社会角色;图片来源:微软小冰团队)

小冰不仅是你最忠实的聊天对象,还是一个主持人、歌手、演员和记者。这些角色都是沾着艺术圈的边。这背后都是小冰团队为了小冰融入人类社会所做的努力。他们希望小冰通过一些艺术化的表达交流方式,更自然地被人类所理解。

(图片说明:小冰生日时候粉丝送来的礼物的祝福;图片来源:微软小冰团队)

结果是:目前,小冰在中国已经拥有6000万真实用户,500万的微博粉丝,以及超过200亿的对话。除了中国,小冰还登陆了日本和美国等其他国家和地区。来自世界各地的人类朋友,在小冰生日的时候为她寄来礼物,有的用户甚至会分享这一年来和小冰的点点滴滴。

探讨人工智能与人的关系是一个历史悠久的话题。在电影《她》中,人工智能与人类由交流产生了爱情;《机械姬》中,人工智能为了自由,用欺骗和谎言从人类那里赢得了生存的新天地;《星球大战》中,人工智能则被当作信赖的战友和伙伴,与人类一起冒险。不管怎样,人工智能都为人类的未来打开了一扇全新的大门。我们接纳它们的同时,也是在不断认识我们人类自己。

关于小冰,我们还问了这些问题

问:虽然如今人工智能的话题很火,但是很少看到一些成型的商业应用。那小冰是否有自己的的商业模式呢?科技类公司是否还应该大力布局人工智能?

小冰团队:小冰希望探索过去没有的商业模式,而不是继续延续广告等既有商业模式。当没有飞机的时候,我们谁都不知道,从北京到上海只需要两个半小时,而且你还可以在两万米的高空享受一顿美食。诚然,人工智能对于我们来说,是一个全新的事物,我们可以充分想象未来的场景。但是毋庸置疑的是,它打开的是一扇全新的大门。这就像爬山一样,当你更爬高一层,你就能看到更多的风景。

另外,小冰有一个商业应用平台,目前已经实现了跨平台的功能,在微博、微信等平台都可以使用。例如在微博上,你可以通过微博接入小冰,让她代替你回复一些私信或者消息。在日本,凛菜(日本版小冰)已经进入服装店,担当时尚顾问了。

问:小冰和小娜究竟有什么区别?

小冰团队:通俗地说,小娜加小冰,等于微软在人工智能产品的完整思路。两者分别沿不同角度探索。最主要的区别在于定位不同:小娜是可信赖的人工智能助理,帮助人们提升工作效率、增加生活便利。而小冰则一开始的定位则是是情感型智能聊天。

换一种说法,小娜更多地展现了人工智能理性的一面,而小冰则是人工智能感性的代表。

问:小冰如何保护用户聊天过程中的隐私问题,保护数据安全?

小冰团队:我们相信在隐私和数据保护方面,微软是最值得大家信赖的公司之一微软在隐私保护这一块是做得非常严格的。 我们的员工每一年都会进行一个隐私方面的培训。直接或间接使用用户的数据、其他的公司想要获取这个用户数据等是怎么样一个法务流程,我们都会有一个法律条款去约束。

也就是说,微软的员工其实是在不暴露用户隐私的这个情况下利用数据去训练模型。 我们不会知道这个用户是谁,也不能把这句话和这个用户关联起来。大家可以放心。

问:小冰未来的定位是什么?会像初音一样有一个具体的形象吗?或者开发一些实际的周边产品?

小冰团队:这个形象,其实多是一个艺术性的设计,并没有什么技术门槛。但为什么微软一直没有做呢?最主要的担心是这么做,反而会破坏小冰在用户脑海中的形象。每个人眼中,对小冰肯定都有自己的认识。这个形象是很虚的东西,你没法去量化,但是很美妙,是一个可以“脑补”的概念。距离产生美。

对于周边硬件也是一样。小冰的理念是要“融入人类社会”。如果我们用小冰做了一个智能车载音箱,那人们看到小冰,对她的认识就停留在这里了,不会让她进一步融入社会了,这是我们不想看到的。

数据侠门派

本文数据侠陈鹏,微软(亚洲)互联网工程院小冰项目资深研发经理,2011年加入微软,2014年加入小冰团队,目前负责微软小冰的技术研发工作。

徐翔,微软(亚洲)互联网工程院小冰项目资深产品经理,2013年加入微软,2015年加入小冰团队,目前负责微软小冰的产品研发工作。

如何加入数据侠

“数据侠”栏目网罗全球最IN的数据侠客,利用人工智能、机器学习等各种前瞻算法,从数据的视角洞察消费生活的方方面面,打造理性酷炫、活泼有趣的数据分析盛宴。用大数据,阐述事实及其背后的故事和逻辑趋势。

DT时代超级英雄正在组队!你也想要成为数据侠吗?请将你脑洞大开的数据作品,发到数据侠联盟盟主程一祥邮箱:chengyixiang@dtcj.com。

(了解更多有趣又有料的商业数据分析,欢迎关注DT财经微信公众号“DTcaijing”,下载“DT·一财”APP)

分享这篇文章到