feedback

意见

反馈

back-to-up

回到

顶部

揭秘科大讯飞人工智能玩法:何谓“火箭式”三级推进体系?

数据侠

· 谭昶

编辑 | 项静   2017-12-21

人工智能蓬勃发展的今天,智能语音是普通用户最常感受到的人工智能应用之一。作为国内智能语音领域的标杆企业,科大讯飞是如何挖掘人工智能背后的价值的?又如何通过精准营销实现数据价值变现?在12月13日的数据侠线上实验室中,科大讯飞大数据研究院执行院长谭昶,为我们分享了科大讯飞的实践。

用人工智能挖掘利用大数据的价值

今天我将为大家介绍科大讯飞怎样用人工智能更好地挖掘利用大数据的价值,理解人、服务人。

科大讯飞是国内人工智能领域的标杆企业,主要从事人工智能以及智能语音的相关技术研发。我们的愿景是让机器能听会说、能理解会思考,让传统产品具备智能的能力,通过与人交互来协助人类进行基本工作。

那讯飞的人工智能技术有哪些实际应用呢?

讯飞的人工智能三级推进体系中最核心的是做原始数据的源头创新,也就是火箭的第一级,即DNN、CNN、RNN等一些深度神经网络模型,也包括很多机器学习的模型。一个模型算法实际上可以应用到非常多的领域,本质上是用模型算法把数据里蕴含的知识、价值,通过逻辑的推导、机器的学习转变为一些能够去理解应用的知识。在这个过程中,我们要做的是用人工智能的技术把各行各业的大数据里蕴含的宝贵知识、价值挖掘利用起来,实现每个行业的创新以及智能化发展。

这张图展示了讯飞的开放平台中有大量的人工智能相关技术,包括语音识别、语音合成、机器翻译、自然语言理解、图片识别、人脸识别、声纹检测等技术,并且都是国际一流的水平。

人工智能+大数据,数据闭环赋能行业

人工智能与人之间形成紧密结合离不开大数据。

讯飞有45万的开发合作伙伴,他们开发了大量的APP、机器人、智能硬件等产品,这些产品只要联网就能收集用户的行为数据、交互数据。在保证用户隐私的前提之下,我们通过云端服务收集了大量的用户行为数据。这些数据每天会有40亿条,来自于15.9亿台终端设备,通过终端设备上的行为,我们可以分析人的行为、机器的行为,给出相关的建议。

在互联网端服务中,最典型的代表就是讯飞输入法。讯飞输入法现已支持98%准确率的普通话转写和输入识别。其实讯飞输入法一开始只能提供80%的准确率,在收集了很多的语音数据、用户输入数据后,我们用这些数据去训练人工智能的语音识别模型,让它变得更聪明,在这样的数据闭环里实现了输入法从80%提升到98%的准确率。

人工智能现在已经走到了每个人的身边,走进了千家万户。讯飞的人工智能不再仅仅停留在“语音”这个单一标签上,还有像晓译翻译机、叮咚音箱、飞鱼助手,这些设备在生活的方方面面都可以基于人工智能,为大家提供更智慧化的服务。

那么人工智能怎样更好地服务人的成长、人的发展、人的生活?接下来我将从几个方面来展示如何用人工智能的智慧化服务手段去服务每一个人,让生活变得更加轻松,工作变得更加容易。

人工智能+广告,构造更精准的用户画像

人工智能理解人,大多是通过自然语言的手段去理解人的文本信息。这些文本信息可能是来自于语音输入或是文本输入,而输入信息对于不同的人来说是差异化的。

目前讯飞DMP系统已覆盖了9亿的有效用户信息,并为这9亿用户建立了2000类的不同标签,包括年龄、性别、购物兴趣、品牌偏好、日常行为习惯。

投放精准广告的关键是找到产品所需要的最终用户。可以看到这张图的左边部分刻画了两类不同的人群,一类是想买车的人,另一类是已经有车的人。那么他们在讨论与车相关的话题时,讨论的关键词实际上是有明显差异的。有车的人更关心的是养车的费用、保险、车出了事故怎么办等等;而想买车的人更关心车的颜色、是不是国产车,什么车性价比高等等。这时如果有一家广告公司要给汽车4S店或保险公司投广告,就可以依此选择这两类不同的人群进行广告精准投放。

我以晓译翻译机为例,分析一下产品是如何触达最终用户的。最初做翻译机时,我们的目标对象是出国旅游的人群。但投放之后当分析哪些人购买翻译机时,我们发现一件非常有趣的事情——买翻译机的主要人群并不是出国旅游的中国人,而更多的是来中国留学或旅游的老外。同时我们也发现机场人群更愿意购买翻译机,除此之外还有一些从事翻译领域的人群及教育培训机构。通过数据分析后,我们在广告的投放上进行策略调整,选择了更精准的人群进行广告投放,最终广告点击率达到了4.6%以上的效果,而一般的广告点击率只有1%左右,这为我们带来了更高的购买量。

人工智能+教育,让因材施教成为可能

众所周知教育领域有一句话是因材施教,因材施教意味着要对每个学生进行有针对性的分析和培养,这是一件很难实现的事。

但现在我们可以通过人工智能技术来进行因材施教培养,假设1个老师带着45个学生,如果他在每个学生身上每天花30分钟去进行针对性的交流和辅导,一天就要花十几个小时,但把时间减少到5分钟,剩下的时间用人工智能的个性化学习手段来代替,那么每个学生都可以享受到个性化的服务,而老师通过人工智能的监督也能更好地督促学生。这个过程就是人工智能的个性化学习手段。

讯飞目前已经收集了大量的教育相关数据,包括学生学习过程中的行为数据:作业、考试、上课时的互动情况等。

如何用这些数据来提供服务呢?

首先是减轻老师的负担,讯飞提供了一套人工智能的组卷引擎,它可以根据学生的学习水平、能力、老师的要求,在三分钟内自动组成一套试卷,同时这套试卷会根据学生的学习情况,进行难度的调整。

其次是实现学生自主学习,如果学生发现知识点掌握不牢固,讯飞会提供一整套的微课,包括微视频、小型的快速练习题等模式来帮助学生。比如说课堂45分钟像直播间一样被录下来,但是录下来之后学生可能会有一个问题:老师前一堂课讲了二次曲线的所有内容,但其中椭圆是在第几分钟讲的?

讯飞可以通过人工智能手段将语音转换成文字去理解后,把视频自动切分成若干段。如果学生想听椭圆部分,服务器就会自动把这部分视频调取出来,还会根据视频给学生推荐配套的练习题、优质的学习资源课件,这样学生就可以有针对性地找到薄弱点。


把这个过程中涉及到的学生、老师的动作整个组合起来,就实现了个性化学习的数据闭环。从图的左上角看起,学生通过电子化的作业考试形成了大量的过程化学业数据,再用人工智能方法把这些数据拆解成每个知识点的掌握程度,每个知识点之间就会形成有关联的知识图谱。

如果学生想进一步地学习或复习,人工智能推荐算法就可以根据知识图谱里的薄弱点,给他推荐相应难度的练习题。当做完练习题后,通过人工智能识别手段对其进行判断,又形成了新的学习能力变化曲线,新的数据闭环又开始一轮循环。经过若干轮后会看到学生从原来漏水的水桶变成了坚固的铁桶,综合能力得到了提高。

目前讯飞已经把“人工智能+教育”的产品应用到了全国1万所学校,服务了8000万的师生,其中有1500万师生在固定地使用。一些全国知名高校如人大附中、黄冈中学,都在使用讯飞的个性化学习产品去指导学生的学习,未来我们希望能够把产品推广到全国的每一所学校,让大家都能够真正地享受到因材施教。

人工智能+政务,足不出户享受服务

除了教育领域,城市服务也和我们息息相关,每个人都想享受更好的服务。为了更好地服务老百姓,目前安徽、杭州、贵阳等地30多个地市都使用了“互联网+政务服务”的产品,那这个产品又是做什么的呢?

政府在过去的信息化建设中形成了很多数据孤岛,我们通过人工智能手段打通数据壁垒,建立数据平台,从而使纸质文件的流转变为数据的流转,实现智慧政务。我们还做了全国首个智能社区服务机器人,实现了零见面、零上传、秒办结——把它放到老百姓的家门口,如果有人想办社保证明、公积金证明等,只需要刷一下身份证,人脸和声纹识别后,机器人就会自动打印证明材料。

这里举一个“人脸+识别”的例子,为了防止退休金被冒领,老年人需要本人每年到人社部门办理社会保险长期待遇人员资格认证,这无疑为行动不便的老人带来了很大的不便。而现在通过人工智能,无论老年人是在哪个地方,只需要一部手机,通过人脸+声纹检测的方法,就能轻松搞定。

再举一个例子,最近杭州市正在进行 “1+N”+X 商事登记制度改革,以前老百姓如果想要开公司,要去十几个部门去办手续,而现在只需要跑一遍就可以办N个部门。这其中就是因为把各个部门之间的数据打通到政务数据的共享交换平台上,办手续时只需要提交一次材料,之后用邮寄的方式把材料寄到办事人员的手上,未来我们还希望能够在互联网上直接申请办理,实现足不出户办手续!

人工智能+医疗,拥有“大白”不是梦

一部《超能陆战队》让人们爱上了萌萌的“大白”,但大家是否想过未来大白可能真的会来到我们身边。在医疗领域,讯飞 “医疗超脑”并有望成为病患的虚拟医师。

“医疗超脑”可以大大减轻医生的负担。众所周知,医生工作量很大,每天要诊断许多的病人,写大量的病例,现在他们可以通过麦克风对讯飞说出病人的情况、应采取的治疗手段,原来20分钟手写的病历只需要3分钟语音就能结束。除此之外,我们已与安徽省立医院合作研发了人工智能医学影像辅助诊断系统。一年来该系统通过学习68万张肺部CT影像资料,已在省立医院CT室辅助医生诊断了一万多的CT影像资料,诊断准确率达94%。 

讯飞“智医助理”机器人还能成为医生的助手,基层的医生因为平时工作比较辛苦,对于一些最新病症的掌握情况并不了解,当遇到疑难杂症后可能会束手无策。在2017年临床执业医师综合笔试中,“智医助理”机器人取得了456分的成绩,超过临床执业医师合格线(360分),属于全国53万名考生中的中高级水平。这意味着它可以用优秀的专家医生的经验去指导基层医生进行诊疗,医生只需要做基本的诊疗后,把病人症状输入到讯飞“智医助理”系统里,机器人就可以根据症状自动地去判断病人可能得了哪些病。

以大数据、人工智能的发展为特征的第四次工业革命来临,人、机合作将成为职场的常态,“未来人们会不会因为AI失业”逐渐被热议,但我相信比人类更强大的一定不是人类制造出来的AI,因为AI仅仅是一个算法,而掌握了AI的人类才是更强大的。

数据侠门派

谭昶,毕业于中国科学技术大学计算机应用与技术专业,曾参与863、国家自然科学基金、国家科技支撑计划等国家科研项目10余项,在ACM TIST、IEEE ICDM和ACM CIKM等高水平国际学术期刊和会议发表多篇学术论文,现任科大讯飞股份有限公司大数据研究院执行院长,负责科大讯飞公司智慧城市、计算广告和个性化推荐等方向的大数据核心技术研发及应用推广工作。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing002并备注“数据社群”,合作请联系datahero@dtcj.com。

(了解更多有趣又有料的商业数据分析,欢迎关注DT财经微信公众号“DTcaijing”,下载“DT·一财”APP)

分享这篇文章到