feedback

意见

反馈

back-to-up

回到

顶部

不会做产品经理的CEO,不是好的数据科学家 | 数据科学50人·柳超

数据科学50人

· 柳超

程一祥   04-13

如今,我们每个人都在谈论“数据科学”,哈佛商业评论杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学领域的科学家、顶尖从业者们又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在2018年走访50位来自各行各业的数据科学领域的顶尖专家,希望能让你们了解这些神奇的人和他们神秘事儿,为你们一窥数据科学的未来与未知。当各大媒体的封面报道都充斥着大数据、人工智能等时髦热词时,柳超说,科技创业根本不在于这些云山雾绕的概念,而是能够经受市场大浪淘沙的产品。

接地气的学者型企业家

2017年,一篇调查报道《穿透安邦魔术》轰动一时。作者为了分析安邦循环投资的情况,对安邦企业的投资关系、股权结构变动、企业注册资本等数据进行了大量的梳理和分析,最终所绘出的关系网图谱令人印象深刻。

类似这样传统的商业调查报道,记者们往往要去工商局等部门自己搜索数据资料,然后再手动分析,工作量很大。而如今,如果借助一款大数据产品——天眼查,记者就能够轻易找到这些数据,进行更便捷、精准的“人物-企业”关系网络分析。(上述调查报道与天眼查并无关系,这里只是举例说明天眼查的相关功能。)

(图片说明:天眼查显示的安邦保险的企业关系图)

柳超是天眼查的创始人和CEO。在一些媒体的评价中,他是一个学者型企业家。

在大数据浪潮下的这一批创业者们,确实有不少都从学界转身而来。他们通常睿智、严谨,对于自己所研究的领域充满自信,熟稔宏观背景,能够对趋势侃侃而谈。

其中的大部分人还会保留着些许学院派的气质,访谈中常常会用英文解释一些拗口的概念。在一些社交场合,比起“XX总”,人们会更愿意称他们为“XX老师”或“XX博士”。

柳超是一个“非典型”的学者型企业家。采访柳超的时候,他刚结束一门商学院的课程。一身休闲夹克,端着点心饮料,十分放松地就跟DT君开始了聊天。他喜欢开玩笑,聊天中总能自然地就跟着他乐呵起来。

他身上,感受到更多的,是一种“接地气”的味道。

(图片说明:柳超在2017年第一财经技术与创新大会上分享开放数据的观点)

他用“做菜”比喻自己的创业项目,采访进行了20多分钟,他甚至没有提到机器学习、数据挖掘等任何一个被炒得火热的名词或概念;连自己是国家“青年千人计划”专家的名头都没讲。

“没有人在乎柳超说了什么,他们也不关心深度学习这些专业的术语。大家真正在乎的,是产品。”

老老实实做产品,是柳超这个学者型企业家的创业逻辑。

做一个广场舞大妈也看得懂的数据产品

2015年,柳超做了天眼查这么一个产品:一个专门用来查询企业工商信息、注册信息、信用信息的商业调查平台。

如果你看过《速度与激情》系列,“天眼查”这个名字一定能让你联想到那个无所不在的监控平台“天眼”。与科幻不同,天眼查“开眼”的对象只是那些肩负着社会责任的企业和人物。

“天眼查要让‘每个人’都能‘公平’地看清这个社会。”

柳超为自己的产品赋予了一个崇高的使命。“每个人”,就是一切和商业社会有联系的人,他们可能是跳广场舞的大妈,刚毕业的青年,生完宝宝的母亲。“公平”,则是要用大数据打破信息获取的壁垒。

这听起来像是某种新形式的布道,既普世又崇高。但是柳超不是一个布道师,他喜欢用产品来为自己解释。

“跳舞的大妈可能需要买理财产品,大学生可能需要去找工作。在做决定之前,他们都可以先去天眼查上面查一下:卖理财产品的公司资质如何?求职的单位信用怎样?而且这些信息都是公开数据,每个人都有权利去查阅和使用。”

但是不同的人对数据的获取能力是有差异的。如果不懂技术,有些人也许永远不知道如何利用这些开放数据为自己服务。

“即使你读书比我多,我在天眼查上也能够看到和你一样的信息。”柳超说道。

在天眼查上,每个人,都是公平的。天眼查的搜集、整理、分析、挖掘的数据,全部都是政府公开数据(天眼查官方网站标注的数据来源,包括全国企业信用信息公示系统、中国裁判文书网、中国执行信息公开网、国家知识产权局、商标局、版权局等)。“政府开放出来这些数据,其实就是认为这些数据对社会有价值,能够增加社会诚信,让社会变得更有效率。”柳超说。

事实上,这些公开数据的价值和社会的需求之间还有很远的距离。柳超创业的切入点,就是想做个能缩小这段距离的产品。

这也是天眼查在市场中的定位。

开放数据的门槛,在于“厨子”

采访过程中,“开放”是柳超提到最频繁的词。

天眼查所有数据源都是政府的开放数据;而且用户无需注册,就可以查询到处理好的企业信息。

如果天眼查是一个公益项目,那么DT君毫不怀疑开放的意义和价值。但是作为一个创业公司,利用开放数据源做数据挖掘,并向用户开放使用权限,这是一件有风险的事情。如果别人爬取走了你整理好的数据,造成数据资产流失呢?如果别人复制了你的技术,做出比你好的产品呢?

归根结底,做“开放数据”创业,你的门槛究竟在哪里?

柳超说,门槛在“厨子”。

“数据挖掘,就好比厨师做菜。《食神》里面厨艺大赛,最后比的是'黯然销魂饭'。什么是黯然销魂饭?其实就是蛋炒饭。食神能把蛋炒饭做出了花样,做出了境界,做出了层次。这样的话,才是食神,才是好的厨子。”

做数据挖掘,也是一样的道理。数据源(食材)固然重要,但是在数据挖掘领域,对海量数据的挖掘和处理(做法)也很关键。对于结果,评判的标准也非常简单——用户(食客)们用脚投票。

好的产品接受市场的认可,不好的就被市场淘汰。

一年前,柳超的“天眼查 ”团队宣布完成了 1.3 亿元人民币的 A 轮融资。从2014年成立至今,天眼查的市场表现可以算是站稳了脚跟。

马化腾说过:开放不是一种态度,而是一种能力。柳超很认可这种观点,要当好一个“厨子”,过硬的技术实力是必须的。

“天眼查敢做开放,就因为我们有很强的反爬虫,比如深度神经对抗网络。我们有这样的技术实力保驾护航,你爬不走我们的数据。”

在聊到专业技术的时候,他底气十足。但也仅仅只有那么一瞬间,马上话题就又切回到了产品上。

“好的技术,感觉就像魔术。”

柳超不停地告诉DT君,所有高深的技术,都是隐藏在产品背后的。科技创业者的任务就是要把这些复杂的东西通过产品简单化,最后呈献给用户一个人性化的服务,解决他们的问题。 

需要市场检验的科学家

“我们必须要盈利。” 柳超斩钉截铁地说道,“创业不是做公益。我们拿了投资人的钱,就要对投资人负责。”

对于企业家柳超来说,开放的能力,不仅是做好产品的技术实力,还包括能盈利的商业实力。

天眼查的商业模式主要是2C端的商业调查工具和2B端的企业产品、技术与服务。

因为数据源是开放数据,而开放数据本身是不收费的,所以天眼查普通的查询服务是免费开放给所有用户。它的收费服务均来自于对数据的深层次挖掘和提炼分析。

一方面,天眼查能够根据不同用户的需求,提供不同层次的数据挖掘服务,创造出具有梯度价值的数据产品;另一方面,他们还会与一些企业合作,结合开放数据和“所有者数据”,开发定制化的数据产品和服务。

“开放数据是未来的趋势,也是最大的数据源。”谈到开放数据的未来,柳超觉得这里面还有很多价值等待着人们去创造。

一切从产品出发,是企业家柳超留给DT君最深的印象,以至于我常常忽略了他的科学家背景。

柳超是典型的数据科班出身。本科毕业于北大计算机系,后师从韩家炜教授,在美国伊利诺伊大学取得计算机硕士与博士学位。2008年开始在微软研究院担任研究员。

2009年他与几位学者一起发表了重量级论文BBM: Bayesian Browsing Model from Petabyte-scale Data(《基于PB级数据的贝叶斯浏览模型》),是国际上最早研究PB级数据挖掘的学者之一。(PB是计算机的存储单位,1PB=1024TB。假设手机播放MP3的编码速度为平均每分钟1MB,而1首歌曲的平均时长为4分钟,那么1PB歌曲可以连续播放2000年)

(图片说明:柳超PB级别数据挖掘论文截图)

从学术到商业,柳超认为最大的不同在于两者的目标。学术是不断拓展知识的边界,商业则是为用户创造价值。

“我们创业,是为用户创造价值,踏踏实实做事,老老实实做人。而不是用一些很酷,很炫的buzzwords(时髦的术语)去忽悠。VR、AR、人工智能、深度神经网络,这些所有东西,都需要产品化之后接受市场检验。”

作为一个创业的科学家,柳超总是提醒自己要用产品说话,科学家也没有什么了不起。很多年过去了,人们可能不会记得深度学习这些热词,但是他们会记得那些优秀的产品。

采访到最后,我还是不死心。就问柳超,你这么强的学术背景,有没有什么别人做不到的技术门槛啊?

“我从来没有觉得,我有什么技术是别人做不了的。”柳超回答依然很接地气,“我和我的团队做产品,满足了一个社会需求,解决用户痛点,也会接受市场的检验。”

也许这是柳超和天眼查的底气。

数据侠门派

柳超,天眼查创始人兼CEO,本科毕业于北京大学计算机系,美国伊利诺伊大学计算机博士。国家青年“千人计划”专家、北京市特聘专家、中国大数据专家委员会委员、中关村高聚人才、国家下一代互联网产业技术创新联盟专家。

在创办天眼查之前,柳超博士任职于美国微软研究院,主管数据智能团队,深耕信息检索、数据挖掘和机器学习等诸多大数据相关领域。后回国出任搜狗科技首席科学家,从零组建了搜狗数据科学研究,全面负责搜狗互联网业务的数据挖掘与机器学习的前沿研究。他还曾经担任美国国家自然科学基金数据挖掘方向的评审专家。

关于数据科学50人

“数据科学50人”项目是DT财经旗下数据侠计划重点内容产品,旨在与数据科学领域KOL共同挖掘数据内容的价值。我们从商业数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布,第一财经数据科技及合作伙伴倾力支持。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing004并备注“数据社群”,合作请联系datahero@dtcj.com。

(了解更多有趣又有料的商业数据分析,欢迎关注DT财经微信公众号“DTcaijing”,下载“DT·一财”APP)

分享这篇文章到