feedback

意见

反馈

back-to-up

回到

顶部

从电气工程到数据科学的“幸运”转身 | 数据科学50人·逄伟

数据科学50人

· 逄伟

张慧芳   01-24

前携程首席数据官、现任人工智能科技公司Appen 首席技术官的逄(páng)伟自我评价为一个“幸运儿”。从大学EE(电气工程)专业的学习到转向数据科学,他站在这个DT时代的风口浪尖之上,试图通过大数据与人工智能技术让世界变得更美好、更高效。作为数据科学的实战派,逄伟幸运吗?或许那个所谓“幸运”只是来自他对技术的信念与努力。

坚定的“转型信念”

二十年前,一个炎热的夏季,坐标杭州,一位学子扶了扶鼻梁上的眼镜,带着一丝无畏和坚定开启了自己的新篇章……

1994年,逄伟进入浙江大学,攻读电气工程专业(Electrical Engineering,简称EE)。就像恋爱一样,有时候恋着恋着就不爱了,学习有时候何其相似乃尔,他学着学着发现自己其实并不爱所学的电气工程。

1994年,中国通过一条64K的国际专线接入互联网,也是这一年,逄伟在辅修课上找到了“真爱”——计算机。

计算机的魅力为其和软件打交道的“花朝月夕”奠定了技术基础,“当时觉得,给我一台电脑,我就能改变整个世界。”逄伟如回忆青春芳华般吐露。

四年后,保研浙大电气工程专业的逄伟虽然没有换专业,但是他对于想要用计算机让世界发生一点改变的内心“嫩芽”依然在“茁壮成长”。

2011年,硅谷知名风投家马克·安德森在《华尔街日报》上提出了一个著名的观点:“软件正在吞噬整个世界”。大学时期的逄伟就有了如此的感悟,他回忆道:“我那个时候倒不会想到软件在吞噬世界,只是认识到通过计算机技术产生一些产品是能够对世界产生一些不可思议的影响的。”

(图片说明:风投家Marc Andreessen发表在华尔街日报的文章《Why Software Is Eating The World》)

学生时的逄伟就开始试着用电脑制作一些分析交易类软件,并尝试创业,他发现,和焊电路板的工作相比,这些更能给他带来成就感。“EE更多服务的是大型的机械系统或者电力系统的启动,这是两个完全不同的世界。”逄伟的追忆略带怀念的气息。

在与DT君的对话中,逄伟多次提到,计算机是个神奇的东西,而用计算机技术做产品去产生一些影响是逄伟后来给自己定下的发展路径。“我明显能感觉到在软件的世界里我非常开心,也能发挥更大作用,到现在为止,我做的东西可能差别比较大,但整体来说,职业都还是沿着这条路在走。”

逄伟很有前瞻性,在学生时代做的一些关于软件开发的兼职让他比同龄人多了些实践经验,所以,一毕业,逄伟就进入IBM,成了一名软件工程师。

IBM期间,被他定义为提升顾问和系统架构师能力的职业生涯阶段,他也成功交付了大量的电子商务、银行、电信等项目,积累了工程、电子商务、项目管理、电信行业和计费方面的扎实知识。那时的逄伟对于软件改变世界的信念坚信不疑,但是隐约中也和数据结下了不小的缘分。

面对数据科学50人的专访,逄伟很明白他得讲讲数据科学的事儿。在做软件系统时,数据是基础,但是在IBM的经验更多是做工程,和数据科学的相关度比较小,他很自然地过渡到了数据这一话题:“我真正接触到数据是在eBay的时候,对我来说那个阶段也是我从工程师转型到数据科学家的一个重要时期。”

循序渐进的数据服务之路

一次偶然的机会,逄伟接到了当时在美国如日中天的eBay(eBay中国)的邀请。“当时前期主要还是在做工程类的工作。”逄伟说道:“但是在2008-2009年左右,eBay经历了一次很大的危机,也让eBay开启了转型的大门。”

2008年,金融危机席卷全球,各大公司掀起一阵裁员“风波”,eBay也受到波及,裁员千人,当时的营收额呈现大幅度下滑。逄伟2006年加盟eBay,在2009年前做的主要是计费系统,“那个时候技术人员真正的能力没有被应用起来,只是被当做了工具。”逄伟感到很可惜,“你把全世界聪明的人聚集到一起,但是没有发挥真正价值。”好在eBay当时也认识到这一点,于是大量招聘高级技术人员,逐渐开始通过算法和数据来驱动业务增长。

“我当时很幸运。”逄伟说道。

DT君测算,“幸运”这个词在整个长达两个多小时的采访中大概被逄伟提及了六次左右。就像后来DT君问逄伟你如何评价自己的这十几年职业生涯一样,他也用了“幸运”一词。

关于这次的“幸运”他形容到:“后来我们开始做搜索业务,用数据结合技术驱动业务,我很幸运接触到并且做了出来。”那是2009年的11月,逄伟从eBay计费方向的高级产品开发经理变为了eBay搜索科学工程总监,这也是逄伟正式和数据科学打交道的开始。

“那又是一个不同的世界。”逄伟说。

以前做计费、支付系统时,如果让客户错了哪怕是一分钱,都会是非常严重的bug,整个团队都要加班加点修改。而逄伟开始接触搜索业务后发现,在这个“世界”里的“玩法”有些不一样,比如用户搜出来的商品第一或者第二的排名,其实并没有绝对的对与错,很多事情能够用数据解释得通。

数据驱动业务的魅力很大,但是当时对于逄伟来说,也是不小的挑战。数据科学和工程领域差异非常大,在做搜索算法时,逄伟需要同时掌握更多专业知识,最大的挑战也就是机器学习。“那个时候没什么人在谈论AI(人工智能),所以对我来说这将会是一个巨大的变化,我该不该去涉及一个新的领域,我当时很困扰。”是继续做工程师还是去担任数据科学家,二十年前的逄伟显得有些犹豫。

又是因为自己的“幸运”,后来,逄伟在人生的分叉路遇到了一位解决其疑惑的“顾问”朋友。那位朋友的经历让逄伟非常触动,从大学教授到现在在工业界管理几千人的团队,除了负责搜索业务,还需要掌握大量的前端及组织业务,在和他多次沟通后,逄伟想通了:“我应该有些突破。”走出舒适圈,逄伟利用每个工作日及周末的晚上学习数据科学,包括统计学的理论知识,并开始深挖机器学习领域。

因此,逄伟在eBay中国领导起了一个数据科学和工程团队,推动用户体验在搜索科学、互联网营销、销售和买家体验方面的改善,并构建一套统计模型和系统,来监控与搜索相关的问题,最终通过改进搜索算法推动了eBay网站GMV和用户的增长。

逄伟感叹道:“eBay对我整个职业生涯的帮助都非常大,让我能了解到商业世界的内在逻辑,通过数据分析来为整个公司做投放的优化让我很有成就感。”在eBay的经历让逄伟很深刻,也很感激。

通过数据帮助团队进行产品投放与优化是逄伟主要在做的事情,说到这里,逄伟举了个例子,通过数据分析发现,美国人们在庆祝万圣节时,有两个类型的物品非常受欢迎:一是个人装扮,为了参加活动;二是派装扮,为了迎接参加派对的人。“以往市场部的逻辑是在节日开始的前四周开始做产品的市场投放,但是后来逄伟通过数据发现,万圣节之后仍然有人在买装置派对的物件。

看上去用户行为发生了变化,其实不然。逄伟分析了下,万圣节的个人装扮更看重时效性,节日过了效果也就不存在了,而装饰室内的物件由于节日后的打折以及非时效性等因素,反而受到欢迎,这是以前的市场部在投放时想不到的,这也是数据科学带来的魅力。

逄伟将数据变成了eBay生产的一部分,这也是eBay在数据上的一次转型。随后逄伟在多次邀请下去了eBay总部,不仅将数据作用于生产,更支持了整个公司的运营,这就到了数据精细化运营的层面。“我需要打通整个eBay内部的数据,这包括了数据集成、公司决策、业务融合、产品优化以及数据产品五个层面,我当时和团队一起对公司整个的数据系统进行了优化。我发现,精细化运营后的数据是真的能在各方面帮助公司实现价值。”逄伟说。

在eBay任职11年之久的逄伟摸清了互联网的商业打法,也知道数据的价值有多大。除了解决了互联网公司的收入问题、支持业务并获得巨大提升以及对产品“做决策”(通过数据分析帮助产品经理设计产品)外,逄伟认知中最重要的是,数据可以帮助商业环境建立一个数据生态,能够帮助客户、媒体以及第三方获得他们想要的信息。

“那么为什么后来选择回国了呢?”DT君很好奇。

“在eBay的工作让我对数据科学越来越熟悉,我知道怎么帮助一家互联网公司增长业务。”逄伟说道:“彼时的中国互联网企业已经过了靠人口红利‘野蛮增长’的阶段,我觉得发展甚至已经处于平缓状态了。”另外,逄伟认为虽然中国企业业务的增长非常迅速,而且技术团队在基础架构方面也发展的不错,但在用数据和算法驱动价值上,国内目前企业做的好的屈指可数。“其实这是精细运营的过程,做好这一块,将会为国内企业带来第二波大增长。”

想真正把带国外学到的知识和经验带到国内,帮助国内企业做精细运营、增长业务,这是逄伟回国的原因。

逄伟说他在选择一家企业时非常看重企业的文化及领导魅力,而携程多个方面都挺吸引他,其中就包括机具学者气息的企业家——携程网创始人梁建章。

梁建章在新书《人口创新力:大国崛起的机会与陷阱》中阐述了其对于中国人口结构与经济发展影响的洞见与分析,并谏言了整个人口红利的未来,这与逄伟“希望用数据的力量对抗因人口红利衰退导致的业务减速”的理念不谋而合。

逄伟说:“我很佩服梁建章,他的经历比较传奇,是个非常理性和有魅力的人。而且当时携程整个公司从上到下都有决心将数据发挥价值,有了这个基础,我也能更好发挥自己的作用和价值。”于是回国后,逄伟就进入了携程担任了一个非常新鲜的职位——CDO(首席数据官),他用“摸着石头过河”来形容当时的状态。

“CDO是一个新角色,不同公司定位不同。”逄伟说。当时他给携程的定位是用数据驱动价值,凭着十多年的数据科学经验,同时利用人工智能技术帮助携程在旅游行业更好地提升了业务效率和能力。他举例说道:“比如通过数据策划,可以帮助客服做质检,生产一批机器人客服,从而减轻业务成本,提高服务效率。”

建立携程大数据平台时,逄伟发现携程在数据上一个很大的问题——数据集成非常困难。

“携程各组织架构非常独立,好处是决策很快,自己可以做主,坏处就是数据之间没有打通。企业数据想要发挥最大价值,必须解决企业内部的“数据孤岛”问题。这其中,携程的数据包括三类:

  • 第一种是结构化数据,主要是线上消费的交易数据,背后包括了消费者去过哪个城市、住了哪家酒店、什么价位。
  • 第二种是半结构化的数据,主要是消费者在App上的行为数据,点开了哪些网页,在哪一个页面停留了多长时间等。
  • 第三种是非结构化数据,主要是平台上获取的图片、文本、视频、语音等数据信息。

这三大类数据的完全打通需要一段时间,就如同产生价值一样,是一个持续性的问题。

2018年末,惜别携程的逄伟入一家叫Appen的海外公司。逄伟说,这是一家非常特殊的企业,旨在为人工智能的发展提供数据基础。这和逄伟以前做的数据精细化运营相比,显然上了一个阶梯,他在打造更高质量的数据。

(图片说明:2018年11月,Appen官方宣布逄伟加入公司任CTO)

“这对我来说是一次新的机遇。”逄伟说。

虽然,当下人工智能的发展已慢慢冷静下来,但仍有大量公司想挤进人工智能的行列。不过,想要发展人工智能,前提是要有数据,小型企业并没有收集大量数据的能力,也缺少机器学习的能力。相较之下,拥有20年历史、从文本翻译起家的Appen就拥有海量大数据和技术结合的经验。

逄伟说自己从前的经历让他知道如何让数据产生更好地价值,而现在的工作则是如何训练数据,用更好的数据集帮助自己的客户获得更高的价值,对于逄伟来说,服务对象不同,挑战也不一样。加入Appen至今不过三月,对未来,他充满期待。

“我是个幸运儿”

从纯工程到纯数据,再到技术+数据,逄伟十多年的职业生涯甚是丰富,对于数据科学的理解也非常清晰。

虽然数据科学还没有一个明确的定义,但是圈子里的人做的事情都差不多。逄伟说,他的理解是数据科学以前叫应用科学,现在也包含数据分析,“我个人觉得只要你能够用数据、算法去产生价值,你就可以被称为数据科学家。”包括机器学习、深度学习背景的一类,也包括统计学习出身背景的一类。

这十几年,逄伟说他很幸运能进入一个“技术行业”。为此,他总结了三点:

  • 行业虽然在不断发展,十年前和现在的关注的事物可能完全不一样,你可能有无数的新的东西要学习,但是用技术驱动业务,用技术给这个世界带来一些变化,这是永远不会变的,变得只是技术的形态而已。
  • 正因为行业发展非常迅速,使得企业发展不断茁壮,这其中影响的可能会是几亿人,逄伟认为自己是影响这几亿人中的一个组成部分,因此感到非常幸运。
  • 很幸运能够接触到全世界最聪明的部分人。可以从中学习到非常多的知识,接触到很多好玩的事。

当然,他也提到自己从一名纯粹技术型工程师,进入信息检索,再到接触数据科学,他很庆幸自己赶上了“潮流”。对于未来数据科学的发展,他仍然非常看好:“数据和AI结合起来解决实际问题,在互联网行业已经有了广泛的应用,未来还会为其他行业,特别是传统行业带来巨大的价值。”

数据科学50人成员

逄伟,现任Appen CTO。数据分析领域知名专家,前携程CDO,通过对携程大数据进行深入有效的分析以及挖掘利用,结合最前沿的人工智能技术,让大数据成为推动公司决策潜在力量的同时,促进旅游行业转型升级。在加入携程之前,逄伟先生在eBay美国担任全球大数据资深总监,负责端到端的数据挖掘和应用,用数据来优化产品和驱动运营,之前先后主导过eBay支付产品、搜索科学、市场流量科学以及行为数据产品的开发。

关于数据科学50人

“数据科学50人”项目是由第一财经旗下DT财经发起的中国顶尖数据科学从业者的系列专访与社群组织,从数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing003并备注“数据社群”,合作请联系datahero@dtcj.com。

 

分享这篇文章到