feedback

意见

反馈

back-to-up

回到

顶部

你离餐饮界最懂顾客的老板,只差一个爬虫的距离 | DT×NYCDSA

NYCDSA

John Yap   2018-08-02

在线点评已经成为现代大众消费里的主流行为,我们在外出寻找一家参观时,往往会首先去看看吃过的人都如何评价。既然顾客都如此在意点评,饭店老板们就更不用说了。数据侠 John Yap 希望为餐饮老板们设计一个爬虫工具,通过分析用户评价,来让他了解自己的饭店的表现情况,制定相应的运营策略。让我们来看看John Yap 具体是怎么做的吧。

在线点评已经成为现代大众消费里的主流行为。以前饭店想要从消费者那里获得反馈,只能靠顾客填写的意见表。而顾客则更多是阅读食评人的文章来决定去哪里吃。但时代已经变了,现在有很多在线点评应用,比如Yelp,比如 TripAdvisor。

 在这些app上,用户评分是最重要的部分,它是一次用餐体验的集中体现。往往一次点评里还包含用户对餐厅的好与坏的具体表述,有时候这些点评还会直接给出是否应该前往用餐的建议。这就营造了一种场景,在这里餐厅被直接曝光在公众的评价之下。这种理念其实并不新鲜,只不过以往只属于食评人的权利,如今到了广大群众的手中。而这些app就成了集中收集和展示人们评论的广场。

所以,看到如今的饭店都在积极的塑造自己的媒体形象也就不意外了,尤其是那些连锁品牌,它们将这些评分视为推进业务的手段。我的项目挑选了纽约人民最爱的Shake Shack 和加州人民自豪的 In-N-Out 的数据。

在这篇文章里,我希望用网络爬虫获取的在线点评数据来完成两件事:(1)提供一个数据库记录,让饭店们可以用它来改善业绩;(2)创建一个评估和比较商业表现的工具。

在我的 GitHub 页面可以看到更多的代码。

搭建属于你自己的数据库,对 Yelp 点评数据进行系统性分析

Yelp的评分等级为1星到5星,5星代表最棒。评分越高你的饭店自然就越有可能被顾客选中。

 Yelp 显示评论时候会有一个“Yelp 精选”的排序,但具体排序规则外界并不清楚。你自己也可以按照日期或评分升降序来排列,但我觉得有系统地来做这件事情会更好。比如,你可以像我一样,用 Beautiful Soup 来爬取数据,用 Ploty 、 Excel等软件或者R语言来进行分析。

 把每个饭店的平均得分展示出来是个不错的选择,但是这并不能展现这家饭店的真实表现。比如,当一家饭店过往一直得到好评,但最近一周差评增多,这时候如果还是展示平均分数,那很可能它的分数还很高,但真实的趋势其实并不乐观。饭店经理需要知道真实的情况并做出改变。所以,最好在分析评分时候考虑进时间因素:

这组数据来自德州 Plano的 In-N-Out ,基于这些数据,饭店经理就可以:对评分变化的趋势进行可视化的分析。这样你就可以知道最近是否评分变差。

分析那些具体的事件。你可以选择只关注某一特定条件的评分变化情况。比如可以只看1星、2星评分,你还可以查看这些评论的具体内容。这样你就可以对比分析,比如,是否在那些人手不足的日子里,饭店获得的评分也会相应变低。

拥有了自己的 Yelp 数据库,你就可以建立一个用于提高表现的参考记录库。比如你可以设置新的栏目,总结评论中吐槽的各类环节,比如后勤,食物或者服务等。这样你就可以发现顾客的抱怨来自哪些环节,并作出针对性的改进。而且,你还可以记录下投诉发生的时间和过程,这样也方便之后的新经理立刻了解过去的经验,避免重复犯错。

Yelp 评分作为一个表现评估工具

如果你是一个关心自己Yelp评分的经理,你要如何知道自己在 Yelp上究竟有没有提升呢?当你有了爬取的Yelp数据时,就很方便了。你可以选择一个日期,然后计算到此日期之前的所有评分的平均值,这就和 Yelp 上显示的当日的评分相同(直到下一个评分打出前)。

同样使用上图中的 In-N-Out 数据,我们可以得到一个下面这样的数据图:

看起来,三家店都在最开始经历了差评潮,北达拉斯店最为严重。但它三年后提升了一颗星。而Plano店这么多年来依然是平均分最高的店。

你以为就这些么?当然不是!还有更多。你竞争对手的表现如何?比如 Shake Shack:

Shake Shack 2016 年开进得克萨斯。看起来它一开始并没有经历In-N-Out的遭遇,这是否意味着得州人更喜欢 Shake Shack? 或者说他们很快就适应了这个从东部过来的连锁快餐?

到2018年,所有店的平均得分都差不多,唯独 Plano 的店的得分脱颖而出。也许这家店的经理真的配得上一次加薪晋升奖励。

何时适合爬取数据

一旦你拿到了 Yelp 的点评数据,你就需要定期更新数据库。那么究竟应该以怎样的频率来更新呢?我们可以看看In-N-Out的数据。这是Plano的这家店获得的点评数的时间分布图:

图表显示,最近每月平均只有1到3个点评。所以每个季度更新一次是更好的选择。而对于像Shake Shack 纽约麦迪逊广场店这样,更大客流量,更多点评数据的店,情况就完全不同了:

这家店是 Shake Shack 的旗舰店,开业于2004、05年左右。巧合的是,这也正是 Yelp 开始上线运营的时期。图表显示,最近每个月它都会收到5到15个点评,所以也许每个月做一次数据更新比较合适。值得注意的是,有时候每月的平均点评数异常高,甚至达到上百个。我不知道这是怎么回事,可能对应的是它最受欢迎的时期?但这种情况下,数据库的更新就可以更加频繁,每周一次都可以。

也许对于一些饭店业者来说,Yelp 和其他在线点评数据很讨厌。但其实,你完全可以将它转化成自己改进服务的工具。你可以记录什么时候收到了差评,可以对评价进行定制化处理,找到可以提升的领域,甚至可以以此作为评判标准,制定一个提升服务质量的目标,并用这个工具来进行评判。关键的是,这样做的成本很低,你并不需要耗费太多精力就可以提升改善自己的经营。

(本文翻译自科技博客 How Chain Restaurants Can Use Online Customer Reviews to Improve Their Businesses,仅代表作者观点,文中图片均来自作者。)

数据侠门派

John Yap是一名在临床试验以及观察性研究方面有多年工作经验的统计学家。他参加了NYCDSA的课程来提高自己的数据科学能力。他希望用自己的能力来帮助人类提高生活质量。

关于DT×NYCDSA

DT财经与纽约数据科学学院是战略合作伙伴。DT×NYCDSA 系合作开设的系列专栏。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing004并备注“数据社群”,合作请联系datahero@dtcj.com。

 

分享这篇文章到