给吃货:数据告诉你叫什么名字的餐馆菜更好吃?

大数据
通过地理位置对饮食习惯的影响分析,可以用大数据来创造新菜

作者:团支书(36大数据授权转载,其他转载请与作者联系,本站不做侵权背书)

这本来是一个美女博士姐姐和我共同参与的严肃学术研究(发表期刊的那种)。在征得她同意后,我删掉了大部分的学术性内容,增加了若干张丧心病狂的图片,篡改成了这篇回答。拿出来给大家娱乐一下。

在这个传播为王的年代,一个好名字异常关键。给孩子起名要计算生辰八字,查看五行缺啥;给大楼起名要请大师开光,收各种赞助。那么开餐馆呢?

我相信餐馆老板们总会慎重万分,斟酌再三。但残酷的现实是,总有些人给自己餐馆取名是这样的:


数据


这样真的好吗?

但是,认真地说,我的确不知道叫做“小三”烧烤店到底好还是不好。本着科学的精神,我们祭出“大数据”来分析一下吧。

“小三”到底好不好?

以魔都为例。我们从网络上收集了沪上约10万个各类餐馆的信息,然后筛选出评分8.0分以上的餐厅(占比29.2%),将这些餐厅名字的词频进行分析,发现魔都高评价的餐厅名字里大多包含着这些字:


数据分析


其中好评餐馆的“小”字使用频度居然排名第四,仅次于“料理”、“酒”、“海”。

看到没,看上去平平无奇的“小三烧烤店”,其名字却包含着大数据中深刻的玄机。我想正因为如此吧,同样隶属于“小”字辈的餐馆们花样繁多层出不穷(但整个画风已经逐渐开始变化):


[[156473]]

 

当然,还有其他的“小”字辈的系列主题餐馆。


数据


当然,还有那些混入的奇怪东西。


数据


果然,看上去貌不惊人的苍蝇馆子都深谙起名字的大道理啊!

但是,问题来了,为什么“小”字辈的餐馆都是这种一看就知的屌丝店?

让我们再按照价格筛选一遍。在所有的餐馆数据中,有超过半数(57%)的餐馆人均价格在30元至100元之间。那么,我们看看这些人均消费在30元以下的苍蝇馆子都用哪些字?


数据

 

从上图可以看到,最廉价的餐厅用字前五名分别是:“烧”“烤”“小”“面”“馆”。

“小”出现频率排名第三!“小”字辈的烧烤店果然非常明确自己的定位啊。

但是,问题来了。那些高端的“小南国”、“小绍兴”、“小金陵”和“小肥羊”们要怎么办?它们也都是“小”字辈的,难道要改名字吗?

看来必须要筛查一下高价餐厅了。我们把人均消费100元以上的餐厅(占比20.7%)拿出来,对其名字里的词频数进行了统计,可以看到下图:


数据


高价餐厅的高频词排序为:“料理”“大”“馆”“家”。看来用“大”字才是高价餐厅的王道啊。

那么,“小”南国是不是要改名为“大”南国才能符合其高端定位呢?先别着急,我们再给“南”字算上一卦。

我们将所有含“南”字的餐厅进行了统计。所有“南”字系餐厅中,中评率约47.1%,差评率28.1%,而好评率仅有24.8%。


数据


看来“南”字的吃货认可度堪忧啊。

刚算到这里,一直安静坐在我旁边的同学忽然问道:“听说,最近著名的餐馆‘俏X南’很不太平,是怎么回事呢?难道也是命犯“南”字之过吗?”

我捻须(虽然没有)一笑:“命犯‘南’字,还不那么打紧。但是别忘了,他们家老板名字中还有个‘小’字呢。虽然可能评价还不错,但天生就不是做高端餐饮的命啊。”

同学若有所思地点头,“哦,怪不得要娶徐熙X,原来是五行缺‘大’啊。”

先按下这些八卦不表,还是让我们稍微严肃地思考一下:到底怎样科学地给自己的餐馆取名?

我想了想,简单地给出几个小贴士吧:

一,菜系起名大法。

按照餐馆主营菜系来起名字,看上去是个好主意。我们以川菜和日料为例,观察其名字字频数的分布规律,如下图所示:


数据


可以看到,川菜馆高频字为:川、菜、鱼、香、重庆等,跟菜系高度相关;日料高频字为:和、花、亭、居酒屋等,跟菜系也高度相关;

那么,是不是起一个跟菜系高度相关的名字,就安全了呢?

我们将所有餐馆按照菜系分类,整理那些名字与主打菜系高度相关(我们称为“恋家”程度)的餐馆,求出其占比程度和溢价率。制作出下图:


数据


可以看到这样一个规律:总体而言,“恋家”指数越高的菜系,其恋家餐馆的溢价率越低。也就是说,要不要给你的餐馆按菜系起名字,这要看你的同行们都怎么干。

如果大家都爱用该菜系关键字来命名餐馆,如湘菜,你还用同样的方法来命名,那么价值不大;但假如大家都不爱用本菜系关键字来命名餐馆,比如本帮江浙菜,那么你忽然取个本帮菜相关的名字,其溢价效果不言而喻啊。

二,城区取名大法

按照餐馆所在地取名,想想看,应该是个好主意。任何地区的人民都有独特的偏好,特别是对大城市而言。于是,我们整理了全上海所有的高评价餐厅,将其名字中的高频词统计出来,然后根据餐厅所在地,将这些高频词分配到城市空间当中,制作出下图:


数据


从北向南逐一来看吧:

我们看到宝山的“串”。(难道宝山真的是撸串之区?)

我们看到杨浦和闸北的“小”。(果然是魔都屌丝双雄啊)。

我们看到虹口的“甜”。(甜品之区?)

我们看到浦东黄浦滨河两岸的“酒”。(浦江两岸果然是纸醉金迷的所在)

我们看到古北的“日”“料理”。(不愧是魔都的日本街)
……

信息太多,不一一阐述了。 有兴趣的话可以看看下图吧。(按照词频排序汇总到市中心各区)


数据


三,八卦解字大法

如果觉得以上两个起名方法都不给力的话,我们只好祭出最终奥义了。八卦解字大法。

我们将所有关于餐馆评价、价位、地域、竞争等数据综合起来,然后将这些数值赋给每一个餐馆起名常用字,最终得到了一个庞大的餐馆起名八卦解字数据库。

这个数据库好不好用呢?我们来试一下。

先以魔都人民热爱的“料理”二字,求一上卦。输入“料理”二字,可见下图:


数据


果然高大上,那我们稍微亲民一点,再来给“烧烤”求个签,输入“烧烤”二字,可得下图:


数据


那么火锅呢?我***的火锅呢?求一卦。输入“火锅”二字,可得下图:


数据


哈哈,怎么样,这个数据库是不是很好用?

***,回到之前我们按下不表的那个小八卦,来给面临危机的“小”字求上***一卦吧。

轻轻地输入“小”字,可得下图:


数据


呃,这个……

一不小心,我想我的数据库程序已经通过图灵测试了。

 

责任编辑:李英杰 来源: 36大数据
相关推荐

2017-11-16 16:08:31

2018-11-28 13:16:39

火锅数据爬虫

2015-06-17 11:18:01

WiFi

2017-08-18 08:18:06

智能饭盒餐具食物

2023-03-16 07:45:52

2021-04-16 10:50:28

程序员技能开发者

2009-03-26 08:26:43

首富盖茨中餐馆

2021-04-15 09:37:05

大数据Maven

2019-07-04 23:25:22

云计算云服务云平台

2021-01-27 14:10:08

大数据年货网购

2012-07-03 16:56:12

Hadoop

2015-08-17 09:20:31

大数据

2015-04-07 09:44:49

Android

2017-12-27 22:13:34

2023-04-06 16:21:52

2021-02-27 10:38:56

Python结构数据

2021-04-19 10:54:45

技术资讯

2017-10-19 21:56:55

数据可视化大数据数据

2015-12-03 10:09:31

2020-09-03 08:02:36

CDN降本P2P
点赞
收藏

51CTO技术栈公众号