数据分析终极一问:自然增长率,到底怎么算!

大数据 数据分析
自然增长率的争吵,还会无穷无尽地进行下去。特别是,有时候数据分析岗位就是设在运营下边,运营的老板需要数据分析帮自己站台,这时候科学不科学,合理不合理就管不上那么多了。食君之禄,分君之忧,想办法圆过去就好。但是,作为数据分析师,自己得清楚游戏是咋玩的,这样再用各种方法圆故事的过程中,才能进退自如。

​数据分析领域有很多终极难题。如果你和营销、运营等部门打交道,最常遇到的问题一定有一个叫:自然增长率!

  • 到底自然增长率怎么算
  • 为啥我算出来的他们都说不合理
  • 为啥他们给的自然增长率都这么低

一、什么是自然增长率

自然增长率,是相对于人工增长率而言的。严格来说,在商业上是没有严格的自然增长率的,所有的业绩都是靠人做出来的,但是,有些部门是能直接产出业绩的,有的就只能打辅助,叠buff。

典型的直接产出业绩的,比如销售,直观的看,所有的业绩都是销售卖出来的。互联网的广告投放与此类似,投了广告,用户点击下来,就直接带来收入。

典型叠buff部门,就是品牌、营销、推广、用户运营、活动运营。他们是在销售、推广的基础上叠buff。

比如:

  • 原本商品卖30元,现在送个优惠券,省5元
  • 原本商品是食品,现在加个“吃个延年益寿”的宣传
  • 原本商品没牌子,现在加个“国际大牌”“驰名商标”

是不是看起来牛逼一点了,买的人可能多一点?有可能,也没可能!总之很难说清楚。

因此,这些部门就特别想输出一个自然增长率的概念。剥离出来“哪些是本来就有的自然销量,哪些是我的优惠券/积分/小礼品/赠品/广告/宣传语/等级/荣誉徽章”带来的。这就是自然增长率问题的起源。

有意思的是,自从这帮人发明自然增长率以后,销售们也开始用这个概念,不过用法是:计算自然增长率是多少,然后证明大环境/天气/运营策划的傻逼活动产生了负影响,导致销售没做好了。

二、理论上的自然增长率

看起来想剥离品牌、运营、营销的BUFF很好解决。只要把销量区分为自然/人工两个部分就好了!

理论上,自然增长率有三种算法。

方法一:按时间区分。没做活动之间是自然增长率,做活动期间是人工增长(如下图)。

图片

方法二:按人群区分。没做活动的人是自然增长,做活动的是人工增长(如下图)。

图片

 

方法三:按产品区分。没做活动的产品是自然增长,做活动的是人工增长(如下图)。

图片

 

搞掂!多轻松。是滴,理论上确实这么轻松,但实际操作起来,麻烦就来了。

三、来自现实的挑战

挑战一:非活动时间数据不工整。

从本质上看,顾客不会时时刻刻均匀的到店买东西。想逛街要等下班、等周末、等放假;想上网得等有空、摸鱼、娃睡了的时候。因此非活动期间数据本身就是高低起伏。到底选3个月平均?选最近一个月?选最近一周?经常因为这个事吵架。

挑战二:几乎天天做活动,没有非活动期。

这个在零售、电商、游戏等行业都很常见,活动几乎天天都在做,无法选非活动期。或者非活动期只有两个大活动之间短短数周,本身处于大促结束后的回暖时期,根本不足为据。这样时间法基本就废掉了。

挑战三:商品属性、生命周期不同,无法类比。

首先,很难选出一模一样的商品进行对比,两款商品或多或少存在差异。其次,商品本身的销量走势,也是人为做出来的。商品卖得好了需要加单,商品卖得差了需要清仓。因此眼前的销量很难被认定为:“自然”。

挑战四:不是所有活动都适合划分参照人群。

比如618,双十一大促,还嫌参与的人不够多呢,不可能剔除某些人不参加。比如非电商渠道,非即时消费产品,如果搞区分人群定价,很容易引发窜货,或者被消费者举报到市场监督局,定一个“大数据杀熟”的罪名。

挑战五:参照人群的划法,很难一碗水端平。

即时分参照人群,也很难说明问题。因为最终要测试的是购买行为,而影响购买行为的变量很多。性别、年龄、过往购买频率、品牌忠诚度、促销敏感性等等因素都有影响,因此通过分析抽样,可以轻松做出来购买率很低的参照组,从而让ABtest失效。

挑战六:外部影响没有考虑。

是滴,即使以上因素全部考虑,依然有人跳出来说:你没有考虑宏观环境/天气/政策/社群族群等等影响,总之,原本应该下跌30%以上的,你看XX同行就跌了这么多,所以我们下跌20%是正常的,嗯,是我们的成果。

更深层地看,之所以有这么多乱七八糟的争论,本质就是两字:

甩锅

不是为了让自己的工作蓬荜生辉,谁又会这么卖力地推过揽功,舌花灿烂呢。你说的数让人家的绩效不好看了。人家就会找各种理由喷你,就这么简单。

四、理论上的破局

有没有合理的解决办法?理论上有!

解决的前提就是站在二层楼看问题,把屁股从小部门位置上挪开。思考到底做到啥程度真的对业绩有帮助,如何完成自己的任务,提高整体效率。

首要要排除的就是把锅甩给外部因素。是否是外部环境变化,其实从数据上很好识别,只要满足四大条件就能说这是主要受外部影响(如下图)。但是,如果不能满足四大条件,仅仅是看到一条新闻报道、听说了同行的抱怨、就不拿来说事。

图片

其次,对于直接产生业绩的部门,根本就不要扯啥自然增长。达标就是达标,不达标就是不达标。只是看从呢不找办法,还是外部找办法。

再次,对于叠buff部门,可以算自然增长。但是要分三大类型算:

图片

简单来说,就是:

  • 不背硬指标的,自己和自己过往比
  • 背硬指标但是有明确任务的,先完成任务
  • 背硬指标,且背整体指标的,关注整体,不纠结细节。整体不达标,你光哔哔我自己做的好,照样没人信
  • 背硬指标,且分群营销的,直接上ABtest,不整虚的

当然,还有最简单的办法,就是:买定离手法。所有人提前共识算法,用最近X周也好,用去年同期也好,总之,在项目开始之前共识好。之后买定离手,事后效果不好了自己反思原因。一开始不定好参照组,事后自然会百般狡辩。

五、现实中的无奈

然而以上仅仅是理论。现实中,无论怎样,都是:

  • 负责叠buff的运营总是想证明自己一手遮天
  • 负责销售的部门总是喜欢抱怨后台支持不给力
  • 负责监督的老板总有自己的小九九和衡量标准

所以关于自然增长率的争吵,还会无穷无尽地进行下去。特别是,有时候数据分析岗位就是设在运营下边,运营的老板需要数据分析帮自己站台,这时候科学不科学,合理不合理就管不上那么多了。食君之禄,分君之忧,想办法圆过去就好。但是,作为数据分析师,自己得清楚游戏是咋玩的,这样再用各种方法圆故事的过程中,才能进退自如。

其实细看之下,会发现,所谓的数据分析终极难题,从来都不是难在计算本身,而是难在各个部门都拿数据当枪使,屁股决定脑袋。当你想收集一个有利的数据证据的时候,你总能找到一个。​

责任编辑:武晓燕 来源: 接地气的陈老师
相关推荐

2022-03-08 23:46:06

数据分析大数据

2020-09-16 10:16:54

数据分析量化大数据

2021-09-05 18:28:10

数据分析模型

2022-01-18 08:04:37

2021-02-23 09:28:48

大数据数据分析

2017-05-23 09:20:32

大数据数据分析多层模型

2019-10-21 13:12:41

数据分析增强分析人工智能

2021-06-17 13:10:47

2015-08-19 13:50:19

数据分析

2019-05-08 08:00:49

增强分析数据科学分析技术

2021-05-10 14:49:21

分析指标下跌

2021-06-04 15:50:49

AI 数据人工智能
点赞
收藏

51CTO技术栈公众号