社区编辑申请
注册/登录
数据分析七大能力:梳理数据需求
大数据 数据分析
数据需求,就是业务部门对数据分析产出的需求。有小伙会说:这还有需求呀,我们公司都是一通电话:“歪!给我个XX数据,快!”就完事了,根本不存在啥需求。

大家好,我是爱学习的小xiong熊妹。

今天分享数据分析师必备的工作能力——需求梳理。需求梳理很不起眼,甚至很多小伙伴感受不到他的存在。但它结结实实影响到大家的下班时间和绩效。

一、什么是数据需求?

顾名思义,数据需求,就是业务部门对数据分析产出的需求。有小伙会说:这还有需求呀,我们公司都是一通电话:“歪!给我个XX数据,快!”就完事了,根本不存在啥需求。

确实有这种无脑公司。不过,这么无脑催数据的结果,就是返工。最常见的局面,就是你辛辛苦苦跑出来数,对面的一通质疑:“数据不对吧!”“为啥和我知道的不一样!”“你再给我个XX数据看看?”“加个字段吧!”然后苦逼的数据分析师,又得重新回去跑数,跑完了又得经历一轮Diss。

所以想早点下班,想不被甩锅,就得梳理清楚:到底业务想要的是什么?

二、怎样是清晰的需求?

一个清晰的需求,需要做到5w清晰。

  • Who:数据使用者
  • When:数据使用时间
  • Where:数据使用场合
  • Why:使用数据原因
  • What:具体数据格式

三、who:谁使用数据包括:

  • 申请人:部门,姓名
  • 审批人:领导签名、邮件回复

加上审批人,可以在一大堆需求塞车的时候,按领导等级高低排序给数。加上审批人邮件/书面签名,能有效避免每个人都说自己“很急!”“重要!”的尴尬局面。

四、when:什么时间使用

当然,大家都希望我这一刻提数据,下一秒马上有。但是干活总需要时间,而且需求多了总得排队,所以最好提一个普通/加急/特批的时间差异。比如普通需求提前3天,加急提前1天,特批的今天内优先做(当然,需要对应的老板书面批准)。

很多没骨气的数据部门领导,不敢搞分级管理。但这其实是害死自己。因为不分级管理,业务部门的需求就会像决堤的洪水。

一来,既然业务打个电话数据就拼命了,那业务还看BI干啥,那业务还看日报干啥!不看!我就打电话逼着你干。这样已上线的数据产品,使用率惨淡,回头还是被批:“做BI都没用!”

二来,自己每天007加班做需求单,照样做不完,照样被人喷“我就要个数,你还搞那么久!”照样有人因为需求塞车来吵架。

所以苟且偷生,最后就是死路一条。管得了期望时间,才好体现数据分析的业绩。

五、where:在什么场合使用

这里重点关注是:

  • 部门内使用:自己闭门分析。
  • 平级部门使用:几个部门开会用。
  • 向上汇报使用:总裁办、总公司。
  • 对外发布使用:公众、媒体、社会。

区分使用场合,主要为管理口径,避免口径混乱引发的争议。减少数据部门背锅。

  • 如涉及不同部门汇报,则重点关注两个部门共同关心的指标。
  • 如是对上汇报,则要核对是否和管理层看的固定报表是否有重叠。
  • 如是对外汇报,则要核对之前公布的数据,避免自己打自己脸

很多公司数据背锅,其实就是没做好这一步。不主动问数据用在哪里,结果业务拿着数据乱捅一波,捅完了就说:“诶呀,我们又不懂,都是数据提供的你去问他”……数据自然百口莫辩,死无全尸……所以不要吝啬语言,问清楚!

六、why:为什么需要数据

这里和分析思路有关,重点区分:

  • 要做监控、找原因、还是做预测?
  • 如是监控,业务是否已上线?什么时候上?
  • 监控数据是否涉及埋点、系统对接?
  • 找原因,是否有假设?假设是什么?
  • 做预测,是否有假设?假设是什么?

有些业务部门思路清晰,可以讲得很清楚,自然省事。有些部门不想说,或者稀里糊涂说不清,就得引导他们说清楚。

如果没有提前沟通好埋点/数据同步的问题,监控是没法按时上线的,更没法提供准确数据。相当多公司埋点管理混乱,就是因为数据、开发、业务相互不通气,信息不一致造成的。

如果没有提前说清楚假设,很有可能拿到的数据维度不够,指标不全,导致反反复复提数。或者业务部门看了数跟没看一样,照样不利于工作开展。

七、why:为什么需要数据

这里是具体的需求,要具体到:

  • 取数对象:针对XX用户、商品、渠道、产品取数。
  • 取数时间段:从X月X日-X月X日。
  • 数据指标:取XXX指标。如是数据字典内标准指标,则直接引用名字。如是临时发明的,需说清楚指标的计算公式。
  • 分类维度:按XXX维度区分数据。

思路清晰的业务部门,自然不用多说。碰到思路混乱的,可以这么引导。

  • 你要分析的是人?货?还是场?(清晰取数对象)。
  • 明确一个重点,比如人以后,开始加“的”。你要分析的是,人的XX情况(清晰指标)在XX时间段内的XX情况(清晰时间)。
  • 加分类维度。你要不要做个对比?你想不想了解不同区域/时间的差异?你想不想看内部结构(清晰分类维度)。

这样三个问题引导完,就很清楚了。

责任编辑:武晓燕 来源: 码工小熊
相关推荐

2022-06-05 21:09:47

Python办公自动化

2022-06-15 11:02:40

网络安全运营

2022-06-15 08:25:07

Python天气数据可视化分析

2022-06-30 18:17:00

数据集云数据建模计数据仓库

2022-06-28 22:13:33

Polars数据处理与分析

2022-06-13 08:00:00

数据湖数据仓库大数据

2022-06-29 09:19:09

静态代码C语言c代码

2022-06-24 10:16:59

Python精选库

2022-06-23 12:43:36

区块链加密货币

2022-07-03 06:10:15

2022-06-27 19:01:04

Python应用程序数据

2022-05-24 15:22:09

网络安全企业风险

2022-06-30 09:07:52

2022-06-28 11:16:36

机器学习数据科学

2022-06-21 10:04:25

数据中心智慧城市

2022-06-27 15:25:08

架构模型治理

2022-06-16 15:42:16

攻击面管理ASM

2022-06-27 23:44:37

云原生云存储云计算

2022-06-15 16:16:21

分布式数据库鸿蒙

2022-06-22 05:53:49

城域网广域网VXLAN

同话题下的热门内容

七个好用常见的大数据分析模型Apache Doris刚刚 "毕业":这个SQL数据仓库有什么不一样?数据指标 VS 标签体系,到底有啥区别?终于讲清楚了!大变局!全国房价,跌破万元大关一文看懂:数据指标体系的四大类型十张图,数据分析如何赋能销售

编辑推荐

什么是数据分析的漏斗模型?数据分析师还吃香吗?用数据告诉你对比解读五种主流大数据架构的数据分析能力《狄仁杰之四大天王》影评分析(爬虫+词云+热力图)22个免费的数据可视化和分析工具推荐
我收藏的内容
点赞
收藏

51CTO技术栈公众号