一文讲清:数据分析与数据挖掘到底有什么区别?

大数据 数据分析
数据分析不比数据挖掘的含金量低,职业前景也不比数据挖掘差。而数据挖掘走技术路线,竞争激烈程度没数据分析大,保住饭碗是没问题的。

[[434476]]

虽然岗位title里都有数据这两个字,但这是两条不同的发展路线,数据分析走的是业务和管理路线,数据挖掘走的是技术路线,二者有高下之分吗?

我认识一位年薪10万刀的数据分析师,只会Excel,不存在别的技能,但人家就是有能力把技术问题转变成业务问题,不需要会算法和模型。

因为“SQL+Excel+BI工具+PPT”这套组合拳,就能满足工作中的绝大部分需求了,如果你再能用PPT把故事讲漂亮,领导就觉得你很厉害了,你大搞机器学习,神经网络,数据算法,如果超出了领导的认知范围并且没有什么好效果的话,你的背景和你的技术也就没什么价值了。

扯远了,先来看看数据分析和数据挖掘这两块分别会涉及到什么。

数据分析

数据分析是比较大的概念,因为它的流程是由很多个部分组成的,包含了数据获取、数据清洗、数据处理、数据分析、数据可视化等。

相比于那些长篇大论的言论,基本上就是这六大块可以完整地概括出一整个数据分析的流程,这也是数据分析概念的体现。

那就我个人而言,平时的数据分析工作都是在做什么?

  • 从0到1搭建数据分析体系
  • 数据分析工具化,产品化
  • 支撑领导、部门决策的专题分析及业务方向探索
  • 数据规范制定及提升数据质量等基础工作

可以看出,数据分析师比较看重分析策略和业务知识,而这些东西,都是需要在平时的工作中,依靠项目经验去积累,比较吃资历、经验和对业务的认知深度。

数据挖掘

什么是数据挖掘?

专业来说,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但有潜在的有用信息和知识的过程。

可以看出,数据挖掘是一个过程结果的称谓,即主要目标是从数据中挖取隐藏的信息。它是一个交叉科学领域,受多个学科影响,包括数据库系统、统计、机器学习、可视化和信息科学。

通俗点解释,数据挖掘就是透过数据的表象发现隐藏在背后的蛛丝马迹,从而找到潜伏的规律以及看似无关事物之间背后的联系,用此来洞察或预测未知事项,输入的是数据,输出的是知识。

都说数据挖掘,那从哪挖掘出来?基于以下4点:

(图源网络)

数据挖掘能做到什么?我觉得举例子更容易理解。

工厂或者制造业,可以预测以后一段时间的产品销量,然后来调节生产计划或采购计划。

头条和抖音,预测用户会对哪个内容感兴趣,然后进行精准的推荐,这也是和算法有关。

电商,可以根据用户购买商品,个性化推荐其他。

券商,关联分析用户的数据,认定用户的能力等级。

……

两个岗位的对比

1、入行门槛

数据分析<数据挖掘,很多年前数据分析的门槛是很低的,但是现在不同了,不过比起数据挖掘所需要的背景,还是要差不少。

举个例子,数据分析师的学历背景:需要985211学校,有互联网公司的实习,最好能参与一个项目全程;

数据挖掘的背景:985硕士优先,要有知名互联网公司项目经历,最好有从0-1的经验

2、职业发展

都差不多,上面也说了,走的是不同的路线,你在清华,我在北大,我们都有光明的未来

3、薪酬

总体上来说,数据分析<数据挖掘,毕竟对数据挖掘的技术背景要求高,当然这只是平均薪酬,做的好的数据分析师薪酬的天花板也是高的,后续往战略、管理岗发展,薪资水涨船高也是完全没问题。

4、跳槽含金量

看人,看项目。如果你只在大厂当螺丝钉,没业务经验积累/技术沉淀,两三年后想跳出来,其实是不好跳的,因为想要你的公司,你看不上给开的薪资,你想去的公司,会觉得你在大厂没参与完整项目,给你的钱和你能带来的经济效益不成正比,最后哪都去不了。

总结

数据分析不比数据挖掘的含金量低,职业前景也不比数据挖掘差。而数据挖掘走技术路线,竞争激烈程度没数据分析大,保住饭碗是没问题的。但是这些都在一个前提中:你处于数据部门,而不是业务部门,并且你的公司要重视数据,你的领导能给团队带来好的资源。

责任编辑:姜华 来源: 数据分析不是个事儿
相关推荐

2021-01-26 11:57:46

数据挖掘数据分析大数据

2022-09-14 09:45:15

指标标签

2012-07-25 15:45:28

ERPSCM

2021-09-06 10:45:18

XDRMDR

2024-02-26 07:36:09

lockJava语言

2020-07-31 12:52:40

OLEDQLEDMicroLED

2022-05-12 13:44:35

数据分析数据

2020-06-15 15:43:23

数据科学家数据分析师数据科学

2020-08-19 08:10:11

数据分析技术IT

2022-10-18 10:10:52

数据技术

2022-08-26 01:41:42

GPUCPU架构

2022-10-27 19:32:20

切片golang数组

2019-07-04 15:16:52

数据挖掘大数据算法

2019-04-23 08:23:51

统计学机器学习人工智能

2022-02-22 10:45:36

URIURLLinux

2022-02-08 10:27:31

URLURI浏览器

2022-07-04 11:27:02

标签数据指标标签体系

2023-07-19 21:54:02

小区扇区信号

2023-06-27 14:49:34

数据中心IT 设备

2020-10-29 09:49:32

HarmonyOS鸿蒙安卓应用
点赞
收藏

51CTO技术栈公众号