数据分析,用对图表很重要

大数据 数据分析
数据分析是互联网产品极其重要的一个环节,目前整个互联网行业的发展逐渐趋于理性了,从好些年前的“增量市场”变为“存量市场”,很大的一个特征就是获客成本变高了,流量越来越珍贵。

数据分析是互联网产品极其重要的一个环节,目前整个互联网行业的发展逐渐趋于理性了,从好些年前的“增量市场”变为“存量市场”,很大的一个特征就是获客成本变高了,流量越来越珍贵。在这种行业背景下,数据分析成为了一手利器,可以推动产品设计与运营环节,列举几个典型的场景:

  • 产品经理在规划新版本时,如何制定相关的数据指标来验证?
  • 功能上线后,如何就采集到的数据,进行数据复盘,判断新功能是否达到团队预期?
  • 如何通过数据了解产品目前的问题以及分析背后的原因?
  • 运营人员在完成一个活动后,如何通过数据来评估本次活动的效果?
  • 如何将冰冷的数据通过直观的可视化图表向上级进行汇报?
  • 在产品设计的时候涉及到数据可视化统计的界面,如何选择核心指标以及合适的可视化图表?
  • ........

以上只是数据分析应用的其中一部分场景,实际上还有很多。有些人可能会认为,数据分析那是数据产品经理的职责,其实不然,我认为数据分析重在思维,是一种通过现象看本质的思维,这种思维能力是产品经理需要掌握的,不少企业在招聘产品经理的时候也会看重产品经理的数据驱动能力。

数据本身冰冷没有意义的,我们需要通可视化图表将数据直观的表现出来,然后对其进行分析,发现背后蕴藏的规律。

数据可视化图表的类型十分丰富,此处不一一列举,本篇文章主要跟大家分享几种比较简单、常见的数据分析可视化图表以及使用场景。如果简单的图表可以解决问题,为什么还要花里胡哨呢?

一、常用的可视化图表

常用的可视化图表包括:饼图、柱形图、条形图、折线图、散点图,这五类图表可以满足我们工作中大部分的数据展现与分析需求,简单的图表往往能够有效、形象、快速地传达信息。

这时候你再回想一下,你在日常工作中见到的图表是不是基本上都是以下几种类型。

 

数据分析,用对图表很重要
基本的可视化图表(图来自《谁说菜鸟不懂数据分析》)

以上五类图表是最为基本的可视化图表,它们还能够衍生出其他稍微复杂些的图表,比如柱形图还包括簇状柱形图、堆积柱形图、百分比柱形图。

EXCEL表对以上图表进行了比较好的分类与归纳,有兴趣做进一步了解的朋友可以打开你的EXCEL表,在插入图表功能中可以看到。

 

数据分析,用对图表很重要

二、通过数据间的关系选择图表

常见的数据关系包括:成分、排序、时间序列、频率分布、相关性、多重数据比较。

1.成分(整体的一部分)

成分也称构成,主要关注每个部分占整体的百分比关系。适用的图表有饼图、柱形图、条形图、瀑布图。

 

数据分析,用对图表很重要

1)饼图

如果仅需要关注单个整体的各部分比例构成,则首选饼图。饼图的分类不建议超过9个,可以把剩余次要的部分归类到“其它”项中。

饼图在数据分析中是比较常用的一种图表,比如用户来源渠道占比、各终端GMV贡献占比等都可以使用饼图。

 

数据分析,用对图表很重要

2)柱形图

当需要对比多个项目之间的成分构成,且项目的个数不多时,我们可以用百分比堆积柱形图。

数据分析,用对图表很重要

通过上图,我们纵向看出六大地区的销售额构成,也可以横向做对比。

为什么不继续使用饼状图呢?大家可以想象一下,如果我使用6个饼状图来向你传达6个地区按客户类型销售额占比,你还有那个耐心看下去吗?

3)条形图

其实条形图跟柱形图两者最主要的差异并不在于统计分析,而是在于数据展示的可读性。

当项目个数较多,名称较长时,可优先选择条形图,因为条形图能够横向布局,方便展示较长的项目名称。

在产品设计中,横向布局的条形图更能节省页面空间,且可以通过适当加大横坐标的长度来体现类目之间的差异性,这也是考虑使用条形图的一个场景。

所以,当需要对比多个项目之间的成分构成,且项目的个数比较多,项目名称较长时,可以用百分比堆积条形图来表示部分与整体之间的组成关系。

 

数据分析,用对图表很重要
某校教师对学生在各方面表现的评价情况

关于瀑布图,我就不在这里展开介绍了,我自己使用的比较少,有兴趣的朋友可以自行百度了解。

2.对比(项目间的数据比较)

指不同项目间数据的比较。在对比的过程中会遇到如何排序问题,可以根据数值大小升序或者降序,也可以根据分析的主题来考虑使用什么排序。适用的图表主要有柱形图、条形图。

 

数据分析,用对图表很重要

1)普通柱形图、条形图

当对比的项目由单一成分构成时,使用普通的柱形图或者条形图即可,比如销售额按地域进行对比、销量按商品品类进行对比、Top排序等。

 

数据分析,用对图表很重要
普通柱形图

 

数据分析,用对图表很重要
普通条形图

2)堆积柱形图、堆积条形图

当对比的项目由多个部分构成时,可使用堆积柱形图或者堆积条形图。可以比较清楚的看出各个项目的总数值大小以各项目内部的构成。

 

数据分析,用对图表很重要
堆积柱形图

 

数据分析,用对图表很重要
堆积条形图

3.时间序列(走势、趋势)

时间序列用于表示某事物按一定的时间顺序发展的趋势、走势,是上涨、下降、上下浮动还是基本稳定。适用的图表有折线图、柱形图、面积图。

 

数据分析,用对图表很重要

1)折线图

折线图是最常用的表达事物随时间发展趋势的可视化图表,当时间序列的时间点比较多时,建议使用折线图。

如果大家有留意新冠疫情的动态统计,就会发现大家都是用折线图来展示疫情的发展趋势,我们通过一条曲线就可以很直观地了解疫情的动态。

下面举一个某小程序近30天变化趋势展示。

 

数据分析,用对图表很重要
某小程序GMV近30天变化趋势

2)柱形图

有些人可能问到,折线图跟柱形图都能够表达时间序列的发展趋势,那什么情况下可以使用柱形图呢?

普通柱形图:一般情况下,如果时间序列的点比较少,且统计的指标由单一成分构成时,可以使用普通的柱形图。

 

数据分析,用对图表很重要

堆积柱形图:如果时间序列的点比较少,且统计的指标由多个部分构成时,使用堆积柱形图会更为直观些。

 

数据分析,用对图表很重要
某平台过去7天活跃用户数趋势

从上图你可以看出,活跃用户在8月15号达到最大值,随后大幅度下降,呈现出比较稳定的趋势。同时,你可以看出每天的活跃用户构成情况,三大运营商的用户数没有比较大的差异。

3)面积图

当然,我们也可以用面积图来表示时间序列的发展趋势。面积图其实是折线图的演变,折线图下方填充阴影,就构成了面积图。

普通面积图:当统计的指标是由单个成分组成的时候,可以使用普通面积图。

但是面积图有个缺点,就是当数据指标大于1个时,各数据指标之间可能会出现相互遮挡的情况,会影响趋势的展示,建议统计的指标类型不要太多。

 

数据分析,用对图表很重要
由普通折线图演变而来的面积图

堆积面积图:当统计的指标是由多个部分构成的时候,可以使用堆积面积图。

下图表示某物流平台在第一大区(由四个重点地区组成)近四年的收入趋势。

 

数据分析,用对图表很重要
堆积面积图

再比如,下图表示的是8月15到8月21号某电商平台的订单总量,(共10个品类,现统计其中3个品类)的变化趋势。

 

数据分析,用对图表很重要
堆积面积图

在介绍上面几种可视化图表时,多次提到了堆积类型的图表,包括堆积柱形图、堆积条形图、堆积面积图,它们都是由多个部分累加得来的,最后组成一个整体。

以上图为例,2015年第一大区的总收入是39,分别由中山、东莞、广州、深圳在2015年的收入累计组成。

4.频率分布

频率分布可以比较清楚显示各组频次分布情况与差别。

当然,这一类比较也可以用频数分布表示,只是单位不同。比较典型的案例有班级学生的身高分布情况。适用的图表有柱形图、条形图、折线图。

 

数据分析,用对图表很重要

利用频率分布,可以帮助我们对某些产品数据进行分析,比如统计用户在某一天内进行详情页浏览的次数分布、统计过去7天用户的购买频次分布情况。

1)柱形图

柱形图是比较常见的表示频率分布的图表,一般情况下,当表示分组较少的频率分布时,可以考虑使用柱形图。

 

数据分析,用对图表很重要

某平台过去7天用户的购买频次分布

2)条形图

如果分组比较多、名称较长的,可以考虑使用条形图。

3)折线图

折线图也可以用于表示频率分布,如果分组比较多,希望看到数据的波动情况,可以选择折线图。

5.相关性

相关性用于衡量X与Y的关系,比如销量与价格之间的关系、访问量与浏览量的关系等。

最为常用的图表有散点图、气泡图。另外对称条形图、柱形图也可表示相关性,不过感觉见得比较少,所以在这里不做介绍,有兴趣的朋友可自行了解。

 

数据分析,用对图表很重要

1)散点图

散点图表示因变量随自变量而变化的大致趋势,通过散点图,我们还可以看出各个点在坐标轴上的分布情况。

当只有两个变量X跟Y时,可用散点图观察两个变量之间的关系。

 

数据分析,用对图表很重要

从上图可以看出,转化率和综合浏览量两者之间是呈正相关的关系。

2)气泡图

散点图一般研究的是两个变量之间的关系,但有时候我们的分析需要涉及到第三个变量,气泡图就是在散点图的基础上衍生而来的,用来表示三个变量之间的关系。

当存在第三变量,即X、Y、Z时,我们可以使用气泡图进行分析,点的大小或者颜色可以定义为第三个变量。

数据分析,用对图表很重要

如上图,用圆点大小来表示访问次数的多少,可以看到访问次数最多的那天(最大的圆点区域),转化率和平均综合浏览量都不高。

6.多重数据对比

多重数据对比指数据类多于2个,且每个数据类拥有多个维度的数据分析比较。我们可以用雷达图来表示。

如下图,比较中兴Grand S 与索尼L36h 两款产品分别在牌照、硬件、价格、屏幕、系统5个维度中的评分情况。

 

数据分析,用对图表很重要

最后,呈上一张总结图

 

数据分析,用对图表很重要
常用图表类型与作用(来自《谁说菜鸟不懂数据分析》)

三、写在最后

数据图表远远不止本篇文章提到的那些,以上是基于自己的经验以及网上的资料总结而来,主要的目的在于帮助大家了解常用的图表以及如何选择合适的图表,如有纰漏的地方,敬请指出。

数据分析的目的在于发现问题、解决问题,需要根据分析的主题、数据之间的关系选择合适的图表,如果简单的图表可以解决问题,实在没有必要执着于复杂,常人不易理解的可视化图表。

 

 

责任编辑:未丽燕 来源: PMCAFF产品经理社区
相关推荐

2011-06-21 16:58:09

外链

2023-05-06 10:43:21

开源数据分析

2019-12-12 14:38:33

数据分析菜鸟工具

2017-06-20 08:34:23

2023-08-30 09:00:00

向量数据库大语言模型

2013-11-13 10:24:53

Xbox微软

2015-10-19 17:57:33

容器OpenStack微服务

2022-01-06 22:05:35

Linux物联网容器

2020-04-29 09:17:42

Seaborn数据可视化数据分析

2022-07-14 23:27:57

数据分析数据驱动可变数据

2023-09-18 16:46:07

2022-11-06 17:48:39

Linux系统命令

2022-03-12 10:00:49

零信任数据安全

2020-05-15 15:09:51

R语言数据分析

2017-08-03 15:20:19

大数据数据分析

2019-07-18 20:51:00

物联网智能产品传感器

2022-05-17 10:52:17

物联网ITOT

2023-05-04 23:30:15

2020-08-10 06:16:26

seaborn数据分析图表

2022-03-21 13:57:00

大数据数据分析技术
点赞
收藏

51CTO技术栈公众号