七次全国人口普查——一个超大的“用户画像”

大数据 数据分析
在万众期待之下,伴随着各种质疑和猜测,第七次全国人口普查数据千呼万唤始出来,终于在5月11日公之于众。

[[398969]]

本文转载自微信公众号「数师兄」,作者数师兄。转载本文请联系数师兄公众号。

在万众期待之下,伴随着各种质疑和猜测,第七次全国人口普查数据千呼万唤始出来,终于在5月11日公之于众。

从数据分析的角度来看,人口普查就相当于对全国人民做了一个画像,从年龄、地域、教育水平等维度来描述我国人口当前分布状况。

今天我们就着第七次人口普查数据,闲扯一篇。

1.整体趋势

(截自《第七次全国人口普查公报(第二号)》)

从上图来看,全国人口虽未负增长,但其增速已经平得不能再平了,年均增长率0.53%,可以理解为近十年在每一万人中,每年新生人口减去死亡人口数量后的净新增只有5.3。

(截自《第七次全国人口普查公报(第二号)》)

再看这个平均每个家庭的人数,不足3个人,较上一次普查减少了0.48,这一数字给我们的直观感觉就是大量家庭是没有孩子的。除了年轻一代长大成人建立了新的家庭之外,还有一大因素就是这些新生家庭的生育意愿正在降低。

过去几次普查数据显示的年均增长率一直都是在下降,1990年-2010年,可以理解为在计划生育相关政策的控制下,将人口增速逐步放缓,而最近几年我们已经放开了二胎,按理说在如此大的人口基数之下,且医疗水平日益提高的今天,正常死亡率会越来越低,净新增应该会出现较大涨幅才对。而实际的增长比上一个十年还要平,“死亡”没有问题,那么“新生”可能就不对劲了。

放到我们通常的互联网产品上来说,这就相当于我们的活跃用户数量增长缓慢,“新生人口”就是我们的新增用户(安装、注册等),“死亡人口”就是流失用户(注销、休眠等)。对于一个发展中的产品,如果新增缓慢,“开源节流”就要提上日程了,这就轮到渠道调控发挥作用了。

2.区域分布

 

(截自《第七次全国人口普查公报(第三号)》)

受于人口基数的影响,在大环境相对稳定的情况下,广东、山东、河南、江苏、浙江这几个人口大省仍然是位居前列。但是省与省之间的差异却是巨大的,这受到了地理环境、历史文化、经济水平等等多重因素的交叉影响,最后以行政单位形成了一个分界线。

同样,引申到用户画像上,不同地域的用户就会具有不同特征,人们在地理位置上的聚集,会一定程度上反应出其在教育水平、家庭收入、文化理念、风土人情等各方面的区域特性。所以,在用户画像当中,地域分布往往都是一个非常重要的标签,通常会按行政区划、城市等级两个方面来进行划分。

3.性别构成

(截自《第七次全国人口普查公报(第四号)》)

我国男女比例并不大,近年波动也较为平缓。这对于单身狗们来说算是个好事儿,至少理论上,狗子们找到另一半的机会还是很可观的。

性别是所有人群的一个自然属性。男性和女性通常会具有不同的行为习惯、不同的性格、不同的需求,所以在常规的画像当中,性别这一标签也有很重要的作用。正是因为不同性别的用户其行为特征差异较大,所以一些产品往往可以利用这一标签大做文章,常见的就是电商平台、内容平台的推荐策略等。

4.年龄构成

所有人还有另一个自然属性,年龄。国家层面上来看,老壮青年龄的分布很大程度上可以左右未来的发展潜力。

(截自《第七次全国人口普查公报(第五号)》)

从本次人口普查公布的年龄分层数据来看,虽然青壮年人口(15-59)占比仍有63.35%,但是对比2010年的第六次人口普查来看,就显得有些后继乏力了。60或65岁以上人口占比上升了5个百分点左右,老龄化的趋势愈发明显。而随着这一数据的发布,当日下午的养老概念股就开始持续走高,未来养老产业可能将要迎来一次高潮。那么为了避免青黄不接、减小老龄化的影响,可以预见政府将会采取一些鼓励生育的措施。所以到时候,我等打工人养娃的成本也许会有所下降,希望这些政策早日出台,我们也可以早日为中华民族的繁荣昌盛再添一把力,生生不息。

再次回到用户画像上,用户的年龄对于互联网产品通常也是极为重要的一个特征。因为不同年龄阶段的用户往往具有不同的需求,比如老人爱“养生”、日常“催婚”“催生”,年轻人爱熬夜、爱秃头、爱追求自由,熊孩子们爱动画片、爱“坑队友”,有孩子的中年人就爱“学习”、爱“攀比”、爱娃生过爱自己。玩笑归玩笑,有一说一,年龄代表了一个人所处的人生阶段,瞄准目标人群有的放矢,这是画像的初衷。

5.受教育水平

(截自《第七次全国人口普查公报(第六号)》)

在人群受教育水平上,北京可谓是一骑绝尘。百分之四十多的大学以上学历,比第二名的上海还高出8个百分点,其教育资源之丰富与其对高学历人才的吸引能力可见一斑。从全国来看,当前大学学历人群与上次人口普查时相比,增加了约70%,这表示我们国家高等教育的普及程度越来越高了,抛开地域因素不谈,我们这代打工人的崽儿也有了更多机会去接受更好的教育。

一个人受教育的程度,会影响他的眼界、能力、素养、行事风格等,那么当然用户画像也用得着这一标签。以短视频平台为例,其用户有着明显的教育水平分层,平台上充斥着大量三俗内容、虚假信息,而这些内容下的用户多数教育程度不高,容易被不良自媒体误导和引诱。本身这些用户并非此类内容的生产者,而是因为这些自媒体的低质内容锚住了下沉用户群。当然平台上也不乏有良心的自媒体账号和优质内容,但还是希望平台可以加大力度整治不良内容、净化网络环境,生产休闲娱乐内容的同时,也能让更多的科学知识惠及到普罗大众,传播更多的正能量和正确的三观。

结语

到这里第七次人口普查的数据基本上就讲完了。

 

通篇来看呢,就相当于对我们的全国人民做了一个画像,通过地域、年龄、性别、教育等属性来描述用户群的分布。那么在分析师的分析工作中,除了以上维度的应用,还有很多其他的画像标签在这里是没有提及的,比如:用户在产品中的行为、用户的偏好、用户社群关系等等。

 

责任编辑:武晓燕 来源: 数师兄
相关推荐

2021-05-11 14:39:55

无人机数据技术

2021-05-18 16:23:13

腾讯云人口普查TDSQL-A

2020-08-03 11:13:06

人口普查腾讯云大数据

2021-05-14 17:23:06

Python数据程序

2020-11-06 10:14:27

思必驰AI机器人

2020-11-02 10:06:29

数据分析网民收入

2021-08-19 16:22:51

零日漏洞攻击黑客

2021-02-03 08:25:47

模块数据概率

2012-02-02 09:06:44

SymbianS40诺基亚

2021-10-21 12:22:01

黑客身份信息网络攻击

2021-05-20 10:27:26

数据爬取页面

2021-08-20 09:52:02

Citrix漏洞黑客美国

2021-10-19 15:04:02

黑客信息泄露网络攻击

2021-03-09 22:46:12

无人机人工智能AI

2019-10-12 17:37:06

微信服务器信息量

2012-12-21 10:16:29

信息保护

2020-12-21 15:15:21

人工智能机器学习技术

2023-08-27 21:25:20

用户画像数据数据分析

2009-04-27 16:32:20

2019-04-12 09:40:30

码农科技开发
点赞
收藏

51CTO技术栈公众号