用Python对微博热搜做舆情分析

开发 后端
通过词云图可以看出,人们围绕这寒暑假这个词讨论的非常热烈,学生和取消、行业等词也被大量提及,我翻了翻评论,发现大部分人都是不想取消的。当然志斌也觉得不要取消。

[[409639]]

大家好,我是志斌~

今天志斌看微博热搜的时候,发现这样一条热搜。

我寻思,这要真的改了,真的炸锅!所以志斌爬取了这条微博下的数据,进行了一个简单的舆情分析!

需要源码的同学,加志斌微信获取哈~

一、数据采集

志斌在之前的两篇文章中,详细的介绍了如何获取微博评论,有兴趣的读者可以看看这两篇文章。这里志斌直接展示核心代码了,代码如下:

  1. for page in range(1,10000): 
  2.   if page == 1 : 
  3.       params = ( 
  4.           ('id''4654152979845247'), 
  5.           ('mid''4654152979845247'), 
  6.           ('max_id_type''0'), 
  7.       ) 
  8.   #s = requests.Session() 
  9.   response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params) 
  10.   a = response.json()['data']['max_id'
  11.   b = response.json()['data']['max_id_type'
  12.  
  13.   for i in response.json()['data']['data']: 
  14.       pinglunshijian = i['created_at'
  15.       neirong = re.sub(r'<[^>]*>''', i['text']) 
  16.       id = i['user']['id'
  17.       yonghumingcheng = i['user']['screen_name'
  18.       with open(r'71.txt''a', encoding='utf-8'as f: 
  19.           f.write(f'{neirong}\n'
  20.   params = ( 
  21.       ('id''4654152979845247'), 
  22.       ('mid''4654152979845247'), 
  23.       ('max_id', str(a)), 
  24.       ('max_id_type', str(b)), 
  25.        ) 
  26.   print(f'爬取第{page}页数据......'
  27.   time.sleep(random.randint(1,3)) 

二、可视化分析

我们来对这些数据进行可视化分析。本次绘图使用的是Excel和Tableau两款软件。

1.点赞数top10用户

我们发现椭圆圆子这个用户所发表的评论点赞数最多,有9.5w+,下面让我们看看它的评论是什么,竟然让用户这么喜欢。

这是一句纯吐槽的话,点赞数这么多,可能是因为发的时间早,或者是引起了老师们的共鸣。

2.评论日期分布

从图中我们可以清晰的看出,7.6号发表评论的人数最多,可能跟今天上热搜有关系的原因,毕竟上了热搜,曝光度就高了!

3.评论时间分布

对6号评论发布时间进行分析,我们发现19点发表的评论数量最多,我当时看到这条热搜的时候,基本也是这个时间,看来热搜对一个消息的影响还是很大的。

4.词云图

通过词云图可以看出,人们围绕这寒暑假这个词讨论的非常热烈,学生和取消、行业等词也被大量提及,我翻了翻评论,发现大部分人都是不想取消的。当然志斌也觉得不要取消。

三、小结

1. 通过分析我们可以看出,热搜对每条微博的影响是巨大的。

2. 大家都不太愿意取消寒暑假。 

3. 本文仅供学习参考,不做它用。

 

责任编辑:武晓燕 来源: 志斌的python笔记
相关推荐

2021-08-09 14:47:44

微信表情移动应用

2019-07-15 16:02:30

大数据数据分析舆情系统

2019-07-12 10:20:45

海量数据搭建

2015-08-10 10:13:09

大数据

2017-08-09 09:19:30

2021-06-02 22:18:11

Python关键词微博

2019-07-16 08:51:03

热搜新浪微博数据

2023-05-22 09:42:12

AI检测

2023-08-31 07:30:09

AIGC代码监测

2019-03-29 09:24:36

国内程序员微博GitHub

2020-03-12 17:00:33

中科曙光

2014-07-18 09:51:05

挖掘数据分析

2019-11-17 22:40:35

AI 数据人工智能

2011-10-21 09:43:28

Python

2015-09-21 09:33:47

大数据数据分析

2020-12-28 10:30:06

微信移动应用

2017-02-23 10:50:32

Python微博数据

2017-02-24 19:32:39

微博数据Python

2011-08-30 14:48:02

2021-01-18 15:18:11

微信微信bug腾讯
点赞
收藏

51CTO技术栈公众号