马老师曾说,我对钱没有兴趣!于是我用Python分析了马老师的语录,发现...

开发 后端
对于马老师,估计无人不知无人不晓,小编第一次看马老师的演讲点评在是赢在中国上面,对于他的口才我深深折服。里面有很多金句,细想想还是很有益处的。最为津津乐道的是马老师跟撒贝宁的在开讲啦节目上面的对话:我对钱没有兴趣。

对于马老师,估计无人不知无人不晓,小编第一次看马老师的演讲点评在是赢在中国上面,对于他的口才我深深折服。里面有很多金句,细想想还是很有益处的。最为津津乐道的是马老师跟撒贝宁的在开讲啦节目上面的对话:我对钱没有兴趣。

[[331507]]

也许钱对于他这样的大佬确实没有啥兴趣,小编还在发愁每个月的房租怎么交,还在愁花呗的账单呢。

 

突发奇想,既然是玩Python,不如把马老师曾经讲过的金句和语录进行一个全方位的总结,用Python来盘点一下,看看到底都有哪些亮点。

01.数据的爬取

我们需要对于数据进行抓取,小编提取的是“名言通”提供的数据,其网址为www.mingyantong.com.由于网页是属于静态网页,因此对于爬取程序的编写相对比较简单,部分如下图所示:

 

上述的程序中,我们首先构造了请求头,然后根据网页数量构造请求链接,然后分页的来爬取对应的信息,这里我们提取的是每个名句的内容,以及名句的子网页、评论的数量和点赞数量。

02.数据的分析和提取

提取到数据后,接下来是对于数据的分析,我们提取到的数据为:

 

对于点赞数和评论数我们需要将其转换为int类型的数据,因此可以采用下述的代码进行处理:

 

03.数据的可视化

1).金句的点赞

我们首先来看一下大家对于金句的点赞情况,如下图所示:

 

从上图可以看出,大家对于金句的点赞分布绝大多数集中在0-200条之前,而且呈现逐渐递减的趋势,分布极为不均匀。

2).Top5的金句

有了点赞的数量和评论的数量,我们来看一下,点赞数量前五名的金句和评论数前五名的金句分别是哪些。


 

 

上图中,字体越大,代表着点赞数或者是评论数越高,我们可以看出,点赞数最高和评论数最高的金句是同一句话,我们可以拿出来单独给大家看一下。

今天会很残酷,明天会更残酷,后天会很美好,但大部分人会死在明天晚上。

这句话也警示我们,凡事需要踏踏实实的坚持到底,才能够会有收获。否则将会一无所获。

3).点赞和评论分布

接下来,看一下点赞数前五的金句,其点赞数和评论数之间的一个分布情况。

 

上图可以看出,对于评论数量和点赞数量,二者没有过多的关系,点赞数很高的金句,其评论数量有可能会很少,例如上图中第二个句子中,点赞数排名第二,但是评论数却为零。

4).词云分析

最后,我们来看一下我们爬取的马云所有的金句,来制作一个词云,看一下,金句的关键词有哪一些。

 

我们可以看出,对于马老师的语录中,最重要的关键词有”我们“、”自己“ 、”成功“等等,一定程度上可以说明是以”我们大家“的共同角度,探讨了自身的一些内容,以及如何去成功等一系列的话题。

好了,以上就是小编今天为大家带来的马老师的著名金句,相信大家也会从马老师的金句中有所感悟,你最喜欢马老师的哪一句?

责任编辑:华轩 来源: 菜鸟学Python
相关推荐

2011-01-12 11:53:17

马云

2016-12-02 09:30:03

思科网络

2013-12-24 16:54:53

2021-07-10 07:40:27

Excel数据分析大数据

2022-02-14 18:46:49

机器人人工智能

2018-09-13 13:37:28

互联网马云IT大佬

2010-08-27 14:04:47

2020-08-27 08:31:11

DDD可视化模型

2009-03-31 14:16:20

马云创业阿里巴巴

2021-07-27 07:40:28

Python

2017-08-30 12:17:02

Python王者荣耀套路

2015-10-16 09:57:19

马云创业云栖

2019-02-12 15:24:50

C语言JavaPython

2020-12-09 13:59:15

神经网络AI算法

2021-11-05 11:10:13

MyBatisSQL查询

2017-09-15 09:29:46

大数据数据分析iPhone

2021-08-13 07:56:12

前端面试 js

2021-03-23 17:31:43

大数据互联网云计算

2020-01-16 15:42:54

五福Python交互

2011-11-24 10:00:10

Xtend
点赞
收藏

51CTO技术栈公众号