爬取上市公司数据、分析数据,并用可视化现实全国各地区公司数量

大数据 数据分析
在很多网站上,都会以表格的形式展示数据,而我们获取这种数据只需通过十几行爬虫代码就可以搞定,轻松搞定网页爬虫,实现高效办公。

前言

在很多网站上,都会以表格的形式展示数据,而我们获取这种数据只需通过十几行爬虫代码就可以搞定,轻松搞定网页爬虫,实现高效办公

 

[[338382]]

知识点:

  • 爬虫基本原理
  • requests的简单使用
  • pandas库
  • pyecharts可视化工具

第三方库:

  • requests
  • pandas

开发环境:

  • Python 3.6
  • Pycharm

这里就只展示部分代码了

爬虫代码

1.导入工具

  1. from urllib.parse import urlencode 
  2. import requests 
  3. import csv 
  4. from bs4 import BeautifulSoup 
  5. import pandas as pd 

2.网页提取函数

  1. def get_one_page(i): 
  2.     paras = { 
  3.         'reportTime''2019-12-31'
  4.         # 可以改报告日期,比如2018-6-30获得的就是该季度的信息 
  5.         'pageNum': i  # 页码 
  6.     } 
  7.     url = 'http://s.askci.com/stock/a/?' + urlencode(paras) 
  8.     response = requests.get(url, headers=headers) 
  9.     if response.status_code == 200: 
  10.         return response.text 

3.提取表格数据

  1. def parse_one_page(html): 
  2.     tb = pd.read_html(html)[3] 
  3.     return tb 

4.保存数据

  1. def save_csv(): 
  2.     pass 
  3.  
  4. if __name__ == '__main__'
  5.     html = get_one_page(1) 
  6.     parse_one_page(html) 

运行代码,效果如下图

 

爬取上市公司数据、分析数据,并用可视化现实全国各地区公司数量

数据可视化代码

  1. ffrom pyecharts import options as opts 
  2. from pyecharts.charts import Map 
  3. from pyecharts.faker import Faker 
  4. df = pd.read_csv('1.csv'
  5.  
  6.  
  7. data = [['北京',331], ['西藏',18], ['湖北',103], ['上海',298], ['天津',50], ['陕西',51], ['安徽',106], ['河北',58], ['贵州',29], ['河南',79], ['山东',206], ['广东',603], ['江西',41], ['江苏',420], ['浙江',443], ['湖南',105], ['黑龙江',37], ['辽宁',78], ['福建',134], ['四川',125], ['重庆',50], ['广西',38], ['新疆',54], ['云南',37], ['山西',38], ['宁夏',14], ['海南',30], ['甘肃',33], ['吉林',42], ['内蒙古',25], ['青海',12]] 
  8. c = ( 
  9.     Map() 
  10.     .add("上市公司数量 ", data, "china"
  11.     .set_global_opts( 
  12.         title_opts=opts.TitleOpts(title="上市公司数量分布"), 
  13.         visualmap_opts=opts.VisualMapOpts(max_=700), 
  14.     ) 
  15.  
  16. c.render_notebook() 

最后运行代码,效果如下图

 

爬取上市公司数据、分析数据,并用可视化现实全国各地区公司数量

 

 

责任编辑:未丽燕 来源: 今日头条
相关推荐

2018-05-10 16:00:19

2014-09-03 09:57:31

前端开发薪资

2011-06-30 15:23:14

2022-06-15 08:25:07

Python天气数据可视化分析

2023-11-17 14:30:51

2022-03-24 09:48:59

勒索软件网络攻击

2021-06-04 12:56:22

数据分析岗位

2019-01-16 18:34:37

Python 开发数据

2020-03-11 14:39:26

数据可视化地图可视化地理信息

2018-02-02 15:51:20

2013-05-21 09:10:47

大数据

2017-10-14 13:54:26

数据可视化数据信息可视化

2016-12-29 20:05:56

数据可视化大数据产品分析

2017-01-12 17:28:59

数据分析数据可视化可视化

2009-10-23 09:40:36

养猪丁磊

2023-05-29 12:23:59

阿里云魔搭AI模型

2013-05-15 09:43:03

数据可视化大数据

2021-01-12 19:52:58

大数据大数应用大数据可视化

2009-05-20 09:56:38

DNS解析故障

2017-09-05 09:38:12

点赞
收藏

51CTO技术栈公众号