数据可视化常用的后端技术

大数据 数据可视化
这篇文章大致讲讲需要用到的后端技术。其实如果只是小数据量,或者是一些小型的项目,研究型的项目,纯前端就可以搞定,利用JS读取数据,JS处理数据。

这篇文章大致讲讲需要用到的后端技术。其实如果只是小数据量,或者是一些小型的项目,研究型的项目,纯前端就可以搞定,利用JS读取数据,JS处理数据。

后端无非就是处理数据,提取用户想要的数据。笔者最常用的就是python了,相对于java,c, c++,python简直对初学者太友好,提供了丰富多彩的API接口,比如常见的降维聚类算法:PCA, t-SNE, MDS, k-means等。笔者曾经用c实现过PCA算法,应该有几百行代码吧,可是在python里,只需要三行代码。下文将为大家介绍下如何用python实现对Iris数据集使用PCA算法,以及展示效果。

[[285922]]

因此,笔者强烈建议新手使用python练手,操作门槛低,前期可以将更多的关注点集中在前端数据可视化上。到了后期,有经验了就可以自由组合。笔者前期使用的是python,可是到了后期由于性能问题,python已经很难解决我项目所遇到的数据和算法复杂度。于是我将复杂度高的算法全部用C重写了一遍,并用python调用这个模块。这样之前项目的项目代码框架不变,不需要代码全部重写重构,只需在相应的地方调用相应的C模块即可。

python使用PCA算法实战

在讲之前,用户需要安装python包,这里强烈建议新手安装anaconda,anaconda集成了python以及在开发过程中一大堆第三方包,比如下文用到的sklearn包。

引入第三方库的PCA算法,sklearn是pythonz中常用的机器学习第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类、聚类等方法。

  1. from sklearn.decomposition import PCA 

加载python中自带的Iris数据集,做机器学习的应该比较熟悉这个数据集。主要包含4个维度,三个类。

  1. from sklearn.datasets import load_iris 
  2. irisData = load_iris() 

对数据集使用PCA算法,将数据降到2维。

  1. pca = PCA(n_components=2) 
  2. reducedData = pca.fit(irisData) 

将结果在散点图中画出来。这里就不讲具体python的绘制逻辑了,没错,python就是这么强大,也提供了可视化图表的能力。但是更多还是以处理数据为目的,将数据传给前端,让前端绘制。感兴趣的可以去了解下:matplotlib,这个是python的可视化绘图库。

 

数据可视化常用的后端技术
iris数据集降到二维
责任编辑:未丽燕 来源: 今日头条
相关推荐

2017-02-23 09:42:53

大数据数据可视化技术误区

2020-03-11 14:39:26

数据可视化地图可视化地理信息

2020-12-22 14:14:25

大数据数据可视化

2020-07-13 14:35:25

可视化数据编程

2017-10-14 13:54:26

数据可视化数据信息可视化

2017-02-20 20:25:00

数据可视化报表工具可视化

2012-11-13 10:52:15

大数据3D可视化

2017-10-11 18:17:06

大数据数据可视化前后端

2016-02-02 16:07:32

可视化大数据数据可视化

2024-03-13 00:00:01

可视化技术气泡图

2015-08-20 10:00:45

可视化

2020-04-14 11:18:11

大数据IT技术

2020-04-14 16:13:13

数据可视化大数据数据

2022-11-15 15:14:05

2022-05-07 09:02:27

数据可视化工具库

2017-02-16 09:30:04

数据可视化信息

2014-05-28 14:49:22

Excel数据可视化

2020-08-04 13:40:02

数据可视化热力图表格

2017-07-18 15:15:57

数据可视化细节层次分析

2017-10-31 09:38:53

大数据数据可视化Python
点赞
收藏

51CTO技术栈公众号