快速提升Python数据分析能力的七个神奇方法

开发 后端
使用Python进行数据分析是一件专业领域的事情,所以要想强化数据分析的技能,需要大家不断练习。同时,我们也需要向有经验的数据分析师学习他们的专业技巧。这篇文章我们介绍来自数据分析大师分享的七个可以提升分析能力的方法。

使用Python进行数据分析是一件专业领域的事情,所以要想强化数据分析的技能,需要大家不断练习。同时,我们也需要向有经验的数据分析师学习他们的专业技巧。这篇文章我们介绍来自数据分析大师分享的七个可以提升分析能力的方法。

[[335015]]

1.Pandas 分析包

这个工具的好处是显而易见的。下面的动画是调用简单方法df.profile_report()的结果,看看自己的结果报告:

使用这个工具很简单,只需安装和导入pandas分析包。

2. 使用Cufflinks和Plotly绘图

我们中的大多数人都是所谓的“有经验的”数据科学家或数据分析师,他们会非常熟悉matplotlib和pandas之间的集成。也就是你可以快速画出一个简单pd的图。DataFrame或pd。通过简单调用.plot()方法,可以得到以下结果:

现在这一切都很好,但如何实现交互,可平移,可缩放,可缩放的图形呢?我们可以用Cufflinks

要在您的环境中安装Cufflinks,只需运行

  1. pip install cufflinks --upgrade 

你就可以开始了。看看下面这些:

3. IPython Magic命令

IPython的“Magic”基本上是IPython在标准Python语法之上的一系列增强。Magic命令有两种类型:行Magic,用一个%前缀表示,对一行输入进行操作;单元Magic,用两个%%前缀表示,对多行输入进行操作。下面是“magic”提供的一些有用的功能:

  • %lsmagic:找到全部
  • %debug:交互式调试
  • %store:在notebook之间传递变量。
  • %who:列出全局作用域的所有变量。
  • %%time: 时间魔法,获取所有时间信息
  • %%writefile:将单元格内容写入文件。

4. 奇特的Jupyter格式

这个超级酷!基本上,Jupyter允许一些HTML / CSS格式的标记单元格。

蓝色风格:

  1. <div class="alert alert-block alert-info"> 
  2.     This is <b>fancy</b>
  3. </div> 

 红色风格:

  1. <div class="alert alert-block alert-danger"> 
  2.     This is <b>baaaaad</b>
  3. </div> 

绿色风格:

  1. <div class="alert alert-block alert-success"> 
  2.     This is <b>gooood</b>
  3. </div> 

 可以看一看效果如何:

5. Jupyter快捷键

在访问和学习快捷键时,您可以使用命令面板:Ctrl + Shift + P。这会显示出笔记本所有功能的列表。以下是最基本的命令举例:

Esc:这将带你进入命令模式。在这个模式下,你可以使用箭头键在笔记本上导航。

  • Enter:返回当前单元格的编辑模式。
  • 更多命令可以一边学习一遍使用。

6. Jupyter中每个单元的多个输出

这个很棒。您是否曾经想要显示pandas DataFrame的.head()和.tail(),但中途放弃了,因为创建额外的代码单元来运行.tail()方法太麻烦了?不用担心了,现在您可以使用以下代码行显示您想要的所有输出:

  1. from IPython.core.interactiveshell import InteractiveShell 
  2. InteractiveShell.ast_node_interactivity = "all" 

现在你看,多重输出的力量:

7. 立即创建一个幻灯片的Notebook

使用RISE,你可以立即把你的Jupyter Notebook变成幻灯片与一个单一的按键。最好的是,Notebook仍然是活动的,所以您可以执行现场编码的同时呈现!

要使用这个出色的工具,简单安装RISE或通过conda或pip取决于您的环境:

  1. conda install -c conda-forge rise/// OR ///pip install RISE 

现在,你可以从你的Notebook上创建有趣的幻灯片,只需点击新建按钮:

 

责任编辑:赵宁宁 来源: 今日头条
相关推荐

2017-11-24 14:20:38

2022-06-30 15:12:48

数据分析工具大数据

2022-10-08 13:13:14

Python程序性能

2022-04-06 17:48:44

数据分析梳理数据业务

2020-10-16 11:53:52

数据分析PythonSQL

2021-08-02 13:45:53

UPS电源数据中心

2023-06-05 18:01:57

shell命令

2019-09-10 11:31:16

Python数据分析表达式

2022-03-29 11:59:34

梳理标签体系

2021-11-22 14:57:35

数据治理CIO数字化转型

2021-09-22 12:45:47

Python数据分析

2012-06-21 08:56:59

2019-11-06 11:16:00

程序员HTMLPython

2016-10-26 19:33:45

数据分析大数据

2024-01-31 12:13:02

JavaScriptSet元素

2014-10-27 12:34:50

JMP

2022-12-09 09:47:02

2021-10-18 13:26:15

大数据数据分析技术

2023-05-06 15:45:04

物联网IOT

2022-05-23 11:13:02

Python工具
点赞
收藏

51CTO技术栈公众号