怎样才算学会Python?

开发 后端
你可知道Python其实只是一个语言标准,它的实现程序不止一个,其中官方的实现是CPython,还有Jython和IronPython等。不过,CPython作为使用最为广泛的解释器当然是开发之首选。

[[237230]]
Python inside the door

Python 实践基础

起源

假如你已经有了编程基础,那么学习一门新语言的困难点绝对不在语法、语义和风格等代码层面上的,而在于语言范式(OO,FP还是Logic),语言的生态(如:依赖管理和包发布等)和工具(编辑器,编译器或者解释器)这些方面,请参看如何高效地学习编程语言。再假如你已经对各类语言范式都有一定的了解,那么***的困难之处就是…细节,它是魔鬼。

我相信真正拥抱一门新语言,花在工具和语言生态上的时间一定很多。庞大的社区利用群体智慧构筑的生态圈充满了各种零碎的知识点,这些知识点可能是前人趟过的陷阱(Common Gotchas),基于局部共识经由经典项目实践过之后的约定(Convention)和惯用法(Idioms),也可能是总结出的概念模式(Pattern),甚至是审美(Aesthetic)和禅(Zen)或道(Dao)。这些知识点作用到了工具和语言生态之中,意味着你需要使用合适工具、遵循生态的玩法才能从中受益。

工具

工欲善其事必先利其器,对于程序员而言,这个器是编辑器…吗?Emacs, Vim, VS Code or PyCharm?

解释器

当然不是,这个器应当是让你能立马运行程序并立刻看到结果的工具,在Python的上下文中,它是Python的解释器。一般情况下,我们会选择***版的解释器或者编译器,但是Python有一点点例外,因为Python3和2并不兼容,那么该选择哪个版本呢?寻找这类问题的答案其实就是融入Python社区的过程。幸运的是,社区出版了一本书 The Hitchhiker’s Guide to Python,里面诚恳地给出了建议。所以不出意外,Python3是比较合适的选择。

因为Python安装起来很简单,我们跳过…吧?不过,大侠留步,你可知道Python其实只是一个语言标准,它的实现程序不止一个,其中官方的实现是CPython,还有Jython和IronPython等。不过,CPython作为使用最为广泛的解释器当然是开发之***。

  1. $ python3 
  2. Python 3.6.5 (default, Jun 17 2018, 12:13:06) 
  3. [GCC 4.2.1 Compatible Apple LLVM 9.1.0 (clang-902.0.39.2)] on darwin 
  4. Type "help""copyright""credits" or "license" for more information. 
  5. >>> print("hello world"
  6. hello world 

编辑器

虽然面向REPL编程(Repl-Oriented Programming)是一种比单元测试的反馈速度更快的编程方式,但是在REPL中编写应用程序并不合适,不合适的地方表现在代码不易组织(分模块)和代码没法记录(存盘)。所以我们需要可以编辑的源代码、目录和其它相关文件,这个时候就需要挑选趁手的编辑器。

神之编辑器Emacs中内置了python-mode,如果已经是Emacs用户,这款编辑器当是写Python的不二之选。编辑器之神的Vim排第二,如果你比较喜欢折腾Vim8.0的插件,或者想自己构建NeoVim的话。其它的编辑器,我不知道,不想用。不过PyCharm是Jetbrains家的IDE,靠谱。

有功夫在Terminal中装一个emacsclient,然后下载一个oh-my-zsh的插件emacsclient,就可以很愉悦地在Terminal中使用Emacs编辑文件了。

  1. $ te hello_world.py # te: aliased to /Users/qianyan/.oh-my-zsh/plugins/emacs/emacsclient.sh -nw 
  2. ""
  3. hello_world.py 
  4. Ctrl+x+c 退出emacs :) 
  5. ""
  6. print("hello world"
  7. $ python3 hello_world.py 
  8. hello world 
  9. $ python3 -m hello_world #注意没有.py的后缀 
  10. hello world 

生态

基本工具比较好把握,但是何时选择什么工具做什么样的事情就不好拿捏了,而且如何把事情做成Pythonic的模样也是对经验和能力的考验。

如果我们不是编程小白的话,就需要充分利用迁移学习的能力了。学习的***方法就是解决问题。不得不承认,在动手实践的过程,时间走得是最快的,在同一件事上花的时间越多也就越熟悉。

我们尝试用Python编写一个tree命令行(Command-Line Application),顾名思义,打印目录层级结构的程序,详细描述参看这篇命令行中 tree 的多重实现。

测试模块

怎么写测试呢?多年养成的TDD习惯让我首先想要了解什么是Python中常用的测试工具。答案不难寻找,unittest是Python内置的测试模块,而pytest是比unittest更简洁和强大的选择,所以我选择后者。

这个程序的测试我使用pytest,但是它并不是所有项目测试的唯一选择,所以***能局部安装,尤其是限制在当前工程目录里。搜索查找的结果是,Python3内置的虚拟环境(Virtual Environment)模块可以做到这点。

虚拟环境

在当前创建venv目录(python3 -m venv venv),然后用tree命令查看该目录的结构。

  1. $ python3 -m venv venv 
  2. $ tree -L 4 venv 
  3. venv 
  4. ├── bin 
  5. │   ├── activate 
  6. │   ├── activate.csh 
  7. │   ├── activate.fish 
  8. │   ├── easy_install 
  9. │   ├── easy_install-3.6 
  10. │   ├── pip 
  11. │   ├── pip3 
  12. │   ├── pip3.6 
  13. │   ├── python -> python3 
  14. │   └── python3 -> /usr/local/bin/python3 
  15. ├── include 
  16. ├── lib 
  17. │   └── python3.6 
  18. │       └── site-packages 
  19. │           ├── __pycache__ 
  20. │           ├── easy_install.py 
  21. │           ├── pip 
  22. │           ├── pip-9.0.3.dist-info 
  23. │           ├── pkg_resources 
  24. │           ├── setuptools 
  25. │           └── setuptools-39.0.1.dist-info 
  26. └── pyvenv.cfg 

进入虚拟环境,然后使用pip3安装pytest测试模块,会发现venv目录多了些东西。

  1. $  . venv/bin/activate 
  2. venv ❯ pip3 install pytest 
  3. Collecting pytest 
  4. ... 
  5. $ tree -L 4 venv 
  6. venv 
  7. ├── bin 
  8. │   ├── py.test 
  9. │   ├── pytest 
  10. ├── include 
  11. ├── lib 
  12. │   └── python3.6 
  13. │       └── site-packages 
  14. │           ├── __pycache__ 
  15. │           ├── _pytest 
  16. │           ├── atomicwrites-1.1.5.dist-info 
  17. │           ├── attr 
  18. │           ├── attrs-18.1.0.dist-info 
  19. │           ├── more_itertools 
  20. │           ├── more_itertools-4.2.0.dist-info 
  21. │           ├── pluggy 
  22. │           ├── pluggy-0.6.0.dist-info 
  23. │           ├── py 
  24. │           ├── py-1.5.3.dist-info 
  25. │           ├── pytest-3.6.2.dist-info 
  26. │           ├── pytest.py 
  27. │           ├── six-1.11.0.dist-info 
  28. │           └── six.py 

此时,虚拟环境会在PATH变量中前置./bin目录,所以可以直接使用pytest命令进行测试。根据约定,测试文件的名称必须以test_开头,如test_pytree.py,测试方法也必须如此,如test_fix_me。遵循约定编写一个注定失败的测试如下:

  1. ""
  2. test_pytree.py 
  3. ""
  4. def test_fix_me(): 
  5.     assert 1 == 0 
  6. $ pytest 
  7. ... 
  8.     def test_fix_me(): 
  9. >       assert 1 == 0 
  10. E       assert 1 == 0 
  11. test_pytree.py:5: AssertionError 

测试失败了,说明测试工具的打开方式是正确的。在进入测试、实现和重构(红-绿-黄)的心流状态之前,我们需要考虑测试和实现代码该放在哪里比较合适。

假设我们会把pytree作为应用程序分发出去供别人下载使用,那么标准的目录结构和构建脚本是必不可少的,Python自然有自己的一套解决方案。

目录结构

在Packaging Python Projects的指导下,我们略作调整,创建和源代码平级的测试目录(tests),得到的完整目录如下:

  1. ├── CHANGES 
  2. ├── LICENSE 
  3. ├── README.md 
  4. ├── docs 
  5. ├── pytree 
  6. │   ├── __init__.py 
  7. │   ├── __version__.py 
  8. │   ├── cli.py 
  9. │   └── core.py 
  10. ├── setup.cfg 
  11. ├── setup.py 
  12. ├── tests 
  13. │   ├── fixtures 
  14. │   └── test_pytree.py 
  15. └── venv 

这样的目录结构不仅可以清晰地模块化,隔离测试和实现,提供使用指导和版本更新记录,还可以很方便地做到包依赖管理和分发,这得归功于setup.py,它是Python项目中事实标准(de facto standard)上的依赖和构建脚本,pytree下的setup.py内容如下:

  1. # setup.py 
  2. # -*- coding: utf-8 -*- 
  3. from setuptools import setup, find_packages 
  4. from codecs import open 
  5. import os 
  6. here = os.path.abspath(os.path.dirname(__file__)) 
  7. about = {} 
  8. with open(os.path.join(here, 'pytree''__version__.py'), 'r''utf-8'as f: 
  9.     exec(f.read(), about) 
  10.      
  11. with open('README.md'as f: 
  12.     readme = f.read() 
  13. with open('LICENSE'as f: 
  14.     license = f.read() 
  15. setup( 
  16.     name='pytree'
  17.     version=about['__version__'], 
  18.     description='list contents of directories in a tree-like format.'
  19.     long_description=readme, 
  20.     author='Yan Qian'
  21.     author_email='qianyan.lambda@gmail.com'
  22.     url='https://github.com/qianyan/pytree'
  23.     license=license, 
  24.     packages=find_packages(exclude=('tests''docs')), 
  25.     classifiers=( 
  26.         "Programming Language :: Python :: 3"
  27.         "License :: OSI Approved :: MIT License"
  28.         "Operating System :: OS Independent"
  29.     ), 
  30.     setup_requires=['pytest-runner'], 
  31.     tests_require=['pytest'], 
  32.     entry_points = { 
  33.         'console_scripts': [ 
  34.             'pytree = pytree.cli:main' 
  35.         ] 
  36.     }, 
  37.     install_requires=[] 

setup.py能帮助我们解决测试中依赖模块的问题,这样我们把pytree作为一个package引入到测试代码中。

  1. venv ❯ python3 
  2. Python 3.6.5 (default, Jun 17 2018, 12:13:06) 
  3. [GCC 4.2.1 Compatible Apple LLVM 9.1.0 (clang-902.0.39.2)] on darwin 
  4. Type "help""copyright""credits" or "license" for more information. 
  5. >>> import sys, pprint 
  6. >>> pprint.pprint(sys.path) 
  7. [''
  8.  '/usr/local/Cellar/python/3.6.5_1/Frameworks/Python.framework/Versions/3.6/lib/python36.zip'
  9.  '/usr/local/Cellar/python/3.6.5_1/Frameworks/Python.framework/Versions/3.6/lib/python3.6'
  10.  '/usr/local/Cellar/python/3.6.5_1/Frameworks/Python.framework/Versions/3.6/lib/python3.6/lib-dynload'
  11.  '/Users/qianyan/Projects/personal/public/pytree/venv/lib/python3.6/site-packages'
  12.  '/Users/qianyan/Projects/personal/public/pytree/venv/lib/python3.6/site-packages/docopt-0.6.2-py3.6.egg'
  13.  '/Users/qianyan/Projects/personal/public/pytree'

然后运行pytest或者python3 setup.py pytest,此时pytest会把.pytree/tests前置到PATH变量中,验证如下:

  1. # test_pytree.py 
  2. import sys 
  3. def test_path(): 
  4.     assert sys.path == '' 
  5. venv ❯ pytest 
  6. -> AssertionError: assert ['/Users/qianyan/Projects/personal/public/pytree/tests',  
  7. '/Users/qianyan/Projects/personal/public/pytree/venv/bin', ...] == '' 
  8. venv ❯ python3 setup.py pytest 
  9. -> AssertionError: assert ['/Users/qianyan/Projects/personal/public/pytree/tests',  
  10. '/Users/qianyan/Projects/personal/public/pytree', ...] == '' 

这里python3 setup.py pytest可以通过setup.cfg设置别名(alias):

  1. # setup.cfg 
  2. [aliases] 
  3. test=pytest 

python3 setup.py test的效果和前面的命令等同。

使用TDD的方式实现了pytree核心的功能(源代码),然后考虑如何把它变成真正的命令行程序。首先要解决的问题是如何以用户友好的方式显示需要哪些传入参数,我们期待pytree -h能提供一些帮助信息,为了不重复造轮子,挑选现成的Option解析库比较轻松。Python内置的argparse已经足够用了,不过docopt值得尝试。

依赖管理

setup.py提供了依赖管理功能,声明依赖及其版本号。

  1. # setup.py 
  2. ... 
  3. install_requires=[docopt==0.6.2] 

然后运行python3 setup.py develop安装。就绪之后,编写cli.py作为命令行程序的入口。

  1. #!/usr/bin env python3 
  2. """list contents of directories in a tree-like format. 
  3.   Usage:  
  4.     pytree <dir> 
  5.     pytree -h | --help | --version 
  6. ""
  7. import pytree.core as pytree 
  8. import pytree.__version__ as version 
  9. def main(): 
  10.     from docopt import docopt 
  11.     arguments = docopt(__doc__, version=version.__version__) 
  12.     dir_name = arguments['<dir>']  
  13.     print('\n'.join(pytree.render_tree(pytree.tree_format('', dir_name)))) 
  14. if __name__ == "__main__"
  15.     main() 

通过打印help信息的方式验证是否符合预期:

  1. $ python3 pytree/cli.py --help 
  2. list contents of directories in a tree-like format. 
  3.   Usage: 
  4.     pytree <dir> 
  5.     pytree -h | --help | --version 

当然理想的结果是直接可以运行pytree --help,setup.py的console_scripts刚好派上用场。

  1. # setup.py 
  2.     entry_points = { 
  3.         'console_scripts': [ 
  4.             'pytree = pytree.cli:main' #以pytree作为命令行程序的调用名 
  5.         ] 
  6.     } 

此时查看which pytree显示/Users/qianyan/Projects/personal/public/pytree/venv/bin/pytree,说明pytree已经在路径变量当中,可以直接执行:

  1. $ pytree tests/fixtures 
  2. tests/fixtures 
  3. └── child 

完成了命令行程序并通过测试,我们尝试发布到测试仓库(TestPyPI)供其他人下载使用。

包发布

依照文档描述,先去TestPyPI注册用户,本地打包成发行版,然后安装twine工具发布。

  1. $ python3 -m pip install --upgrade setuptools wheel 
  2. $ python3 setup.py sdist bdist_wheel 
  3. $ pytree dist # pytree查看dist目录 
  4. dist 
  5. ├── pytree-1.0.2-py3-none-any.whl 
  6. └── pytree-1.0.2.tar.gz 
  7. $ python3 -m pip install --upgrade twine 
  8. $ twine upload --repository-url https://test.pypi.org/legacy/ dist/* #or twine upload --repository testpypi dist/* 如果你配置了~/.pypirc 

上传成功需要一段时间,等待服务完成同步才可以下载,我们在另一个虚拟环境中进行验证:

  1. $ python3 -m venv test 
  2. $ . test/bin/activate 
  3. test > python3 -m pip install --index-url https://test.pypi.org/simple/ pytree==1.0.2 
  4. test > ls venv/lib/python3.6/site-packages/ 
  5. ... 
  6. pytree 
  7. pytree-1.0.2.dist-info 
  8. ... 

确保site-packages目录下有这两个目录:pytree和pytree-1.0.2.dist-info,然后我们就可以完成***的验证阶段了,如下:

  1. test > pytree tests/fixtures 
  2. tests/fixtures 
  3. └── child 

这里版本号之所以是1.0.2,是因为已经上传过了0.0.1, 1.0.0, 1.0.1 等版本,TestPyPI不允许同名同版本的文件重复上传,即使删除原来的文件也不行。前面的版本都有一定的错误,错误的根因在于find_packages以及package_dir的配置项文档说明很模糊,而且只有到上传到TestPyPI然后下载下来,才能验证出来,这种缓慢的反馈是Python的应该诟病的地方。

注意

find_package()也是一个深坑,***个参数如果写成find_packages('pytree', exclude=...),那么pytree下的所有Python文件都会被忽略。原因是pytree已经是package,所以不应该让setup去这个目录找其他的packages.

这个package_dir也是如此,我们如果设置package_dir={'': 'pytree'},setup.py就会将/Users/qianyan/Projects/personal/public/pytree/pytree前置到PATH中,这会导致console_scripts': ['pytree = pytree.cli:main']抛出错误 ModuleNotFoundError: no module named ‘pytree’,究其原因是pytree/pytree导致setup尝试在pytree/pytree这个package里头找自己(pytree),自然找不到。但是如果改成console_scripts': ['pytree = cli:main'],因为cli在pytree/pytree底下,所以就能成功执行。当然这是一种错误的写法。

如果遇到了 ModuleNotFoundError: no module named ‘pytree’ 的错误,***的方式就是import sys, pprint然后pprint.pprint(sys.path),很容易发现Python运行时的执行路径,这有助于排查潜在的配置错误。

责任编辑:未丽燕 来源: lambeta.com
相关推荐

2010-11-04 10:55:24

编程语言

2019-08-01 07:40:01

物联网测试物联网IOT

2018-03-15 08:36:07

2017-05-10 08:39:34

装机线缆机箱

2012-10-18 15:07:12

创业用户创业者

2015-07-29 09:58:29

快速学习

2017-12-07 16:13:18

程序员编程代码

2017-08-14 14:36:02

云计算云服务云端

2020-12-04 08:24:34

监控多维度立体化监控系统

2014-06-09 10:51:59

2015-08-17 11:33:58

2012-08-23 09:35:46

2010-01-12 16:55:40

交换机怎样设置

2010-02-01 14:14:16

安装Python

2010-02-02 18:02:20

Python源文件

2022-08-22 12:03:25

代码技术

2010-02-02 17:18:16

Python图像处理

2017-12-11 18:11:02

2023-07-02 14:05:13

2020-05-15 15:28:51

爬虫Python学习
点赞
收藏

51CTO技术栈公众号