浅析Python虚拟机执行框架

开发 后端
下面的文章大家即将看到Python虚拟机的整体执行框架,大家还可以看到Python虚拟机在执行过程中不断使用的执行环境。

Python虚拟机中一个最核心的概念,在Python语言中,一切都是对象,也就是说一个整数就是一个对象,一个字符串也是一个对象,其实类型也是一种对象,整数类型是一个对象。

了解这两点对掌握第二部分的内容已经足够了。但是,虚拟机和执行环境还仅仅是Python运行机理(或者说运行模型)的一部分,为了对Python整个的运行机理做一个全面的了解,我们还需要大致了解一下Python的运行时环境。

前面我们说了,PyFrameObject对应于可执行文件在执行时的栈帧,但是一个可执行文件要在操作系统中运行,只有栈帧是不够的。之前我们遗漏了两个对于可执行文件运行至关重要的概念:进程和线程。

在本节中,我们首先要对Python的运行模型(主要是线程模型)进行一个整体概念上的了解,虽然这部分内容我们会留到剖析Python的多线程实现时再详细考察。但是由于Python虚拟机在初始化时会创建一个主线程。

所以其运行时环境中存在一个主线程,而且本部分将剖析的Python的异常机制会利用到Python内部的线程模型,因此对Python线程模型有一个整体概念上的了解也是必须的。以Win32平台为例,我们知道,对于原生的Win32可执行文件,无论是由C/C++产生,还是由Delphi产生,都会在一个进程(Process)中运行。

进程并非是与机器指令序列相对应的活动对象,这个与可执行文件中机器指令序列对应的活动对象是由线程(Thread)这个概念来进行抽象的,而进程则是线程的活动环境。对于通常的单线程可执行文件,在执行时操作系统会创建一个进程,在进程中,又会有一个主线程;而对于多线程的可执行文件,在执行时会操作系统会创建一个进程和多个线程。

该多个线程能共享进程地址空间中的全局变量,这就自然而然地引出了线程同步的问题。CPU对任务的切换实际上是在线程之间切换,在切换任务时,CPU需要执行线程环境的保存工作,而在切换至新的线程之后,需要恢复该线程的线程环境。

这些关于程序运行的概念同样适用于PythonPython实现了对多线程的支持,而且Python中的一个线程就是操作系统上的一个原生线程。这里我们对多线程机制不过多深入,现在只需记住,Python在执行时,可能会有多个线程存在。

在前面我们看到了虚拟机的大致运行框架,实际上这个虚拟机就是Python中对CPU的抽象,可以看做是一个软CPU,Python中的所有线程都使用这个软CPU来完成计算工作。真实机器上的任务切换机制对应到Python中。

就是使不同的线程轮流使用虚拟机的机制。CPU切换任务时需要保存线程运行环境。对于Python来说,在切换线程之前,同样需要保存关于当前线程的信息。在Python中,这个关于线程状态信息的抽象是通过PyThreadState对象来实现的,一个线程将拥有一个PyThreadState对象。

所以从另一种意义来说,这个PyThreadState对象也可以看成是对线程本身的抽象。但实际上,这两者是有很大区别的,PyThreadState并非是对线程本身的模拟,因为Python中的线程仍然使用操作系统的原生线程。

PyThreadState仅仅是对线程状态的抽象,不过在本书的大部分章节中,为了叙述的方便,我们不过分严格地区分线程和线程状态本身。所以在以后我们有时会称PyThreadState为线程对象,有时会称之为线程状态对象。只有在剖析多线程机制时,我们会严格区分两者。对于下面将提到的PyInterpreterState对象,也有类似的考量。

刚才提到,在Win32下,线程是不能独立存活的,它需要存活在进程的环境中,而多个线程可以共享进程的一些资源。在Python中同样也是如此,考虑一下,如果Python程序中有两个线程,都会进行同样的一个动作——import sys,那么这个sys module究竟应该存在几份?

是全局共享的还是每个线程都有一个sys module?如果每个线程有自己独立module集合,那么Python对内存的消耗就会显得非常惊人。所以在Python中,这些module都是全局共享的,仿佛这些module都是进程中的共享资源一样,对于进程这个抽象概念,Python以PyInterpreterState对象来实现。

在Win32下,通常都会有多个进程,而Python实际上也可以有多个逻辑上的interpreter存在。在通常的情况下,Python中只有一个interpreter。这个interpreter中维护了一个或多个PyThreadState对象,与这些PyThreadState对象对应的线程轮流使用一个字节码执行引擎。看,是不是与真实机器上的程序执行模型非常相似?

谈到多线程,就不能不谈到线程同步。在Python虚拟机中,是通过一个全局解释器锁GIL(Global Interpreter Lock)来实现线程同步的,关于这部分内容,我们留到剖析Python多线程机制时再详细考察。

好了,现在讨论刚才提到的那两个关键对象:表示进程概念的PyInterpreterObject对象和表示线程概念的PyThreadState对象。

【编辑推荐】

  1. 有关Python系统文件进行介绍指导
  2. 如何正确的使用Python函数
  3. 对Python 构建工具进行详细介绍分析
  4. PythonAndroid浅析Python优势所在
  5. 如何使用Python模块解析配置文件?
责任编辑:chenqingxiang 来源: CSDN
相关推荐

2018-04-04 15:05:17

虚拟机字节码引擎

2009-06-19 15:38:43

Java虚拟机

2012-05-18 10:22:23

2010-07-26 09:02:38

2013-07-17 09:32:58

2010-02-26 15:28:15

Python虚拟机

2017-11-14 16:43:13

Java虚拟机线程

2009-12-22 16:05:05

Linux操作系统

2019-03-19 15:30:42

程序员JVM虚拟机

2023-01-26 00:06:05

JAVA虚拟机优化

2014-02-21 11:20:34

KVMXen虚拟机

2020-01-17 10:52:37

无服务器容器技术

2012-04-10 10:29:29

2023-09-03 17:05:20

虚拟机

2010-12-23 14:05:12

虚拟机

2009-06-18 13:51:07

Java虚拟机

2010-02-24 10:49:11

Python运行环境

2010-02-24 10:07:28

Python虚拟机

2023-04-26 07:51:36

虚拟机操作系统进程

2010-01-21 11:17:36

xen虚拟机
点赞
收藏

51CTO技术栈公众号