聊聊死锁的四种排查工具 !

开发 开发工具
死锁(Dead Lock)指的是两个或两个以上的运算单元(进程、线程或协程),都在等待对方停止执行,以取得系统资源,但是没有一方提前退出,就称为死锁。

作者 | 王磊

来源 | Java中文社群(ID:javacn666)

转载请联系授权(微信ID:GG_Stone

死锁(Dead Lock)指的是两个或两个以上的运算单元(进程、线程或协程),都在等待对方停止执行,以取得系统资源,但是没有一方提前退出,就称为死锁。

死锁示例

接下来,我们先来演示一下 Java 中最简单的死锁,我们创建两个锁和两个线程,让线程 1 先拥有锁 A,然后在 1s 后尝试获取锁 B,同时我们启动线程 2,让它先拥有锁 B,然后在 1s 之后尝试获取锁 A,这时就会出现相互等待对方释放锁的情况,从而造成死锁的问题,具体代码如下:

  1. publicclass DeadLockExample { 
  2.     public static void main(String[] args) { 
  3.         Object lockA = new Object(); // 创建锁 A 
  4.         Object lockB = new Object(); // 创建锁 B 
  5.  
  6.         // 创建线程 1 
  7.         Thread t1 = new Thread(new Runnable() { 
  8.             @Override 
  9.             public void run() { 
  10.                 // 先获取锁 A 
  11.                 synchronized (lockA) { 
  12.                     System.out.println("线程 1:获取到锁 A!"); 
  13.                     try { 
  14.                         Thread.sleep(1000); 
  15.                     } catch (InterruptedException e) { 
  16.                         e.printStackTrace(); 
  17.                     } 
  18.                     // 尝试获取锁 B 
  19.                     System.out.println("线程 1:等待获取 B..."); 
  20.                     synchronized (lockB) { 
  21.                         System.out.println("线程 1:获取到锁 B!"); 
  22.                     } 
  23.                 } 
  24.             } 
  25.         }); 
  26.         t1.start(); // 运行线程 
  27.  
  28.         // 创建线程 2 
  29.         Thread t2 = new Thread(new Runnable() { 
  30.             @Override 
  31.             public void run() { 
  32.                 // 先获取锁 B 
  33.                 synchronized (lockB) { 
  34.                     System.out.println("线程 2:获取到锁 B!"); 
  35.                     try { 
  36.                         Thread.sleep(1000); 
  37.                     } catch (InterruptedException e) { 
  38.                         e.printStackTrace(); 
  39.                     } 
  40.                     // 尝试获取锁 A 
  41.                     System.out.println("线程 2:等待获取 A..."); 
  42.                     synchronized (lockA) { 
  43.                         System.out.println("线程 2:获取到锁 A!"); 
  44.                     } 
  45.                 } 
  46.             } 
  47.         }); 
  48.         t2.start(); // 运行线程 
  49.     } 

以上程序的执行结果如下:

从上述结果可以看出,线程 1 和线程 2 都在等待对方释放锁,这样就造成了死锁问题。

死锁产生原因

通过以上示例,我们可以得出结论,要产生死锁需要满足以下 4 个条件:

  1. 互斥条件:指运算单元(进程、线程或协程)对所分配到的资源具有排它性,也就是说在一段时间内某个锁资源只能被一个运算单元所占用。
  2. 请求和保持条件:指运算单元已经保持至少一个资源,但又提出了新的资源请求,而该资源已被其它运算单元占有,此时请求运算单元阻塞,但又对自己已获得的其它资源保持不放。
  3. 不可剥夺条件:指运算单元已获得的资源,在未使用完之前,不能被剥夺。
  4. 环路等待条件:指在发生死锁时,必然存在运算单元和资源的环形链,即运算单元正在等待另一个运算单元占用的资源,而对方又在等待自己占用的资源,从而造成环路等待的情况。

只有以上 4 个条件同时满足,才会造成死锁问题。

死锁排查

如果程序出现死锁问题,可通过以下 4 种方案中的任意一种进行分析和排查。

方案 1:jstack

我们在使用 jstack 之前,先要通过 jps 得到运行程序的进程 ID,使用方法如下:

“jps -l”可以查询本机所有的 Java 程序,jps(Java Virtual Machine Process Status Tool)是 Java 提供的一个显示当前所有 Java 进程 pid 的命令,适合在 linux/unix/windows 平台上简单察看当前 Java 进程的一些简单情况,“-l”用于输出进程 pid 和运行程序完整路径名(包名和类名)。

有了进程 ID(PID)之后,我们就可以使用“jstack -l PID”来发现死锁问题了,如下图所示:

jstack 用于生成 Java 虚拟机当前时刻的线程快照,“-l”表示长列表(long),打印关于锁的附加信息。

PS:可以使用 jstack -help 查看更多命令使用说明。

方案 2:jconsole

使用 jconsole 需要打开 JDK 的 bin 目录,找到 jconsole 并双击打开,如下图所示:

然后选择要调试的程序,如下图所示:

之后点击连接进入,选择“不安全的连接”进入监控主页,如下图所示:

之后切换到“线程”模块,点击“检测死锁”按钮,如下图所示:

之后稍等片刻就会检测出死锁的相关信息,如下图所示:

方案 3:jvisualvm

jvisualvm 也在 JDK 的 bin 目录中,同样是双击打开:

稍等几秒之后,jvisualvm 中就会出现本地的所有 Java 程序,如下图所示:

双击选择要调试的程序:

单机鼠标进入“线程”模块,如下图所示:

从上图可以看出,当我们切换到线程一栏之后就会直接显示出死锁信息,之后点击“线程 Dump”生成死锁的详情信息,如下图所示:

方案 4:jmc

jmc 是 Oracle Java Mission Control 的缩写,是一个对 Java 程序进行管理、监控、概要分析和故障排查的工具套件。它也是在 JDK 的 bin 目录中,同样是双击启动,如下图所示:

jmc 主页信息如下:

之后选中要排查的程序,右键“启动 JMX 控制台”查看此程序的详细内容,如下图所示:

然后点击“线程”,勾中“死锁检测”就可以发现死锁和死锁的详情信息,如下图所示:

总结

死锁是因为两个或两个以上的运算单元,都在等待对方停止执行,以取得系统资源,但没有一方提前退出,于是就出现了死锁。死锁的排查工具总共有 4 种:

  • jstack
  • jconsole
  • jvisualvm
  • jmc

从易用性和性能方面来考虑,推荐使用 jconsole 或 jvisualvm 来排查死锁。

【编辑推荐】

 

责任编辑:姜华 来源: Java中文社群
相关推荐

2022-10-13 08:02:13

死锁运算系统

2021-04-07 19:34:16

社区买菜团购

2023-08-26 20:08:15

分库分表Spring

2023-12-18 08:36:39

消息队列微服务开发

2022-05-16 07:35:47

死锁工具jstack

2023-09-03 17:03:54

工具RegexGPTBloop

2015-07-15 10:36:31

2020-02-27 09:00:00

数据库设计工具

2010-03-24 19:09:43

Python语言

2011-11-24 16:34:39

Java

2019-10-24 07:42:28

Java引用GC

2011-03-16 09:05:53

NATiptables

2012-09-11 09:55:26

编程HTML5编程能力

2017-07-06 15:40:19

DevOps核心能力

2021-10-24 08:37:18

网络监控网络架构网络

2020-06-12 08:28:29

JavaScript开发技术

2023-02-10 11:13:42

网络功耗无线网络设备

2020-11-10 10:08:41

Kubernetes容器开发

2021-12-01 23:05:27

物联网计算数据

2013-06-14 15:24:57

Android开发移动开发数据存储方式
点赞
收藏

51CTO技术栈公众号