Java 中一个你不常用,但是关键时刻可以帮我们提升性能的一个知识点

开发 后端
在提供优化代码之前,先简单的描述一下这个方法做的事情,要做的事情很简单,就是返回一个整数,整数表示的是二进制数组中有多少个 1。给到了入参是一个 Map 其中 key 我们不关心,value 是二进制字符串。

[[440000]]

本文转载自微信公众号「Java极客技术」,作者鸭血粉丝Tang 。转载本文请联系Java极客技术公众号。

最近阿粉在实现一个功能的时候,遇到了一个性能问题,一个方法在某些场景下运行时长达到了 4s 多,虽然说业务功能是实现了,但是不管是从业务的角度还是作为一个有追求的程序员,都是不能接受的,所以优化这个方法势在必行。在优化的过程中就用到了本文要说明的一个知识点,看阿粉慢慢道来。

在提供优化代码之前,先简单的描述一下这个方法做的事情,要做的事情很简单,就是返回一个整数,整数表示的是二进制数组中有多少个 1。给到了入参是一个 Map

根据我们上面的分析,列一下我们写代码的步骤:

  • 因为我们要按位进行或运算,所以二进制的长度应该要一样才行,我们取最长的二进制的长度为 maxLength,所有没有这么长的二进制字符串,我们需要进行前面补 0 ;
  • 将所有的二进制字符串按位进行或运算;
  • 遍历最终的数组输出 1 的个数;

按照这个思路,我们可以写出下面的代码,maxLength 作为入参传递到我们的方法中。

  1. public static long version1(Map<String, String> map, int maxLength) { 
  2.         long result = 0L; 
  3.         if (!CollectionUtils.isEmpty(map)) { 
  4.             //1. 将长度不够 maxLength 长的二进制字符串前面补 0 
  5.             for (Map.Entry<String, String> m : map.entrySet()) { 
  6.                 if (m.getValue().length() < maxLength) { 
  7.                     StringBuilder newValue = new StringBuilder(); 
  8.                     for (int i = 0; i < maxLength - m.getValue().length(); i++) { 
  9.                         newValue.append(0); 
  10.                     } 
  11.                     newValue.append(m.getValue()); 
  12.                     map.put(m.getKey(), newValue.toString()); 
  13.                 } 
  14.             } 
  15.             //2. 将每个关键字的二进制字符串按位进行或 | 运算 
  16.             Integer[] sum = new Integer[maxLength]; 
  17.             for (int i = 0; i < maxLength; i++) { 
  18.                 sum[i] = 0; 
  19.             } 
  20.             for (Map.Entry<String, String> m : map.entrySet()) { 
  21.                 for (int i = 0; i < maxLength; i++) { 
  22.                     String substring = m.getValue().substring(i, i + 1); 
  23.                     sum[i] = sum[i] | Integer.parseInt(substring); 
  24.                 } 
  25.             } 
  26.             //3. 统计计算结果中 1 的个数 
  27.             for (Integer integer : sum) { 
  28.                 result += integer
  29.             } 
  30.         } 
  31.         return result; 
  32.     } 

简单分析一下:

第一步的时候我们构造了一个 StringBuilder 对象,根据二进制字符串的长度和 maxLength 的长度,在前面进行补 0 操作,两者相差多少就在前面补多少个 0,然后将原始的二进制补到最后,得到一个新的二进制字符串;

第二步我们遍历 Map,将二进制字符串中的每一位与之前构造的全是 0 的 sum 数组进行或运算操作,并将结果写到 sum 数组对应的位置上,因为经过第一步的补 0 这里 Map 中所有的 value 的长度是一样的;

第三步再遍历 sum 数组,将每一位累加起来,得到的结果就是我们需要的结果,因为 sum 数组中只有 1 和 0,所以总和就是 1 的个数。

代码写到这里,内心毫无波澜,没有一丝丝感觉,毕竟只要思路清晰,代码的实现都是小事。

然而就当把这个功能发到测试环境的时候,测试妹妹反馈某些情况下在前端页面等待的时间太长了,loading 的小按钮一直转不停,往往要 4,5 秒的时间才能得到结果,体验太差了。

抱着以用户体验为目标的决心(其实是怕被扣工资),阿粉看了一下测试用例,追踪了一下代码结果发现当这个方法中 map 中的 key 达到 1000+ 的时候,整个方法竟然执行了4s 多!是可忍孰不可忍,作为一个有追求的程序员怎么能让这种情况发生了,不得已阿粉走上了优化这个方法的道路。

优化之前我们当然需要知道有哪些可以优化的地方,看下这段代码,发现里面好多 for 循环,毫无疑问我们的优化目标就是降低 for 循环的个数以及次数。

仔细看了一下代码,我们想一想真的有必要要先将每个二进制字符串进行前面补 0 的动作吗?是不是可以在进行或运算的时候发现位数不够的时候自动补 0 呢?还有就是我们真的有必要在最后遍历 sum 数组,得到 1 的个数吗?因为是或运算,只要 sum[i] 是 1 了,或运算得到的结果就一定是 1 那这个时候是不是就可以得到结果呢?

带着这两个问题,将代码优化成了下面的样子:

  1. public static long version2(Map<String, String> map, int maxLength) { 
  2.         long result = 0L; 
  3.         if (!CollectionUtils.isEmpty(map)) { 
  4.             Integer[] sum = new Integer[maxLength]; 
  5.             for (int i = 0; i < maxLength; i++) { 
  6.                 sum[i] = 0; 
  7.             } 
  8.             // 1. 将长度不够 maxLength 长的二进制字符串前面补 0 
  9.             // 2. 并将每个关键字的二进制字符串按位进行或 | 运算 
  10.             for (Map.Entry<String, String> m : map.entrySet()) { 
  11.                 String value = m.getValue(); 
  12.                 for (int i = maxLength - 1; i >= 0; i--) { 
  13.                     char c; 
  14.                     int index = value.length() - i - 1; 
  15.                     if (index < 0) { 
  16.                         c = '0'
  17.                     } else { 
  18.                         c = value.charAt(index); 
  19.                     } 
  20.                     //3. 统计计算结果中 1 的个数 
  21.                     int temp = sum[i]; 
  22.                     sum[i] = sum[i] | Integer.parseInt(String.valueOf(c)); 
  23.                     if (temp == 0 && sum[i] == 1) { 
  24.                         result += 1; 
  25.                     } 
  26.                 } 
  27.             } 
  28.         } 
  29.         return result; 
  30.     } 

简单分析一下,我们可以从数组的最后一位开始进行按位或运算,这样当得到的 index 小于 0 的时候,表示该二进制数组已经遍历完了,那么这个时候如果还没有达到 maxLength 的长度,我们就补 0,用 0 进行或运算;同时我们在进行或运算的时候,通过记录 sum[i] 在或运算前和或运算后差异来记录 1 的个数,我们只记录或运算前 sum[i] == 0 或运算后 sum[i] == 1 的值,就是我们需要的结果。

经过我们优化后的代码,首先从 for 循环的个数来看就已经减少了,我们测试一下效果如下,这里因为二进制的数组很长,不能放到公众号文章里面,就简化了。

  1. public static void main(String[] args) { 
  2.     String binaryString1 = "1000101010010101010101010100110101010101001001010101010101..."
  3.         Map<String, String> map = new HashMap<>(16); 
  4.         for (int i = 0; i < 1500; i++) { 
  5.             map.put("key_" + i, binaryString1); 
  6.         } 
  7.         int maxLength = 0; 
  8.         for (Map.Entry<String, String> m : map.entrySet()) { 
  9.             maxLength = Math.max(maxLength, m.getValue().length()); 
  10.         } 
  11.         long start1 = System.currentTimeMillis(); 
  12.         long aLong1 = version1(map, maxLength); 
  13.         System.out.println("version1:" + aLong1 + ":" + (System.currentTimeMillis() - start1)); 
  14.  
  15.         long start2 = System.currentTimeMillis(); 
  16.         long aLong2 = version2(map, maxLength); 
  17.         System.out.println("version1:" + aLong2 + ":" + (System.currentTimeMillis() - start2));     

从测试结果我们可以看到,当 map size 在 1000 的时候,version1 耗费了 4034ms,version2 耗费了 2090ms,性能提升接近 2 倍说明我们的优化还是有效果的。

事情到了这里,你以为就结束了吗?那就错了,因为还没有提到阿粉前面说的知识点,下面重点来了,请注意看。version2 的代码我们能不能再优化了?不管能不能再优化,有一行代码看起来总是让人很不爽,那就是sum[i] = sum[i] | Integer.parseInt(String.valueOf(c)); 这一行,将 char 字符,转换成 String,再通过 Integer.parseInt() 转成 int 的 0 或者 1 来进行或运算。很容易让人想到,这里经过几层的包装转换,是很浪费资源的,所以这里也是我们优化的点。

这一行的目标是进行或运算,Integer.parseInt(String.valueOf(c)) 的目标就是将 char 的 0 或者 1 转成 int 的 0 或者 1。那为什么我们不直接用 c ?然后我们测试了一下下面的代码,结果跟我们想象的不太一样,但是这个结果也是可以用的,我们再后面减掉一个 48 是不是就可以了呢?得到的就是 0 和 1 了。

经过上面的测试,我们 version3 版本的代码如下:

  1. public static long version3(Map<String, String> map, int maxLength) { 
  2.         long result = 0L; 
  3.         if (!CollectionUtils.isEmpty(map)) { 
  4.             Integer[] sum = new Integer[maxLength]; 
  5.             for (int i = 0; i < maxLength; i++) { 
  6.                 sum[i] = 0; 
  7.             } 
  8.             // 1. 将长度不够 maxLength 长的二进制字符串前面补 0 
  9.             // 2. 并将每个关键字的二进制字符串按位进行或 | 运算 
  10.             for (Map.Entry<String, String> m : map.entrySet()) { 
  11.                 String value = m.getValue(); 
  12.                 for (int i = maxLength - 1; i >= 0; i--) { 
  13.                     char c; 
  14.                     int index = value.length() - i - 1; 
  15.                     if (index < 0) { 
  16.                         c = '0'
  17.                     } else { 
  18.                         c = value.charAt(index); 
  19.                     } 
  20.                     //3. 统计计算结果中 1 的个数 
  21.                     int temp = sum[i]; 
  22.                     sum[i] = sum[i] | ((int) c - 48); 
  23.                     if (temp == 0 && sum[i] == 1) { 
  24.                         result += 1; 
  25.                     } 
  26.                 } 
  27.             } 
  28.         } 
  29.         return result; 
  30.     } 

测试结果如下:

我们发现在同样大小的情况下,version3 版本直接进入到了 1 秒了,只用了 746ms,这次的优化性能提升了接近 5.5 倍!至此此次的性能优化终于画上了句号。

相信看到这里的小伙伴也知道了阿粉前面提到的知识点是什么了,那就是 char 类型可以跟 int 做转换,其实这就是我们学编程之初学到的 ASCII 码,可能学习的时候并没有想过要怎么用,当真正用到的时候就会发现真香!

 

总结一下今天阿粉给大家介绍了如果将一个运行 4s 多的方法,优化到了 800ms 以内,通过实战介绍了 ASCII 在我们日常工作中的应用。如果大家觉得看了文章的内容有收获,欢迎小伙伴们收藏,点赞,评论,转发,每一次互动都是对阿粉的鼓励。

 

责任编辑:武晓燕 来源: Java极客技术
相关推荐

2024-02-26 00:00:00

Linux技巧工具

2021-11-16 07:31:59

JavaJDK 7 String

2022-01-12 14:24:37

接口Callable程序

2014-07-07 10:58:22

SQL Server

2021-03-17 08:11:29

SpringBoot项目数据库

2021-11-01 07:27:25

开发Java泛化

2023-11-23 16:46:55

LinuxAWK运维

2017-06-07 12:49:21

2022-10-29 08:55:19

页面react

2022-08-01 07:42:17

线程安全场景

2011-11-22 13:52:38

2024-02-22 16:55:13

2022-02-10 09:56:33

git revertgit resetGit

2023-08-16 17:44:38

2021-07-24 13:11:19

Redis数据技术

2023-02-21 17:06:49

硬件软件系统

2023-01-03 08:13:26

GoModulesMaven

2022-11-29 07:33:15

JavaLombokRecord

2024-02-28 08:35:26

内置组件Vue3页面

2016-09-26 17:26:20

点赞
收藏

51CTO技术栈公众号