ArrayPool 源码解读之 Byte[] 也能池化?

开发 前端
不知道大家有没有发现在 .netcore 中增加了不少池化对象的东西,比如:ArrayPool,ObjectPool 等等,确实在某些场景下还是特别实用的,所以有必要对其进行较深入的理解。

[[420806]]

一:背景

1. 讲故事

最近在分析一个 dump 的过程中发现其在 gen2 和 LOH 上有不少size较大的free,仔细看了下,这些free生前大多都是模板引擎生成的html片段的byte[]数组,当然这篇我不是来分析dump的,而是来聊一下,当托管堆有很多length较大的 byte[] 数组时,如何让内存利用更高效,如何让gc老先生压力更小。

不知道大家有没有发现在 .netcore 中增加了不少池化对象的东西,比如:ArrayPool,ObjectPool 等等,确实在某些场景下还是特别实用的,所以有必要对其进行较深入的理解。

二:ArrayPool 源码分析

1. 一图胜千言

在我花了将近一个小时的源码阅读之后,我画了一张 ArrayPool 的池化图,所谓:一图在手,天下我有 。

有了这张图,接下来再聊几个概念并配上相应源码,我觉得应该就差不多了。

2. 池化的架构分级是什么样的?

ArrayPool 是由若干个 Bucket 组成, 而 Bucket 又由若干个 buffer[] 数组组成, 有了这个概念之后,再配一下代码。

  1. public abstract class ArrayPool<T> 
  2.     public static ArrayPool<T> Create() 
  3.     { 
  4.         return new ConfigurableArrayPool<T>(); 
  5.     } 
  6.  
  7. internal sealed class ConfigurableArrayPool<T> : ArrayPool<T> 
  8.     private sealed class Bucket 
  9.     { 
  10.         internal readonly int _bufferLength; 
  11.         private readonly T[][] _buffers; 
  12.         private int _index; 
  13.     } 
  14.  
  15.     private readonly Bucket[] _buckets;     //bucket数组 

3. 为什么每一个 bucket 里都有 50 个 buffer[]

这个问题很好回答,初始化时做了 maxArraysPerBucket=50 设定,当然你也可以自定义,具体参考如下代码:

  1. internal sealed class ConfigurableArrayPool<T> : ArrayPool<T> 
  2.     internal ConfigurableArrayPool() : this(1048576, 50) 
  3.     { 
  4.     } 
  5.  
  6.     internal ConfigurableArrayPool(int maxArrayLength, int maxArraysPerBucket) 
  7.     { 
  8.         int num = Utilities.SelectBucketIndex(maxArrayLength); 
  9.         Bucket[] array = new Bucket[num + 1]; 
  10.         for (int i = 0; i < array.Length; i++) 
  11.         { 
  12.             array[i] = new Bucket(Utilities.GetMaxSizeForBucket(i), maxArraysPerBucket, id); 
  13.         } 
  14.         _buckets = array; 
  15.     } 

4. bucket 中 buffer[].length 为什么依次是 16,32,64 ...

框架做了默认假定,第一个bucket中的 buffer[].length=16, 后续 bucket 中的 buffer[].length 都是 x2 累计,涉及到代码就是 GetMaxSizeForBucket() 方法,参考如下:

  1. internal ConfigurableArrayPool(int maxArrayLength, int maxArraysPerBucket) 
  2.     Bucket[] array = new Bucket[num + 1]; 
  3.     for (int i = 0; i < array.Length; i++) 
  4.     { 
  5.         array[i] = new Bucket(Utilities.GetMaxSizeForBucket(i), maxArraysPerBucket, id); 
  6.     } 
  7.  
  8. internal static int GetMaxSizeForBucket(int binIndex) 
  9.     return 16 << binIndex; 

5. 初始化时 bucket 到底有多少个?

其实在上图中我也没有给出 bucket 到底有多少个,那到底是多少个呢??????? ,当我阅读完源码之后,这算法还挺有意思的。

先说一下结果吧,默认 17 个 bucket,你肯定会好奇怎么算的?先说下两个变量:

  • maxArrayLength=1048576 = 2的20次方
  • buffer.length= 16 = 2的4次方

最后的算法就是取次方的差值:bucket[].length= 20 - 4 + 1 = 17,换句话说最后一个 bucket 下的 buffer[].length=1048576,详细代码请参考 SelectBucketIndex() 方法。

  1. internal sealed class ConfigurableArrayPool<T> : ArrayPool<T> 
  2.     internal ConfigurableArrayPool(): this(1048576, 50) 
  3.     { } 
  4.  
  5.     internal ConfigurableArrayPool(int maxArrayLength, int maxArraysPerBucket) 
  6.     { 
  7.         int num = Utilities.SelectBucketIndex(maxArrayLength); 
  8.         Bucket[] array = new Bucket[num + 1]; 
  9.         for (int i = 0; i < array.Length; i++) 
  10.         { 
  11.             array[i] = new Bucket(Utilities.GetMaxSizeForBucket(i), maxArraysPerBucket, id); 
  12.         } 
  13.         _buckets = array; 
  14.     } 
  15.  
  16.     internal static int SelectBucketIndex(int bufferSize) 
  17.     { 
  18.         return BitOperations.Log2((uint)(bufferSize - 1) | 0xFu) - 3; 
  19.     } 

到这里我相信你对 ArrayPool 的池化架构思路已经搞明白了,接下来看下如何申请和归还 buffer[]。

三:如何申请和归还

既然 buffer[] 做了颗粒化,那就应该好借好还,反应到代码上就是 Rent() 和 Return() 方法,为了方便理解,上代码说话:

  1. class Program 
  2.     static void Main(string[] args) 
  3.     { 
  4.         var arrayPool = ArrayPool<int>.Create(); 
  5.  
  6.         var bytes = arrayPool.Rent(10); 
  7.  
  8.         for (int i = 0; i < bytes.Length; i++) bytes[i] = 10; 
  9.  
  10.         arrayPool.Return(bytes); 
  11.  
  12.         Console.ReadLine(); 
  13.     } 

有了代码和图之后,再稍微捋一下流程。

从 ArrayPool 中借一个 byte[10] 大小的数组,为了节省内存,先不备货,临时生成一个 byte[].size=16 的数组出来,简化后的代码如下,参考 if (flag) 处:

  1. internal T[] Rent() 
  2.    { 
  3.        T[][] buffers = _buffers; 
  4.        T[] array = null
  5.        bool lockTaken = false
  6.        bool flag = false
  7.        try 
  8.        { 
  9.            if (_index < buffers.Length) 
  10.            { 
  11.                array = buffers[_index]; 
  12.                buffers[_index++] = null
  13.                flag = array == null
  14.            } 
  15.        } 
  16.        if (flag) 
  17.        { 
  18.            array = new T[_bufferLength]; 
  19.        } 
  20.        return array; 
  21.    } 

这里有一个坑,那就是你以为借了 byte[10],现实给你的是 byte[16],这里稍微注意一下。

当用 ArrayPool.Return 归还 byte[16] 时, 很明显看到它落到了第一个bucket的第一个buffer[]上,参考如下简化后的代码:

  1. internal void Return(T[] array) 
  2.   { 
  3.       if (_index != 0) 
  4.       { 
  5.           _buffers[--_index] = array; 
  6.       } 
  7.   } 

这里也有一个值得注意的坑,那就是还回去的 byte[16] 里面的数据默认是不会清掉的,从上面的代码也是可以看出来的,要想做清理,需要在 Return 方法中指定 clearArray=true,参考如下代码:

  1. public override void Return(T[] array, bool clearArray = false
  2.   { 
  3.       int num = Utilities.SelectBucketIndex(array.Length); 
  4.  
  5.       if (num < _buckets.Length) 
  6.       { 
  7.           if (clearArray) 
  8.           { 
  9.               Array.Clear(array, 0, array.Length); 
  10.           } 
  11.           _buckets[num].Return(array); 
  12.       } 
  13.   } 

四:总结

学习这其中的 池化架构 思想,对平时项目开发还是能提供一些灵感的,其次对那些一次性使用 byte[] 的场景,用池化是个非常不错的方法,这也是我对朋友dump分析后提出的一个优化思路。

本文转载自微信公众号「一线码农聊技术」,可以通过以下二维码关注。转载本文请联系一线码农聊技术公众号。

 

责任编辑:武晓燕 来源: 一线码农聊技术
相关推荐

2023-09-08 08:42:01

数据场景项目

2022-07-19 13:51:47

数据库Hikari连接池

2019-04-17 18:04:10

网卡虚拟化网络设备

2023-01-07 17:41:36

线程池并发

2017-01-12 14:52:03

JVMFinalRefere源码

2020-07-09 07:00:00

HashMap

2020-05-26 18:50:46

JVMAttachJava

2017-01-11 14:02:32

JVM源码内存

2009-01-18 09:19:00

DHCPVlANIP

2021-11-11 11:31:54

摆动序列数字

2022-02-21 14:32:20

数字化转型AI算法

2017-01-11 14:19:26

JVM源码All

2009-07-15 11:00:48

proxool连接池

2015-06-15 10:32:44

Java核心源码解读

2015-10-20 10:57:22

无线充电无线技术

2016-08-29 19:12:52

JavascriptBackbone前端

2010-01-27 10:37:17

Android图片浏览

2011-07-13 10:32:09

开源

2013-05-28 13:57:12

MariaDB

2011-08-16 09:34:34

Nginx
点赞
收藏

51CTO技术栈公众号