news 2026/4/23 14:59:04

ArrayPool.Shared解说

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ArrayPool.Shared解说

NET 中频繁创建和销毁数组的情况下会导致垃圾回收器出现严重的内存压力,ArrayPool<T> 通过池化手段有效地降低了数组的分配和垃圾回收器的回收压力,同时 ArrayPool<T> 也是 MemoryPool<T> 和 PipeWriter、PipeReader 的底板。

ArrayPool<T>.Shared 是 ArrayPool<T> 的一种实现,它设计成静态共享以供全体共同使用。在实际应用中, Shared 实例几乎承载了全部的 ArrayPool<T> 调用。

Shared实例的Rent#

Copy

static void RentAndReturn(int size)

{

var pool = ArrayPool<byte>.Shared;

var array = pool.Rent(size);

// 在这里使用 array

pool.Return(array);

}

其中输入的 size 和 Rent 得到 array.Length的关系如下:

Copy

var index = SelectBucketIndex(size);

var arrayLenth = GetMaxSizeForBucket(index);

static int SelectBucketIndex(int size)

{

return BitOperations. Log2((uint)((size - 1) | 0xF)) - 3;

}

static int GetMaxSizeForBucket(int bucketIndex)

{

return 16 << bucketIndex;

}

调用 SelectBucketIndex(int.MaxValue) 会得到27,实际上 Shared 实现只维护最大索引值为 26 的总共 27 个 Bucket,所以当你 Rent 出大于 1GB 的数组时永远触发分配且不会 Return 到 Bucket 里。

Shared实例的Return#

如果我们书写如下代码,会发生什么情况?

Copy

var pool = ArrayPool<byte>.Shared;

var array1 = new byte[16];

pool.Return(array1);

var array2 = new byte[16];

pool.Return(array2);

array1 和 array2 都不是 Rent 出来的,Return 操作 pool 会接受吗?

答案是都接受,只要 array.Length 符合要求都会接受,而且也不会考虑多次 Return 同一个引用 array 的特殊情况。所以千万不要对同一个 Rent 到的 array 实例进行多次 return 操作。

Shared实例的Thread-Local-Storage#

如果我们书写如下代码,会触发 Shared 的 Buckets 读写访问吗?

Copy

var pool = ArrayPool<byte>.Shared;

for(var i =0; i <100; i++)

{

var array = pool.Rent(1024 * 1024);

pool.Return(array);

}

答案是不会触发 Buckets 读写访问,执行之后 27 个 Bucket 还是未初始化的 null 值,因为Shared使用Thread-Local-Storage做了第一层无锁缓存。

原始代码

Copy

[ThreadStatic]

private static SharedArrayPoolThreadLocalArray[]? t_tlsBuckets;

方便理解的简化代码

Copy

// 创建一个 Array 类型的数组,数组共27个元素

// 每个元素的索引值,对应 Bucket 的索引

[ThreadStatic]

private static Array? [] t_tlsBuckets = new Array[27];

当执行

Copy

var array = ArrayPool<byte>.Shared.Rent(16);

实际的逻辑是

Copy

var index = SelectBucketIndex(16); // index = 0;

var array = t_tlsBuckets[index];

if(array != null)

{

t_tlsBuckets[index] = null; // 当然这里不会对t_tlsBuckets进行2次索引访问,使用 ref 来解决

return array;

}

Return 的时候也是一样的缓存访问逻辑,当 t_tlsBuckets 索引对应的元素为 null 时缓存成功。

Shared实例的Buckets#

当 t_tlsBuckets[index] 缓存不命中时,会触发 Bucket = Buckets[index] 的创建和访问。注意这里一个 Bucket 不是 Array的集合,而是Array的集合的集合,我们叫他Partitions。为了方便理解,下面给出示意代码:

Copy

// bucket 是 Partition 的集合,Partition 是 Array 的集合

// bucket 的元素数量是 Environment.ProcessorCount

List<Partition> bucket = Buckets[index];

Debug.Assert(bucket.Count == Environment.ProcessorCount);

当进行 Rent 操作时,尝试从 bucket 里弹出一个 Array,其示意过程如下(注意真实的实现为高性能代码可理解性更难):

Copy

// bucket 是 Partition 的集合,Partition 是 Array 的集合

// bucket 的元素数量是 Environment.ProcessorCount

List<Partition> bucket = Buckets[index];

// 每个 cpu 核心操作固定的一个 Partition,目的是去锁化

int cpuIndex = Thread.GetCurrentProcessorId() % Environment.ProcessorCount;

Partition cpuPartition = bucket[cpuIndex];

// Partition 的元素数量固定是 32

Debug.Assert(cpuPartition.Count == 32);

// 尝试从当前 cpu 核心对应的 Partition 进行TryPop()

// TryPop() 的实现有排他锁,但这里只要没有别的线程来访问此 Partition,就不会产生互斥

// 如果在同一线程下租赁过32次且不归还,TryPop()会失败

Array array = null;

if ((array = cpuPartition.TryPop()) != null)

{

return array;

})

// 以上失败后则尝试从其它的 Partition TryPop(),此时排他锁可能就生效了

for(var index = 0; index < bucket.Count; index++)

{

if(index!= cpuIndex)

{

Partition otherPartition = bucket[index];

if ((array = otherPartition.TryPop()) != null)

{

return array;

})

}

}

return null;

在进行 Return 操作是,大的流程和 Rent 一样,不同是 TryPop() 变成了TryPush()。

总结一下,在指定 size 之后,Shared 实例最多能 Rent(size) 出 Environment.ProcessorCount * 32 个可复用的数组,伴随着 Return 的及时性越低,Rent 时排它锁触发的几率就越高。

总结#

以为是本人对 ArrayPool.Shared 实现的分析和理解,并变换成一种相对容易理解的伪代码,如有不对之处请指正。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 9:45:51

大模型参数高效微调技术

引言我们正处在一个由基础模型&#xff08;Foundation Models&#xff09;驱动的时代。GPT、Llama、Claude等大规模预训练语言模型&#xff08;LLM&#xff09;已成为理解和生成语言的通用引擎,展现出惊人的能力。然而,这些强大的通用模型如同未经雕琢的璞玉,要将其应用于特定场…

作者头像 李华
网站建设 2026/4/23 12:56:51

200Smart与WinCC通讯

1.Modbus_TCP200Smart作为服务器1.调用Modbus_TCP Server2.对程序块进行设定MBUS_SERVER&#xff1a;Modbus 服务器EN&#xff1a;使能&#xff08;输入&#xff09;Connect&#xff1a;连接&#xff08;输入&#xff09;IP_Port&#xff1a;IP 端口&#xff08;输入&#xff0…

作者头像 李华
网站建设 2026/4/23 13:04:17

【Triton 教程】triton_language.view

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境&#xff0c;以高效编写自定义 DNN 计算内核&#xff0c;并能够在现代 GPU 硬件上以最大吞吐量运行。 更多 Triton 中文文档可访问 →triton.hyper.ai/ triton.language.view(input, *shape)返…

作者头像 李华
网站建设 2026/4/22 21:54:36

RabbitMQ的安装集群、镜像队列配置

1 RabbitMQ集群简介RabbitMQ 集群是一个或多个节点的逻辑分组&#xff0c;每个节点共享用户、虚拟主机、队列、流、交换机、绑定、运行时参数和其他分布式状态。集群中的节点名称必须是唯一的。在集群中&#xff0c;节点使用节点名称来识别和相互联系。这意味着每个节点名称的主…

作者头像 李华
网站建设 2026/4/11 11:07:42

【Triton 教程】triton_language.load

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境&#xff0c;以高效编写自定义 DNN 计算内核&#xff0c;并能够在现代 GPU 硬件上以最大吞吐量运行。 更多 Triton 中文文档可访问 →triton.hyper.ai/ triton.language.load(pointer, maskNo…

作者头像 李华