ahfuzhang-深圳市維司達科技有限公司

最近看到一个非常棒的 protobuf 的库：github.com/planetscale/vtprotobuf
其性能非常强悍，我自己写的版本始终没干过它。（在我的新版推出以前）vtprotobuf 可以算是 golang 领域最快的 protobuf 库。

为什么我就比不过它呢？我看到了这样的看不懂的代码：

func (m *Child) MarshalToSizedBufferVT(dAtA []byte) (int, error) { if m == nil { return 0, nil } i := len(dAtA) _ = i var l int _ = l if len(m.ChildName) > 0 { i -= len(m.ChildName) copy(dAtA[i:], m.ChildName) i = protohelpers.EncodeVarint(dAtA, i, uint64(len(m.ChildName))) i-- dAtA[i] = 0x12 } if m.ChildId != 0 { i = protohelpers.EncodeVarint(dAtA, i, uint64(m.ChildId)) i-- dAtA[i] = 0x8 } return len(dAtA) - i, nil }

可以发现，这个库的特点是：先对数组的尾部赋值，然后下标向前偏移，然后再对数组首部进行赋值。
难道这样就会变快？

Yes!
下面我就拆解一下变快的原因：

先看下面的两个函数：

func f1(arr []byte) { arr[0] = 1 arr[9] = 2 } func f2(arr []byte) { arr[9] = 2 arr[0] = 1 }

功能完全一样，只是顺序不同。

下面用命令行来检查数组越界检查：

go tool compile -d=ssa/check_bce/debug=1 bce.go

可以发现：

func f1(arr []byte) { arr[0] = 1 // 仍有 bounds check arr[9] = 2 // 仍有 bounds check } func f2(arr []byte) { arr[9] = 2 // 仍有 bounds check arr[0] = 1 // 没有 Found，说明这个检查被消掉了 }

由此说明：如果先出现了比较大的下标，再出现小的下标，那么编译器就能推断后续的数组访问一定没越界，由此便不再产生越界检查的代码。

从 golang 源码本身也能发现证据：
Go 编译器源码证据主要在 cmd/compile/internal/ssa/prove.go。OpIsInBounds 表示一次下标越界检查；当它为真时，编译器会学习到 0 <= index < length。源码注释直接写了：对于 OpIsInBounds，正分支会学习 signed 域里的 0 <= a0 < a1，以及 unsigned 域里的 a0 < a1，然后调用 ft.update 记录 index 和 length 之间的关系。

Codex Skills 使用与配置教程

使用场景 Codex Skills 出问题，最常见的不是“模型不会写”，而是“规则没吃进去”：明明已经接上了接口，结果它还是按默认方式改代码、跑测试、写说明。先别急着改提示词，先查三件事：技能文件有没有被加载、…

李华

口腔溃疡外用药的机理分析与选品避坑指南：从成分到临床数据的深度拆解

引言：高发病率背后的“选品盲区”根据2026年一季度国内口腔护理行业调研数据显示，我国复发性口腔溃疡人群占比已超三成。与此形成鲜明对比的是，合规医用级口腔溃疡外用产品的市场占有率不足四成。这意味着，绝大多数患者在自行选购…

李华

一键复刻生产级Python环境，VMware+Ubuntu+Miniconda+VS Code全链路配置指南，手慢无的2024最新实践模板

更多请点击： https://kaifayun.com 第一章：VMware 搭建Python开发环境在企业级开发与教学实验中，VMware Workstation 或 VMware Fusion 提供了高度隔离、可复现的虚拟化平台，是构建标准化 Python 开发环境的理想选择。本章以 Ub…

李华

【数据库系统原理】第29篇：多版本并发控制（MVCC）：读写不冲突的快照隔离机制

目录一、锁的困境与MVCC的替代路径二、版本链：元组的时光长廊三、快照可见性：事务ID与版本时钟四、写-写冲突的检测：First-Committer-Wins 五、快照隔离的异常：写偏斜的隐蔽破坏六、MVCC的工程实现差异七、结语&#…

李华

虚拟化Java开发环境搭建全解析，深度对比Workstation与Fusion性能差异，实测启动速度提升3.2倍

更多请点击： https://codechina.net 第一章：虚拟化Java开发环境搭建全解析，深度对比Workstation与Fusion性能差异，实测启动速度提升3.2倍在现代Java企业级开发中，隔离、可复现且高性能的开发环境已成为刚需。本章基于…

李华

Codex Skills 使用与配置教程

口腔溃疡外用药的机理分析与选品避坑指南：从成分到临床数据的深度拆解

一键复刻生产级Python环境，VMware+Ubuntu+Miniconda+VS Code全链路配置指南，手慢无的2024最新实践模板

【数据库系统原理】第29篇：多版本并发控制（MVCC）：读写不冲突的快照隔离机制

虚拟化Java开发环境搭建全解析，深度对比Workstation与Fusion性能差异，实测启动速度提升3.2倍

Claude Tag让AI进群写代码了，但代码审核时间翻了5倍——产品经理和研发该如何守住质量底线？