news 2026/5/3 18:23:04

现代C++工程实践:简单的IniParser3——改进我们的split

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
现代C++工程实践:简单的IniParser3——改进我们的split

目录

前言

下面这个改进对吗

关键问题: substr() 返回的是新的 std::string

第二版:问题是如何被修复的?

修复的核心点:使用原始 src 构造 string_view 作为根

1. substr() 变成了 "视图切片",不是 "创建副本"

2. 原始 src 在整个函数调用外都是稳定对象


前言

上一篇博客我们提到了说我们是要改进咱们的split的,传送门在下面:

  • CSDN:现代C++工程实践:简单的IniParser2:分解需求与编写split-CSDN博客

  • 知乎:现代C++工程实践:简单的IniParser2:分解需求与编写split - 老老老陈醋的文章 - 知乎

  • Github: Awesome-Embedded-Learning-Studio/Tutorial_cpp_SimpleIniParser: 这是我们C++工程化开始的旅程!手搓一个最简单的Ini分析器!This is the beginning of our journey in C++ engineering! Handcrafting the simplest INI parser!

笔者这里单独开了一个博客全面的介绍了std::string_view

  • 简说C++17新东西:string_view-CSDN博客

  • C++17: std::string_view 全攻略 - 老老老陈醋的文章 - 知乎

看这篇博客之前,单独看看string_view。

下面这个改进对吗

下面这个片段是笔者一开始写出来的,各位看官阅读一下:

std::vector<std::string_view> splits_v2( const std::string& src, const char ch) { ​ std::vector<std::string_view> results; ​ if (src.empty()) { return results; } ​ auto current_positions = src.find(ch, 0); const size_t str_sz = src.size(); size_t last_index = 0; ​ while (current_positions != std::string::npos) { results.emplace_back(src.substr(last_index, current_positions - last_index)); results.emplace_back(src.substr(current_positions, 1)); ​ last_index = current_positions + 1; current_positions = src.find(ch, current_positions + 1); } ​ results.emplace_back(src.substr(last_index)); return results; }

看出来问题了吗?

关键问题:substr()返回的是新的std::string

std::string::substr()不是返回视图,它是拷贝构造一个新的字符串

std::string substr(pos, count);

而函数返回的是:

std::vector<std::string_view>

意味着如下情况会发生:

  1. src.substr(...)创建了一个临时的 std::string 对象

  2. string_view绑定到临时对象的内部buffer

  3. 临时对象生命周期仅存活到当前表达式结束

  4. string_view中的ptr立即悬空(dangling pointer)

  5. 返回后访问 view →UB(未定义行为)直接爆炸

也就是说,这个函数看起来运行正常,但返回的数据其实全部悬空。所以笔者在Release模式下就惊喜的发现了一堆bug:包括随机数据和直接悬空的问题

这是一种非常常见的 “临时对象挂掉,string_view 变尸体” 的经典错误。


第二版:问题是如何被修复的?

来看修复后的版本:

std::vector<std::string_view> splits_v2_fixed( const std::string& src, const char ch) { ​ std::vector<std::string_view> results; if (src.empty()) { return results; } ​ std::string_view src_view(src); // ⭐ 关键修复点:构造一个稳定的 view ​ const size_t delim_count = std::count(src.begin(), src.end(), ch); results.reserve(delim_count * 2 + 1); ​ size_t last_index = 0; size_t current_positions = src.find(ch, last_index); ​ while (current_positions != std::string::npos) { ​ results.emplace_back( src_view.substr(last_index, current_positions - last_index)); ​ results.emplace_back( src_view.substr(current_positions, 1)); ​ last_index = current_positions + 1; current_positions = src.find(ch, last_index); } ​ results.emplace_back(src_view.substr(last_index)); ​ return results; }
修复的核心点:使用原始src构造string_view作为根
std::string_view src_view(src);

这样带来两个关键改进:

1. substr() 变成了"视图切片",不是"创建副本"

string_view::substr()的实现机制:

  • 不会创建新的字符串

  • 只计算新的 offset + length

  • 返回的string_view始终指向原始src的内存区域

源码层面类似:

return string_view(this->data() + pos, count);

你再怎么分割,它都只是“原文的一块切片”,不会发生内存复制,也不会有临时对象。

2. 原始src在整个函数调用外都是稳定对象

你传进来的是:

const std::string& src

只要调用者保证src的生命周期≥返回的 vector 的使用生命周期,那么:

  • 所有 view 保证不悬空

  • 性能更高(完全无拷贝)

  • 内存占用更小

现在这个split就被改进了!我们马上就能跑步进入编写一个真正的split了!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 16:09:07

毕业论文文献综述:分类型撰写与深度优化指南

文献综述是毕业论文的 “学术基石”&#xff0c;不仅需要系统梳理研究领域的核心成果&#xff0c;更要精准定位研究空白、论证本研究的学术价值。不少学生在撰写中陷入困境&#xff1a;学术类综述缺乏逻辑脉络&#xff0c;实验类综述忽视方法演进&#xff0c;应用类综述脱离实践…

作者头像 李华
网站建设 2026/4/29 10:40:46

Llama-Factory训练过程显存占用优化技巧汇总

Llama-Factory训练过程显存占用优化技巧汇总 在大模型时代&#xff0c;一个残酷的现实摆在开发者面前&#xff1a;你可能拥有绝佳的想法和高质量的数据&#xff0c;却因为一张24GB显存的RTX 3090跑不动7B参数的模型而被迫放弃本地微调。这种“有心无力”的困境曾是常态——直到…

作者头像 李华
网站建设 2026/4/24 0:31:32

Wan2.2-T2V-A14B如何处理超现实主义风格的文本输入?

Wan2.2-T2V-A14B 如何理解“融化的钟表”与“无脸行人”&#xff1f;——超现实主义文本的AI视频生成之路 在当代视觉创作中&#xff0c;一个看似简单的指令——“钟表像面条一样融化在沙漠上”——足以让大多数AI系统陷入混乱。这并非因为模型无法识别“钟表”或“沙漠”&…

作者头像 李华
网站建设 2026/5/1 13:13:47

如何快速安装DiffSynth-Studio:终极扩散模型视频生成指南

如何快速安装DiffSynth-Studio&#xff1a;终极扩散模型视频生成指南 【免费下载链接】DiffSynth-Studio DiffSynth Studio 是一个扩散引擎。我们重组了包括 Text Encoder、UNet、VAE 等在内的架构&#xff0c;保持了与开源社区模型的兼容性&#xff0c;同时提高了计算性能。我…

作者头像 李华
网站建设 2026/5/2 17:18:04

医疗影像AI快速部署:MONAIBundle核心功能实战解析

医疗影像AI快速部署&#xff1a;MONAIBundle核心功能实战解析 【免费下载链接】MONAI AI Toolkit for Healthcare Imaging 项目地址: https://gitcode.com/GitHub_Trending/mo/MONAI 面对医疗影像AI开发中的数据预处理复杂、模型配置繁琐、部署流程冗长等痛点&#xff0…

作者头像 李华
网站建设 2026/5/1 18:17:36

5分钟快速上手gif-h:C++动画制作终极指南

5分钟快速上手gif-h&#xff1a;C动画制作终极指南 【免费下载链接】gif-h Simple C one-header library for the creation of animated GIFs from image data. 项目地址: https://gitcode.com/gh_mirrors/gi/gif-h gif-h是一个简单易用的C单头文件库&#xff0c;专门用…

作者头像 李华