news 2026/4/23 10:55:19

Labview结合Yolov5与TensorRT(Wangxingyu版)实现快速并行推理,d...

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Labview结合Yolov5与TensorRT(Wangxingyu版)实现快速并行推理,d...

labview yolov5 tensorrt(wangxingyu版)推理,封装dll, labview调用dll,支持同时加油多个模型并行推理,识别视频和图片,速度6ms内,模型需要pt->wts->engine, 由于不同电脑和平台需要重新wts->engine,所以包含一个wts模型转engine软件,只需要替换模型的engin和nameclass即可

这次折腾的是LabVIEW结合YOLOv5和TensorRT的高性能推理方案。别看LabVIEW长得像儿童编程玩具,配合C++ DLL玩起多模型并行推理,速度直接干到6ms以内,摄像头实时处理完全没压力。

模型转换踩坑记

YOLOv5的pt模型转TensorRT engine是个技术活。wangxingyu版的转换脚本比官方方案更适配LabVIEW环境,不过要注意模型输出层的命名规范。举个栗子:

with open('yolov5s.wts', 'w') as f: f.write('{}\n'.format(len(model.state_dict().keys()))) for k, v in model.state_dict().items(): vr = v.reshape(-1).cpu().numpy() f.write('{} {} '.format(k, len(vr))) f.write(' '.join(['%f' % x for x in vr]) + '\n')

这段代码把PyTorch的权重拍平成文本格式,注意reshape(-1)可能会改变某些层的维度顺序,遇到推理异常先检查这里。

DLL封装那些事儿

C++侧用了双缓冲+内存共享的黑科技处理多模型并行。核心推理函数长这样:

__declspec(dllexport) void InferParallel( unsigned char* img_data, int model_index, Result* results) { auto& context = g_contexts[model_index]; // 不同模型实例隔离 cudaMemcpy(context.input_buffer, img_data, INPUT_SIZE, cudaMemcpyHostToDevice); context.stream->infer(); // 异步流执行 post_process(context.output_buffer, results); // 零拷贝结果回传 }

重点在于每个模型有自己的cuda流和内存空间,避免多线程打架。LabVIEW调用时通过模型索引切换,实测开4个模型也能稳定在15ms内。

LabVIEW调教指南

前面板放个多线程队列处理器,配合DLL的异步接口直接起飞:

While循环(并行) Dequeue获取图像数据 调用库函数节点(DLL路径, "InferParallel") 结果分析Cluster解包 图像标注叠加 End循环

注意设置执行选项为"在UI线程外运行",否则前面板会卡成PPT。视频流处理建议用生产者-消费者结构,DMA传输能省30%时间。

手搓转换工具

由于TensorRT engine和CUDA版本强相关,我们搞了个傻瓜式转换器(C# WinForm)。核心转换命令:

trtexec --onnx=yolov5s.onnx --saveEngine=yolov5s.engine --fp16 --workspace=4096

工具自动替换模型名称和类别文件,支持拖拽操作。实测不同显卡生成engine速度差异极大,RTX4090转换比1060快8倍你敢信?

整套方案在工业质检场景跑了三个月,日均处理20万张图片没翻车。要说遗憾就是LabVIEW的异常处理比较蠢,C++侧得自己加内存泄漏检测。最近在研究用OpenVINO替代TensorRT,等有进展再来唠。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 10:52:40

低成本高精度OCR方案:HunyuanOCR仅需1B参数即可达到SOTA水平

低成本高精度OCR方案:HunyuanOCR仅需1B参数即可达到SOTA水平 在金融票据自动录入、跨境电商商品信息提取、教育扫描阅卷乃至海关通关文档处理等场景中,OCR(光学字符识别)早已不再是边缘技术,而是支撑业务流转的核心引擎…

作者头像 李华
网站建设 2026/4/23 10:51:29

腾讯混元OCR实战案例分享:复杂票据与卡证信息提取精准高效

腾讯混元OCR实战案例:复杂票据与卡证信息提取的精准高效之道 在银行柜台处理开户申请时,你是否曾因身份证照片反光、角度倾斜导致系统反复识别失败?在医院档案数字化项目中,面对成千上万张模糊的老病历扫描件,传统OCR工…

作者头像 李华
网站建设 2026/4/11 22:23:24

HunyuanOCR能否识别红包金额?春节特别应用场景趣味探索

HunyuanOCR能否识别红包金额?春节特别应用场景趣味探索 在春节这个最富仪式感的中国节日里,一张张红彤彤的红包被递出、拍下、分享。越来越多的人习惯用手机记录下收到的“压岁钱”或“利是”,或是为了记账,或是为了发朋友圈炫耀好…

作者头像 李华
网站建设 2026/4/21 7:45:44

博物馆导览系统革新:HunyuanOCR识别展品说明牌并朗读内容

博物馆导览系统革新:HunyuanOCR识别展品说明牌并朗读内容 在一座国际级博物馆的展厅里,一位来自法国的游客举起手机,对准一块写满中文的文物说明牌。不到两秒,耳边便传来清晰的英文语音:“Northern Song Dynasty Ru Ki…

作者头像 李华
网站建设 2026/4/18 15:40:30

量化感知训练QAT在HunyuanOCR中的应用研究方向

量化感知训练QAT在HunyuanOCR中的应用研究方向 在当前AI大模型向端边云协同演进的趋势下,如何在不牺牲精度的前提下显著降低推理成本,已成为工业界落地的关键瓶颈。尤其是在OCR这类对延迟敏感、输入动态复杂的多模态任务中,模型不仅要“看得准…

作者头像 李华
网站建设 2026/4/23 8:16:45

HunyuanOCR支持军事密级文档处理吗?明确禁止涉密场景使用

HunyuanOCR支持军事密级文档处理吗?明确禁止涉密场景使用 在智能办公和数字化转型加速的今天,AI驱动的文档识别技术正以前所未有的速度渗透进各行各业。从一张发票的自动报销,到跨国企业多语言合同的快速解析,OCR(光学…

作者头像 李华