Labview结合Yolov5与TensorRT（Wangxingyu版）实现快速并行推理，d...-深圳市維司達科技有限公司

labview yolov5 tensorrt(wangxingyu版)推理，封装dll, labview调用dll，支持同时加油多个模型并行推理，识别视频和图片，速度6ms内，模型需要pt->wts->engine, 由于不同电脑和平台需要重新wts->engine，所以包含一个wts模型转engine软件，只需要替换模型的engin和nameclass即可

这次折腾的是LabVIEW结合YOLOv5和TensorRT的高性能推理方案。别看LabVIEW长得像儿童编程玩具，配合C++ DLL玩起多模型并行推理，速度直接干到6ms以内，摄像头实时处理完全没压力。

模型转换踩坑记

YOLOv5的pt模型转TensorRT engine是个技术活。wangxingyu版的转换脚本比官方方案更适配LabVIEW环境，不过要注意模型输出层的命名规范。举个栗子：

with open('yolov5s.wts', 'w') as f: f.write('{}\n'.format(len(model.state_dict().keys()))) for k, v in model.state_dict().items(): vr = v.reshape(-1).cpu().numpy() f.write('{} {} '.format(k, len(vr))) f.write(' '.join(['%f' % x for x in vr]) + '\n')

这段代码把PyTorch的权重拍平成文本格式，注意reshape(-1)可能会改变某些层的维度顺序，遇到推理异常先检查这里。

DLL封装那些事儿

C++侧用了双缓冲+内存共享的黑科技处理多模型并行。核心推理函数长这样：

__declspec(dllexport) void InferParallel( unsigned char* img_data, int model_index, Result* results) { auto& context = g_contexts[model_index]; // 不同模型实例隔离 cudaMemcpy(context.input_buffer, img_data, INPUT_SIZE, cudaMemcpyHostToDevice); context.stream->infer(); // 异步流执行 post_process(context.output_buffer, results); // 零拷贝结果回传 }

重点在于每个模型有自己的cuda流和内存空间，避免多线程打架。LabVIEW调用时通过模型索引切换，实测开4个模型也能稳定在15ms内。

LabVIEW调教指南

前面板放个多线程队列处理器，配合DLL的异步接口直接起飞：

While循环(并行) Dequeue获取图像数据 调用库函数节点(DLL路径, "InferParallel") 结果分析Cluster解包 图像标注叠加 End循环

注意设置执行选项为"在UI线程外运行"，否则前面板会卡成PPT。视频流处理建议用生产者-消费者结构，DMA传输能省30%时间。

手搓转换工具

由于TensorRT engine和CUDA版本强相关，我们搞了个傻瓜式转换器（C# WinForm）。核心转换命令：

trtexec --onnx=yolov5s.onnx --saveEngine=yolov5s.engine --fp16 --workspace=4096

工具自动替换模型名称和类别文件，支持拖拽操作。实测不同显卡生成engine速度差异极大，RTX4090转换比1060快8倍你敢信？

整套方案在工业质检场景跑了三个月，日均处理20万张图片没翻车。要说遗憾就是LabVIEW的异常处理比较蠢，C++侧得自己加内存泄漏检测。最近在研究用OpenVINO替代TensorRT，等有进展再来唠。

低成本高精度OCR方案：HunyuanOCR仅需1B参数即可达到SOTA水平

低成本高精度OCR方案：HunyuanOCR仅需1B参数即可达到SOTA水平在金融票据自动录入、跨境电商商品信息提取、教育扫描阅卷乃至海关通关文档处理等场景中，OCR（光学字符识别）早已不再是边缘技术，而是支撑业务流转的核心引擎…

李华

腾讯混元OCR实战案例分享：复杂票据与卡证信息提取精准高效

腾讯混元OCR实战案例：复杂票据与卡证信息提取的精准高效之道在银行柜台处理开户申请时，你是否曾因身份证照片反光、角度倾斜导致系统反复识别失败？在医院档案数字化项目中，面对成千上万张模糊的老病历扫描件，传统OCR工…

李华

HunyuanOCR能否识别红包金额？春节特别应用场景趣味探索

HunyuanOCR能否识别红包金额？春节特别应用场景趣味探索在春节这个最富仪式感的中国节日里，一张张红彤彤的红包被递出、拍下、分享。越来越多的人习惯用手机记录下收到的“压岁钱”或“利是”，或是为了记账，或是为了发朋友圈炫耀好…

李华

博物馆导览系统革新：HunyuanOCR识别展品说明牌并朗读内容

博物馆导览系统革新：HunyuanOCR识别展品说明牌并朗读内容在一座国际级博物馆的展厅里，一位来自法国的游客举起手机，对准一块写满中文的文物说明牌。不到两秒，耳边便传来清晰的英文语音：“Northern Song Dynasty Ru Ki…

李华

量化感知训练QAT在HunyuanOCR中的应用研究方向

量化感知训练QAT在HunyuanOCR中的应用研究方向在当前AI大模型向端边云协同演进的趋势下，如何在不牺牲精度的前提下显著降低推理成本，已成为工业界落地的关键瓶颈。尤其是在OCR这类对延迟敏感、输入动态复杂的多模态任务中，模型不仅要“看得准…

李华

HunyuanOCR支持军事密级文档处理吗？明确禁止涉密场景使用

HunyuanOCR支持军事密级文档处理吗？明确禁止涉密场景使用在智能办公和数字化转型加速的今天，AI驱动的文档识别技术正以前所未有的速度渗透进各行各业。从一张发票的自动报销，到跨国企业多语言合同的快速解析，OCR（光学…

李华