news 2026/5/9 19:58:11

昇腾GE时间批处理功能

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
昇腾GE时间批处理功能

TimeBatch

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能介绍

TimeBatch功能是基于UDF为前提的。

正常模型每次处理一个数据,当需要一次处理一批数据时,就需要将这批数据组成一个batch,最基本的batch方式是将这批N个数据直接拼接,然后shape前加N,而某些场景需要将某段或者某几段时间数据组成一个batch,并且按特定的维度拼接,则可以通过使用TimeBatch功能来组batch。

在ASR(Automatic Speech Recognition)自动语音识别场景下,存在按定长时间段组batch或按时间分段(时间不连续)组整批batch两种诉求,可以通过TimeBatch实现。

使用方法

用户在DataFlow构图时通过给FlowNode的输入设置属性来添加TimeBatch功能。示例如下。

TimeBatch time_batch = {}; // 按需求设置time_batch中各属性的值 time_batch.time_window = 10; time_batch.batch_dim = 5; time_batch.drop_remainder = true; DataFlowInputAttr flow_attr = {DataFlowAttrType::TIME_BATCH, &time_batch}; std::vector<DataFlowInputAttr> flow_attrs = {flow_attr}; // 然后通过FlowNode的MapInput设置 FlowNode::MapInput(xx, xx, xx, flow_attrs);
属性名称数据类型取值说明
time_windowint64_t整型(单位ms),当值>0时表示按该时间窗来组batch,当值为-1时表示按时间分段来组batch,其他值报错。
batch_dimint64_t只有设置了time_window时,该参数才生效。取值范围[-1,shape维度]。

- 默认为-1表示数据输出shape会在第0维添加一个batch维。
- shape维度>batch_dim>=0时表示按某个维度组batch。
- batch_dim>shape维度或者<-1时报错。
drop_remainderbool只有设置了time_window时,该参数才生效。
仅在time_window>0时生效,选择不足time_window时是否丢弃,默认false不丢弃。true则丢弃。举例如下:
假如time_window=5ms,输入数据时长为3ms,则:

- drop_remainder不配置或者配置为false时,不丢弃输入数据。
- drop_remainder配置为true时如果输入数据未携带EOS或者SEG,会一直等待,不丢弃数据。如果输入数据只携带了SEG,则丢弃数据。如果输入数据携带了EOS标记,则丢弃输入数据,只传递EOS标记。
- 如果输入数据未携带EOS或者SEG,会一直等待,不丢弃数据。
- 如果输入数据只携带了SEG,则丢弃数据。
- 如果输入数据携带了EOS标记,则丢弃输入数据,只传递EOS标记。
time_intervalint64_t未使能
timeoutint64_t未使能
flagint32_t未使能
paddingbool未使能

使用注意事项

当前Batch特性无法做负荷分担,因此如果使用2P环境,需要在ge初始化时添加{"ge.exec.logicalDeviceClusterDeployMode", "SINGLE"}, {"ge.exec.logicalDeviceId", "[0:0]"}。其中logicalDeviceId可以是[0:0],也可以是[0:1],详细介绍如下。

logicalDeviceClusterDeployMode为SINGLE时,用于指定模型部署在某个指定的设备上。

配置格式:[node_id:device_id]

  • node_id:昇腾AI处理器逻辑ID,从0开始,表示资源配置文件中第几个设备。
  • device_id:昇腾AI处理器物理ID。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 19:56:32

AI赋能人才分析:从数据清洗到算法应用的全景解析

1. 项目概述&#xff1a;当AI遇见人才管理在人力资源这个传统上高度依赖“直觉”和“经验”的领域&#xff0c;一场静默的革命正在发生。过去&#xff0c;HR经理们筛选简历、评估候选人、预测员工离职风险&#xff0c;很大程度上依赖于个人判断和有限的量化指标。然而&#xff…

作者头像 李华
网站建设 2026/5/9 19:55:57

如何从八大主流网盘获取真实下载链接?LinkSwift开源工具深度解析

如何从八大主流网盘获取真实下载链接&#xff1f;LinkSwift开源工具深度解析 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云…

作者头像 李华
网站建设 2026/5/9 19:53:44

CANN/ge GraphProcessPoint API

GraphProcessPoint 【免费下载链接】ge GE&#xff08;Graph Engine&#xff09;是面向昇腾的图编译器和执行器&#xff0c;提供了计算图优化、多流并行、内存复用和模型下沉等技术手段&#xff0c;加速模型执行效率&#xff0c;减少模型内存占用。 GE 提供对 PyTorch、TensorF…

作者头像 李华
网站建设 2026/5/9 19:51:14

ChatGPT在教育领域的应用、挑战与未来展望:AI导师如何重塑教学

1. 项目概述&#xff1a;当AI导师走进课堂“ChatGPT在教育领域的应用、挑战与未来展望”这个标题&#xff0c;乍一看像是一篇学术论文的题目&#xff0c;但背后折射出的&#xff0c;是每一位教育工作者、学生乃至家长都在亲身经历的一场静默革命。作为一名长期关注技术与教育交…

作者头像 李华
网站建设 2026/5/9 19:47:31

AI赋能认知行为疗法:从数据构建到临床落地的技术实践

1. 项目概述&#xff1a;当AI遇见CBT作为一名在心理健康与数字技术交叉领域摸爬滚打了十来年的从业者&#xff0c;我亲眼见证了从简单的在线问卷到如今智能干预工具的演变。最近几年&#xff0c;“AI赋能认知行为疗法”这个话题的热度居高不下&#xff0c;它不再是实验室里的概…

作者头像 李华
网站建设 2026/5/9 19:47:30

CANN/runtime msproftx扩展接口

19-02 msproftx扩展接口 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 本章节描述 msproftx 扩展接口&#xff0c;用于自定义性能标记&#xff08;Stamp&#xff09;、范围标记及调用栈标记。 void …

作者头像 李华