news 2026/5/9 16:55:48

CANN运行时异步内存复制示例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN运行时异步内存复制示例

4_d2h_async_memory_copy

【免费下载链接】runtime本项目提供CANN运行时组件和维测功能组件。项目地址: https://gitcode.com/cann/runtime

描述

本样例展示了Device到Host的内存复制,使用aclrtMemcpyAsync内存复制接口。

产品支持情况

本样例支持以下产品:

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

编译运行

环境安装详情以及运行详情请见example目录下的README。

运行步骤如下:

# ${install_root} 替换为 CANN 安装根目录,默认安装在`/usr/local/Ascend`目录 source ${install_root}/cann/set_env.sh export ASCEND_INSTALL_PATH=${install_root}/cann # ${ascend_name} 替换为昇腾AI处理器的型号,可通过 npu-smi info 查看 Name 字段并去掉空格获得,例如 ascend910b3 export SOC_VERSION=${ascend_name} # 部分样例中涉及调用AscendC算子,需配置AscendC编译器ascendc.cmake所在的路径,如 ${install_root}/cann/aarch64-linux/tikcpp/ascendc_kernel_cmake # 可在CANN包安装路径下查找ascendc_kernel_cmake,例如find ./ -name ascendc_kernel_cmake,并将${cmake_path}替换为ascendc_kernel_cmake所在路径 export ASCENDC_CMAKE_DIR=${cmake_path} # 编译运行 bash run.sh

CANN RUNTIME API

在该Sample中,涉及的关键功能点及其关键接口,如下所示:

  • 初始化
    • 调用aclInit接口初始化AscendCL配置。
    • 调用aclFinalize接口实现AscendCL去初始化。
  • Device管理
    • 调用aclrtSetDevice接口指定用于运算的Device。
    • 调用aclrtResetDeviceForce接口强制复位当前运算的Device,回收Device上的资源。
  • Stream管理
    • 调用aclrtCreateStream接口创建Stream。
    • 调用aclrtSynchronizeStream可以阻塞等待Stream上任务的完成。
    • 调用aclrtDestroyStreamForce接口强制销毁Stream,丢弃所有任务。
  • 内存管理
    • 调用aclrtMallocHost接口申请Host上的内存。
    • 调用aclrtMalloc接口申请Device上的内存。
    • 调用aclrtFreeHost接口释放Host上的内存。
    • 调用aclrtFree接口释放Device上的内存。
  • 数据传输
    • 调用aclrtMemcpyAsync接口通过内存复制的方式实现Device-to-Host数据传输。

已知issue

暂无

【免费下载链接】runtime本项目提供CANN运行时组件和维测功能组件。项目地址: https://gitcode.com/cann/runtime

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 16:55:39

从‘执行’的英文用词,聊聊程序员与产品经理的思维差异

从技术术语到业务意图:解码“执行”背后的思维差异 在软件开发团队中,产品经理兴奋地描述着"系统将执行用户身份验证流程",而开发者则埋头编写"执行SQL查询"的代码——看似都在讨论"执行",实则身处…

作者头像 李华
网站建设 2026/5/9 16:53:45

Go语言实现轻量级TCP/UDP代理:核心原理、源码解析与实战部署

1. 项目概述:一个轻量级代理转发工具的核心设计最近在折腾一些本地服务联调和跨网络访问的场景时,经常遇到一个痛点:某个服务只监听在本地回环地址(127.0.0.1),或者因为网络策略限制,无法从外部…

作者头像 李华
网站建设 2026/5/9 16:51:34

CANN/pypto转置批量矩阵乘法API

pypto.experimental.transposed_batchmatmul 【免费下载链接】pypto PyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto 产品支持情况 产品是否支持Ascend 950PR/Ascend 9…

作者头像 李华
网站建设 2026/5/9 16:51:32

CANN/ops-cv项目目录结构说明

项目目录 【免费下载链接】ops-cv 本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-cv 本章罗列的部分目录是可选的,请以实际交付件为准。尤其单算子目录,不同场…

作者头像 李华
网站建设 2026/5/9 16:51:11

空间记忆模型在视频分析中的应用与优化

1. 项目背景与核心价值在监控视频分析、自动驾驶感知、工业质检等领域,我们经常会遇到一个经典难题:如何让计算机像人类一样记住场景中物体的空间位置,并准确识别出它们随时间发生的变化?这个问题看似简单,却涉及计算机…

作者头像 李华
网站建设 2026/5/9 16:51:01

DNSSEC 中断事件深度解析:当德国顶级域名 .de 遭遇信任危机

DNSSEC 中断事件深度解析:当德国顶级域名 .de 遭遇信任危机 2025年8月的一个普通工作日,全球互联网用户突然发现,大量以 .de 结尾的德国网站无法访问。Hacker News 上迅速聚集了665票的热度,技术社区陷入一片哗然。这并非一次普通…

作者头像 李华