news 2026/5/11 13:19:46

CANN/asc-devkit向量计算int32转int64函数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit向量计算int32转int64函数

asc_int322int64

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

将int32_t类型数据转换为int64_t类型。

函数原型

  • 前n个数据计算

    __aicore__ inline void asc_int322int64(__ubuf__ int64_t* dst, __ubuf__ int32_t* src, uint32_t count)
  • 高维切分计算

    __aicore__ inline void asc_int322int64(__ubuf__ int64_t* dst, __ubuf__ int32_t* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride)
  • 同步计算

    __aicore__ inline void asc_int322int64_sync(__ubuf__ int64_t* dst, __ubuf__ int32_t* src, uint32_t count)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src输入源操作数(矢量)的起始地址。
count输入参与计算的元素个数。
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src_block_stride输入源操作数单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src_repeat_stride输入源操作数相邻迭代间相同DataBlock的地址步长。

返回值说明

流水类型

PIPE_V

约束说明

  • dst、src的起始地址需要32字节对齐。
  • 操作数地址重叠约束请参考通用地址重叠约束。

调用示例

constexpr uint64_t total_length = 128; // total_length指参与计算的数据长度 __ubuf__ int32_t src[total_length]; __ubuf__ int64_t dst[total_length]; asc_int322int64(dst, src, total_length); // 将src转换为int64_t类型并存放到dst中

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 13:18:20

2025届必备的降重复率方案解析与推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 对内容创作而言,要降低人工智能生成内容占比,就得从源头着手优化&…

作者头像 李华
网站建设 2026/5/11 13:17:59

Paraview矢量可视化(1):定制Glyph的形态与方向

1. Glyph过滤器的基本概念与应用场景 在科学计算可视化领域,矢量数据的直观呈现一直是个技术难点。想象一下,当你面对一组描述流体运动或电磁场分布的矢量数据时,单纯依靠数字和公式很难快速把握整体态势。这就是Paraview的Glyph过滤器大显身…

作者头像 李华
网站建设 2026/5/11 13:17:06

Xbox存档提取终极指南:3分钟实现跨平台游戏进度迁移

Xbox存档提取终极指南:3分钟实现跨平台游戏进度迁移 【免费下载链接】XGP-save-extractor Python script to extract savefiles out of Xbox Game Pass for PC games 项目地址: https://gitcode.com/gh_mirrors/xg/XGP-save-extractor 作为Xbox Game Pass订阅…

作者头像 李华
网站建设 2026/5/11 13:16:37

CANN asc-devkit寄存器存储接口

asc_storeunalign_post_postupdate 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址…

作者头像 李华
网站建设 2026/5/11 13:10:32

CANN/ge ACL设置张量原始形状

aclSetTensorOriginShape 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、T…

作者头像 李华