news 2026/6/19 6:28:00

CANN/asc-devkit:BRCB矢量计算函数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit:BRCB矢量计算函数

asc_brcb

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

给定一个输入矢量,每一次取输入矢量中的8个数填充到结果矢量的8个datablock(32Bytes)中去,每个数对应一个datablock。

函数原型

  • 高维切分计算

    __aicore__ inline void asc_brcb(__ubuf__ uint16_t* dst, __ubuf__ uint16_t* src, uint16_t dst_block_stride, uint16_t dst_repeat_stride, uint8_t repeat) __aicore__ inline void asc_brcb(__ubuf__ uint32_t* dst, __ubuf__ uint32_t* src, uint16_t dst_block_stride, uint16_t dst_repeat_stride, uint8_t repeat)
  • 同步高维切分计算

    __aicore__ inline void asc_brcb_sync(__ubuf__ uint16_t* dst, __ubuf__ uint16_t* src, uint16_t dst_block_stride, uint16_t dst_repeat_stride, uint8_t repeat) __aicore__ inline void asc_brcb_sync(__ubuf__ uint32_t* dst, __ubuf__ uint32_t* src, uint16_t dst_block_stride, uint16_t dst_repeat_stride, uint8_t repeat)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src输入源操作数(矢量)的起始地址。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
repeat输入迭代次数。

返回值说明

流水类型

PIPE_V

约束说明

  • 不支持src与dst为同一块内存地址。

调用示例

constexpr uint32_t src_length = 16; constexpr uint32_t dst_length = 256; __ubuf__ uint16_t src[src_length]; __ubuf__ uint16_t dst[dst_length]; asc_brcb(dst, src, 1, 8, 2);

结果示例:

输入数据src:[1 2 3 ... 16] 输出数据dst:[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ... 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16]

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/19 6:20:56

如何快速构建智能标注系统:OpenMMLab MMPose的完整指南

如何快速构建智能标注系统:OpenMMLab MMPose的完整指南 【免费下载链接】mmpose OpenMMLab Pose Estimation Toolbox and Benchmark. 项目地址: https://gitcode.com/GitHub_Trending/mm/mmpose 在计算机视觉领域,人体姿态估计已成为AI技术的重要…

作者头像 李华
网站建设 2026/6/19 6:18:33

DeepSeek V4 Lite百万上下文技术真相:分块稀疏注意力与工程落地瓶颈

1. 项目概述:一场被误读的“百万上下文”风暴,和它背后真实的模型演进逻辑最近几天,技术圈里关于 DeepSeek API 的讨论像开了锅——“DeepSeek V4 Lite 百万 Token 上下文上线!”“API 支持 1M 上下文,直接对标网页版&…

作者头像 李华
网站建设 2026/6/19 6:17:49

Python开发中的常见陷阱与避坑策略

在Python开发的世界里,简洁优雅的语法和强大的生态系统吸引着无数开发者。然而,即便是经验丰富的程序员,也难免会陷入一些看似微小却可能引发严重问题的陷阱。本文将深入剖析Python开发中的常见陷阱,并提供实用的避坑策略&#xf…

作者头像 李华
网站建设 2026/6/19 6:15:09

云识慧一脸通模块二:人脸门禁系统

# 云识慧人脸门禁系统:智慧通行的安全守护者传统门禁依赖刷卡、密码等方式,存在易丢失、易复制、通行效率低等安全隐患。云识慧人脸门禁系统以先进的人脸识别技术为核心,打造了安全、便捷、智能的出入管理解决方案,广泛应用于企业…

作者头像 李华
网站建设 2026/6/19 6:14:04

嵌入式开发中高性能ADC选型指南:SAR与ΔΣ架构深度解析与实战应用

1. 项目概述:为什么ADC选型是嵌入式开发的“临门一脚”在嵌入式系统开发里,ADC(模数转换器)的选型,常常是决定项目成败、性能上限甚至成本控制的关键一步。我见过太多项目,前期MCU、传感器、算法都选得挺好…

作者头像 李华
网站建设 2026/6/19 6:05:58

6月18日模数开源主理人学院首期毕业路演,30余位创业者展示OPC商业计划!

模数开源主理人学院:开启OPC创业者全维度蜕变之旅由北京亦庄、开源中国、极新联合发起的模数开源主理人学院,将于6月18日在北京亦庄国家信创园举行首期毕业典礼暨毕业路演。该学院是在经开区信产局指导下,由开源中国与极新联合打造的核心数字…

作者头像 李华