news 2026/5/11 7:29:49

CANN/Ascend C Mull乘法API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/Ascend C Mull乘法API

Mull

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

功能说明

根据mask对输入数据srcReg0、srcReg1按元素相乘操作,将结果写入dstReg0,溢出部分写入dstReg1。

函数原型

template <typename T = DefaultType, typename U> __simd_callee__ inline void Mull(U& dstReg0, U& dstReg1, U& srcReg0, U& srcReg1, MaskReg& mask)

参数说明

表 1模板参数说明

参数名

描述

T

操作数数据类型。

Ascend 950PR/Ascend 950DT,支持的数据类型为:uint32_t/int32_t

U

srcReg0/srcReg1/dstReg为RegTensor类型, 例如RegTensor<uint32_t>,由编译器自动推导,用户不需要填写。

表 2参数说明

参数名

输入/输出

描述

dstReg0

输出

目的操作数。

类型为RegTensor。

dstReg1

输出

目的操作数。

类型为RegTensor。

srcReg0

输入

源操作数。

类型为RegTensor。

两个源操作数的数据类型需要与目的操作数保持一致。

srcReg1

输入

源操作数。

类型为RegTensor。

两个源操作数的数据类型需要与目的操作数保持一致。

mask

输入

源操作数元素操作的有效指示,详细说明请参考MaskReg。

返回值说明

约束说明

调用示例

template<typename T> __simd_vf__ inline void MullVF(__ubuf__ T* dst0Addr, __ubuf__ T* dst1Addr, __ubuf__ T* src0Addr, __ubuf__ T* src1Addr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg0; AscendC::Reg::RegTensor<T> srcReg1; AscendC::Reg::RegTensor<T> dstReg0; AscendC::Reg::RegTensor<T> dstReg1; AscendC::Reg::MaskReg mask; for (uint16_t i = 0; i < repeatTimes; i++) { mask = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg0, src0Addr + i * oneRepeatSize); AscendC::Reg::LoadAlign(srcReg1, src1Addr + i * oneRepeatSize); AscendC::Reg::Mull(dstReg0, dstReg1, srcReg0, srcReg1, mask); AscendC::Reg::StoreAlign(dst0Addr + i * oneRepeatSize, dstReg0, mask); AscendC::Reg::StoreAlign(dst1Addr + i * oneRepeatSize, dstReg1, mask); } }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 7:21:45

告别网盘限速!3步搞定百度网盘高速下载秘籍

告别网盘限速&#xff01;3步搞定百度网盘高速下载秘籍 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘的龟速下载而烦恼吗&#xff1f;每次看到那几十KB/s的速…

作者头像 李华
网站建设 2026/5/11 7:16:38

Starknet智能体开发:构建安全自主的链上AI代理基础设施

1. 项目概述&#xff1a;构建自主、安全且可组合的Starknet智能体基础设施如果你正在探索如何让AI智能体&#xff08;Agent&#xff09;在Starknet区块链上自主、安全地执行任务&#xff0c;比如自动进行DeFi交易、管理链上身份或审计智能合约&#xff0c;那么你很可能已经遇到…

作者头像 李华
网站建设 2026/5/11 7:15:31

量子去极化信道与3槽序列纯化策略解析

1. 量子去极化信道与纯化策略概述量子去极化信道是量子信息处理中最典型的噪声模型之一&#xff0c;它描述了一个量子态在传输过程中以概率γ完全退化为最大混合态的过程。具体而言&#xff0c;对于一个单量子比特态ρ&#xff0c;经过去极化信道Nγ作用后&#xff0c;输出态可…

作者头像 李华
网站建设 2026/5/11 7:12:44

[2026.5.7][IT工坊]WIN11.26300.8346专业工作站版[PIIS]中简 深度优化 系统推荐

精简了Defender和大多数人用不上的IIS、hyper-V等组件 精简了EDGE、Webview2、微软应用商店 (三者提供有恢复安装包) 精简了SxS,不支持启用新功能,不支持更新 保留了截图工具、讲述人、TTS、实时字幕、人脸识别 、NET4.8.1、Media Player等 集成了NET3.5、VC运行库等 建议使用固…

作者头像 李华
网站建设 2026/5/11 7:12:35

web项目工程搭建、Result封装类、部门功能的增删改查和日志技术Logback

工程搭建第一步1.检查maven版本和JDK版本(这里我们采用17)和字符集版本(UTF-8)检查mavenJDK版本检查字符集2.创建SpringBoot工程3.引入web开发起步依赖lombok驱动(Spring Boot版本自行选择)spring websql驱动(mysql和mybatis)第二步1.配置yml文件#Spring Boot项目名字 spring:a…

作者头像 李华
网站建设 2026/5/11 7:06:08

开源项目封装实战:适配器模式与门面模式提升开发体验

1. 项目概述&#xff1a;一个被“包装”的开源项目最近在GitHub上闲逛&#xff0c;发现了一个挺有意思的项目&#xff0c;叫MYSKV/opencode-wrapped。光看这个名字&#xff0c;就让我这个老码农会心一笑。“Wrapped”这个词&#xff0c;在技术圈里&#xff0c;尤其是在前端和开…

作者头像 李华