news 2026/5/9 18:27:56

CANN/pyasc矩阵乘法迭代方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pyasc矩阵乘法迭代方法

asc.language.adv.Matmul.iterate

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

Matmul.iterate(en_partial_sum: bool = False, sync: bool = True, local_c_matrix: BaseTensor | None = None) → MatmulIterator

每调用一次Iterate,会计算出一块baseM * baseN的C矩阵。

对应的Ascend C函数原型

template <bool sync = true> __aicore__ inline bool Iterate(bool enPartialSum = false)
template <bool sync = true, typename T> __aicore__ inline bool Iterate(bool enPartialSum, const LocalTensor<T>& localCmatrix)

参数说明

  • en_partial_sum: 是否将矩阵乘的结果累加于现有的CO1数据,默认值为false。
  • sync: 设置同步或者异步模式。
  • local_c_matrix: 由用户申请的CO1上的LocalTensor内存,用于存放矩阵乘的计算结果。

约束说明

  • 当使能MixDualMaster(双主模式)场景时,即模板参数enableMixDualMaster设置为true,不支持使用该接口。
  • 对于用户自主管理CO1的iterate函数,创建Matmul对象时,必须定义C矩阵的内存逻辑位置为TPosition::CO1、数据排布格式为CubeFormat::NZ、数据类型为float或int32_t。

调用示例

# 同步模式样例 while mm.iterate() as count: mm.get_tensor_c(tensor=ub_cmatrix) # 异步模式样例 mm.iterate(sync=False) # 其他操作 for i in range(single_m // base_m * single_n // base_n): mm.get_tensor_c(tensor=ub_cmatrix, sync=False)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 18:26:21

将Taotoken接入企业内部知识问答Agent的架构设计与实践

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 将Taotoken接入企业内部知识问答Agent的架构设计与实践 应用场景类&#xff0c;探讨企业希望构建基于内部文档的智能问答系统时&am…

作者头像 李华
网站建设 2026/5/9 18:09:35

AI安全国际协作:从内容溯源到协作红队的技术实践与信任构建

1. 项目概述&#xff1a;当AI成为全球对话的“新语言”最近几年&#xff0c;我参与和观察了不少跨国、跨机构的AI安全项目&#xff0c;一个深刻的体会是&#xff1a;技术问题往往只是冰山一角&#xff0c;水面之下是更为复杂的信任鸿沟。当一家机构的AI模型生成了有争议的内容&…

作者头像 李华
网站建设 2026/5/9 18:09:34

AI驱动电力电子设计:基于BN-NN与GA的变换器参数自动化寻优

1. 项目概述&#xff1a;当AI遇见电力电子设计干了十几年电力电子&#xff0c;画过的电路图、调过的参数、烧过的管子&#xff0c;加起来能绕实验室好几圈。每次接到一个新项目&#xff0c;比如设计一个车载电源里的同步Buck变换器&#xff0c;最头疼的环节是什么&#xff1f;不…

作者头像 李华
网站建设 2026/5/9 18:08:50

第三代社保卡全功能使用指南

文章目录社保卡代际区分&#xff08;因省份而存在差异&#xff09;第三代社保卡申领官方推广时间节点说明申领基础条件线下申领&#xff08;支持即时制卡&#xff0c;当场拿卡&#xff09;线上申领&#xff08;邮寄到家/银行网点自取&#xff09;第三代社保卡全功能指南基础社保…

作者头像 李华
网站建设 2026/5/9 18:08:03

RWKV7-1.5B-g1a部署教程:解决‘页面打不开’问题的5步标准化排查法

RWKV7-1.5B-g1a部署教程&#xff1a;解决页面打不开问题的5步标准化排查法 1. 模型简介 rwkv7-1.5B-g1a是基于新一代RWKV-7架构的多语言文本生成模型&#xff0c;特别适合中文场景下的轻量级应用。这个1.5B参数的版本在保持较高生成质量的同时&#xff0c;对硬件要求相对友好…

作者头像 李华