news 2026/5/9 16:51:34

CANN/pypto转置批量矩阵乘法API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pypto转置批量矩阵乘法API

pypto.experimental.transposed_batchmatmul

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

该接口为定制接口,约束较多。不保证稳定性。

该算子执行转置批量矩阵乘法。具体操作为:

  1. 将输入张量tensor_a从形状 (M, B, K) 转置为 (B, M, K)。
  2. 执行批量矩阵乘法,将转置后的tensor_a(B, M, K) 与tensor_b(B, K, N) 相乘,得到中间结果 (B, M, N)。
  3. 将中间结果转置回形状 (M, B, N) 作为最终输出。

函数原型

transposed_batchmatmul(tensor_a: Tensor, tensor_b: Tensor, out_dtype: dtype) -> Tensor

参数说明

参数名输入/输出说明
tensor_a输入左侧输入张量。
支持的数据类型为:DT_FP16, DT_BF16。
不支持空Tensor,支持三维。
形状必须为 (M, B, K)。
tensor_b输入右侧输入张量。
支持的数据类型为:DT_FP16, DT_BF16。
不支持空Tensor,支持三维。
形状必须为 (B, K, N)。
out_dtype输入输出张量的数据类型。
支持的数据类型为:DT_FP16, DT_BF16。

返回值说明

返回输出 Tensor,Tensor 的数据类型由out_dtype指定,形状为 (M, B, N)。

调用示例

import pypto # 创建输入张量 a = pypto.tensor((16, 2, 32), pypto.DT_FP16, "tensor_a") b = pypto.tensor((2, 32, 64), pypto.DT_FP16, "tensor_b") # 调用算子 c = pypto.experimental.transposed_batchmatmul(a, b, pypto.DT_FP16) # 输出张量 c 的形状为 (16, 2, 64)

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 16:51:32

CANN/ops-cv项目目录结构说明

项目目录 【免费下载链接】ops-cv 本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-cv 本章罗列的部分目录是可选的,请以实际交付件为准。尤其单算子目录,不同场…

作者头像 李华
网站建设 2026/5/9 16:51:11

空间记忆模型在视频分析中的应用与优化

1. 项目背景与核心价值在监控视频分析、自动驾驶感知、工业质检等领域,我们经常会遇到一个经典难题:如何让计算机像人类一样记住场景中物体的空间位置,并准确识别出它们随时间发生的变化?这个问题看似简单,却涉及计算机…

作者头像 李华
网站建设 2026/5/9 16:51:01

DNSSEC 中断事件深度解析:当德国顶级域名 .de 遭遇信任危机

DNSSEC 中断事件深度解析:当德国顶级域名 .de 遭遇信任危机 2025年8月的一个普通工作日,全球互联网用户突然发现,大量以 .de 结尾的德国网站无法访问。Hacker News 上迅速聚集了665票的热度,技术社区陷入一片哗然。这并非一次普通…

作者头像 李华
网站建设 2026/5/9 16:50:47

基于MCP协议为AI助手构建nmbot技能库:原理、集成与实战

1. 项目概述:为AI助手构建专属技能库如果你正在开发或使用基于大型语言模型的AI助手,比如Claude、GPTs,或者像Cursor、Windsurf这样的AI编程IDE,你可能会发现一个痛点:这些助手虽然知识渊博,但在执行具体、…

作者头像 李华
网站建设 2026/5/9 16:49:59

基于向量数据库与LLM的智能文献管理:Zotero AI插件原理与实践

1. 项目概述:当Zotero遇上AI,文献管理进入“对话”时代如果你和我一样,常年泡在论文堆里,用Zotero管理着上千篇文献,那你一定懂那种感觉:文献是存好了,引用也方便了,但真要写综述、找…

作者头像 李华
网站建设 2026/5/9 16:49:48

我做了一个 Agent Skill,一句话生成一镜到底城市宣传片

上周,我制作了一个 skill ,用这个 skill 可以一键直出符合生成 seedance2.0 视频生成模型的城市宣传片分镜提示词,这个 skill 可以让你在 15 秒的视频当中,做出一镜到底效果的城市宣传片。我为什么制作这么一个 skill 呢&#xff…

作者头像 李华