news 2026/5/10 5:30:15

CANN向量到立方体模式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN向量到立方体模式

Vec-to-Cube Pattern

【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills

Generic baseline only. For a2 (b3) kernels, prefer the a2-specific patterns underagent/references/patterns/(e.g.,a2-cube-vec.md) and readagent/references/constraints/a2-device.mdfor device-side rules.

Read this file when vec work preprocesses data before cube consumes it in a later matmul stage.

Use this pattern when

  • the formula needs elementwise or row-wise preprocessing first
  • the cube stage should consume the transformed result
  • the host-side contract should stay reshape-only instead of doing a heavy layout transform outside the kernel

Minimal flow

GM -> UB -> @vf -> UB -> L1 -> L0 -> L0C -> GM

Ownership rule

The vec-to-cube publish is a cross-side ownership edge. Use explicitVcMutex. Do not expectauto_sync()to replace it.

Stable repository mapping:

  • VcMutex(..., src_end_pipe=Pipe.MTE3, dst_end_pipe=Pipe.FIX)

What usually matters most

  • whether the publish path is ND or NZ
  • whether the host-side layout stays reshape-only
  • how subblock rows are split between vec sides
  • whether the preprocessed value must remain in half or float before cube consume

Typical files to study

  • agent/example/kernels/a5/vec_cube_abs_sqrt_matmul.py
  • agent/example/kernels/a5/vec_cube_abs_sqrt_matmul_nz.py
  • agent/example/kernels/a5/recompute_wu_cube_vec.py

【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 5:30:04

iButton数据记录器:冷链监控与环境监测技术详解

1. iButton数据记录器概述iButton数据记录器是Maxim Integrated公司推出的一款微型环境监测设备,外形仅相当于五枚叠放的硬币大小(16mm直径)。这种不锈钢封装的设备内置温度传感器(部分型号含湿度传感器)、实时时钟、非…

作者头像 李华
网站建设 2026/5/10 5:30:02

Orcha:为AI编程助手构建微服务架构感知的智能工作空间

1. 项目概述:为AI智能体装上“工作空间大脑” 如果你和我一样,正在一个由多个独立代码仓库组成的微服务架构里折腾,并且尝试用Claude Code、Cursor这类AI编程助手来提升效率,那你肯定遇到过这样的场景:每次打开一个新的…

作者头像 李华
网站建设 2026/5/10 5:29:37

OpenClaw像素仪表盘:游戏化AI智能体实时监控与运维实战

1. 项目概述与核心价值 如果你和我一样,在本地部署了多个AI智能体(Agent),每天看着终端里滚动的日志,或者对着冰冷的API状态页面,总感觉少了点什么。我们投入了大量精力去调优提示词、配置工具链&#xff0…

作者头像 李华
网站建设 2026/5/10 5:26:23

从Cursor规则文件到AI智能体:自动化提升AI编程协作效率

1. 项目概述:从规则文件到智能体的自动化转换如果你和我一样,深度使用 Cursor 这款 AI 编程工具,那么你一定对它的.cursorrules文件不陌生。这个小小的配置文件,是我们与 Cursor 的 AI 模型(比如 Claude 3.5 Sonnet&am…

作者头像 李华
网站建设 2026/5/10 5:19:45

ClawScript:专为量化交易与AI自动化设计的领域特定语言

1. 项目概述:ClawScript,一个为交易与自动化而生的领域特定语言如果你像我一样,在量化交易和自动化流程的构建上投入了大量时间,那你一定对那种在通用编程语言的灵活性与专用交易平台的便捷性之间反复横跳的体验深有感触。用Pytho…

作者头像 李华
网站建设 2026/5/10 5:17:42

CANN/pyasc erfc函数API文档

asc.language.adv.erfc 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。 项目地址: https://gitcode.com/cann/pyasc asc.language.adv.erfc(dst: LocalT…

作者头像 李华