news 2026/5/9 16:39:00

CANN驱动设备错误码查询

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN驱动设备错误码查询

dcmi_get_device_errorcode_string

【免费下载链接】driver本项目是CANN提供的驱动模块,实现基础驱动和资源管理及调度等功能,使能昇腾芯片。项目地址: https://gitcode.com/cann/driver

函数原型

int dcmi_get_device_errorcode_string(int card_id, int device_id, unsigned int error_code, unsigned char *error_info, int buf_size)

功能说明

查询设备故障描述。

参数说明

参数名称

输入/输出

类型

描述

card_id

输入

int

设备ID,当前实际支持的ID通过dcmi_get_card_list接口获取。

device_id

输入

int

芯片ID,通过dcmi_get_device_id_in_card接口获取。取值范围如下:

NPU芯片:[0, device_id_max-1]。

MCU芯片:mcu_id。

error_code

输入

unsigned int

要查询的错误码,通过dcmi_get_device_errorcode_v2接口获取。

error_info

输出

unsigned char *

对应的错误描述。

buf_size

输入

int

传入的error_info取值范围是大于等于48Byte。

  • 若设置的error_info小于48Byte,则系统报错。
  • 若设置的error_info在48~255Byte之间,则在《健康管理故障定义》中的故障码,查询出来的故障信息为简化信息。
  • 若设置的error_info大于等于256Byte,则查询出来的故障信息为实际故障信息。

返回值说明

类型

描述

int

处理结果:

  • 成功:返回0。
  • 失败:返回码请参见return_codes。

异常处理

无。

约束说明

调用该接口查询到的信息仅代表当前芯片设计了这种错误码类型,具有上报这种故障类型的能力,但不代表当前已经使用这个错误码。当前芯片已经支持的错误码请按照参数说明表中error_code参数的描述获取。

表 1不同部署场景下的支持情况

产品形态

物理机场景(裸机)root用户

物理机场景(裸机)运行用户组(非root用户)

物理机+普通容器场景root用户

Atlas 900 A2 PoD 集群基础单元

Y

Y

Y

Atlas 800T A2 训练服务器

Y

Y

Y

Atlas 800I A2 推理服务器

Y

Y

Y

Atlas 200T A2 Box16 异构子框

Y

Y

Y

A200I A2 Box 异构组件

Y

Y

Y

Atlas 300I A2 推理卡

Y

Y

Y

Atlas 300T A2 训练卡

Y

Y

Y

注:Y表示支持;N表示不支持;NA表示不涉及,当前未规划此场景。

调用示例

#define ERROR_CODE_MAX_NUM (128) #define BUF_SIZE (256) … int ret = 0; int card_id = 0; int device_id = 0; int errorcount = 0; unsigned int error_code_list[ERROR_CODE_MAX_NUM] = {0}; unsigned char error_info[BUF_SIZE] = {0}; ret = dcmi_get_device_errorcode_v2(card_id, device_id, &errorcount, error_code_list, ERROR_CODE_MAX_NUM); if ((ret != 0) || (errorcount == 0)){ //todo:记录日志 return ret; } ret = dcmi_get_device_errorcode_string(card_id, device_id, error_code_list[0], error_info, BUF_SIZE); if (ret != 0) { //todo:记录日志 return ret; } …

【免费下载链接】driver本项目是CANN提供的驱动模块,实现基础驱动和资源管理及调度等功能,使能昇腾芯片。项目地址: https://gitcode.com/cann/driver

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 16:38:32

CANN/driver删除算力组API文档

dcmi_delete_capability_group 【免费下载链接】driver 本项目是CANN提供的驱动模块,实现基础驱动和资源管理及调度等功能,使能昇腾芯片。 项目地址: https://gitcode.com/cann/driver 函数原型 int dcmi_delete_capability_group(int card_id, …

作者头像 李华
网站建设 2026/5/9 16:38:31

老鸟如何使用Linux系统

老鸟如何使用Linux系统:从命令记忆到问题驱动的认知重构别再背命令了,你需要的是搭建一套排错决策树很多Linux学习者都有这样的经历:上学时抄下一张命令清单,ls、cd、grep、awk……背得滚瓜烂熟,可一离开课本就忘得一干…

作者头像 李华
网站建设 2026/5/9 16:37:34

SlimeNexus:基于Spring Boot与Vue的Minecraft服务器一体化运维管理平台

1. 项目概述:一个为《我的世界》服务器量身定制的现代化管理枢纽如果你是一名《我的世界》(Minecraft)服务器管理员,尤其是运营着有一定玩家基数的社区服,那么你一定对“管理”这两个字的重量深有体会。从玩家数据备份…

作者头像 李华
网站建设 2026/5/9 16:31:03

CANN/atvoss内核调度运行接口

BaseKernelSchedule::Run 【免费下载链接】atvoss ATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。 …

作者头像 李华
网站建设 2026/5/9 16:29:57

Gitee CodePecker SCA:中国企业级软件供应链安全的破局者

随着全球数字化转型进程加速,软件供应链安全正面临前所未有的挑战。开源组件的大规模应用在提升开发效率的同时,也带来了复杂的安全隐患。据行业统计,2022年开源组件相关问题同比增长超过200%,其中约40%的企业因第三方组件问题遭受…

作者头像 李华
网站建设 2026/5/9 16:28:32

基于MCP协议构建Google Search Console AI助手:实现对话式SEO数据分析

1. 项目概述:一个连接Google Search Console与AI的桥梁 如果你是一名SEO从业者、内容创作者,或者像我一样,经常需要分析网站的自然搜索表现,那你一定对Google Search Console(GSC)不陌生。它提供了海量的数…

作者头像 李华