news 2026/5/9 15:10:20

cann/hccl HCCL网卡配置说明

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
cann/hccl HCCL网卡配置说明

HCCL_SOCKET_IFNAME

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

功能描述

配置HCCL初始化时Host使用的通信网卡名,HCCL将通过该网卡名获取Host IP,与root节点通信,以完成通信域的创建**。**

开发者可以选取以下规则中的一种进行配置:

  • eth:使用所有以eth为前缀的网卡。

    若指定多个网卡前缀,多个网卡前缀间用英文逗号分隔。

    例如:export HCCL_SOCKET_IFNAME=eth,enp,表示使用所有以eth或enp为前缀的网卡。

  • ^eth:不使用以eth为前缀的网卡。

    若指定多个网卡前缀,多个网卡前缀间用英文逗号分隔。

    例如:export HCCL_SOCKET_IFNAME=^eth,enp,表示不使用任何以eth或enp为前缀的网卡。

  • =eth0:使用指定的eth0网卡。

    若指定多个网卡,多个网卡间用英文逗号分隔。

    例如:export HCCL_SOCKET_IFNAME==eth0,enp0,表示使用eth0网卡或enp0网卡。

  • ^=eth0:不使用指定eth0网卡。

    若指定多个网卡,多个网卡间用英文逗号分隔。

    例如:export HCCL_SOCKET_IFNAME=^=eth0,enp0,表示不使用eth0与enp0网卡。

[!NOTE]说明

  • HCCL_SOCKET_IFNAME中可配置多个网卡,取最先匹配到的网卡作为通信网卡。
  • 环境变量HCCL_IF_IP的优先级高于HCCL_SOCKET_IFNAME。
  • 如果用户未指定HCCL_IF_IP和HCCL_SOCKET_IFNAME,按照如下优先级选择: docker/lo以外网卡(网卡名字典序升序) > docker网卡 > lo网卡

如果不配置HCCL_IF_IP或HCCL_SOCKET_IFNAME,系统将按照优先级自动选择网卡。若当前节点选择的网卡与root节点选择的网卡链路不通,将导致HCCL建链失败。

配置示例

# 使用eth0或endvnic的网卡 export HCCL_SOCKET_IFNAME==eth0,endvnic

使用约束

支持的型号

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas A2 训练系列产品/Atlas A2 推理系列产品(针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。)

Atlas 训练系列产品

Atlas 推理系列产品(针对Atlas 推理系列产品,仅支持Atlas 300I Duo 推理卡。)

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 15:01:31

LSTM+云原生:O-RAN网络智能异常检测工程实践

1. 项目概述与核心价值最近在搞O-RAN网络运维的朋友,估计都遇到过同一个头疼的问题:网络里那些稀奇古怪的异常,比如基站性能突然跳水、切片资源分配异常、CU/DU之间接口时延飙升,总是事后才被发现。传统的基于固定阈值的告警系统&…

作者头像 李华
网站建设 2026/5/9 14:50:32

动态域名解析工具diny:基于Cloudflare API的轻量级DDNS解决方案

1. 项目概述:一个轻量级、可定制的动态域名解析工具最近在折腾个人服务器和家庭网络服务时,我又一次被动态公网IP的问题给绊住了。相信很多自己搭网站、建NAS或者跑一些自研服务的朋友都深有体会:运营商给的公网IP说变就变,一旦IP…

作者头像 李华
网站建设 2026/5/9 14:49:53

OpenClaw会话历史管理工具:本地CLI与Web界面实现

1. 项目概述与核心价值如果你和我一样,是OpenClaw的重度用户,那你肯定遇到过这个痛点:想回顾一下昨天那个Discord机器人是怎么处理用户请求的,或者想看看上周那个定时任务(cron job)的执行日志,…

作者头像 李华
网站建设 2026/5/9 14:49:51

GPT-5.5相比GPT-5有哪些提升?核心能力对比分析

概要如果说 GPT-5 代表了新一代大模型在理解、推理、多模态和工具调用上的全面升级,那么 GPT-5.5 更像是在 GPT-5 基础上的一次“体验增强版”迭代。它不一定只是参数变大,更重要的是在真实使用场景中变得更稳、更快、更懂上下文,也更适合日常…

作者头像 李华