news 2026/5/12 6:56:59

海光 Z100L GPU 使用 PyTorch 训练时 segfault,寻找 torch-2.4.1+das.opt1.dtk25041 wheel

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
海光 Z100L GPU 使用 PyTorch 训练时 segfault,寻找 torch-2.4.1+das.opt1.dtk25041 wheel

各位大佬好,最近在服务器上训练学生行为识别项目(目标检测 + VideoMAE动作识别),使用的是海光 Z100L GPU,目前卡在 PyTorch 环境兼容问题,求助一下。

## 服务器环境

GPU:
海光 Z100L

驱动:

hy-smi -a

输出:

Driver Version: 6.3.3-V1.8.0
Card Series: Z100L
Vendor: Chengdu Haiguang IC Design Co., Ltd.

说明 GPU 驱动正常。

---

## 当前 PyTorch 环境

当前安装:

torch 2.4.1+rocm6.1
torchvision 0.19.1+rocm6.1
torchaudio 2.4.1+rocm6.1

测试:

python -c "import torch; print(torch.cuda.is_available())"

返回:

True

python -c "import torch; print(torch.cuda.device_count())"

返回:

1

python -c "import torch; print(torch.cuda.get_device_name(0))"

返回:

AMD Radeon Graphics

---

## 当前问题

以下操作正常:

torch.cuda.is_available()
torch.cuda.init()
torch.empty(..., device="cuda")

但是以下操作直接 segfault:

x = torch.randn(3,3).cuda()
print(x+1)

或者:

import torch.nn as nn
m = nn.Linear(10,5).cuda()

以及:

train_videomae.py

都会直接 segmentation fault

---

## 已排查

我搜索到公网资料发现:

似乎需要海光 DTK 定制版:

torch-2.4.1+das.opt1.dtk25041-cp310-cp310-manylinux_2_28_x86_64.whl

并且看到有文章提到来源:

10.16.4.1:8000

但当前容器无法访问该内网地址。

---

## 想请教大家

1. 有没有人用过海光 Z100L?
2. 有没有这个 wheel 文件?
3. 是否有公网下载地址?
4. 是否可以用其他版本替代?

非常感谢!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/12 6:48:35

别再手动调字号了!LaTeX字体大小命令全解析(从tiny到Huge)

LaTeX字体大小命令实战指南:从学术排版到视觉层次设计 在学术写作和技术文档领域,LaTeX以其卓越的排版质量著称,但许多用户在使用字体大小调整命令时往往陷入两个极端:要么机械地反复尝试不同字号直到"看起来差不多"&am…

作者头像 李华
网站建设 2026/5/12 6:47:34

WarcraftHelper终极指南:5分钟解锁魔兽争霸III完整潜能

WarcraftHelper终极指南:5分钟解锁魔兽争霸III完整潜能 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper WarcraftHelper是一款专为《魔兽争…

作者头像 李华
网站建设 2026/5/12 6:40:45

Ruby开发者本地调用大语言模型:Ollama AI Gem 完全指南

1. 项目概述:Ollama AI Ruby Gem如果你是一个Ruby开发者,最近想在本地跑一些开源的大语言模型(LLM),比如Llama 2、Mistral,并且希望用自己熟悉的Ruby语言来调用,而不是去折腾Python或者命令行&a…

作者头像 李华