汉得企业级大模型训练与管理平台(中文名灵炼,英文名H-AI TrainHub,以下简称灵炼),旨在提供企业级一站式模型训练与管理平台,覆盖数据集管理、精调、推理部署与评测等端到端能力,专注性能与安全保障,全面支撑企业 AI 模型开发与落地。
本文将带你快速掌握大模型微调全流程:从模型训练到模型发布,再到后续部署与应用,帮助你高效构建企业级专属AI能力。
一、模型微调
通过简洁的页面操作,即可完成大模型快速微调,大幅降低使用门槛,同时显著提升微调效率:
1. 新建微调任务
模型训练/模型微调:新建微调任务
首先配置基本信息&模型及数据。
- 微调类型:按需选择微调类型
- 继续预训练:强化领域知识理解
- SFT精调:提升指令遵循与理解能力
- 基础模型:选择目标模型及版本
- 数据格式:选择对应数据结构
- 训练集来源:灵活适配不同数据规模与业务需求
- 平台数据集(推荐)
- 手工上传(≤30MB)
- 本地存储路径(适用于大规模数据)
其次设置算力、微调相关配置,并点击【确认】完成创建。
- 算力集群:选择执行节点
- 调度方式:
- 手工调度:精细化控制资源
- 自动调度:基于 Ray 实现资源智能分配
- 训练引擎:支持多版本选择
- 微调方法:LoRA / 全参微调
- 分布式训练策略:
- DDP(原生分布式数据并行策略)
- DeepSpeed:
ZeRO-1 / ZeRO-2 / ZeRO-3
支持 CPU Offload(降低显存占用)
- 参数配置:平台预置默认参数配置,同时支持学习率、Epoch、序列长度等关键参数自定义,以及 Warmup 等高级参数调优能力
2. 开始训练
创建任务后,点击【开始训练】,即可启动模型微调流程。平台将自动完成资源调度、训练执行、状态管理等,全流程自动化,降低操作复杂度。
3. 查看训练操作记录
操作记录完整记录微调过程中的各阶段信息,实现全过程可观测与问题快速定位。包括:
- 数据加载
- 训练执行状态
- 节点运行情况
- 日志信息
4. 评估报告
训练完成后,可查看评估报告,全面了解模型效果,用数据驱动模型优化决策:
- ROUGE / BLEU 等评估指标
- Loss 曲线变化
- Token级准确率等
5. 发布模型
微调完成后,可将模型发布至模型仓库,支持后续部署与复用,构建企业级模型资产体系。
点击【发布】,完成以下配置:
- Checkpoint选择:保持默认或指定训练结果
- 是否自动合并:
- 合并基础模型生成完整模型
- 或仅发布 LoRA Adapter
- 发布方式:
- 新版本:基于已有模型迭代
- 新模型:创建全新模型资产
6. 查看发布操作记录
发布过程中,也可通过操作记录查看:发布状态、执行日志、合并进度等,全流程透明可控。
7. 查看发布结果
发布完成后,可在模型仓库查看,实现模型资产沉淀与复用:
- 新版本:在原模型下查看新增版本
- 新模型:在模型列表中查看
结语
以上内容主要讲解了如何通过灵炼进行模型微调、过程监控、效果评估、模型发布的相关能力,打造完整的模型训练与应用闭环。
更多功能细节可参阅开放平台文档,或随时联系研发团队。未来我们将持续迭代,为您带来更多AI模型开发与落地体验,期待与您交流!
💬 欢迎在评论区留言,一起探讨AI模型开发在您业务中的应用潜力~
联系我们
- 相关产品咨询或更多信息了解,欢迎联系我们
邮箱 ➡️ openhand@vip.hand-china.com - 若您有任何问题需要咨询,都可前往焱牛开放平台(open.hand-china.com)提反馈,或将疑问发往联系邮箱。我们有专业人员针对您的问题进行解决回复,技术精良的研发团队根据您的反馈进行应用优化。期待您的反馈,我们将用心对待每一份回应~