news 2026/4/23 11:17:34

Verl中的checkpoint合并成huggingface形式的模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Verl中的checkpoint合并成huggingface形式的模型

这里用的fsdp训练的模型,大概内容如下:

里面打开还是有很多文件

现在想要hf那个格式的模型,VeRL提供了merge函数,下面是一个代码:具体参考https://verl.readthedocs.io/en/latest/advance/checkpoint.html#checkpoint-page

#!/bin/bash # 合并 PPO 训练的 checkpoint 为 HuggingFace 格式 # Checkpoint 路径:/root/autodl-tmp/verl/checkpoints/verl_example_gsm8k/deepseek_llm_7b_function_rm/global_step_105 set-x # 设置 Hugging Face 缓存目录 export HF_HOME=/root/autodl-tmp export TRANSFORMERS_CACHE=/root/autodl-tmp # Checkpoint 路径 CHECKPOINT_DIR="/root/autodl-tmp/verl/checkpoints/verl_example_gsm8k/deepseek_llm_7b_function_rm/global_step_105"ACTOR_DIR="${CHECKPOINT_DIR}/actor"# 输出目录(合并后的 HuggingFace 模型) TARGET_DIR="${CHECKPOINT_DIR}/merged_hf_model"# 执行合并 python-m verl.model_merger merge \--backend fsdp \--local_dir"${ACTOR_DIR}"\--target_dir"${TARGET_DIR}"echo"合并完成!模型已保存到: ${TARGET_DIR}"

合并后的模型如下:

后记

2025年12月12日于上海。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/12 7:47:19

轻松实现酷安社区桌面端体验:UWP版客户端完全使用指南

轻松实现酷安社区桌面端体验:UWP版客户端完全使用指南 【免费下载链接】Coolapk-Lite 一个基于 UWP 平台的第三方酷安客户端精简版 项目地址: https://gitcode.com/gh_mirrors/co/Coolapk-Lite 还在为安卓模拟器的卡顿和资源消耗而烦恼吗?想要在W…

作者头像 李华
网站建设 2026/4/20 4:03:45

PySide6 自定义侧边栏 实现思路与代码详解

PySide6 自定义侧边栏 实现思路与代码详解 PySide6 虽然得益于Qt框架的强大与Python语法的快速开发,但是默认提供的主题不符合现代UI的省美!比如:侧边栏一般也叫导航栏(更多是手机平板的等设备)。 写在前边 笔者使用的是Linux的Gnome桌面系…

作者头像 李华
网站建设 2026/4/20 13:10:11

【蓝桥杯单片机】第二讲 过渡模拟二与LED模块

一、过渡模拟二 1 小数点输入 case 11://小数点输入if(Seg_Disp_Mode 0 && Point_Flag 0 && Seg_Input[0] ! 11)//处于温度采集界面、标志位为0、输入数组第一位有数据{Seg_Point[2Seg_Input_Index] 1;Point_Wela Seg_Input_Index;//记录此时指针状态 便于…

作者头像 李华
网站建设 2026/4/21 3:07:45

涪陵区市电路灯批发报价与成本分析

在城市照明基础设施建设中,涪陵区近年来持续推进智慧化、绿色化升级,尤其在市电路灯系统的优化与更新方面成效显著。作为连接城市功能与居民生活的重要载体,路灯不仅承担基础照明任务,更需契合不同应用场景对光效、安全、节能及维…

作者头像 李华
网站建设 2026/4/22 19:35:42

光学工程师面试真题

一、基础理论与原理类1. 请解释数值孔径(NA) 的定义及计算公式,它对光学系统(如显微镜、光纤)的分辨率和通光量有何影响?2. 什么是光学镀膜的“增透膜”和“高反膜”?分别基于什么光学原理实现&…

作者头像 李华