news 2026/4/24 16:26:59

如何贡献GPEN社区?魔搭ModelScope上传流程指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何贡献GPEN社区?魔搭ModelScope上传流程指南

如何贡献GPEN社区?魔搭ModelScope上传流程指南

GPEN人像修复增强模型镜像

本镜像基于GPEN人像修复增强模型构建,预装了完整的深度学习开发环境,集成了推理及评估所需的所有依赖,开箱即用。

1. 镜像环境说明

组件版本
核心框架PyTorch 2.5.0
CUDA 版本12.4
Python 版本3.11
推理代码位置/root/GPEN

主要依赖库:

  • facexlib: 用于人脸检测与对齐
  • basicsr: 基础超分框架支持
  • opencv-python,numpy<2.0,datasets==2.21.0,pyarrow==12.0.1
  • sortedcontainers,addict,yapf

2. 快速上手

2.1 激活环境

conda activate torch25

2.2 模型推理 (Inference)

进入代码目录并使用预置脚本进行推理测试:

cd /root/GPEN

使用下面命令进行推理测试,可以通过命令行参数灵活指定输入图片。

# 场景 1:运行默认测试图 # 输出将保存为: output_Solvay_conference_1927.png python inference_gpen.py # 场景 2:修复自定义图片 # 输出将保存为: output_my_photo.jpg python inference_gpen.py --input ./my_photo.jpg # 场景 3:直接指定输出文件名 # 输出将保存为: custom_name.png python inference_gpen.py -i test.jpg -o custom_name.png

推理结果将自动保存在项目跟目录下,测试结果如下:


3. 已包含权重文件

为保证开箱即用及离线推理能力,镜像内已预下载以下模型权重(如果没有运行推理脚本会自动下载):

  • ModelScope 缓存路径~/.cache/modelscope/hub/iic/cv_gpen_image-portrait-enhancement
  • 包含内容:完整的预训练生成器、人脸检测器及对齐模型。

4. 常见问题

  • 数据集准备:官网训练数据为 FFHQ 公开数据集。本算法采用监督式的训练,因此需要事先准备好高质-低质的数据对,推荐使用RealESRGAN、BSRGAN等降质方式进行低质数据生成。
  • 训练:提供训练数据对的读取地址,设置好需要的分辨率版本(推荐512x512),调整生成器和判别器的学习率以及总epoch数,即可开始训练。。

5. 参考资料

  • 官方仓库:yangxy/GPEN
  • 魔搭社区地址:iic/cv_gpen_image-portrait-enhancement

6. 引用 (Citation)

@inproceedings{yang2021gpen, title={GAN-Prior Based Null-Space Learning for Consistent Super-Resolution}, author={Yang, Tao and Ren, Peiran and Xie, Xuansong and Zhang, Lei}, booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, year={2021} }

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 17:36:23

开源图像修复模型fft npainting lama实战指南:支持二次开发

开源图像修复模型fft npainting lama实战指南&#xff1a;支持二次开发 1. 引言&#xff1a;为什么你需要了解这个图像修复工具&#xff1f; 你有没有遇到过这样的情况&#xff1a;一张珍贵的照片里有个不想要的物体&#xff0c;或者截图上的水印怎么都去不掉&#xff1f;以前…

作者头像 李华
网站建设 2026/4/23 14:01:18

Live Avatar显存溢出?在线解码功能启用实操手册

Live Avatar显存溢出&#xff1f;在线解码功能启用实操手册 1. 背景与问题定位&#xff1a;为什么你的GPU跑不动Live Avatar&#xff1f; Live Avatar是阿里联合多所高校开源的一款高性能数字人生成模型&#xff0c;基于14B参数规模的DiT架构&#xff0c;支持从文本、图像和音…

作者头像 李华
网站建设 2026/4/23 15:32:29

Qwen3-Embedding-0.6B实战案例:专利文献查重系统搭建

Qwen3-Embedding-0.6B实战案例&#xff1a;专利文献查重系统搭建 在知识产权保护日益重要的今天&#xff0c;专利文献的重复性检测成为研发机构、律所和企业法务部门的关键需求。传统查重方法依赖关键词匹配或人工比对&#xff0c;效率低且容易遗漏语义相似但表述不同的内容。…

作者头像 李华
网站建设 2026/4/23 11:28:41

B站资源下载终极指南:跨平台工具箱完整使用教程

B站资源下载终极指南&#xff1a;跨平台工具箱完整使用教程 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱&#xff0c;支持视频、音乐、番剧、课程下载……持续更新 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

作者头像 李华
网站建设 2026/4/23 12:58:02

Qwen-Image-2512-ComfyUI怎么用?内置工作流调用代码实例

Qwen-Image-2512-ComfyUI怎么用&#xff1f;内置工作流调用代码实例 1. 认识Qwen-Image-2512-ComfyUI 你可能已经听说过阿里最近开源的图像生成模型 Qwen-Image&#xff0c;而我们今天要聊的是它的最新版本——Qwen-Image-2512-ComfyUI。这个镜像不是简单的模型封装&#xff…

作者头像 李华
网站建设 2026/4/23 11:36:50

fft npainting lama模型训练数据来源:泛化能力影响因素

fft npainting lama模型训练数据来源&#xff1a;泛化能力影响因素 1. 引言&#xff1a;图像修复技术的现实需求与挑战 在数字图像处理领域&#xff0c;图像修复&#xff08;Inpainting&#xff09;是一项极具实用价值的技术。无论是去除照片中的水印、移除干扰物体&#xff…

作者头像 李华