news 2026/4/23 16:49:09

HiWave:无需额外学习即可生成 4K 图像的小波扩散创新]

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
HiWave:无需额外学习即可生成 4K 图像的小波扩散创新]

摘要

本文提出的 HiWave 是一种使用预先训练的扩散模型生成超高分辨率(如 4096 x 4096)图像的方法,无需额外的训练或架构修改。

虽然现有的基于补丁的方法可以增强局部细节,但容易造成整体结构的破坏和重叠伪影。

HiWave 首先生成低分辨率的基础图像,然后将其放大到高分辨率,并对每个补丁应用 DDIM 反变换来估计初始噪声。此外,在频域中,低频分量用于保存结构,而高频分量则用于增加细节信息。

在人体评估实验中,发现所提出的方法比传统方法质量更高,因此是高分辨率图像合成的一种新方法。

建议的方法

HiWave 包括三个阶段:基础图像生成、片段式 DDIM 反转和基于小波的细节增强。

首先,使用预先训练好的扩散模型(如 Stable Diffusion XL)生成 1024 x 1024 的基础图像,然后通过插值将图像空间放大到 4096 x 4096。

然后将放大后的图像划分为多个补丁,并对每个补丁进行 DDIM 反变换,以获得反映原始图像结构的初始噪声。

最后,使用 DWT(离散小波变换)对低频成分进行约束以保留结构,并根据 CFG(无分类器引导)对高频成分进行修正以增强细节。

通过对每个频率应用不同的引导,成功实现了整体图像的一致性和高细节增强。

实验

为了验证 HiWave 的有效性,我们进行了与 Pixelsmith(基于补丁)和 HiDiffusion(基于直接推理)的对比实验。

为了进行评估,从 LAION2B-en-aesthetic 数据集中随机选取了 1,000 个提示,每种方法都生成了 4096 x 4096 分辨率的图像。
目测比较结果显示,HiDiffusion 产生的图像结构破碎、纹理模糊,而 Pixelsmith 则倾向于产生重复的对象。

相比之下,HiWave 在保持结构完整性的同时,还具有较高的细节精确度,并大大减少了伪影的产生。此外,用户还进行了 A/B 测试,在 81.2% 的情况下,HiWave 比其他方法更受欢迎。

这从定量和定性两方面证实了所提出方法的高质量和自然的高分辨率图像生成性能。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 10:44:33

11、构建OpenStack网络基础设施:从虚拟交换机到网络资源管理

构建OpenStack网络基础设施:从虚拟交换机到网络资源管理 1. 搭建基于Open vSwitch的虚拟交换基础设施 在部分计算节点和网络节点上,我们需要安装和配置Neutron Open vSwitch机制驱动和代理。以下是详细的步骤: 1.1 更新防火墙驱动配置 需要在compute02和compute03上更新…

作者头像 李华
网站建设 2026/4/23 10:43:49

数据库死锁问题重现:测试场景构建与排查指南

一、死锁问题概述与重现价值 数据库死锁是指两个或更多事务相互等待对方释放锁资源,导致系统陷入永久阻塞的状态。对软件测试从业者而言,死锁问题重现不仅是验证系统稳定性的关键环节,更是保障数据一致性与用户体验的重要手段。 在当前的分…

作者头像 李华
网站建设 2026/4/23 13:16:58

HTTP/2服务器推送:突破性网络优化技术深度解析

HTTP/2服务器推送:突破性网络优化技术深度解析 【免费下载链接】TinyWebServer :fire: Linux下C轻量级WebServer服务器 项目地址: https://gitcode.com/gh_mirrors/ti/TinyWebServer 还在为网页加载缓慢而困扰吗?当用户访问包含多个资源的页面时&…

作者头像 李华
网站建设 2026/4/23 11:25:57

19、OpenStack网络路由:独立路由器与高可用路由实现

OpenStack网络路由:独立路由器与高可用路由实现 1. 独立路由器相关操作 在OpenStack网络中,Neutron路由器是核心组件,为用户提供了灵活设计网络以适应其应用的能力。下面介绍独立路由器的一些常见操作。 1.1 接口状态 当将接口添加到路由器后,接口状态立即显示为“Down…

作者头像 李华
网站建设 2026/4/23 12:21:51

5步搞定Phaser宠物系统:从零搭建智能跟随伙伴

5步搞定Phaser宠物系统:从零搭建智能跟随伙伴 【免费下载链接】phaser Phaser is a fun, free and fast 2D game framework for making HTML5 games for desktop and mobile web browsers, supporting Canvas and WebGL rendering. 项目地址: https://gitcode.com…

作者头像 李华
网站建设 2026/4/23 12:10:30

算法备案到底卡在哪?实操中没人明说的坑

最近几年,算法备案成了不少技术团队绕不开的一道坎。政策文件写得挺清楚,但真要动手填表、整理材料、对接监管部门,才发现处处是暗礁。很多人以为就是走个流程,结果一上手就卡住,拖了几个月都过不了。今天我就把实际操…

作者头像 李华