news 2026/4/23 14:07:25

Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

4.3. 预训练Z-Image 采用流匹配目标函数 [44, 48] 进行训练:首先通过高斯噪声
x
0

与原始图像
x
1

的线性插值构造带噪输入,即
x
t

=t⋅x
1

+(1−t)⋅x
0

;随后训练模型预测定义二者间路径的向量场的速度(即
v
t

=x
1

−x
0

)。训练目标可表示为:
L=E
t,x
0

,x
1

,y

[∥u(x
t

,y,t;θ)−(x
1

−x
0

)∥
2
],(1)
其中
θ
是可学习参数,
y
是条件嵌入。我们参考 SD3 [18],采用 logit - 正态噪声采样器将训练过程集中在中间时间步。此外,为应对多分辨率训练设置下信噪比(SNR)的波动,我们借鉴 Flux [34] 所使用的动态时间偏移策略,确保不同图像分辨率下的噪声水平得到合理缩放,从而提升训练效果。Z-Image 的预训练大致分为两个阶段:低分辨率预训练和全尺度预训练。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 17:22:38

如何实现高效分布式存储系统的性能优化与调优

如何实现高效分布式存储系统的性能优化与调优 【免费下载链接】rustfs 🚀 High-performance distributed object storage that is faster than MinIO 项目地址: https://gitcode.com/GitHub_Trending/rus/rustfs 在数据爆炸式增长的时代,分布式存…

作者头像 李华
网站建设 2026/4/21 8:38:35

Google Cloud语音与视觉AI:企业级智能应用架构深度解析

Google Cloud语音与视觉AI:企业级智能应用架构深度解析 【免费下载链接】google-cloud-go Google Cloud Client Libraries for Go. 项目地址: https://gitcode.com/GitHub_Trending/go/google-cloud-go 在数字化转型浪潮中,智能语音处理和计算机视…

作者头像 李华
网站建设 2026/4/17 16:02:36

Stressapptest专业指南:打造坚不可摧的系统稳定性防线

Stressapptest专业指南:打造坚不可摧的系统稳定性防线 【免费下载链接】stressapptest Stressful Application Test - userspace memory and IO test 项目地址: https://gitcode.com/gh_mirrors/st/stressapptest Stressapptest作为业界知名的用户空间内存与…

作者头像 李华
网站建设 2026/4/21 2:30:03

Outfit字体:解决现代设计排版难题的终极方案

Outfit字体:解决现代设计排版难题的终极方案 【免费下载链接】Outfit-Fonts The most on-brand typeface 项目地址: https://gitcode.com/gh_mirrors/ou/Outfit-Fonts 在当今数字设计领域,字体选择往往成为项目成功的关键因素。设计师们常常面临这…

作者头像 李华
网站建设 2026/4/19 21:47:41

漫画翻译新体验:智能交互如何让复杂技术变简单

漫画翻译新体验:智能交互如何让复杂技术变简单 【免费下载链接】manga-image-translator Translate manga/image 一键翻译各类图片内文字 https://cotrans.touhou.ai/ 项目地址: https://gitcode.com/gh_mirrors/ma/manga-image-translator 你是否曾在翻译漫…

作者头像 李华