NewBie-image-Exp0.1怎么用？create.py交互脚本使用入门必看-深圳市維司達科技有限公司

NewBie-image-Exp0.1怎么用？create.py交互脚本使用入门必看

NewBie-image-Exp0.1
本镜像已深度预配置了 NewBie-image-Exp0.1 所需的全部环境、依赖与修复后的源码，实现了动漫生成能力的“开箱即用”。通过简单的指令，您即可立即体验 3.5B 参数模型带来的高质量画质输出，并能利用独特的 XML 提示词功能实现精准的多角色属性控制，是开展动漫图像创作与研究的高效工具。

1. 快速上手：从零生成第一张图

如果你刚启动容器，别担心复杂的配置。这个镜像已经帮你把所有环境、依赖和模型权重都准备好了，连常见的代码 Bug 都修完了。你现在要做的，就是运行几条命令，马上看到成果。

1.1 进入项目目录并运行测试脚本

打开终端，依次输入以下命令：

cd .. cd NewBie-image-Exp0.1 python test.py

这三步的意思分别是：

回到上级目录
进入NewBie-image-Exp0.1项目文件夹
执行内置的测试脚本

执行完成后，你会在当前目录下看到一张名为success_output.png的图片。这就是你的第一张由 3.5B 大模型生成的动漫图像！

小贴士：如果报错提示找不到test.py，请确认是否正确进入了NewBie-image-Exp0.1目录。可以用ls命令查看当前有哪些文件。

1.2 看懂输出结果

这张图不只是“跑通了”那么简单。它代表的是一个完整推理流程的成功闭环——从文本理解、特征编码到图像解码，整个链条都已经为你调好。你可以双击打开图片看看细节，比如发丝边缘是否清晰、色彩过渡是否自然。

接下来，我们就可以开始玩点更有趣的了。

2. 深入使用：create.py 交互式生成脚本详解

test.py是一次性运行的脚本，适合验证环境。而真正让你可以反复尝试、不断调整提示词的利器，是另一个脚本：create.py。

2.1 什么是 create.py？

create.py是一个交互式对话生成脚本。它的最大特点是：支持循环输入提示词，无需每次修改代码或重启程序。

这意味着你可以连续生成多张图，边看效果边调整描述，就像跟 AI 对话一样自然。

使用方法很简单：

python create.py

运行后，你会看到类似这样的提示：

请输入你的 XML 提示词（输入 'quit' 退出）: >

这时你就可以直接输入一段 XML 格式的描述，回车后模型会立刻开始生成，并自动保存图片。

2.2 实际操作演示

假设你想生成一位蓝发双马尾少女，风格为高质量动漫风。你可以这样输入：

<character_1> <n>miku</n> <gender>1girl</gender> <appearance>blue_hair, long_twintails, teal_eyes, school_uniform</appearance> </character_1> <general_tags> <style>anime_style, high_quality, sharp_focus</style> </general_tags>

回车后，脚本会显示进度条，几秒到十几秒后（取决于显卡性能），一张新图就生成好了，默认命名为output_时间戳.png。

然后提示符再次出现，你可以继续输入新的提示词，无限循环下去。

优势总结：
不用手动改代码
可快速试错不同设定
适合做创意探索或批量测试

3. 核心功能解析：XML 结构化提示词系统

NewBie-image-Exp0.1 最强大的地方，不是参数量大，而是它引入了XML 结构化提示词机制。这让你能像写说明书一样，精确控制每一个角色的属性。

3.1 为什么用 XML 而不是纯文本？

传统的文生图模型靠自然语言描述，比如“一个蓝发女孩，穿着校服，站在樱花树下”。但这种写法容易模糊，AI 可能忽略某些细节，或者把多个角色搞混。

而 XML 把信息结构化了，相当于给每个元素打上标签，让模型知道：“这是角色1的名字”、“这是她的外貌特征”。

这就像是从“口头描述”升级到了“表格填写”，准确度大幅提升。

3.2 XML 提示词的基本结构

完整的结构分为两个主要部分：

<character_X> <n>角色名</n> <gender>性别标签</gender> <appearance>外观描述（逗号分隔）</appearance> </character_X> <general_tags> <style>整体风格</style> </general_tags>

各字段说明：

字段	作用	示例
`<n>`	角色昵称（用于内部识别）	miku, luna, character_a
`<gender>`	性别/人数标签	1girl, 2boys, group
`<appearance>`	外貌关键词组合	pink_hair, cat_ears, glasses
`<style>`	全局画风控制	anime_style, watercolor, sketch

3.3 多角色控制实战案例

想试试两个角色同框？没问题。只需要添加第二个<character_2>块即可。

例如：

<character_1> <n>luna</n> <gender>1girl</gender> <appearance>pink_hair, short_hair, red_eyes, casual_clothes</appearance> </character_1> <character_2> <n>kaito</n> <gender>1boy</gender> <appearance>black_hair, spiky_hair, blue_jacket, backpack</appearance> </character_2> <general_tags> <style>anime_style, outdoor_scene, daytime</style> </general_tags>

这样就能生成一男一女在户外场景互动的画面，而且不会出现特征错乱（比如把男生的帽子戴到女生头上）。

经验分享：建议给每个角色起个简单名字（如 char1, girlA），方便自己区分和调试。

4. 文件结构与自定义开发指南

了解完基本使用，我们来看看镜像里的文件是怎么组织的，方便你后续做个性化调整。

4.1 主要目录与文件一览

进入NewBie-image-Exp0.1后，你会看到这些内容：

. ├── create.py # 交互式生成脚本（推荐新手使用） ├── test.py # 单次测试脚本（适合验证环境） ├── models/ # 模型主干网络定义 ├── transformer/ # 已下载的 DiT 主模块权重 ├── text_encoder/ # 文本编码器（Gemma 3 + Jina CLIP） ├── vae/ # 图像解码器（负责最终高清输出） ├── clip_model/ # 图像语义对齐模块 └── outputs/ # （可选）存放生成图片的目录

4.2 如何修改默认行为？

虽然create.py支持实时输入，但如果你想固定某种风格，也可以直接编辑脚本本身。

以create.py为例，找到这一行：

prompt = input("请输入你的 XML 提示词（输入 'quit' 退出）:\n> ")

你可以在上面加一句默认值，比如：

default_prompt = """<character_1><n>default</n><gender>1girl</gender><appearance>long_hair, smiling, soft_lighting</appearance></character_1>""" prompt = input(f"请输入你的 XML 提示词（回车使用默认，输入 'quit' 退出）:\n> ") or default_prompt

这样即使你不输入任何内容，按回车也能用预设模板生成。

4.3 批量生成小技巧

如果你要做一系列风格统一的图，可以在create.py外面套个 shell 循环：

for i in {1..5}; do echo "生成第 $i 张..." python create.py << EOF <character_1> <n>gen$i</n> <gender>1girl</gender> <appearance>random_style, unique_outfit</appearance> </character_1> <general_tags> <style>anime_style, high_detail</style> </general_tags> EOF done

当然，这需要你对 shell 有一定了解。更简单的方式是在 Python 脚本里加个 for 循环，传入不同的 prompt 列表。

5. 常见问题与优化建议

尽管这个镜像已经做了大量优化，但在实际使用中仍可能遇到一些情况。以下是高频问题及应对方案。

5.1 显存不足怎么办？

模型运行时大约占用14-15GB 显存。如果你的 GPU 小于 16GB，可能会出现 OOM（内存溢出）错误。

解决办法：

降低分辨率：在生成脚本中将图像尺寸从1024x1024改为768x768或512x512
关闭 FlashAttention：虽然速度快，但更吃显存，可在初始化时设置use_flash_attn=False
使用 CPU 卸载（不推荐）：部分组件移至 CPU，速度极慢

建议硬件配置：NVIDIA RTX 3090 / 4090 / A100 及以上级别显卡

5.2 生成图像模糊或失真？

可能是以下原因导致：

问题	可能原因	解决方法
整体模糊	VAE 解码异常	检查`vae/`目录权重是否完整
脸部扭曲	提示词冲突	避免同时写`young`和`old`类标签
色彩偏暗	缺少光照描述	加入`bright_lighting`,`soft_shadows`等词

5.3 如何提升生成稳定性？

几个实用建议：

在<appearance>中尽量使用社区通用标签（如long_hair,cat_ears），避免生造词汇
控制总 token 数不超过 77 个（XML 内容也算）
多用<general_tags>统一风格，减少重复描述

6. 总结：掌握 create.py，开启高效创作

通过本文，你应该已经掌握了 NewBie-image-Exp0.1 镜像的核心使用方式，特别是如何利用create.py实现快速、灵活的交互式图像生成。

6.1 关键要点回顾

开箱即用：无需安装依赖、修复 Bug 或下载模型，直接运行即可
交互生成：create.py支持循环输入，极大提升调试效率
结构化提示：XML 格式让多角色控制更精准，避免特征混淆
高质量输出：3.5B 参数模型配合 bfloat16 推理，兼顾速度与画质

6.2 下一步你可以尝试

编写自己的 XML 模板库，一键调用常用角色设定
将生成结果用于漫画分镜、游戏角色设计等实际项目
结合其他工具（如 GFPGAN）进行人脸增强后处理

现在，你已经具备了使用这套系统进行稳定创作的能力。不妨马上打开终端，运行python create.py，亲手生成属于你的第一张结构化动漫图像吧！

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

NewBie-image-Exp0.1怎么用？create.py交互脚本使用入门必看