ChatGLM3-6B-128K创意写作：长篇故事连贯性测试-深圳市維司達科技有限公司

ChatGLM3-6B-128K创意写作：长篇故事连贯性测试

你有没有想过，让AI帮你写一部几十万字的长篇小说，而且还能保证前后情节不矛盾、人物性格不跑偏？这听起来像是天方夜谭，但ChatGLM3-6B-128K的出现，让这个想法变得触手可及。

今天我们不聊部署，不谈参数，就单纯看看这个号称能记住128K上下文（相当于9万多汉字）的模型，在创意写作这个最考验“记忆力”和“逻辑性”的领域，到底表现如何。我花了几天时间，用它来续写一个已经写了十几章的奇幻故事，结果让我有点意外。

1. 测试准备：一个精心设计的“记忆迷宫”

为了真正考验模型的长期记忆能力，我设计了一个相当复杂的测试场景。这可不是随便写个开头就让AI接着编，而是构建了一个充满细节和伏笔的“记忆迷宫”。

1.1 故事背景设定

我创建了一个名为《星尘旅人》的奇幻故事，目前已经手动写了前15章，大约4.5万字。这个故事有几个特点：

多线叙事：三条故事线并行推进，主角团在不同地点同时行动
复杂人物关系：12个主要角色，每个人都有自己的背景故事和动机
大量伏笔：前15章埋下了超过30个伏笔，有些很隐晦
世界观细节：虚构的魔法体系、地理环境、历史事件都有详细设定

故事讲的是在一个魔法与科技并存的世界里，一群年轻人寻找失落文明“星尘遗迹”的冒险。听起来有点老套？但关键在于细节。

1.2 测试方法设计

我的测试方法很简单，但很残酷：

完整输入前文：把4.5万字的前15章全部作为上下文输入给模型
指定续写要求：给出具体的续写指令，包括情节走向、人物互动等
评估标准：
- 情节连贯性：新内容是否与前文逻辑一致
- 人物一致性：角色性格、说话方式是否保持统一
- 伏笔回收：是否记得并合理使用之前埋下的伏笔
- 风格统一：文风、叙事节奏是否与之前保持一致

我准备了5个不同的续写任务，每个都针对不同的记忆挑战。

2. 效果展示：当AI成为“合著者”

说实话，开始测试前我并没抱太大期望。毕竟让AI记住4.5万字的所有细节，还要在此基础上进行创造性写作，这要求实在太高了。但实际结果让我不得不重新审视这个模型的能力。

2.1 任务一：复杂人物对话场景

我的指令：“请续写第16章的开头部分。场景：主角艾莉亚和反派塞拉斯在‘遗忘图书馆’对峙。要求：1. 体现两人之前的恩怨（塞拉斯杀了艾莉亚的导师） 2. 对话中要提到第三章中提到的‘星尘契约’ 3. 艾莉亚的性格应该是外冷内热，塞拉斯则是优雅但残忍”

模型生成的结果（节选）：

图书馆的穹顶高得看不见尽头，书架上爬满了发光的藤蔓。塞拉斯站在一扇彩绘玻璃窗前，月光透过玻璃，在他苍白的脸上投下斑驳的影子。
“艾莉亚，我们又见面了。”他的声音平静得像在讨论天气，“上次见面时，你的导师还在教你如何解读星尘契约的第三条款。可惜，他没能看到你现在的成长。”
艾莉亚的手指握紧了腰间的短剑。她记得第三章里，导师指着羊皮卷上的古老文字说：“星尘契约不是束缚，是选择。”现在，这句话在她耳边回响。
“你提到契约，却忘了它的本质。”她的声音比想象中更稳，“导师教我的不是仇恨，是责任。而你，塞拉斯，你选择了背叛。”
塞拉斯轻笑一声，从书架上抽出一本厚重的典籍。“背叛？亲爱的，我只是做出了不同的选择。就像你选择记住仇恨，而我选择……遗忘。”

我的分析：

记忆准确：模型准确记得“星尘契约”是在第三章首次出现，并且知道这是导师教给艾莉亚的内容
性格一致：艾莉亚的“外冷内热”表现得很好——表面冷静，但内心情绪通过握剑的动作透露；塞拉斯的“优雅但残忍”也到位
恩怨体现：自然提到了塞拉斯杀导师的往事，没有生硬插入
文风统一：描写风格、对话节奏都和前15章保持一致

这已经超出了我的预期。模型不仅记得细节，还能把这些细节自然地融入到新的创作中。

2.2 任务二：多线叙事切换

我的指令：“切换到另一条故事线。描述雷欧和米拉在‘迷雾峡谷’寻找‘时光之泉’的过程。要求：1. 雷欧有恐高症（第七章提到过） 2. 要使用第五章中出现的‘寻路罗盘’ 3. 峡谷的环境描写要呼应第二章对地理特征的设定”

模型生成的结果（节选）：

迷雾峡谷的岩壁近乎垂直，雷欧每往下爬一步，都能感觉到胃在抽搐。第七章那次从钟楼摔下来的经历，让他的恐高症变本加厉。
“抓紧绳子！”米拉在下方喊道，她的声音在峡谷中回荡，“你的罗盘还在工作吗？”
雷欧用牙齿咬住登山绳，腾出一只手从怀里掏出那个青铜罗盘。第五章里，古董店老板说这是“会呼吸的指南针”，现在指针正疯狂旋转，然后猛地指向峡谷深处的一个裂缝。
“它找到了……但方向是往下。”雷欧的声音有些发颤。他想起第二章的地理志记载：迷雾峡谷底部有地下河，河水因特殊矿物呈现翡翠色。而现在，透过浓雾，他隐约看到了那抹熟悉的绿色。

我的分析：

细节记忆惊人：模型记得雷欧的恐高症是在第七章提到的，记得罗盘来自第五章，甚至记得第二章对峡谷地理特征的描述
情感描写到位：恐高症的生理反应（胃抽搐、声音发颤）写得很真实
道具使用合理：罗盘不是摆设，而是推动情节的关键
环境连贯：峡谷的描写不仅呼应前文，还增添了新的细节（翡翠色河水）

这个任务特别能体现128K上下文的威力。模型需要在4.5万字中精准定位三个分散在不同章节的细节，然后把它们有机结合起来。它做到了。

2.3 任务三：伏笔回收与拓展

我的指令：“回收第9章埋下的伏笔‘破碎的怀表’。场景：老工匠格里姆在修理这个怀表时发现了隐藏的信息。要求：1. 怀表是第9章中主角在废墟中找到的 2. 怀表上刻有‘致时光的守护者’ 3. 格里姆应该提到他年轻时见过类似的机关（呼应第11章他对古代机械的了解）”

模型生成的结果（节选）：

格里姆的工作台上堆满了齿轮和发条。他戴着单片放大镜，小心翼翼地用镊子夹起怀表内部的一片碎裂的蓝宝石表盘。
“这可不是普通的怀表。”他喃喃自语，声音里带着久违的兴奋，“第九纪的星象仪技术……我年轻时在王都的皇家档案馆见过类似的机关。那时候我还是个学徒，跟着导师研究古代机械。”
他轻轻按压表壳边缘一个几乎看不见的凸起。怀表发出轻微的咔嗒声，表盘翻转，露出背面蚀刻的密文。在“致时光的守护者”这行字下方，还有一行更小的字：“当三颗星辰连成一线，遗迹之门将再度开启。”
格里姆倒吸一口凉气。他想起了第十一章里研究过的星象文献——三颗星辰，指的难道是“命运三角”？

我的分析：

完美回收伏笔：不仅记得怀表来自第9章，还记得上面的刻字
知识连贯：格里姆对古代机械的了解在第11章有详细描写，这里自然衔接
新增信息合理：发现的密文既解释了怀表的重要性，又引出了新的谜团
角色专业度：格里姆作为老工匠的专业术语和操作描写很到位

这是最让我惊讶的部分。模型不仅记得“有这么一个怀表”，还记得关于它的所有细节，并且能在此基础上进行合理的拓展创作。

3. 写作风格控制技巧实测

在测试过程中，我也尝试了不同的写作风格控制方法。ChatGLM3-6B-128K在这方面表现得相当灵活。

3.1 通过指令控制文风

我发现，只要在指令中明确描述想要的风格，模型就能很好地调整：

指令示例：“用海明威式的简洁硬汉风格写一段战斗描写。句子要短，少用形容词，多用动词。”

生成结果：

剑相交。金属撞击。他后退一步。地面湿滑。雨水混着血。对方又冲过来。他侧身。挥剑。命中肋骨。听到断裂声。对方倒下。他没停。继续前进。

指令示例：“用普鲁斯特式的细腻心理描写写一段角色回忆往事的场景。注重感官细节和内心独白。”

生成结果：

茶杯的热度透过瓷壁传到指尖，就像多年前那个冬夜，祖母的手握住我冰凉的手指。茶香让我想起她衣柜里樟脑丸和薰衣草混合的气味——一种属于安全与童年的气味。窗外的雨声渐渐模糊，我仿佛又回到了那间有着桃心木地板的客厅，壁炉里的柴火噼啪作响，而我知道，无论外面多么寒冷，这里总是温暖的。

3.2 通过示例控制风格

更有效的方法是给模型一个风格示例：

我的做法：先手动写一段具有特定风格的文字，然后告诉模型：“请用类似的风格续写接下来的内容。”

例如，我写了一段带有古龙风格的对话：

“你来了。” “我来了。” “你不该来。” “但我还是来了。”

然后让模型续写，它生成的内容确实保持了那种简洁、留白、充满张力的风格。

3.3 角色语气的一致性维护

对于长篇故事来说，保持角色语气一致是关键。我发现如果在前文中某个角色的对话很有特色，模型在续写时能很好地保持这种特色。

比如故事里有个说话喜欢引用古籍的老学者，每次出场都文绉绉的。在续写中，模型给他的对话依然是：

“《星象考源》有云：‘辰宿列张，各司其职。’如今三星移位，恐非吉兆啊。”

这种一致性不是简单的词汇模仿，而是整个语言节奏、用词习惯的保持。

4. 能力边界与局限性

当然，ChatGLM3-6B-128K不是完美的。在测试中我也发现了它的一些局限性。

4.1 记忆的“衰减效应”

虽然模型能记住大部分关键细节，但对于一些非常细微的、只出现过一次的描述，有时会出现偏差。

例如，前文中提到某个配角“左眼角有颗泪痣”，在续写中模型有时会写成“右眼角”或直接忽略这个细节。这倒不影响情节，但如果是关键伏笔就可能出问题。

4.2 复杂逻辑推理的挑战

当需要基于多个分散的线索进行复杂推理时，模型有时会“偷懒”或选择简单的连接方式。

比如，前文有三个不同的线索都指向同一个阴谋，但模型在续写时可能只使用其中两个，或者用比较直接的方式揭露阴谋，缺少那种“把所有线索串起来”的巧妙感。

4.3 创造性 vs 保守性

模型在续写时倾向于“安全”的选择——符合前文逻辑、不引入太大矛盾、保持风格统一。这保证了连贯性，但有时会牺牲一些大胆的创意。

我尝试让它“写一个意想不到的转折”，结果生成的转折虽然合理，但不够“意想不到”。它更像是一个谨慎的合著者，而不是天马行空的创意伙伴。

5. 实用建议：如何用好这个创意写作工具

基于我的测试经验，如果你也想用ChatGLM3-6B-128K进行长篇创作，这里有一些实用建议：

5.1 前期准备要做足

建立人物卡片：在故事开始前，用简单的语言告诉模型每个角色的关键特征。比如：“艾莉亚，女，22岁，魔法学院毕业生，性格外冷内热，擅长风系魔法，讨厌吃胡萝卜。”
梳理关键设定：把重要的世界观设定、魔法规则、地理信息等整理成清单，可以在需要时提醒模型。
标记伏笔：如果你埋了重要的伏笔，可以在文中用注释的方式标记，或者单独记录。

5.2 续写指令要具体

不要只说“继续写”，要像导演给演员说戏一样具体：

明确场景：“接下来是夜晚，在皇宫花园，两人秘密会面”
指定人物：“对话双方是王子和大臣，王子怀疑大臣背叛”
控制节奏：“这段要紧张刺激，用短句，加快叙事节奏”
提醒细节：“记得大臣有咳嗽的老毛病，对话中要体现”

5.3 分段续写，定期回顾

不要一次性让模型续写太多。我的经验是：

每次续写2000-3000字为宜
每续写3-4章，就回头让模型“总结目前的故事进展和人物关系”
发现偏差及时纠正，可以告诉模型：“这里不对，艾莉亚的剑应该是银色的，不是金色”

5.4 善用风格控制

给参考：如果你想要某种风格，找一段类似风格的文字给模型看
定基调：每章开始前，用几个词定义这章的基调，如“悬疑压抑”或“轻松幽默”
调比例：控制描写、对话、心理活动的比例，比如“这章对话为主，描写简练”

6. 总结

测试完ChatGLM3-6B-128K在长篇创意写作上的表现，我的感受很复杂。一方面，它的记忆能力和连贯性保持确实令人印象深刻——能记住4.5万字中的大量细节，并在续写中合理运用，这已经超越了大多数写作工具的范畴。

另一方面，它毕竟不是人类作者。那种深层的主题挖掘、精妙的结构设计、突破性的创意飞跃，还是需要人类的主导。但作为一个“超级助理”，它无疑是合格的。

如果你正在创作长篇小说，或者需要保持大型文档的连贯性，这个模型值得一试。它不会替你完成所有工作，但能帮你记住所有细节，保持风格统一，避免前后矛盾——这些恰恰是长篇创作中最耗时耗力的部分。

用下来的感觉是，它像一个记忆力超强、文笔不错、但创意相对保守的合著者。你需要告诉它方向，它负责把路铺平。这种合作模式，对于很多创作者来说，可能正是最需要的。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

ChatGLM3-6B-128K创意写作：长篇故事连贯性测试