Lychee Rerank MM惊艳案例：法律合同截图+条款关键词的精准段落重排序效果-深圳市維司達科技有限公司

Lychee Rerank MM惊艳案例：法律合同截图+条款关键词的精准段落重排序效果

1. 这不是普通检索，是法律文本的“智能法官”

你有没有遇到过这样的场景：手头有一份30页的PDF合同扫描件，客户突然问：“请快速找出所有关于‘不可抗力’的条款，并按重要性排序”？传统做法是手动翻页、Ctrl+F搜索、逐条比对——耗时20分钟，还可能漏掉嵌在图表说明或附录里的关键表述。

Lychee Rerank MM做的，恰恰是这件事的“降维打击”。它不依赖OCR文字提取的准确性，也不靠关键词简单匹配。它把整张合同截图当作一个整体“看懂”，再结合你输入的“违约责任”“数据保密”“终止条件”等关键词，直接对合同中所有段落（哪怕只是一页里的几个小段）进行语义级相关性打分和重排序。

这不是在找字，是在理解意图；不是在匹配字符串，是在判断法律逻辑关联度。本文将用真实法律合同截图+关键词查询的完整流程，带你亲眼见证：一张图+一句话，如何让AI像资深律师一样，瞬间锁定最相关的合同段落。

2. Lychee Rerank MM是什么：多模态重排序的底层逻辑

2.1 它不是OCR，也不是大模型问答

很多人第一反应是：“这不就是用Qwen2.5-VL直接提问吗？”——其实完全不是。Lychee Rerank MM是一个专为重排序（Rerank）任务设计的精调系统，它的核心使命只有一个：给已有的候选文档列表，重新打分、重新排序。

举个例子：

你先用传统方法（比如Elasticsearch）从合同库中召回100个可能相关的段落；
然后把这100个段落，连同你的查询（比如“跨境数据传输合规要求”），一起喂给Lychee Rerank MM；
它会逐一对每个段落计算一个0~1之间的精细相关分，最后输出一个按分数从高到低排列的新列表。

而本文展示的“法律合同截图+关键词”案例，是它更强大的一种用法：Query是图文混合（一张合同截图 + 一段文字指令），Document是多个纯文本段落。系统真正读懂了截图里的排版结构、表格位置、加粗标题，再结合文字指令的深层意图，做出远超纯文本模型的判断。

2.2 为什么Qwen2.5-VL是它的“眼睛”和“大脑”

Qwen2.5-VL（7B版本）之所以被选作基座，关键在于它具备三项法律文本处理刚需能力：

视觉结构感知力：能识别合同截图中的标题层级（如“第5.2条”“附件三”）、表格边框、加粗/斜体强调、页眉页脚等非文字线索，这些在法律效力认定中至关重要；
长上下文语义锚定：合同条款常跨页引用（如“详见本协议第8条及附件四”），Qwen2.5-VL的128K上下文窗口能同时“看见”主文和附件位置关系；
法律术语微粒化理解：对“视为”“不得”“应”“可”等中文法律虚词的语义强度差异有敏感建模，避免把“乙方可选择终止”误判为强约束条款。

这不是通用多模态模型的“副业”，而是哈工大（深圳）NLP团队针对法律、金融、政务等高精度场景，专门打磨出的“专业级重排序引擎”。

3. 法律场景实测：三步完成合同段落精准重排序

我们用一份真实的《技术开发委托合同》扫描件（含封面、签字页、正文、附件共12页）进行实测。目标：找出所有与“知识产权归属”直接相关的条款，并按法律约束力强度排序。

3.1 第一步：准备Query——一张图+一句话，缺一不可

在Lychee Rerank MM的Streamlit界面中，我们这样设置Query：

上传图片：选择合同第3页截图（该页含“知识产权”章节标题及前两条正文）；
输入指令：Given a contract clause, determine whether it defines the ownership of intellectual property rights.

注意：这里没有写“找知识产权条款”，而是用法律人思维描述判断标准——“是否定义了知识产权权利归属”。指令越接近法律逻辑，结果越精准。

3.2 第二步：准备Documents——15个候选段落，覆盖全文关键位置

我们从合同全文中人工提取15个可能相关的段落（确保不遗漏），包括：

正文第4.1条（明确约定“开发成果知识产权归甲方所有”）
附件一《交付物清单》末尾小字“知识产权随交付物一并转移”
签字页下方“本合同未尽事宜，按《民法典》执行”
第7.3条“乙方保证不侵犯第三方知识产权”（这是义务条款，非归属条款）
封面页“本合同一式两份，双方各执一份”（明显无关，用于测试误判率）

全部以纯文本形式粘贴进批量模式输入框，每段用---分隔。

3.3 第三步：运行与结果——分数差异揭示法律逻辑深度

点击“Run Rerank”后，系统在A10显卡上耗时约8.2秒，返回如下排序（截取Top 5）：

排名	段落内容（节选）	得分	关键判断依据
1	“第4.1条本项目所有开发成果的知识产权（包括但不限于著作权、专利权、商标权）均归甲方独家所有。”	0.982	明确主语（甲方）、客体（所有开发成果）、权利类型（著作权/专利权/商标权）、归属方式（独家所有）
2	“附件一：交付物清单…知识产权随交付物一并转移至甲方。”	0.937	虽在附件，但使用“随…一并转移”这一法律上明确的权利变动表述
3	“第5.2条乙方承诺，在开发过程中不使用任何第三方享有知识产权的技术。”	0.612	属于义务性条款（不侵权），非权利归属条款，得分显著低于前两项
4	“第8.4条本合同终止后，乙方应返还所有甲方提供的技术资料。”	0.428	涉及资料返还，但未提知识产权归属，属衍生义务
5	“封面页：本合同一式两份，双方各执一份。”	0.089	无任何知识产权语义，得分趋近于0

关键发现：

系统不仅正确识别了最核心的第4.1条（得分0.982），还将附件中的隐含归属条款（0.937）排在第二——这正是律师审阅合同时会重点关注的“明示+默示”双重保障；
把“不侵权”义务条款（0.612）和“资料返还”条款（0.428）严格区分，证明它理解法律概念间的逻辑层级；
最低分段落（0.089）几乎为零，说明误判率极低。

4. 为什么它比传统方法更可靠：三个硬核优势

4.1 不依赖OCR质量，直击图像语义

传统方案必须先OCR识别文字，再做文本检索。但合同扫描件常有以下问题：

扫描歪斜导致OCR错行（如把“第4条”识别成“第4条乙方”）；
表格内文字被识别成乱序字符串；
手写批注干扰正文识别。

Lychee Rerank MM跳过OCR环节，直接以原始图像为输入。它看到的不是“第4.1条”，而是标题字体加粗、字号放大、居左对齐、下方有下划线这一整套视觉信号——这些恰恰是法律文本中“条款编号”的典型视觉锚点。图像即语义，省去中间环节，准确率自然提升。

4.2 理解法律表述的“程度副词”，拒绝一刀切

法律效力强弱，往往藏在细微用词中。我们测试了两组对比段落：

A段：“甲方享有该成果全部知识产权”（得分0.971）
B段：“甲方原则上享有该成果知识产权”（得分0.326）

系统对“原则上”这一限制性副词极其敏感，将其得分压至0.3以下。而传统关键词检索会把两段都标为“高相关”，因为都含“甲方”“知识产权”——这在法律风险审查中是致命缺陷。

4.3 支持“图文-文本”跨模态推理，捕捉隐含逻辑

合同中常有“见附件X”“参见第Y条”等跨位置引用。我们测试了一段文字：“具体验收标准见附件二《技术指标表》”。系统在分析时，会结合Query中上传的附件二截图（含表格），自动建立图文关联，对“验收标准”相关段落给出更高权重。这种跨页面、跨模态的逻辑缝合能力，是纯文本模型无法实现的。

5. 实战建议：如何用好这个法律“智能助手”

5.1 指令编写心法：用法律人语言，而非程序员语言

错误示范：find paragraphs containing "intellectual property"
正确示范：Determine if this clause explicitly assigns ownership of intellectual property rights to a party.

关键区别：

“containing”是字符串匹配思维；
“explicitly assigns ownership”是法律行为判断思维。
系统训练时使用的指令微调数据，正是大量此类法律逻辑描述，用对指令，效果立现。

5.2 图片上传技巧：聚焦“信息密度区”，而非全页

不要上传整页合同扫描件。建议：

对于条款查询，只截取含标题+前3行正文的区域（如“第4.1条本项目所有…”）；
对于表格类查询（如“付款方式”），截取表格本身+表头；
避免包含页眉页脚、空白边距等低信息密度区域——这能减少显存占用，加快推理速度。

5.3 结果解读指南：分数不是绝对值，而是相对标尺

得分>0.85：可直接作为核心依据引用；
得分0.7~0.85：需人工复核上下文，可能存在限定条件；
得分<0.5：基本无关，但建议扫一眼，确认是否为特殊表述（如否定式条款：“除非另有约定，否则…”）；
相邻段落得分差>0.2：说明系统对法律逻辑边界判断清晰，可信度高。

6. 总结：让法律文本处理回归“理解”，而非“匹配”

Lychee Rerank MM在法律合同场景的价值，不在于它有多快，而在于它第一次让AI具备了类似人类律师的“文本诊断能力”：

它不满足于找到“有这个词”的段落，而是追问“这段话在法律上究竟意味着什么”；
它不把合同当作文本流，而是当作一个有结构、有逻辑、有视觉线索的法律实体；
它的输出不是冷冰冰的列表，而是带着法律效力刻度的相关性排序。

对于律所、法务部、合规团队来说，这意味着：

合同审阅时间从小时级压缩到分钟级；
重大条款遗漏风险大幅降低；
新人律师也能快速掌握资深律师的条款判断逻辑。

技术终将退场，而法律人的专业判断力，正通过这样的工具被前所未有地放大。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

Lychee Rerank MM惊艳案例：法律合同截图+条款关键词的精准段落重排序效果