城市数字治理中的大模型应用架构：以上海云宇星空大模型为例-深圳市維司達科技有限公司

当下，政务大模型的落地路径，正在分化出两条截然不同的跑道：
当不少地方政府选择以“轻量化”的方式，将DeepSeek等通用模型快速接入政务系统时，上海市规划和自然资源局给出了一条更“重”、更深的路线。
近日，由上海市规划资源局与商汤大装置联合打造的全国规划资源领域首个基础大模型“云宇星空大模型”（专业版）上线。这并非一个简单的对话机器人，而是一个6000亿参数、深度嵌入规资全业务系统的行业大模型：它能调取地图、做统计，能理解规划图纸、会写报告，覆盖从知识检索、空间分析到决策支撑的完整工作闭环。
与“把AI接进来”不同，上海选择的是另一条路径——把AI装进去。

一、问题背景：从通用模型到政务模型的鸿沟

1.1 政务场景的特殊性

传统的通用大模型（如GPT系列）在政务应用中面临三大核心痛点：

数据隐私风险：政务数据涉及公民信息、资源配置、城市规划等敏感内容，直接调用云端API存在合规风险
知识结构差异：城市治理需要特定领域知识（如规划法规、行政流程、资源约束），通用模型的知识库可能不适配
可解释性要求：政府决策需要清晰的决策链路，黑盒模型难以满足审计和问责需求

1.2 上海的解决思路：本地化闭环

上海市规划资源局与商汤大装置联合打造的云宇星空大模型，采取了"轻重模式"的双轨策略：

轻量化路线：将DeepSeek等通用模型接入政务系统 本地化路线：构建云宇星空专业版（含6000+参数量级的垂直模型）

这一设计体现了对"模型选型不是非此即彼"的深刻理解。

二、架构设计：云宇星空大模型的技术方案

2.1 核心架构层次

云宇星空大模型采用了分层递进式的多模型体系：

L1 层：基座大模型

时空感知主体：注入城市尺度的时空编码能力
参数高效微调：使用LoRA等轻量级适配方法，避免对基础模型的大规模改动
知识融合：将行业垂直知识通过检索增强生成（RAG）动态注入

L2 层：垂直专业模型

覆盖10个一级知识领域、80个二级知识领域
包括：生态保护、城市更新、市政设施管理、历史文化遗产等
每个垂直域采用领域特定的预训练数据集和微调策略

L3 层：应用基础模型

能调图、会统计、能处理规划用纸：三项关键能力
支持直接处理二维、三维空间数据
内置对城市规划文档的结构化理解

2.2 关键技术突破

能调图（Spatial Data Understanding）

传统模型：文本→向量→语义表示 云宇星空：地理栅格→时空编码→多维感知 实现方式： - 将城市地块、建筑、道路等转换为特征编码 - 建立地理邻接关系的图神经网络表示 - 支持"区域老龄化程度变化超过50%"这类时空约束查询

会统计（Quantitative Analysis）

直接调用数据库进行统计聚合
支持跨多个数据源的复杂查询（如2024年浦东新区土地出让金统计）
生成"脱敏处理后"的答案，确保数据产品化不违反隐私约束

能处理规划用纸（Document Understanding）

建立对规划图纸、约束条件、配套要求的结构化理解
通过多模态编码，支持图文混合的规划文档解析
实现"按图索骥"的规划推理能力

2.3 数据流与隐私保护

业务流程图： 用户输入 ↓ 请求分类器（轻重模型判别） ├→ 简单查询 → DeepSeek（快速响应） ├→ 需要隐私的复杂查询 → 本地专业版（完全闭环） └→ 跨域融合查询 → 混合方案 ↓ 数据脱敏层（敏感信息掩码） ↓ 模型推理 + 事实核验 ↓ 结果合规检查 ↓ 返回结果

关键设计：采用"业务专家在下，模型在业务系统上"的架构，而非"接入"的被动模式。这样确保了：

政务数据永远不出政务网络
知识集成发生在业务应用侧
模型调用仅用于推理，不用于存储

三、工程实践：从模型到系统的关键决策

3.1 双版本策略的深层逻辑

维度	专业版	公众版
数据源	业务系统的核心数据	脱敏后的公开信息
用户	政府工作人员	市民、企业
隐私要求	极高	相对宽松
实时性	高（秒级更新）	中等（周期性更新）
可解释性	必须支持追溯	友好性优先

3.2 "15分钟生活圈"案例深度解析

文中提到的规划场景——"如果一个区域老龄化程度变化超过50%，继续按既定规划配置幼儿园、显然不合适"——体现了模型的约束感知能力：

# 伪代码：约束感知推理 class PlanningConstraintModel: def evaluate_plan(self, district, plan): # 1. 时空特征提取 demographic_change = self.extract_demographic_trend( district, time_window="past_5_years" ) # 2. 硬约束检查（规范性） if demographic_change['aging_ratio'] > 0.5: # 触发规划重评 return self.trigger_plan_review( reason="demographic_shift", recommended_facilities=["elderly_care", "community_center"] ) # 3. 软约束优化（可选性） facility_config = self.optimize_facility_placement( constraints=[ traffic_capacity, land_availability, service_coverage_15min ], objectives=["minimize_investment", "maximize_coverage"] ) return facility_config

这体现了从"规则驱动"到"数据驱动约束求解"的升级。

3.3 "规划AI伙伴"的定位

文中关键论述："规划AI不是替代规划师，而是打造一个'规划AI伙伴'"

这意味着系统设计遵循以下原则：

工作流集成而非替代
- 规划师仍是决策者
- AI提供证据和备选方案
- 最终选择权在人类
可追溯性而非黑盒输出
- 每个建议都附带推理过程
- 数据来源可溯源
- 约束冲突可解释
持续学习而非一成不变
- 支持规划师反馈
- 累积行业最佳实践
- 周期性模型更新

四、技术层面的三层递进

4.1 模型层：多模型协同框架

Base Model Layer ├─ DeepSeek（通用能力） ├─ Claude（分析能力） └─ Domain-Specific Models（垂直能力） ├─ Spatial Model（地理信息处理） ├─ Document Model（规划文件理解） └─ Quantitative Model（统计分析）

4.2 系统层：创建性地构建了"智能度分级"

╔════════════════════════════════════════════╗ ║ 云宇星空基座大模型 ║ ║ ┌──────────────────────────────────────┐ ║ ║ │ 时空感知主体 │ ║ ║ │ 亲类模型回配 │ ║ ║ │ 知识融合指令 │ ║ ║ └──────────────────────────────────────┘ ║ ║ ↓ ║ ║ ┌──────────────────────────────────────┐ ║ ║ │ 业务领域应用大模型 │ ║ ║ │ ┌─────────────┐ ┌─────────────┐ │ ║ ║ │ │ 结构化数据 │ │ 半结构化 │ │ ║ ║ │ │ 处理能力 │ │ 文档理解 │ │ ║ ║ │ └─────────────┘ └─────────────┘ │ ║ ║ └──────────────────────────────────────┘ ║ ║ ↓ ║ ║ ┌──────────────────────────────────────┐ ║ ║ │ 应用基础大模型 │ ║ ║ │ • 基础设施 • 基层主体 • 空间科学 │ ║ ║ └──────────────────────────────────────┘ ║ ╚════════════════════════════════════════════╝

4.3 工程层：三大关键能力

模型层：基于商汤跨越多模态能力，构建"1+6"模型体系
系统层：创新性地采用"智能度分级"，从10个知识领域到80个二级领域的递进
工程层：解决行业大模型落地中最难的制约开发、Agent基础设施、行业数据治理

五、对政务AI应用的启示

5.1 模型选型不是二元问题

上海的方案表明，政务大模型应该采用组合式架构：

对于通用、高频、低隐私风险的查询→用轻量模型（快速、经济）
对于专业、涉密、高准确需求的决策→用本地专业模型（安全、可控）

5.2 能力边界需要清晰定义

模型能做什么、不能做什么必须在上游定义，而不是事后补救：

明确划分"替代"与"辅助"场景
建立模型输出的可信度评分机制
设计人机协作的明确流程

5.3 数据治理是前置条件

云宇星空的成功背后是上海多年的数据治理投入：

2018年以来的政务数据流通基础建设
建立的行业数据仓库（城市信息模型ICM）
建立跨域的数据共享机制

没有这些基础，再强的模型也难以发挥作用。

六、总结与展望

云宇星空大模型代表了政务AI从"能用"到"好用"的升级。其核心创新在于：

承认差异：政务场景有独特需求，不能简单套用通用模型
分层应对：采用多层次多模型体系，而非单一技术方案
人机共舞：强调AI的辅助角色，保留人的决策权和审查权
可持续运营：建立反馈循环，支持模型的持续优化

从技术角度看，这个方案的挑战在于：

如何在隐私约束下实现高效的知识迁移
如何量化模型在不同场景下的可信度
如何处理长尾场景中的知识覆盖不足

但从城市治理的角度看，云宇星空大模型已经给出了一个既实用、又安全、还可控的政务AI范本。这对其他城市的类似建设具有重要参考价值。

参考资源

上海市规划资源局：云宇星空大模型（专业版）相关文档
商汤大装置：多模态AI能力白皮书
推荐阅读：《AI驱动的城市规划决策系统》相关行业研究

城市数字治理中的大模型应用架构：以上海云宇星空大模型为例