告别手动计算！ArcGIS‘分区统计’结合Excel，高效处理土地利用栅格数据占比-深圳市維司達科技有限公司

ArcGIS与Excel协同工作流：土地利用栅格数据占比分析实战指南

面对海量土地利用栅格数据，传统的手工统计方法不仅耗时耗力，还容易出错。本文将分享一套结合ArcGIS空间分析与Excel数据处理的完整工作流，帮助您快速完成格网单元内各类用地占比计算与可视化呈现。

1. 格网创建与优化策略

格网单元的设计直接影响统计结果的精度与实用性。在ArcGIS中创建格网时，渔网工具（Create Fishnet）是最常用的选择，但参数设置需要格外注意：

格网尺寸：10km×10km的矩形格网适合省级尺度分析，但具体尺寸需根据研究区域特征调整
几何类型：必须选择POLYGON（面）类型，确保后续分区统计能正确执行
坐标系统：应与土地利用数据保持一致，避免投影变形带来的面积计算误差

实际操作中，建议先创建多个不同尺寸的格网样本，通过叠加分析评估哪个尺寸最能反映土地利用的空间异质性。以下是一个创建基础格网的Python脚本示例：

# ArcPy创建渔网示例 import arcpy from arcpy import env env.workspace = "C:/data/project.gdb" outFeatureClass = "fishnet_10km" originCoordinate = "500000 4000000" # 左下角起点坐标 yAxisCoordinate = "500000 4005000" # 确定Y轴方向 cellSizeWidth = "10000" # 10km cellSizeHeight = "10000" numRows = "" numColumns = "" oppositeCorner = "650000 4150000" # 右上角坐标 labels = "LABELS" templateExtent = "DEFAULT" geometryType = "POLYGON" arcpy.CreateFishnet_management(outFeatureClass, originCoordinate, yAxisCoordinate, cellSizeWidth, cellSizeHeight, numRows, numColumns, oppositeCorner, labels, templateExtent, geometryType)

提示：创建格网后，务必添加唯一标识字段（如GridID），这对后续表格连接至关重要。可以使用字段计算器创建自动递增的ID值。

2. 土地利用数据预处理技巧

在开始分区统计前，需要对土地利用数据进行必要的预处理：

数据重分类：原始分类系统可能过于详细，可根据研究目的进行合理归并
无效值处理：识别并处理NoData区域，避免影响统计结果
投影统一：确保所有数据层使用相同的坐标系统

对于省级尺度的分析，常见的土地利用分类包括：

代码	类型	说明
1	农田	包括水田、旱地等
2	森林	各类林地
3	裸地	无植被覆盖的自然地表
4	草地	天然和人工草地
5	湿地	沼泽、滩涂等湿地生态系统
7	矿区	采矿及相关设施用地
8	城市	城市建设用地

预处理完成后，建议使用按属性提取工具（Extract by Attributes）为每类土地创建单独的数据层，这虽然增加了前期工作量，但能大幅简化后续的统计流程。

3. 分区统计的核心操作

ArcGIS的以表格显示分区统计工具（Zonal Statistics as Table）是工作流的核心环节。该工具可以计算每个格网单元内指定土地利用类型的多项统计指标：

AREA：各类用地的面积总和
COUNT：像元数量
MEAN/MAX/MIN：像元值的统计特征

实际操作时需要注意以下要点：

输入区域数据：选择创建好的格网图层
区域字段：指定唯一标识字段（如GridID）
赋值栅格：选择对应的土地利用数据层
统计类型：通常选择"SUM"或"MEAN"

以下是处理农田用地的典型参数设置：

输入栅格或要素区域数据: Fishnet_10km 区域字段: GridID 输入赋值栅格: LandUse_农田 输出表:农田统计表 统计类型: SUM

注意：对每类土地利用数据都需要单独运行此工具，生成对应的统计表。建议使用Model Builder或Python脚本批量处理，节省时间。

4. Excel高级数据处理技巧

将ArcGIS生成的统计表导出为CSV或Excel格式后，真正的效率提升在于Excel的数据处理能力。以下是关键操作步骤：

4.1 数据整合与连接

将所有土地利用类型的统计表导入同一Excel工作簿
使用VLOOKUP或INDEX+MATCH函数基于GridID连接各表
创建汇总表，包含每个格网单元内各类用地的面积数据

4.2 占比计算与数据透视

面积占比计算可以使用简单的公式：

=某类用地面积/SUM(所有用地面积)

但更高效的方法是使用数据透视表：

创建包含GridID和各类用地面积的数据透视表
添加计算字段实现占比自动计算
设置条件格式突出显示特定用地类型的高占比区域

对于需要频繁更新的分析，建议使用Power Query建立数据模型，实现一键刷新所有计算结果。

4.3 高级公式应用实例

SUMIFS函数可以快速汇总特定条件下的用地面积：

=SUMIFS(农田面积列, 行政区列, "太原市", 年份列, 2020)

而使用SUMPRODUCT则可以计算加权平均占比：

=SUMPRODUCT(面积列, 权重列)/SUM(面积列)

5. 可视化与报告生成

Excel的强大图表功能可以弥补ArcGIS在统计可视化方面的不足：

组合图表：用柱状图展示面积绝对值，折线图显示占比趋势
热力图：通过条件格式创建格网单元的热力分布图
动态图表：结合切片器创建交互式可视化面板

对于空间分布展示，可以将Excel处理后的占比数据重新导回ArcGIS，通过连接字段功能将统计结果关联到原始格网，然后使用分级色彩进行制图。

一个专业报告通常包含以下要素：

研究区域概况
数据处理方法说明
主要用地类型空间分布
关键区域的用地结构分析
时间变化趋势（如果有多期数据）

6. 工作流优化与自动化

对于周期性开展的分析工作，可以考虑以下自动化方案：

ArcGIS Model Builder：将分区统计流程模型化，支持一键运行
Python脚本：使用arcpy库批量处理所有土地利用类型
Excel VBA：自动更新数据透视表和图表
Power BI：创建动态仪表盘，实现数据实时可视化

以下是一个简单的Python脚本示例，可自动完成分区统计并导出结果：

import arcpy import pandas as pd # 设置工作环境 arcpy.env.workspace = "C:/data/project.gdb" landuse_classes = ["农田", "森林", "草地", "城市"] # 执行分区统计 tables = [] for lu_class in landuse_classes: out_table = f"ZonalStats_{lu_class}" arcpy.sa.ZonalStatisticsAsTable("Fishnet_10km", "GridID", f"LandUse_{lu_class}", out_table, "DATA", "SUM") # 转换为pandas DataFrame arr = arcpy.da.TableToNumPyArray(out_table, ["GridID", "SUM"]) df = pd.DataFrame(arr) df.rename(columns={"SUM": lu_class}, inplace=True) tables.append(df) # 合并所有表格 result = tables[0] for df in tables[1:]: result = pd.merge(result, df, on="GridID", how="outer") # 计算占比 total_area = result.iloc[:, 1:].sum(axis=1) for lu_class in landuse_classes: result[f"{lu_class}_占比"] = result[lu_class] / total_area * 100 # 导出到Excel result.to_excel("LandUse_Statistics.xlsx", index=False)

在实际项目中，这套工作流将数据处理时间从原来的数小时缩短到几分钟，而且大大降低了人为错误的风险。关键在于充分发挥ArcGIS的空间分析优势和Excel的数据处理灵活性，避免在单一软件中完成所有操作。