地表覆盖/利用分类优化模型（LC-COM）：考虑空间异质性的新融合模型

马力mali@hebeu.edu.cn河北工程大学李轩河北工程大学侯建伟河北工程大学

文章

关键词：土地覆盖，分类，集成，优化，谷歌地球引擎
发布日期：2024年9月20日
DOI：https://doi.org/10.21203/rs.3.rs-4894998/v1
许可协议：© (i) 本作品采用知识共享署名 4.0 国际许可协议进行许可。
阅读完整许可协议

额外声明：未报告竞争利益。

土地覆盖/利用分类优化模型（LC-COM）：考虑空间异质性的新融合模型

摘要

李马 $^{1, 2^{*}}$ ，宣 ${Li}^{1}$ 及侯建伟 $^{3}$ $^{1}$ 河北工程大学地球科学与工程学院，邯郸，056038，中国。 $^{2}$ 河北省资源调查与研究重点实验室，河北工程大学，邯郸，056038，中国。 $^{3}$ 河北工程大学现代教育技术中心，邯郸，056038，中国。*电子邮件：mali@hebeu.edu.cn 摘要——土地利用/覆盖分类优化模型（LC-COM）旨在整合多个分类器和现有产品的分类结果优势。在 LC-COM 中，开发了协调指数以使现有的土地利用/覆盖产品与待分类的 Landsat 影像的综合方法相一致。随后，从这些土地利用/覆盖产品中自动生成训练样本，并通过光谱指数进行优化，以进一步匹配所选的 Landsat 影像。利用 Google Earth Engine 平台提供的六个分类器进行分类，以充分挖掘 Landsat 影像中的详细和特定信息。这些分类器与五个土地利用/土地覆盖（LULC）产品的结果随后通过使用生产者准确率、用户准确率以及专门设计的反映空间异质性的匹配准确率指数，整合成一个基于准确率加权的混合图。结果表明，融合后的优化土地覆盖分类通过整合各个单独结果的优势，有效提高了整体准确率，并且在考虑空间异质性时，分类性能能够显著提升。

关键词-土地覆盖，分类，整合，优化，Google Earth Engine

引言

土地利用和土地覆盖（LULC）是人类与自然共同影响地球的直接表现，影响全球环境变化、生物多样性和生态系统服务

^{1, 2}

。此外，作为地球系统模型的主要输入参数之一，LULC 数据在地表辐射能量平衡、生物圈-大气相互作用、生物地球化学循环及其模拟研究中发挥着关键作用

^{3, 4}

。

地球观测技术的进步显著提升了获取土地利用和覆盖信息的能力。这一进展归功于分类和制图技术的持续发展，特别是卫星、机载和地面观测网络的整合

^{5}

。这些网络共同形成了一个大数据平台，实现了地表状况的多维度、全面覆盖和持续更新

^{6}

。此外，随机森林和深度学习模型等人工智能算法正被应用于从地球观测大数据中提取遥感图像特征

^{7}

。在 NASA 提供的最新 MODIS 全球土地覆盖类型产品（第 6 版）中

^{8}

，结合隐马尔可夫模型的随机森林算法被用来预测每个层级的可能性并对每年数据进行分类，伪造的土地覆盖变化量从第 5 版的

11.4 %

减少到第 6 版的

1.6 %

。欧洲航天局（ESA）还将其哥白尼全球陆地服务更新至 Collection 2，采用随机森林技术作为核心分类器

^{9, 10}

，并将整体精度从

74.3 %

提升至

80.2 %

。谷歌和 ESRI 均利用新兴的深度学习技术，基于哨兵-2 遥感图像

^{11, 12}

开发了具有

10 m \times 10 m

空间分辨率的全球土地覆盖图。

这些新开发的 LULC 产品具有较高的准确性水平，能够为土地覆盖分类提供重要见解。然而，需要注意的是，分类结果中的差异可能会阻碍其在碳循环等建模过程中的有效性

^{13}

。因此，学者们开始评估一致性和准确性，并分析现有分类产品中的不一致性

^{14 - 16}

。通过统一空间分辨率、分类系统概念框架及相应图例

^{17 - 19}

，研究重点放在整合（即融合）现有分类数据集以综合优化分类结果。这些融合方法包括 Dempster-Shafer 证据理论、基于专家的方法

^{20, 21}

、多数/比例聚合方法

^{22}

、面积和准确性加权方法

^{23}

、监督回归树模型

^{24}

、带有一致性评分方法的投票程序

^{25}

，从而整体分类准确性得到了提升。

与现有的这些融合模型相比，我们打算设计这个全球或大陆尺度的土地覆盖/利用分类优化模型（LCCOM），旨在实现对 Landsat 影像的高精度土地覆盖/利用分类。LC-COM 将具体实现：（1）基于设计的调和指数，调和 Landsat 影像的复合方法与现有的土地覆盖/利用产品；（2）自动生成训练样本，并利用光谱指数进行优化，以进一步匹配复合的 Landsat 影像；（3）利用 GEE 平台中选定的六个分类器进行深入分类，挖掘定制 Landsat 影像的详细信息；（4）整合所有 11 个数据集，形成最终的优化结果，旨在融合各个数据集的优势。在此过程中，我们需要应对以下具体挑战：（1）如何协调自动生成的训练样本与待分类的复合 Landsat 图像，（2）如何评估由空间异质性和光谱混淆引起的局部精度对分类准确性的影响，以及（3）如何整合 11 组分类结果并实现最终优化。

研究区域和数据

研究区域四川省位于中国西南部，总土地面积为

486, 000 {km}^{2}

。这里有山脉、丘陵、平原、盆地和高原，海拔范围从 193 米到 7043 米（图 1），使其成为土地利用/覆盖分类的理想区域。四川西部由众多山脉组成，山顶覆盖积雪，山下生长着森林和草地。省的东部大部分位于肥沃的四川盆地，长江及其支流穿流其中，是中国重要的农业生产基地。四川也是中国主要的工业中心之一，位于新兴的成渝城市群内。本研究选取了四个典型且具有代表性的感兴趣区域（ROI）以展示土地覆盖/利用的局部细节（图 1），包括典型城市区（ROI-1）及其郊区（ROI-2）、从积雪到荒地和植被的过渡区（ROI-3）以及湿地（ROI-4）。

图 1 研究区域及四个感兴趣区域（ROIs）。

方法

数据。在 LC-COM 中，选择了五个 2020 年具有 10 米或 30 米空间分辨率的最先进 LULC 数据集来生成训练样本，并为后续整合提供分类建议（表 1）。所有坐标系统均重新投影到本地投影坐标系统（CGCS2000_3_Degree_GK_Zone_34），空间分辨率重新采样为 30 米。

表 1 LC-COM 中使用的五个 LULC 产品摘要。
数据集	规模与空间分辨率	用于分类	分类系统及类别总数	分类器	参考
土地利用/土地覆盖图（LULCM）	全球，10米	哨兵-2号	自定义，10类	深度学习模型	11
动态世界（DW）	全球，10米	哨兵-2	IPCC，9 类，	深度学习模型	12
世界覆盖（WC）	全球，10米	哨兵-1，2	LCCS，11 类	梯度提升决策树	26
GLC_FCS30	全球，30米	Landsat 8，Sentinel-1	LCCS，16 个全球类别和 14 个区域类别	随机森林	27
中国土地覆盖数据集（CLCD）	中国，30米	Landsat 8	自定义，9类	随机森林	28
行星级 GEE	云平台	提供了该	大气校正	地表反射率（SR）

行星级 GEE 云平台提供了 2020 年（集合 2，一级）大气校正的地表反射率（SR）产品，数据来源于 Landsat 8 OLI/TIRS 传感器。其他辅助数据包括 ALOS 全球数字表面模型（DSM）V3.2 版本的 DEM 数据

30 m \times 30 m^{29}

，以及 VIIRS 夜间昼夜年度波段合成的夜间灯光（NTL）数据 V21 版本

500 m \times 500 m^{30}

。LC-COM 中使用的所有数据均在与土地覆盖数据集相同的要求下进行了重投影和重采样。
分类系统的统一。参考 LCCS 和 IPCC 分类系统，定义了一个简化的分类系统，包含以下八个土地覆盖类别：森林地（树木和灌木）、草地、农田或耕地、不透水表面区域（ISA）或聚居地、水体、永久冰雪、荒地和湿地。为了与该新分类系统保持一致，所有五个现有的土地利用/土地覆盖（LULC）数据集随后均进行了相应的重新分类（附录表 S1）。
应特别指出的是，GLC-FCS30 中树木或灌木覆盖（果园）这一子类，在土地覆盖分类系统中可以被归类为森林用地，或者在土地利用分类系统中被归类为农田（或园地）。在 LC-COM 中，我们在进行土地覆盖分类时，将树木或灌木覆盖（果园）这一子类归类为森林用地，以保持与用于分类的 Landsat 影像及其他分类产品的一致性。
Landsat 影像的合成用于分类。利用了 2020 年全年 Landsat 8 SR 影像来合成分类影像。由于仍存在少量无数据区域，还生成了 2019 年至 2021 年的合成影像，以拼接 2020 年的影像。收集了辅助数据以帮助挖掘有用信息用于
土地覆盖分类，包括从合成 Landsat 影像生成的 NDVI、MNDWI、NDBI、BSI、APGI 波段（附录表 S2），以及从 DEM 数据和夜间灯光数据生成的三个地形波段：高程、坡度和坡向。
LC-COM 采用了五种综合方法生成 30 米分辨率的 Landsat 影像：最大值法、均值法、中值法、众数法和最小值法。设计了调和指数（RI）以通过与五个现有分类产品的比较，帮助选择最合适的方法：

R I = \frac{1}{n} \sum_{i = 1}^{n} r (t_{i}), r (t_{i}) = \frac{S_{img} (t_{i}) \cap S_{prt} (t_{i})}{S_{prt} (t_{i})}

其中

n

是选定的土地覆盖类别总数，

r (t_{i})

是土地覆盖类别的匹配得分，

t_{i}, i \in [1, n]; S_{prt} (t_{i})

是从五个现有产品中提取的土地覆盖的公共面积，

t

是基于相应光谱指数标准（附录表 S3）从 Landsat 合成影像中提取的土地覆盖分布面积。
训练样本的生成。训练样本的质量对监督分类的结果有显著影响

^{31 - 33}

。然而，人工采样耗时且费力

^{34}

。因此，LC-COM 采用自动方法生成训练样本。从五个现有数据集中提取每个土地覆盖类别的公共区域，并通过光谱指数进行精细化处理（附录表 S4）。使用分层随机抽样方法从这些公共区域自动生成了共计 9000 个训练样本，其中包括 2000 个 ISA 样本和每个其他土地覆盖类别各 1000 个样本。然而，在实际操作中，五个数据集中湿地类别没有公共区域。相反，官方文件截至

2020^{35, 36}

年底已定义了两个国际和七个省级湿地保护区。因此，将官方范围内湿地面积最小的数据集替换为官方湿地区域。随后，基于此替换生成了湿地的公共区域。有关生成过程的详细描述，请参见支持信息中的文本 S1。
分类。GEE 平台还提供了多种智能分类器，包括概率、距离、超平面和决策树的分类算法。在 LC-COM 中，应用了六种分类器以充分挖掘最小值合成 Landsat 影像的详细信息，包括最小距离（MD）、朴素贝叶斯（NB）、支持向量机（SVM）、随机森林（RF）、分类与回归树（CART）和梯度提升树（GTB）。
基于像素的分类中，由于存在光谱混淆，后分类校正始终是一个重要步骤

^{37, 38}

。在六个分类器的分类结果中，(1) 一些位于山丘和建筑物阴影下的土地被误分类为水体；(2) 城市区域的树木和草地被误分类为农作物；(3) 农田中的梯田和温室被误分类为 ISA。基于夜间灯光（NTL）数据，城市区域被定义为 NTL 指数大于四川省省会成都官方城市区域内最低 NTL 指数的区域。结合其他辅助数据（光谱指数、地形指数和夜间灯光影像），进一步提取误分类区域，并直接赋予正确的土地覆盖类别，或在移除错误土地覆盖类别的训练样本后重新分类。这些后分类校正的具体方法在另一篇文章中进行了描述。
准确性评估。在 LC-COM 中，验证样本通过以下方式收集：（1）在整个研究区域随机生成 300 个样本，在定义的城市区域随机生成 100 个样本；（2）对于面积较小的土地覆盖类别，包括水体、永久冰雪、裸地、湿地和人工不可渗透表面（ISA），手动额外收集了每类 50 个具有代表性的样本。共计 650 个验证样本通过参考 ESRI 的 World Imagery Wayback 高分辨率历史影像进行解译。整体准确率、制图者准确率、使用者准确率和 Kappa 系数被用作分类准确性指标。
优化。LC-COM 中将所有 11 组分类结果通过采用以准确性指标为权重的多数投票法整合为最终优化结果。
权重计算。每个分类结果用于整合的权重包括以下组成部分：
(1) 用户准确率（UA）。用户准确率指的是某一特定类别中被正确分类的样本数占该类别总分类样本数的百分比。如果将分类结果作为随机抽样测试，这些验证样本可以从用户的角度为预测的土地覆盖类别

t

中的每个像素提供其实际土地覆盖类别

τ

的概率：

U A (t) = \frac{n_{t}^{τ}}{n_{t}}, n_{t} = \sum_{τ = 0}^{8} n_{t}^{τ}

其中

n

是验证样本的数量；

t

是来自现有数据集或分类结果的预测土地覆盖类别，

t \in [0, 8]; τ

是预测的土地覆盖类别，

τ \in [0, 8]

。
(2) 生产者准确率（PA）。生产者准确率在机器学习领域也称为精确率，指的是某一特定类别中被正确分类的样本数占实际属于该类别的样本总数的百分比。因此，PA 常作为整合分类结果时的权重，这里我们采用它来描述用于

P A (t)

的分类样本的质量。

P A (t) = \frac{n_{τ}^{t}}{n_{τ}} n_{τ} = \sum_{t = 0}^{8} n_{τ}^{t}

（3）匹配精度（MA）。考虑到地物类别分布存在空间异质性（例如，住宅区的绿地，或农田中的池塘）以及遥感影像中的光谱混淆，引入了第三个指标 MA，用以描述分类结果中的地物类别与现实世界细节的匹配程度。MA 将由专家根据选定的典型且具有代表性的感兴趣区域（ROI）中每个分类产品的表现进行评估：

M A (t) \subset [0.01, 1]

来自 GLC-FCS30 的子类信息促进了从土地覆盖到土地利用的分类转换，使我们能够进一步与官方公开的土地利用统计数据进行比较。因此，土地利用类别的 MA 也基于以 GLC-FCS30 为中心的农田 MA 权重进行计算。
最后，所有这些精度指标被结合成土地覆盖类别的协同精度

t

，作为后续整合的权重：

S A_{i}^{j} (t) = U A_{i}^{j} (t) \times P A_{i}^{j} (t) \times M A_{i}^{j} (t)

其中

S A_{i}^{j} (t)

为土地覆盖类别的协同权重，

t; j

为分类结果，

j \in [1, 11]; i

为分类结果中土地覆盖类别

t

的像素，

j

。
集成。我们采用了加权准确率多数投票作为集成方法，累积了11组分类结果的协同准确率，以获得每个土地覆盖类别的总协同准确率

S A_{i} (t)

：

S A_{i} (t) = \sum_{j = 1}^{11} S A_{i}^{j} (t)

计算了每个土地覆盖类别

S A_{i} (t)

的相对比例概率

P_{i} (t)

：

P_{i} (t) = \frac{S A_{i} (t)}{\sum_{t = 0}^{8} S A_{i} (t)}

选择具有最大

P_{i} (t)

的土地覆盖类别，作为像素

i

的最终优化分类结果

t_{opt} (i)

：

t_{opt} (i) = argmax (P_{i} (t))

准确性评估与模型验证。使用相同的 650 个验证样本，通过总体准确率和 Kappa 系数评估优化结果的分类准确性。
LC-COM 的整个工作流程如图 2 所示。

图 2. 土地覆盖/利用分类优化模型（LC-COM）的工作流程。

结果

生成和选择用于分类的 Landsat 合成影像。2020 年的 Landsat 合成影像通过不同的合成方式生成：最大值、均值、中位数、众数和最小值（图 3）。可以观察到冰雪覆盖影响了实际土地覆盖信息的识别。特别是在冰雪向荒地和植被过渡区域的选定感兴趣区（图 1 和附录图 S1）中，所有五个现有数据集中分类的植被、水体和荒地，在最大值、均值和中位数合成影像中仍被识别为冰雪（附录图 S1-a、b、c）。如果使用这些影像进行分类，生成的训练样本将被错误标注。相比之下，众数和最小值合成影像与土地覆盖类别匹配较好（附录图 S1-d、e）。

图 3. 不同合成方法的 Landsat 影像。
调和结果进一步表明，最小值合成影像具有最高的平均匹配指数（MI）

69.35 %

（表 2），使其成为最适合分类的影像。尽管众数值合成影像的 MI 仅略低（

66.90 %

，表 2），但该方法中存在普遍的噪声像素，给分类带来不便的干扰。最大值方法的平均 MI 最低（

41.66 %

，表 2），其荒地类和湿地类的 MI 仅为 0 和

1.37 %

，这也表明这些合成方法无法生成有效的训练样本。

表2 各合成方法与土地覆盖类型的匹配得分。

合成方法	匹配索引
合成方法	什么。	冰	湿。	条形图	平均值
最小值	94.24%	99.40%	51.64%	32.10%	69.35%
众数值	93.18%	98.96%	42.90%	32.56%	66.90 %
平均值	90.84%	100.00%	47.37%	1.37%	59.90 %
中位数值	96.10%	99.84%	18.67%	16.90%	57.88 %
最大值	62.59%	99.98%	4.08%	0.00%	41.66 %

样本生成。训练样本和验证样本的生成过程展示于附录图 S2 中。光谱指数在优化训练样本中起着不可或缺的作用，有助于从农田中筛除农舍和池塘，从不可渗透表面（ISA）中筛除街道树木，以及从冰面中筛除裸地，应用于 LC-COM。例如，在 ROI-3 区域，位置（1）处为雪地向荒地变化的区域（图 4-a），所有五个数据集均将其分类为冰/雪（图 4-b）。通过引入归一化差异雪指数（NDSI），我们将该区域从雪样本生成中剔除（图 4-c）。此外，位置（2）的荒地和位置（3）的雪地均未被所有现有数据集识别。这正是我们分类器的优势，能够为复合影像提供最合适且针对性强的分类，特别是针对荒地和冰的土地覆盖类别。

图 4. 用于生成训练样本的现有产品公共区域的细化，(a) ROI 的定制 Landsat 影像及特定位置，(b) 现有产品的公共区域，(c) 细化后的公共区域，(d) ROI 的位置，

{99.5012}^{\circ} E, {30.5882}^{\circ} N

。
分类。所有十一组分类结果均展示于图 5 中，并在表 3 中给出了它们的总体准确率（OA）、Kappa 系数及综合准确率指数（CA）。结果显示：(1) ESA 的 World Cover 地图（WC）的总体准确率为

78.92 %

，显著高于其他数据集（范围为

68.46 %

至

76.77 %

）。(2) 由于在分类荒地和湿地方面表现较差，GLC_FCS30 的 Kappa 系数低于

60 %

。(3) 设计的 CA8 指数得分与 OA 非常接近（约为

1 %

或更低，CLCD 除外，其为

2.52 %

），这表明 CA8 指数能够准确反映分类结果的总体准确率。

表3 数据集与分类器的分类结果

分类结果		$CA = (PA \times UA)^{1 / 2}$								OA	卡拉	${CA}_{8}^{*}$	${CA}_{5}^{*}$
分类结果		瓦特。	格拉。	福尔。	作物	ISA	大麦	冰	湿地	OA	卡拉	${CA}_{8}^{*}$	${CA}_{5}^{*}$
数据集	WC	94.97%	70.57%	86.87%	70.89%	93.01%	45.67%	72.30%	95.26%	78.92%	75.26%	79.95%	83.58%
	G_F30	90.60%	55.02%	75.79%	68.51%	87.49%	22.10%	78.25%	13.61%	65.08%	58.84%	65.02%	75.11%
	CLCD	85.91%	59.13%	77.01%	67.79%	76.64%	51.45%	69.49%	68.04%	67.85%	62.31%	70.37%	73.23%
	DW	85.70%	54.01%	72.58%	54.73%	82.10%	72.46%	63.77%	56.11%	68.74%	62.48%	68.61%	69.92%
	LULCM	92.83%	47.34%	67.23%	51.68%	80.73%	75.50%	75.09%	68.04%	68.15%	61.88%	68.64%	67.12%
分类器	RF	95.81%	73.39%	73.84%	50.07%	80.20%	88.39%	90.55%	74.54%	76.00%	71.83%	76.77%	74.05%
	MD	94.09%	69.74%	72.44%	53.11%	82.93%	91.63%	94.89%	66.67%	74.92%	70.21%	76.58%	73.79%
	GTB	93.21%	73.10%	73.04%	51.24%	80.39%	82.77%	84.88%	74.85%	75.85%	71.63%	75.51%	73.65%
	SVM	93.23%	61.67%	72.90%	56.76%	83.06%	81.93%	83.67%	77.11%	74.92%	70.45%	74.99%	72.93%
	CART	92.33%	65.74%	69.73%	49.15%	76.67%	82.83%	83.67%	65.70%	71.69%	66.85%	71.96%	70.00%
	NB	91.50%	62.89%	53.89%	50.96%	78.85%	83.99%	94.87%	60.65%	66.92%	61.39%	68.95%	65.19%

注：

{CA}_{8}

和

{CA}_{5}

是加权平均分类准确率，权重为相应的验证样本数量。

因此，

{CA}_{5}

指数也可以作为比较和评估排除有争议的土地覆盖类别（土地荒地、冰雪和湿地）后的分类结果综合准确性的合适指标，这些类别在分类图像中常常表现出不一致性。基于此标准，ESA 的 CA

_{5}

指数达到了

83.58 %

，远远领先于排名第二的 G_F30 的

75.11 %

（表 3）。两个深度学习模型的 CA

_{5}

指数低于

70 %

，而我们的朴素贝叶斯分类器准确率最低，

{CA}_{5}

分数为

65.19 %

（表 3）。

图5. 多分类器和现有数据集的土地覆盖分类结果。

ROI 区域的局部分类表现。城市区域的 ROI 位于四川省省会成都（图 6）。结果显示，所有分类结果均能捕捉不透水面背景，并识别出 ROI 左侧的河流和两个小湖泊（图 6）。然而，(1) DW 和 LULCM 未能完全提取树木覆盖（森林地）（图 6-d,e），而 GLC-FCS30 和 CLCD 则将其误分类为农作物（图 6-f,g）。(2) 基于 10 米分辨率 Sentinel 影像的 WC、DW 和 LULCM 成功识别了 ROI 右下角的河流支流（图 6-c,d,e），而基于 30 米分辨率 Landsat 影像的 GLC-FCS30、CLCD 及我们的最佳结果均未能识别（图 6-f,g,h）。(3) WC 在所有产品中表现最佳，提取了城市区域的详细绿地、农田和裸地，但仍未能捕捉 ROI 中上部的主河流小支流（图 6-a,c），而 DW 和 GTB 部分捕捉到了该支流（图 6-d,h），但它们均将部分建筑阴影过度提取为水体，GLC-FCS30 也存在同样问题（图 6-f）。

图 6. 典型城市区域的分类结果

({104.09014}^{\circ} E, {30.61249}^{\circ} N

），(a) 是 2020 年用于分类的 Landsat 合成影像；(b) 是来自 World Imagery Wayback 的历史影像，日期为 2020 年 12 月 16 日；(c) 是 ESA 的 WC 分类结果；(d) 是谷歌 DW 的结果；(e) 是 ESRI 的 LULCM；(f) 是 CAS 的 GLC-FCS30；(g) 是 WHU 的 CLCD；(h) 是来自 GEE 的梯度提升树（GTB）分类结果，是六个分类器结果中表现最好的。

图 7 展示了四川一个典型的郊区区域。省道 S103 从底部中央斜穿而过，将该区域分为两部分：右侧是高尔夫球场、周围别墅和高端住宅区；左侧是农舍、村庄和大片农田。然而，分类结果存在显著差异：（1）WC、DW 和 LULCM 数据集，以及我们的 RF 分类结果有效识别了高尔夫球场（图 7-c,d,e,h）；相比之下，GLC-FCS30 和 CLCD 错误地将该区域分类为耕地（图 7-f,g）。（2）DW 和 LULCM 在识别水体方面效果最佳（图 7-d,e），例如有效识别了高尔夫球场内的小湖泊和省道 S103 旁的小支流；而 WC 再次将这些小水体误分类为荒地（图 7-c），基于 Landsat 的分类结果未能捕捉到它们（图 7-f,g,h）。（3）农田中的一些温室被 WC 误分类为荒地（图 7-c），被 DW 和 LULCM 误分类为不可渗透人工表面（ISA）（图 7-d,e）；而苗圃和树木周围的农舍被 GLC-FCS30 和 CLCD 误分类为作物（图 7-f,g）。（4）我们的 RF 分类结果面临两个主要挑战：一方面，在城乡交界区仍难以有效区分耕地和林地；另一方面，由于夜间灯光数据的有限空间分辨率（1km×1km），城乡界面显得僵硬（图 7-h）。

图 7. 典型郊区的分类结果（

{103.871413}^{\circ} E, {30.504502}^{\circ} N

），(a) 是 2020 年用于分类的 Landsat 合成影像；(b) 是来自 World Imagery Wayback 的历史影像，日期为 2020 年 12 月 16 日；(c) 是 ESA 的 WC 分类结果；(d) 是 Google 的 DW 结果；(e) 是 ESRI 的 LULCM；(f) 是 CAS 的 GLC-FCS30；(g) 是 WHU 的 CLCD；(h) 是来自 GEE 的最小距离（MD）分类结果，是六个分类器结果中表现最好的。

在选定的永久冰雪区域 ROI 中，Landsat 合成影像与历史影像存在一定差异（图 S4-a，b）。现有数据集的结果与历史影像更为一致（图 S4-c，d，e，f，g），而朴素贝叶斯分类器的结果则忠实地从 Landsat 合成影像中提取了雪地和裸地（图 S4-h）。
选定的湿地区域位于官方指定的湿地保护区内，清晰地展示了从中心湖泊、湿地到草地的空间分布特征（图 S5-a，b）。我们可以看到，WC、CLCD 和我们的 GTB 结果都正确分类并展示了这一过渡（图 S5-c，g，h），而 DW 和 GLC 均未能有效提取湿地（图 S5-d，h），LULCM 则在无人区内的 ROI 提取了大量农田（图 S5-e）。
集成与优化。匹配准确度指标是基于代表性感兴趣区（ROI）中每个分类结果的表现进行评估的（表 S7）。图 8 展示了最终优化的分类结果及通过整合所有十一种分类结果获得的相对概率。通过结合各个数据集的优势，包括湿地和永久积雪的空间分布（图 S5-a，图 8-a1；图 S4-a，图 8-a2）、郊区的高尔夫球场及其小湖泊（图 6-a，图 8-a3）以及城市区域的小河支流（图 6-a，图 8-a4），2020 年基于 Landsat 的土地覆盖信息得到了准确分类。相对概率图基本对应其八类分类结果，但更为复杂（图 8-b1，b2，b3，b4）。总体而言，低概率主要出现在不同类别的边界和混合区域。

图 8。优化结果及其分类概率，（a1）-（a4）为四个感兴趣区的结果，（b1）-（b4）为对应的概率。

我们还比较了整合这十一组分类数据集时常用的加权方法（表 4）。基本上，所有这些整合结果在整体精度（OA）和 Kappa 系数上均较原始基础分类数据集有所提升。特别是我们的 Opt_LC，即来自 LC-COM 的优化分类结果，其整体精度（OA）超过

87 %

，显著优于其他加权方法（表 4）。

表4 不同融合方法的分类精度比较

权重	OA	Kappa 系数
OA	$79.54 %$	$75.79 %$
UA	$81.69 %$	$78.39 %$
$($ UA+PA $) / 2$	$82.31 %$	$79.13 %$
PA	$82.47 %$	$79.34 %$
优化土地覆盖	$87.38 %$	$85.20 %$

讨论

分类。LC-COM 中使用了共计十一种分类结果，既包括现有数据集，也包括分类器，这些结果在分类精度（表 3）和土地覆盖空间分布（图 6-8，补充图 4-5）上存在差异。这些差异可归因于数据源本身的特性和局限性（包括卫星平台、传感器和数据分辨率）、分类方案、分类算法、景观异质性以及解译误差

^{39 - 41}

。统计分析显示，每个分类结果都有其优势和不足

^{42, 43}

。我们的研究进一步支持这一点：ESA 的 WC 获得了最高的整体精度并提供了详细的分类信息，但仍然误分类了温室、某些建筑物以及像支流和小路这样的小特征。在我们应用的分类器中，RF 的整体精度（OA）为

76.00 %

，而 NB 的 OA 为

66.92 %

。尽管如此，NB 的结果仍然具有重要意义，特别是在结合其他分类结果识别冰雪和荒地时。因此，整合适当的分类结果，利用其优势并减轻其局限性，将非常有益。
集成与优化。集成方法，也称为融合方法，是一种协同结合现有土地覆盖/土地利用（LULC）数据集以实现优化的方式

^{44 - 47}

。Dempster-Shafer 证据理论（DSET）及其改进方法是强有力的工具，已被广泛应用于融合领域

^{48, 49}

。作为贝叶斯概率理论的扩展，DSET 能够提供一种数学方法，将来自多个来源的证据结合起来以得出逻辑结论

^{50}

。然而，在 LC-COM 中，利用了十一组分类结果进行集成，DSET 方法将消耗大量计算资源。多数/多票投票是另一种常用的多源分类产品集成方法，它允许集体决策，有助于达成共识或做出有约束力的决定

^{51 - 53}

。许多研究证明，即使是最简单的投票方法也能提高总体精度（OA）

^{51, 53}

。因此，我们采用了基于精度加权的多数投票作为集成方法，使决策过程更加简化。

还有许多方法可以评估分类结果的准确性

^{40}

。专家知识或他们的判断在早期研究中经常被采用，而最近以下准确性指标已成为加权分类结果的主要方法：PA、UA、OA 和 (PA + UA)

/ 2

，等等

^{53 - 56}

。Clinton 等人

^{53}

证明投票方法也能达到比输入分类中最佳结果更高的准确性。我们的结果进一步证实，采用这些准确性指标的集成方法将使最终分类结果的 OA 和 Kappa 系数至少提高

2 %

。

然而，根据概率论和贝叶斯定理，这些准确率指标仅在土地覆盖类别在其空间分布边界内必须是均匀的理想条件下才有效。因此，土地覆盖的空间异质性和遥感影像中的光谱混淆将对这些准确率指标产生重要影响。分类器的偏差和方差在输入空间

^{57}

中也以复杂的方式变化。先前的研究尝试通过结合地理坐标来提高元分类器的性能，但结果并未显示出显著的准确率提升

^{53}

。另一种方法是利用地图对应的空间自相关结构来建模 GLC 地图的空间准确率

^{47}

。Zhu 等人

^{44}

采用克里金方法基于与参考样本像元的空间对应关系，为每个源土地覆盖图生成局部准确率图，但用户准确率的提升仍然有限。在我们的研究中，我们引入了一个新的指标——匹配准确率（MA），用于评估每个土地覆盖（LC）类别基于其在选定代表性感兴趣区域（ROI）中的表现，准确反映现实世界状况的能力。通过引入这一附加指标，我们显著提升了整体分类准确率，有效利用了每个分类结果的优势。

最后但同样重要的是，人们普遍认为整合更多地图会带来更高的准确率。然而，在最近的一次融合实验中，Feng 等人

^{58}

发现了一个有趣的现象：参与融合的基础分类器数量与分类准确率并不直接相关——最高的分类准确率竟然是在融合三到四个基础分类器时获得的，而不是使用全部六个分类器。Tsendbazar 等人

^{47}

提出的一个合理解释是，如果大多数输入地图在某一类别上达成一致，投票规则可能会错误地将像素分配给该类别。因此，通过为每个输入地图分配适当的权重，我们可以发挥其优势，同时减轻其弱点，从而...
优化最终分类结果。通过这种方式，集成方法允许每个分类器或分类产品参与投票过程，确保每个分类结果拥有投票权；另一方面，通过引入更多的土地覆盖产品，可以增强集成的多样性。基分类器之间的差异是分类器融合的关键因素

^{58}

，且融合的有效性随着基分类器之间差异的增大而提高

^{59, 60}

。

结论

LC-COM 是一个为土地覆盖/利用分类设计的集成优化模型，以中国四川省为研究区域。它利用现有的分类产品自动生成训练样本，并使用来自 Google Earth Engine 的六个分类器，全面挖掘复合 Landsat 图像的分类信息。在此过程中，设计了调和指数以优化训练样本，并辅助选择最适合分类的 Landsat 图像复合方法。这确保了训练样本与分类图像之间的高度一致性，特别是对于那些年度变化显著的土地覆盖类别。根据我们的研究，当研究区存在永久积雪/冰时，推荐使用最小值复合方法作为生成分类图像的最佳方式。

研究区的分类结果在空间分布、总面积以及各土地覆盖类别的分类精度上表现出差异。这为每个分类结果都应有机会被纳入分类集成的决策过程提供了充分的理由。

以传统的基于误差矩阵得出的精度指标作为集成权重，优化后的分类结果的总体精度（OA）可以得到有效提升。然而，基于典型且具有代表性的感兴趣区域（ROI）中的局部表现，考虑空间异质性和光谱混淆，LC-COM 能够将总体精度进一步提升至令人印象深刻的

87.23 %

。这些提升显著优于单一分类方法或仅基于误差矩阵的集成方法所获得的结果。

本研究强调了在进行土地利用/土地覆盖（LULC）分类融合时考虑空间异质性和光谱混淆的重要性。通过纳入这些因素，集成模型能够有效利用每个输入图的优势，同时最小化其弱点。这种方法还为集成过程引入了多样性。如何客观量化由土地覆盖空间异质性和光谱混淆引起的局部精度影响，仍是未来的研究方向。

致谢

作者感谢 Google Earth Engine 提供的免费开放云平台、更新的卫星影像、科学数据集及广泛的地理空间功能；感谢环境系统研究所提供的高分辨率历史世界影像 Wayback；Landsat-8 影像由美国地质调查局提供。

利益冲突声明

作者声明他们没有已知的可能影响本文报告工作的竞争性财务利益或个人关系。

数据可用性

支持本研究结果的序列数据已存储在 GEE 平台上（https://code.earthengine.google.com/dff9be679c08c23aa3699a352c95793b）。

参考文献

1 Pandey, P. C., Koutsias, N., Petropoulos, G. P., Srivastava, P. K. & Ben Dor, E. 从地球观测视角看土地利用/土地覆盖：数据来源、输入维度和分类器——现状综述。Geocarto International 36, 957-988 (2021)。
2 Yonaba, R. 等。动态土地利用/土地覆盖输入有助于描绘萨赫勒悖论：评估萨赫勒流域地表径流变化的变异性及归因。Science of the Total Environment 757, 143792 (2021)。
3 Sy, S. 和 Quesada, B. 人为土地覆盖变化对 21 世纪气候极端事件的影响。《环境研究快报》15, 034002, doi:10.1088/1748-9326/ab702c (2020)。
4 Yang, J. 等. 卫星遥感在气候变化研究中的作用。《自然气候变化》3, 875-883 (2013)。
5 Liu, H. 等. 全球每日无缝数据立方体的生成及 1985 年至 2020 年全球土地覆盖变化的量化——iMap World 1.0。《环境遥感》258, 112364 (2021)。
6 Zhang, C. 和 Li, X. 大数据时代的土地利用和土地覆盖制图。《土地》11, 1692 (2022)。
7 Gilić, F., Gašparović, M. 和 Baučić, M. 制作大规模土地覆盖图的现状与挑战：基于近期土地覆盖产品的综述。Geocarto International 38, 2242693, doi:10.1080/10106049.2023.2242693 (2023)。