这是用户在 2024-9-3 16:47 为 https://app.immersivetranslate.com/pdf-pro/13ddf51c-0a56-47ea-89f6-df8bd41584de 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?
2024_09_03_0a43a6152779f954be7eg


CCropLand30:通过最先进的遥感产品与最新国家土地调查的协同作用创建的中国高分辨率混合农田地图


张玲 , 王伟国 , 齐敏 , 应怡 , 惠 , 赵彦博

甘肃省遥感重点实验室,黑河遥感实验研究站,西北生态环境资源研究院,

中国科学院,兰州 730000,中国

山西师范大学,地理科学学院,中国太原 030000

成都信息工程大学资源与环境学院,中国成都 610225

江苏海洋大学海洋技术与测绘学院,中国江苏 222005

中国科学院大学,北京 100049,中国


文章信息

 关键词:

 混合农田地图

土地利用和土地覆盖产品

 数据融合
 国土调查

空间模式效率

 食品安全
 中国

 摘要


摘要 准确的耕地范围和动态信息对于应对满足日益增长的食品需求与减少环境足迹这两大挑战至关重要。尽管已有众多全球和区域耕地地图,但在总体面积和空间分布方面仍存在显著的不确定性和差异。在本研究中,我们通过整合最先进的遥感土地利用和土地覆盖产品(即 GlobeLand30、GLAD、CLUD、CLCD 和 CACD)与最新的国家土地调查(NLDS),开发了中国的高分辨率混合耕地地图(CCropLand30)。为此,我们提出了一种具有成本效益的数据融合方法,即多数投票-模糊一致性评分(MV-FAS)方法。使用视觉解读和第三方样本以及县级 NLDS 数据评估了 CCropLand30 和输入耕地地图的准确性。CCropLand30 在 2020 年左右的整体准确率、Kappa 系数和 F1 分数分别为 和 0.86。 它与参考点的符合度优于输入的耕地地图,整体准确性提高了 10-30%。此外,CCropLand30 在空间一致性方面优于 NLDS 数据,空间模式效率平均提高了 。通过区域视觉比较,进一步确认了 CCropLand30 的优越性。CCropLand30 产品显示出中国耕地面积从 2000 年到 2020 年明显下降的趋势。在相对水资源丰富的地区,耕地面积显著减少,而在水资源稀缺的干旱和半干旱地区则显著扩大,这引发了对中国水资源与土地资源空间不匹配的担忧。我们的高分辨率混合耕地产品 CCropLand30 将为耕地监测和管理以及各个领域的研究提供重要支持。

 1. 引言


食品安全是一个全球性问题,原因包括人口增长、饮食模式变化、气候变化和国际不稳定(例如,俄罗斯与乌克兰之间的冲突)(Fritz et al., 2013; Sloat et al., 2020; Zhu et al., 2022)。虽然农业扩张和集约化是解决食品安全的便捷方式,但它们同时也带来了显著的环境影响和不利后果,如生物多样性丧失、土地退化和水资源枯竭(Potapov et al., 2021; Meng et al., 2023; Xie et al., 2023)。为了应对 21 世纪的双重挑战:满足人类日益增长的食品需求,同时减少农业对环境的影响(Foley et al., 2011; Jägermeyr et al., 2017),获取关于耕地范围和动态的准确可靠信息至关重要(Waldner et al., 2015; Yang and Huang, 2021)。

卫星观测为长期和大规模的农田制图提供了空间明确且具有成本效益的良好机会(Potapov et al., 2021)。在过去的二十年中,许多
https://doi.org/10.1016/j.compag.2024.108672

收到日期:2023 年 10 月 2 日;修订后收到日期:2023 年 12 月 11 日;接受日期:2024 年 1 月 23 日


在线可用日期:2024 年 2 月 3 日


0168-1699/© 2024 爱思唯尔公司。保留所有权利。


全球和区域土地利用/土地覆盖(LULC)产品的数量已经利用中等到粗分辨率的遥感数据开发出来(Bicheron et al., 2008; Pittman et al., 2010; Tateishi et al., 2011; Defourny et al., 2012; Teluguntla et al., 2018)。然而,大多数遥感产品并未优先考虑农田制图,而是必须在一种制图方法中平衡各种 LULC 类别(Teluguntla et al., 2018; Van Tricht et al., 2023),这可能会降低最终农田地图的准确性(Yang et al., 2017)。此外,由于中等到粗的空间分辨率,这类数据无法识别小的田块(Fritz et al., 2015; Tu et al., 2023)。

近年来,高分辨率遥感数据(如 Landsat 和 Sentinel-2)和云计算平台的日益普及,促进了创建细分辨率土地利用/土地覆盖(LULC)产品的广泛努力(Gong et al., 2013; Chen et al., 2015; Yang and Huang, 2021; Zhang et al., 2021b)。与此同时,许多高分辨率专题耕地产品相继出现(Teluguntla et al., 2018; Potapov et al., 2021; Tu et al., 2023)。尽管取得了这些进展,但在耕地地图的空间比较中,仍然存在相当大的不确定性和不一致性(Xiong et al., 2017; Becker-Reshef et al., 2019; Zhang et al., 2022a; Tubiello et al., 2023),无论是在总体面积还是空间分布方面。这些差异源于农业系统的多样性和复杂性、耕地定义的差异、分类技术、源数据以及与草地的光谱相似性(Xiong et al., 2017; Gao et al., 2020; Lu et al., 2020)。因此,选择适合特定应用的耕地地图面临重大挑战(Li et al., 2023a),可能会给下游研究的结果带来较大的不确定性。

为了调和耕地地图中的不一致性并提高耕地制图的准确性,一种有效的方法是通过数据融合或协同创建混合产品(Fritz et al., 2013; Fritz et al., 2015)。数据协同利用来自不同数据源的互补信息,同时减轻各自的弱点(See et al., 2015; Teluguntla et al., 2018)。大量努力已证明数据协同技术在开发比输入地图更可靠和准确的混合土地利用/土地覆盖(LULC)产品方面的有效性(Ran et al., 2012; Yu et al., 2013; Kinoshita et al., 2014; Schepaschenko et al., 2015; See et al., 2015; Li et al., 2023a)。然而,大多数数据协同方法需要大量参考数据用于模型训练和验证(Schepaschenko et al., 2015),同时,融合结果可能对训练样本的大小和代表性敏感(Zhong et al., 2019)。虽然许多众包平台如 GeoWiki 和 Collect Earth 已可用于样本收集,但由于贡献者的领域知识差异,确保样本的质量和一致性仍然具有挑战性(See et al.)。,2015;Bey 等,2016)。

解决训练样本可用性问题的一种潜在方法是通过整合多种卫星衍生的农田产品与农业统计和普查数据,创建混合农田地图(Ramankutty et al., 2008; Fritz et al., 2011; Yu and Lu, 2018; Lu et al., 2020)。这种整合通常涉及最初使用来自遥感数据的农田产品生成概率农田地图,然后使用普查或统计数据约束农田范围。数据协同方法隐含地假设遥感衍生的农田面积与农业统计和普查数据一致。然而,由于数据来源、农田定义和测量技术的差异,农业普查与遥感产品之间可能存在显著的系统性偏差。因此,直接使用普查或统计数据约束农田范围可能会降低制图精度(Schepaschenko et al., 2015)。 此外,由于采用了从现有土地利用/土地覆盖(LULC)产品中自动提取样本,遥感耕地产品之间可能并不完全独立(杨和黄,2021;涂等,2023)。候选地图之间的紧密联系可能导致耕地的概率图不可靠,从而影响混合产品的准确性。此外,尽管高分辨率 LULC 产品的可用性不断增加,但将其与农业普查或统计数据结合以创建更精确的混合耕地地图的工作却很少进行(杨等,2020)。

可靠且高分辨率的耕地地图对中国至关重要,因为中国仅占全球耕地的 8%,却养活着世界上 的人口。在过去几十年中,由于快速的社会经济发展,中国的耕地经历了重大而复杂的变化(杨和黄,2021;陈等,2022b;图等,2023)。鉴于中国与世界其他地区日益紧密的粮食联系,准确的耕地空间信息不仅对中国的农业监测至关重要,也对评估全球粮食安全至关重要。此外,中国的农场大多数是小规模和分散的,平均耕地面积不到一公顷,因此需要使用高分辨率的耕地产品来精确绘制这些耕地(特鲁贡特拉等,2018)。

在本研究中,我们提出了一种创新的方法,以在 2000 年至 2020 年间每五年创建中国的高分辨率混合耕地地图(CCropLand30)(Zhang et al., 2023)。本研究的主要贡献有三方面。首先,我们引入了一种不敏感于偏差的空间模式匹配指标,以评估和排名卫星衍生耕地地图的准确性。其次,提出了一种多数投票模糊一致性评分(MV-FAS)方法,用于融合多种遥感耕地地图与耕地调查数据。最后,我们通过协同结合最先进的土地利用/覆盖(LULC)产品与中国最新的国家土地调查(NLDS),创建了高分辨率且可靠的混合耕地地图。最新的 NLDS 提供了中国耕地的最可靠信息,据我们所知,这是首次用于创建混合耕地地图。我们新开发的混合耕地地图将大大支持耕地监测和管理,以及农业、水资源和气候变化等多个领域的研究。

 2. 材料和方法


本研究的工作流程如图 1 所示。我们的方法论始于通过结合从选定的遥感土地利用/土地覆盖(LULC)产品中获得的农田二元图生成农田协议图。接下来,通过结合随机森林模型的脊田面积估算,调整了 NLDS 报告的农田面积。此调整的目的是提高 NLDS 与 LULC 产品之间农田面积估算的一致性。然后,我们使用一种不受偏差影响的多组分空间模式匹配指标(即 SPAEF)对候选农田图进行了空间模式导向的评估和排名。随后,通过一种新颖的 MV-FAS 方法,将遥感农田图与 NLDS 数据整合,创建了混合农田图。在第五步中,我们使用视觉解释和第三方参考点( )评估了混合农田图和输入图的准确性。最后,我们利用新开发的农田图研究了 2000-2020 年期间中国农田的时空动态。

 2.1. 数据集


2.1.1. 最先进的遥感土地利用/土地覆盖产品


如表 1 所示,我们选择了五种最先进的遥感土地利用/覆盖(LULC)产品,以创建中国的混合农田地图。这些产品包括 GlobeLand30(Jun 等,2014;Chen 等,2015)、全球农田范围和变化数据集(GLAD)(Potapov 等,2021)、中国土地利用/覆盖数据集(CLUD)(Liu 等,2014;Xu 等,2018)、中国年度土地覆盖数据集(CLCD)(Yang 和 Huang,2021)以及中国年度农田数据集(CACD)(Tu 等,2023)。我们的选择主要基于以下标准:(1)这些产品是在过去十年内开发的;(2)产品的空间分辨率应约为 30 米;(3)产品应覆盖 2000 年至 2020 年间的多个时间段。有关更多细节

图 1. 本研究的工作流程。蓝色数字表示本研究中涉及的主要步骤,而绿色框表示分析工具和过程。缩写包括 LULC、SPAEF、NLDS、FAR、MV 和 FAS,分别对应土地利用和土地覆盖、空间模式效率、国家土地调查、田间脊面积、多数投票和模糊一致性得分。
 表 1

所选土地利用/土地覆盖(LULC)产品和中国国家土地调查(NLDS)的基本信息。
 产品/调查
 空间覆盖

时间覆盖 / 调查周期
 映射方法  耕地定义  参考
 全球土地 30  地球仪 2000, 2010, 2020

基于像素-对象-知识的方法

用于种植作物的土地,包括水田、灌溉旱地、雨养旱地,以及主要用于种植作物并夹杂果树和其他经济价值树木的土地。耕作的牧场和以灌木为基础的经济作物(如茶、咖啡)也包括在内。

陈等人(2015)
GLAD  地球仪
2003, 2007, 2011,
2015,2019
 随机森林

用于人类消费的年度和多年生草本作物、饲料(包括干草)和生物燃料的土地。排除多年生木本作物、永久性牧场和轮作。

波塔波夫等人(2021)
CLUD  中国

1980 年代到 2020 年在不同的时间间隔

人机交互解释

用于耕种作物的土地,包括休耕地和轮作田,以及主要用于种植作物的土地,夹杂着果树和其他经济价值树木,耕作的河岸和沿海地区也包括在内。

刘等人(2014)
CLCD  中国

1990 年至 2021 年,每年
 随机森林  类似于 CLUD

杨和黄(2021)
CACD  中国

1986 年至 2021 年,按年计算

基于轨迹的方法

一块面积为 0.09 公顷的土地(最小宽度为 30 米),在播种或种植日期后的 12 个月内至少播种/种植并可收获一次。

Tu 等人 (2023)。
NLDS  中国
1984-1996,

图像解读与土地测量
 类似于 CLUD

https://www. mnr.gov.cn/

这些产品已在补充文本中提供。


虽然用于种植一年生作物的土地始终被归类为耕地,但所选的土地利用/土地覆盖(LULC)产品之间在耕地定义上存在差异,如表 1 所示。例如,GlobeLand30 将耕作的牧场和以灌木为基础的经济作物(如茶和咖啡)视为耕地,而其他 LULC 产品则将其排除在外。CLUD 和 CLCD 中的耕地包括休耕地,而 GlobeLand30、GLAD 和 CACD 则将其排除在外。不同产品之间的耕地定义差异可能是耕地面积和空间分布估算不确定性的重要驱动因素(Tubiello 等,2023)。在本研究中,耕地被定义为用于种植作物的土地,包括水田、灌溉旱地、雨养旱地、休耕地和轮作田,主要用于种植作物的土地夹杂着果树和其他经济价值树木,以及耕作的河岸和沿海地区。该定义与 CLUD、CLCD 和国家土地调查一致(见下一节)。


2.1.2. 中国国土调查


土地调查虽然耗时且成本高,但在获取土地资源的准确和可靠信息方面发挥着至关重要的作用(陈等,2022b)。迄今为止,中国已进行了三次全国土地调查(NLDS),提供了对中国土地资源和利用状况的全面和系统的普查(周等,2023)。值得注意的是,第三次 NLDS 在三次 NLDS 中对中国土地资源的调查结果最为可靠,这得益于采用了先进的调查技术以及更为详细的调查过程(补充文本)。然而,出于国家安全考虑,土地调查地图和结果在较长时间内未向公众公开。幸运的是,自然资源部

中华人民共和国资源部最近发布了第二和第三次 NLDS 的县级调查结果,详细说明了不同土地利用类型的区域(https://www.mnr.gov.cn/)。据我们所知,这项研究是首次利用第三次 NLDS 数据评估和开发 LULC 产品的努力。


2.2. 耕地协议地图


耕地协议图是通过结合五个来自选定土地利用/覆盖(LULC)产品的耕地二元图生成的。最初,选定的产品使用 WGS84 参考系统统一到地理坐标,像素大小约为 度(在赤道上相当于 )。随后,多类 LULC 产品(包括 GlobeLand30、CLUD、CLCD)被重新分类为二元耕地图,值为 1 表示耕地,值为 0 表示非耕地。最后,将五个二元耕地图相加,生成一个耕地协议图,正像素值范围从 1 到 5。这些值表示识别该像素为耕地的产品数量,并指示候选耕地图在耕地识别中的不同空间一致性(SA)水平(Tubiello 等,2023)。


2.3. 田间脊区面积估算


尽管第三次国家土地调查(NLDS)采用了“所见即所得”的调查方法,但其耕地面积估算与遥感土地利用/覆盖(LULC)产品得出的估算之间仍存在显著的系统性偏差。NLDS 估算的耕地面积代表净耕地面积,排除了田埂等区域,以及道路、池塘和房屋等线性和分散特征(补充图 S1)。相比之下,遥感 LULC 产品得出的耕地面积代表总耕地面积,包括亚像素非耕地面积。因此,与 NLDS 报告相比,遥感得出的耕地面积通常表现出明显的正系统性偏差(Zhang et al., 2021a; Zhang et al., 2022b)。为了增强 NLDS 与遥感数据之间的一致性,我们通过包括田埂面积来调整 NLDS 的原始耕地面积。

县级田埂面积在第三次 NLDS 中未被报告,但第二次 NLDS 提供了地级数据。在本研究中,我们采用了一种机器学习模型(即随机森林算法)来估计第三次 NLDS 中的县级田埂面积。我们首先建立了一个地级田埂系数的随机森林模型(即田埂面积与总耕地面积的比率),使用海拔、坡度、旱地比率(即旱地面积与总耕地面积的比率)和行政身份作为解释因素,如公式(1)所示。

  错误

其中 分别代表田埂系数、海拔、坡度、旱地比例和管理身份; 是地级市。RF 算法使用 MATLAB 的 TreeBagger 函数实现,超参数(包括树的数量和每个节点的最小观察数)通过试错过程确定。我们通过五折交叉验证技术评估随机森林模型的性能。该模型达到了更高的决定系数(0.79),表明其表现良好(补充图 S2)。接下来,我们利用该模型通过纳入县级驱动变量来估计县级田埂系数。原始估计值通过公式(2)进行了偏差修正,假设地级市的田埂系数在第二和第三次 NLDS 之间保持一致。


其中 分别是 县的偏差修正和原始估计的田间脊系数,第三次 NLDS 报告的耕地面积; 是第二次 NLDS 报告的田间脊系数; 是 i 省的县数。最后,我们根据公式 (3) 调整了第三次 NLDS 的县级耕地面积。



其中 地区 县的调整后县级耕地面积。第三次 NLDS 的调整后耕地面积随后称为 NLDS 估算耕地面积。


2.4. 空间模式效率指标


尽管包括了山脊田地面积,但调查的耕地面积仍然相对于遥感产品的估计显示出系统性偏差。这归因于在遥感产品的耕地网格中确定线性和分散特征(例如,道路、池塘和房屋)覆盖面积的困难。为了考虑剩余的系统性偏差,我们引入了一种新颖的多组分空间模式匹配指标,以评估和排名候选耕地地图的准确性。该指标被称为空间模式效率(SPAEF)(Demirel 等,2018;Koch 等,2018),其公式为公式(4)。SPAEF 同时评估 NLDS 的耕地面积估计与遥感 LULC 产品之间单调关系的强度和相对变异性,以及它们在县级尺度上的空间匹配程度(Dembélé等,2020)。因此,SPAEF 是一个对偏差不敏感的指标,强调耕地的空间模式而非其大小。

SPAEF

其中 是 NLDS 的耕地面积估计与遥感产品之间的皮尔逊相关系数;Beta 的计算公式为: ,其中 分别表示标准差和均值。Beta 表示遥感衍生的耕地面积相对于 NLDS 估计值的变异性;Gama 是空间模式匹配项,计算公式为: ,其中 是县的数量, 代表耕地面积。Gama 表示遥感衍生的耕地面积的标准化值(z 分数)相对于 NLDS 标准化估计值的均方根误差。


2.5. MV-FAS 方法用于创建混合农田地图


我们提出了一种 MV-FAS 方法,通过将最先进的遥感土地利用/覆盖(LULC)产品与 NLDS 融合,创建中国的混合耕地地图(图 2)。由于 CLUD、CLCD 和 CACD 之间的非独立性(补充文本),我们的数据融合方法首先评估了每个县的三幅耕地地图之间的配对一致性。一致性的衡量标准是由两幅地图标记的耕地和非耕地面积相对于总县面积的比例。对于给定的县,选择一致性最低的地图对,因为更高的不一致性表示更多的互补信息(Gong 等,2016)。

我们接下来估计了每个候选耕地地图在给定县的 SPAEF,使用邻近 10 个县的 NLDS 耕地面积估计。然后将候选地图的平均 SPAEF( )与中国所有县的 SPAE 的第 25 百分位数(记作 q25,通过试错过程确定)进行比较。如果 ,我们认为候选地图在当前县的耕地映射上具有高度一致性,并且具有高耕地一致性的像素有很大的可能性。

图 2. 多数投票-模糊一致性评分(MV-FAS)方法的流程图。SA、SPAEF、CA 和 THR 分别表示空间一致性、空间模式效率、耕地面积和 FAS 的阈值。术语 q25 指的是中国所有县候选地图的平均 SPAEF 的第 25 百分位数。


作为农田区域。换句话说,在这种情况下,采用了 MV 方法来识别潜在的农田像素。否则,采用 FAS 方法来开发混合农田地图。

关于 MV 方法,我们假设被识别为农田的像素,如果候选者中大于或等于 的数量(即 ),则具有很高的农田可能性,遵循之前的研究(Iwao 等,2011;Li 等,2023a)。因此,我们将它们指定为中间混合图中的最小农田面积。使用等面积投影系统计算的中间混合图的累积农田面积( )随后与 NLDS 估计值进行了比较。考虑到遥感衍生的农田面积相对于调查数据的正系统偏差(补充图 S1),如果 超过 NLDS 估计的农田面积 ,则中间混合农田图被确定为最终混合图。否则,我们将 FAS 的初始阈值设定为 11(即 ,对应于当 时的最小 FAS),并继续进行 FAS 方法的下一次迭代。

关于 FAS 方法,我们首先根据候选农田地图的性能排名和空间一致性估算了给定县内每个像素的 FAS 值。具有更高 SPAEF 值的候选地图获得了更高的排名,表明更大的信心和优先级(Fritz 等,2011)。每个像素的 FAS 值是根据 FAS 表(补充表 S2)计算的。FAS 值范围从 0 到 15,值越大表示农田的可能性越高(Lu 等,2020)。随后,我们将 设定为 15,并将 FAS 值大于阈值的像素指定为中间混合图中的农田区域。如果中间图的累积农田面积( )超过 ,则被视为最终混合产品。否则,我们逐步降低 FAS 阈值,并重复上述迭代过程,直到 大于 CA 。使用 MV-FAS 方法,我们首先生成了大约 2020 年的混合农田地图。 随后,我们保留了数据协同规则,包括选定的候选耕地地图和 FAS 的阈值,并将其应用于创建其他时间段的混合耕地地图(补充文本)。最终,我们使用新创建的混合耕地地图检查了 2000 年至 2020 年中国耕地的时空变化(补充文本)。

 2.6. 精度评估


我们评估了 CCropLand30 和输入耕地地图的准确性,使用了来自 Google Images 的视觉解释样本和现有文献中的第三方样本。2015 年左右的第三方样本来自 Laso Bayas 等(2017)、Congalton 等(2017)和 Potapov 等(2021)(补充文本)。如图 3 所示,共有 2,591 个第三方样本,主要位于始终被识别为无耕地或

图 3. 验证样本的空间分布。顶部面板显示第三方样本(a)和视觉解释样本(b)的空间分布。底部面板展示不同类别像素中第三方样本(c)和视觉解释样本(d)的数量和比例。SA1-5 表示候选耕地地图在耕地识别中的不同空间一致性(SA)水平。


候选耕地地图的耕地。为了稳健评估耕地地图的性能,必须在耕地空间不一致性较低的区域中包含更多样本。因此,我们通过对谷歌图像的视觉解读,额外获得了大约 5,433 个 2020 年左右的样本。这些样本中大约 位于 SA 值在 1 到 4 之间的像素中,其余 位于输入耕地地图中耕地/非耕地分类一致的区域。

从混淆矩阵得出的性能指标,包括总体准确率(OA)、卡帕系数、F1 分数、耕地和非耕地类别的生产者准确率(PA)(补充表 S1),被用来定量评估耕地地图的准确性(Zhang et al., 2022b)。此外,耕地地图的空间模式效率(SPAEF)使用县级 NLDS 数据进行评估。最后,在中国不同地区的五个地点进行了耕地地图的视觉比较(补充图 S3)。

 3. 结果


3.1. 遥感农田地图的空间一致性


图 4 展示了五个选定土地利用/覆盖(LULC)产品之间耕地的空间一致性(SA)。候选地图在东北平原(I)、黄淮海平原(III)、四川盆地(V)和北部干旱及半干旱地区(II)中显示出高水平的耕地识别空间一致性,这些地区的耕地广泛且连续分布。相反,在青藏高原,耕地分布稀疏,导致候选地图之间的空间一致性最低。云南-贵州高原和南方中国以山地景观为特征,耕地呈现出零散的分布。在这两个农业区,少于 的耕地在四到五张地图中表现出一致的分类(即,SA )。总体而言,中国约有 的耕地被少于两张候选地图识别。这些发现强调了在中国耕地映射中,LULC 产品存在显著的不一致和不确定性,特别是在耕地零散的地区。


3.2. 遥感耕地地图的空间模式效率


如图 5a 所示,除了 GLAD 之外,所有遥感产品对农田面积的估计均高于 NLDS。与全球地图(GLAD 和 GlobeLand30)相比,三种国家农田地图(CLUD、CLCD 和 CACD)之间的农田面积估计更为一致。GlobeLand30 的农田面积估计最高,主要是因为它将耕作的牧场和以灌木为基础的经济作物(如茶和咖啡)视为农田,而其他产品则将其排除在外(见表 1)。相反,GLAD 提供的农田面积估计最低,特别是在农田分布零散且复杂的地区,包括青藏高原(V)、四川盆地(VI)和滇黔高原(VIII)。

图 4. 2020 年左右五个 LULC 地图之间的耕地空间一致性。中间面板显示了耕地一致性地图,而左侧和右侧面板展示了中国及其子区域中具有不同空间一致性水平的耕地比例。

图 5. 2020 年左右遥感耕地地图的空间模式效率。顶部面板比较了 NLDS 与候选耕地地图之间的耕地面积估算,而底部面板显示了耕地地图的空间模式效率。左侧和右侧面板分别显示了中国及九个农业区的结果。农业区 I 至 IX 分别对应东北平原、北方干旱和半干旱地区、黄淮海平原、黄土平原、青藏高原、四川盆地及周边地区、滇黔高原和南方中国(见图 4)。


和中国南方(IX)。GLAD 在这些地区的耕地面积估计低于其他产品,这可以归因于其分类错误和狭窄的作物定义(例如,耕地中排除了轮作)(Zhang et al., 2022a)。

在空间模式效率方面,CACD 与中国的 NLDS 表现出最高的空间一致性(图 5c),其次是 CLCD、GlobeLand30 和 GLAD,而 CLUD 的符合度最低。如图 5d 和补充图 S4 所示,候选耕地地图在耕地分布更广泛的农业区(如中国东北、干旱和半干旱地区以及黄淮海平原)往往具有更高的 SPAEF 和更好的与 NLDS 的空间一致性。然而,五个候选产品在所有农业区中并没有一个始终优于其他产品,这表明将它们结合起来以增强与 NLDS 的空间一致性具有显著潜力。


3.3. 混合农田地图的准确性评估


3.3.1. 像素级精度


如图 6a 所示,混合耕地图(CCropLand30)在 2020 年左右的总体精度(OA)、Kappa 系数和 F1 分数分别为 和 0.86。相比之下,输入耕地图(包括 GlobeLand30、GLAD、CLCD 和 CACD)的这些指标范围分别为 。GLAD 表现出最高的准确性,而在五个输入耕地图中,CLUD 的准确性最低。与输入耕地图的平均表现相比,CCropLand30 在 OA(提高 16%)、Kappa 系数(提高 50%)和 F1 分数( )方面取得了显著提升。在五个输入耕地图中,GlobeLand30 在耕地的生产者准确性上更高,而 GLAD 在非耕地的生产者准确性上明显更高。CCropLand30 的耕地和非耕地的生产者准确性分别接近 GlobeLand30 和 GLAD。这表明 CCropLand30 有效地利用了不同输入耕地图的优势,同时弥补了它们各自的不足。2015 年左右的第三方样本评估结果与 2020 年左右的结果相似。 值得注意的是,2015 年左右的耕地地图表现出比 2020 年更小的差异。这是因为超过 的第三方样本位于候选耕地地图一致识别为耕地或非耕地的区域,如第 2.6 节中所提到的。


3.3.2. 空间模式效率


如图 7 所示,CCropLand30 估算的县级耕地面积分布与 NLDS 数据具有很强的空间一致性。CCropLand30 在中国的 SPAEF 达到 0.80,显著高于输入耕地图的平均 SPAEF(即 0.64)。在所有农业区,CCropLand30 在 SPAEF 方面始终优于输入耕地图。与输入耕地图相比,CCropLand30 在不同区域的 SPAEF 提高范围从 。这种提升在黄土高原(IV)、青藏高原(V)、滇黔高原(VIII)和华南(IX)尤为明显。

 3.3.3. 视觉比较


图 8 显示了 CCropLand 30 与输入耕地地图的区域比较。在位置 A,耕地地图,包括 CCropLand30、GLAD、GlobeLand30 和 CLUD 彼此之间显示出强一致性,紧密匹配实际耕地分布。然而,CLCD 和 CACD 在该地区显著低估了耕地范围。对于位置 B 和 C,CCropLand30、GLAD、CLCD 和 CACD 与实际耕地分布相比,表现出更高的一致性和更好的对齐。在位置 D,CCropLand30 和 CLCD 准确描绘了实际耕地范围,而 GlobeLand30、CLUD 和 CACD 则倾向于高估耕地。


图 6. 混合地图(CCropLand30)和输入耕地地图(GlobeLand30、GLAD、CLUD、CLCD 和 CACD)的性能指标值。顶部和底部面板分别显示了大约 2020 年(a)和 2015 年(b)的结果。OA 和 PU 分别代表总体准确度和生产者准确度。

 耕地面积(百万公顷)

图 7. 混合耕地地图(CCropLand30)和输入耕地地图的空间模式效率。顶部面板显示了 NLDS(a)和 CCropLand30(b)的县级耕地面积估计分布,而底部面板则比较了 CCropLand30 的 SPAEF 与包括 GlobeLand30、GLAD、CLUD、CLCD 和 CACD 在内的输入耕地地图的平均 SPAEF。农业区从 I 到 IX 与图 5 相同。

GLAD 大大低估了它们。GlobeLand30 明显高估了农田,而 GLAD、CLUD 和 CACD 则大幅低估了它们。相比之下,CCropLand30 和 CLCD 与实际农田分布表现出良好的一致性。区域比较确认了 CCropLand30 相对于输入农田地图的优越性。


3.4. 农田的空间格局和时间变化


如图 9 所示,中国的耕地面积在 2000 年至 2020 年间显著减少,从 1.64 亿公顷降至 1.61 亿公顷(Mha)。值得注意的是,在此期间,干旱和半干旱地区(II)的耕地显著增加了 (或 3.47 Mha)。耕地的扩张归因于农业投入的增加和灌溉效率的提高(Fu et al., 2022),这对该地区的水安全构成了重大挑战(Chen et al., 2022a)。东北平原(I)和青藏高原(V)也经历了耕地的增加。相反,在其余农业区,耕地在 2000 年至 2020 年间持续呈下降趋势。这些地区耕地减少的原因可以归结为人口增长和快速城市化等社会经济因素(Zhou et al., 2023)。如图 10 所示,耕地主要分布在平原和湿润地区。在 2000 年至 2020 年期间,所有四个地貌区的耕地均呈下降趋势,其中平原的下降幅度较其他区域更为明显。 耕地在湿润和半湿润地区呈下降趋势,而这些地区的水资源相对丰富。相比之下,在水资源稀缺的干旱和半干旱地区,耕地则呈上升趋势。这种对比趋势可能加剧中国水资源与土地资源之间的空间不匹配。

 4. 讨论


4.1. MV-FAS 方法的优缺点


本研究提出了一种新颖的 MV-FAS 方法来开发混合耕地地图。我们方法的关键优势在于其独立于训练样本,这使其与许多现有的数据协同方法区分开来,后者严重依赖于广泛且具有代表性的训练样本(Schepaschenko 等,2015)。我们的数据融合方法还通过以下策略考虑了遥感数据与调查数据之间的系统性偏差:(1)通过纳入山脊田地面积来调整调查的耕地面积;(2)引入一种对偏差不敏感的空间模式匹配指标来评估和排名候选耕地地图;(3)考虑与耕地高度一致的像素作为候选地图的最小耕地范围。

图 8. 混合农田地图(CCropLand30)与输入农田地图的视觉比较。A-E 的位置见补充图 S3。从上到下的七行分别对应谷歌地图、混合地图和五个输入农田地图(即 GlobeLand30、GLAD、CLUD、CLCD 和 CACD)。


地图在农田识别方面显示出高度一致性;(4)假设基于网格的农田面积估计值大于而不是接近调查结果。我们将我们的方法与传统的 FAS 方法进行了比较,后者未考虑遥感数据与调查数据之间的系统性偏差(Fritz et al., 2011;Lu et al., 2020)。我们的结果表明,尽管传统的 FAS 方法可以提高农田制图的准确性,但与输入地图相比,其性能显著低于我们的 MV-FAS 方法(补充图 S6)。

此外,我们的 MV-FAS 方法不仅易于实施,而且计算效率高。考虑到需要使用 遥感产品处理中国超过 150 亿个网格,计算效率成为创建混合农田地图的重要考虑因素。我们的方法可以在配备英特尔酷睿处理器的联想笔记本电脑上仅用两小时生成混合农田地图。


i9980H-CPU,16 GB RAM 和 8 个处理器核心。此外,我们的方法灵活,可以创建其他混合地图(例如,森林和草地)并处理新的可用 LULC 产品。除了农田面积,NLDS 还报告其他土地利用类型的县级数据,使得能够为不同土地利用类别创建可靠的专题地图。预计遥感技术和分类算法的进步,我们的方法可以轻松吸收这些改进,进一步提高未来农田制图的准确性。

然而,我们的方法也有一些缺点。首先,它严重依赖可靠和详细的(即县级)耕地调查或普查数据。较粗的空间分辨率(例如,地级和省级)或高不确定性的调查或普查数据会显著影响混合耕地地图的性能。其次,我们的方法专门设计用于创建混合地图。

图 9. 2000 年至 2020 年中国耕地面积及变化。中间面板显示了稳定(未变化)、扩展和减少的耕地面积。左侧和右侧面板展示了中国及九个农业区的耕地面积变化。

图 10. 2000 年至 2020 年中国不同地貌和气候区的耕地面积。顶部面板比较了不同地貌(a)和气候(b)区的耕地面积和比例。底部面板显示了 2000 年至 2020 年耕地面积的净变化。地貌和气候区的空间分布见补充图 S5。


单一土地利用类型,而不是多类产品。将单类混合图集成到多类产品中的策略需要进一步探索。最后,与其他数据融合方法类似,我们的 MV-FAS 方法的性能在很大程度上依赖于候选图的准确性。在所有候选图的分类准确性较低的区域,我们的方法无法实现。


在制图精度方面有显著改善。尽管存在这些局限性,我们的 MV-FAS 方法对农田制图做出了宝贵贡献,并可以作为进一步研究和数据融合技术进展的基础。解决这些局限性并探索潜在的改进无疑将提升我们方法在未来的准确性和适用性。


4.2. 本研究的局限性


我们承认本研究存在几个局限性。首先,耕地的定义在所选的遥感土地利用/覆盖(LULC)产品中存在不一致性(见第 2.1.1 节)。作物定义的差异难以协调,可能影响本研究及其他类似研究中混合耕地地图的准确性(Fritz 等,2011;Yu 等,2013;Zhong 等,2019;Lu 等,2020)。其次,所选的 30 米 LULC 产品在南方耕地分类中存在显著的差异和不确定性。这主要归因于“混合像素”问题,因为南方许多田地的面积小于 900 平方米 。然而,混合耕地地图的创建实际上无法解决“混合像素”问题,需要进一步努力来应对这一问题,例如生成超高分辨率的耕地地图(Li 等,2023b)。第三,本研究考虑了遥感衍生的耕地面积与调查数据之间的正系统偏差,前者代表总耕地面积,后者代表净面积(补充图 S1)。 虽然这一考虑可以显著提高农田制图的准确性(补充图 S6),但它也给结果带来了新的不确定性。这是因为很难确定遥感产品与调查数据之间系统性偏差的实际大小。最后,混合农田地图的性能在很大程度上依赖于土地调查数据的可靠性和时间一致性。本研究首次利用中国最可靠的土地调查数据(即第三次 NLDS)来创建混合农田地图。然而,遥感产品与 NLDS 之间的时间差异可能会给制图结果带来额外的误差。

 5. 结论


本文概述了中国高分辨率混合耕地地图的开发(CCropLand30)。提出了一种多数投票模糊一致性评分(MV-FAS)方法,以整合五种最先进的土地利用/覆盖产品(即 GlobeLand30、GLAD、CLUD、CLCD 和 CACD)与最新的国家土地调查(NLDS)。通过视觉解读和第三方样本评估了混合耕地地图和候选耕地地图的准确性。此外,使用县级 NLDS 数据评估了耕地地图的空间模式效率(SPAEF)。在中国不同地区的五个地点进一步进行了耕地地图的视觉对比。最后,我们利用混合耕地地图考察了 2000 年至 2020 年中国耕地的时空变化。

结果显示,在候选产品中,耕地识别存在显著的分歧和不确定性,特别是在耕地碎片化的地区。此外,在与使用 SPAEF 的 NLDS 进行比较时,五个候选产品在所有农业区中并没有一个能够始终优于其他产品。这些发现强调了通过数据融合技术提高耕地制图准确性的必要性和潜力。CCropLand30 与参考点的符合度优于输入地图,2020 年左右的整体准确率(OA)、Kappa 系数和 F1 分数分别为 和 0.86。相比之下,输入耕地地图的这些指标范围分别为 。此外,CCropLand30 与 NLDS 的符合度优于输入耕地地图,在中国达到了 0.80 的高 SPAEF。耕地地图的视觉比较进一步确认了 CCropLand30 相对于输入地图的优越性。这些发现表明,混合地图成功利用了不同输入耕地地图的优势,同时弥补了它们的不足。

CCropLand30 显示,从 2000 年到 2020 年,中国的耕地面积呈明显下降趋势。值得注意的是,在此期间,干旱和半干旱地区的耕地面积显著增加了 (或 347 万公顷),而在平原以及湿润和半湿润地区,如黄淮海平原、中下游长江平原和南方地区,耕地面积显著减少。这种对比趋势可能加剧中国水资源与土地资源之间的空间不匹配,给可持续的土地和水资源管理带来重大挑战。我们新开发的混合耕地地图将大大支持耕地监测和管理,以及在农业、水资源和气候变化等多个领域的研究。


CRediT 作者贡献声明


张玲:概念化、撰写 - 原始草稿、方法学、资金获取、数据管理、调查、验证、撰写 - 审阅与编辑。王伟国:调查、数据管理、撰写 - 审阅与编辑。马启敏:调查、数据管理、撰写 - 审阅与编辑。胡颖怡:可视化、撰写 - 审阅与编辑。马辉:可视化、撰写 - 审阅与编辑。赵彦博:数据管理、方法学、撰写 - 审阅与编辑。


竞争利益声明


作者声明,他们没有已知的竞争性财务利益或个人关系,这些关系可能会影响本文所报告的工作。

 数据可用性


我们的混合农田地图(CCropLand30)可以在以下链接自由访问:https://doi.org/10.6084/m9.figshare.23764248.v2(Zhang et al., 2023)。

 致谢


本研究得到了中国国家自然科学基金(42271286 和 41901045)以及中国科学院青年创新促进会(2023454)的支持。我们非常感谢中华人民共和国自然资源部提供的数据。


附录 A. 补充数据


本文的补充数据可以在线找到,网址为 https://doi. org/10.1016/j.compag.2024.108672。

 参考文献


贝克-雷谢夫, I., 巴克, B., 汉伯, M., 普里切利, E., 桑切斯, A., 萨哈贾帕尔, R., 麦高赫, K., 贾斯蒂斯, C., 巴鲁斯, B., 吴, B., 普拉卡什, A., 阿卜杜勒雷扎, A., 贾维斯, I., 2019. GEOGLAM 作物监测器用于 AMIS:在全球市场背景下评估作物状况。全球食品安全 23, 173-181. https://doi.org/10.1016/j. gfs.2019.04.010.


Bey, A., Sánchez-Paus Díaz, A., Maniatis, D., Marchi, G., Mollicone, D., Ricci, S., Bastin, J.-F., Moore, R., Federici, S., Rezende, M., Patriarca, C., Turia, R., Gamoga, G., Abe, H., Kaidong, E., Miceli, G., 2016. Collect Earth: 通过增强视觉解读进行土地利用和土地覆盖评估。遥感. (巴塞尔). https://doi.org/10.3390/rs8100807.


比舍龙,P.,德福尔尼,P.,布罗克曼,C.,肖滕,L.,范库特森,C.,赫克,M.,邦坦普斯,S.,勒罗伊,M.,阿查尔,F.,赫罗德,M.,2008 年。全球覆盖:产品描述和验证报告。荷兰诺德维克。


陈, J., 陈, J., 廖, A., 曹, X., 陈, L., 陈, X., 何, C., 韩, G., 彭, S., 陆, M., 张, W., 童, X., 米尔斯, J., 2015. 全球土地覆盖图绘制,分辨率为 30 米:A

    •  通讯作者。

    电子邮件地址:zhanglingky@lzb.ac.cn(L. Zhang)。