这是用户在 2025-5-7 14:57 为 https://app.immersivetranslate.com/pdf-pro/94c83cb8-71fa-48aa-a21a-c0c6a7d35538/ 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?

使用空间分析技术和谷歌地球引擎进行作物地数据融合与校正

靳伟 Li a , b Li a , b Li^(a,b)\mathrm{Li}^{\mathrm{a}, \mathrm{b}} 和 许克瑞 a a ^(a){ }^{\mathrm{a}} a ^("a "){ }^{\text {a }} 中国科学院地理科学与资源研究所地表格局与模拟重点实验室,北京,中国;b 中国科学院大学,北京,中国

  摘要

准确识别区域耕地数量和空间分布对于耕地监测、粮食安全和区域可持续发展至关重要。许多国家和组织已生产了一系列土地覆盖产品。然而,遥感器、土地覆盖分类方案和分类方法之间的差异导致了差异。在本研究中,我们开发了一种新方法,通过融合和纠正四个耕地产品:CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC,以提高“一带一路”地区的耕地数据精度。实施了空间分析技术,包括气候分层、一致性评估和统计滤波,以开发模型校正的训练样本。使用这些训练样本执行 Google Earth Engine(GEE)平台和随机森林(RF)算法,以纠正融合的多数据产品,并生成一个校正后的 2015 年耕地产品。校正后的产品表明,耕地占“一带一路”地区的 14.94 % 14.94 % 14.94%14.94 \% ,其结果比任何四个单个土地覆盖产品都更接近联合国粮农组织(FAO)统计的结果。 在国家尺度上,校正后的耕地产品数量与联合国粮农组织(FAO)统计数据之间的均方根误差为 11.39 % 11.39 % 11.39%11.39 \% ,相关系数值为 0.77。这表明该方法具有更好的拟合特性。使用 3112 个通过目视解译和谷歌地球获取的样本,评估了四个耕地产品之间不一致区域的校正产品精度。校正后的耕地产品在不一致区域的整体精度为 77.54 % 77.54 % 77.54%77.54 \% 。校正后的耕地产品产生的最高精度表明了我们的方法的有效性,该方法可以快速提高异质地区的耕地数据精度。结合现有耕地产品融合和更新技术以及来自 GEE 平台的多源遥感数据,我们预见该方法有潜力应用于更新全球耕地产品。

  文章历史

  收到日期:2020年6月27日
  接受日期:2020年10月13日

  关键词

耕地;数据融合;谷歌地球引擎;一带一路地区

  1. 引言

土地利用/土地覆盖(LULC)可以强烈影响人类社会、经济活动和自然生态(Allan 2004;Foley 等人 2005)。LULC 变化影响地表环境和生态系统结构,进一步改变区域生态系统服务功能并增加区域生态风险(Jarnagin 2004;Maeda、Formaggio 和 Shimabukuro 2008)。绘制 LULC 及其变化说明了地球系统变化对土地科学研究的驱动因素(Verburg、Neumann 和 Nol 2011)。它还有助于政府决策和土地资源的可持续利用(Jin 等人 2017)。
遥感、地理信息系统(GIS)技术的利用以及使用多源遥感数据集已成为主要
LULC 制图方法。自 20 世纪 90 年代以来,许多国家和国际组织已在区域和全球尺度上应用了具有不同空间和时间分辨率的地表覆盖产品。这些包括产品验证、产品分析和产品协同(Fritz 等人 2011a;Hansen 和 Reed,2000;Jung 等人 2006;Mayaux 等人 2006)。具有粗分辨率的地表覆盖产品包括 IGBP DISCover、GLC 2000 和 1 公里的 UMD,500 米的 MODIS Collection 5,以及 300 米分辨率的 CCI-LC、GlobCover(Bartholome 和 Belward 2005;Bicheron 等人 2008;Friedl 等人 2010;Hansen 等人 2000;Loveland 等人 2000;Santoro 等人 2017)。具有 30 米中等分辨率的产品包括 GlobeLand 30、GFSAD 30 和 FROM-GLC(Chen 等人 2015;Gong 等人 2013;Oliphant 等人 2019;Teluguntla 等人 2018)。由于数据量、工作量等问题。
和图像信息提取(Gong 等人,2019 年),很少有大范围的高分辨率土地覆盖产品被发布(只有 FROM-GLC10 在 10 m ) 10 m ) 10m)10 \mathrm{~m}) 。尽管许多土地覆盖产品描述了地球表面,但产品之间的制图精度和一致性限制了研究人员在许多应用中的使用(Fritz 和 See,2008 年)。
精确的全球和区域土地覆盖产品为研究全球变化、地表过程模拟、生态文明建设以及区域可持续发展提供了重要的基础数据(GCOS. 2013)。然而,在异质地区,现有土地覆盖产品精度低且一致性差,限制了它们在区域和全球尺度上的应用。大量研究表明,空间异质性是导致整体精度低的主要原因,这主要反映在一些混合类别中。(Congalton et al. 2014; Herold et al. 2008; Latifovic and Olthof 2004)。此外,由于降水变化、光照时间、温度、农业政策以及城市扩张等因素,农田的空间分布是不确定的。现有土地覆盖产品在遥感器、时空分辨率、土地利用/土地覆盖(LULC)分类方案和分类方法方面表现出一致性差(Grekousis, Mountrakis, and Kavouras 2015)。 这些导致类别精度不同,特别是在过渡区,并进一步妨碍了土地覆盖产品在多种学科中的有效利用(Congalton 等人,2014 年;Fritz 等人,2011a 年;Herold 等人,2008 年)。
随着多源土地覆盖产品日益丰富且易于获取,应用数据融合方法与统计技术克服了现有土地覆盖产品的兼容性、可比性和精度限制(Jung 等人,2006 年;Ran 等人,2012 年;See 和 Fritz,2006 年)。这些策略可以根据融合方法分为两种类型:地理加权回归(GWR)和融合决策规则。一些研究使用 GWR 来预测土地覆盖空间分布的概率(Schepaschenko 等人,2015 年;See 等人,2015 年)。然而,训练样本的数量和采样密度决定了在大区域内的分类精度(Chen 等人,2012 年;Lu 等人,2014 年)。在融合决策规则中,使用多个模型,如贝叶斯理论(Gengler 和 Bogaert,2018 年;Xu 等人,2014 年)、Dempster-Shafer 证据理论(Ran、Li 和 Lu
2009 年),以及模糊集理论(Perez-Hoyos、GarciaHaro 和 San-Miguel-Ayanz,2012 年),已被用于根据输入土地覆盖产品的兼容性生成协同土地覆盖产品。一些研究表明,原始土地覆盖产品的质量显著影响最终协同产品的精度(Fritz 等人,2011b;Fritz 等人,2015 年)。此外,建立规则需要大量的先验知识和土地利用统计数据。当土地覆盖产品的数量增加且研究区域扩大时,现有的数据融合方法可能既耗时又难以实施(Lu 等人,2017 年)。
收集训练样本的主要方法包括广泛实地调查(Oliphant 等人,2019 年)、高分辨率遥感图像的目视解译(Yu 和 Gong,2012 年)以及使用众包数据(如开放获取的 GIS 数据和 Geo-wikis)(Fritz 等人,2009 年)。但训练样本数量不足、分布不均以及难以频繁更新可能会限制其在广大区域的应用。一些研究从土地覆盖产品中提取训练样本;它们可以是自动的、充足的、分布广泛的,并与多种土地覆盖类别相关(Huang 等人,2018 年;Jia 等人,2014 年;Radoux 等人,2014 年;Sexton 等人,2013 年;Wessels 等人,2016 年;Zhang 和 Roy,2017 年)。数学形态学和光谱特征是可用于从土地覆盖产品中选择训练样本的方法。数学形态学用于对不同土地覆盖类别的边界像素进行空间滤波,特别是对于那些经常被错误分类的类别。 这种方法有助于减少土地覆盖产品与遥感数据之间的空间差异,但在景观破碎化程度高的地区可能会出现训练样本提取不足的情况(Radoux 等人,2014 年;Sexton 等人,2013 年;Zhang 和 Roy,2017 年)。光谱特征可用于去除异常像素(Huang 等人,2017 年;Radoux 等人,2014 年;Wessels 等人,2016 年)。然而,这种方法并没有显著提高分类精度(Radoux 等人,2014 年;Wessels 等人,2016 年)。大多数研究从单一土地覆盖产品中提取训练样本,训练样本的可靠性很容易受到分类错误和土地覆盖变化的影响。因此,我们提出了一种从多源土地覆盖产品中提取训练样本的快速方法,可以提高可靠性和精度。
传统土地覆盖制图方法处理大量遥感影像并收集大量训练样本。这需要大量时间,包括计算时间(Waldner 等人,2015 年;张、冯和姚,2014 年)。谷歌地球引擎(GEE)是一个云计算平台,专门用于批量处理遥感影像(如 Landsat 和 Sentinel 系列)和其他地球科学数据(Gorelick 等人,2017 年)。它帮助研究人员在云端访问和处理大量影像(Gorelick 等人,2017 年)。通过结合从各种土地覆盖产品中提取的现有训练样本和利用 GEE 平台强大的云计算能力和多源遥感数据更新方法,可以实现全球土地覆盖的长期系列制图。
在这篇论文中,我们提出了一种使用空间分析技术的新型数据融合方法。这种方法结合了多源土地覆盖产品和 GEE 平台的信息,以快速生成一个 2015 年大区域(“一带一路”地区)的高精度耕地产品。首先,我们对四个耕地产品进行一致性分析,并从完全一致的区域生成过滤后的训练样本。其次,使用这些训练样本和随机森林(RF)算法,利用大量卫星数据和 GEE 云计算来纠正不一致的区域。第三,联合国粮食及农业组织(FAO(2015))的耕地统计数据和视觉
使用从 Google Earth 获取的解释参考样本来验证结果的可靠性。

  2. 材料

  2.1. 研究区域

“一带一路”地区包括 65 个国家,覆盖面积约为 630 万平方公里,横跨亚洲、欧洲和非洲三大洲(图 1)。受“一带一路”倡议的启发,土地利用重点关注三条路线:(1)从中国经中亚和俄罗斯到达欧洲波罗的海;(2)从中国经中东和西亚到达波斯湾和地中海;(3)从中国到东南亚、南亚和印度洋。复杂多样的自然环境因素给整个地区的土地利用制图带来了挑战(Dong 等人,2018 年)。2015 年,“一带一路”地区有 46 亿人口,占地球 74 亿人口总数的 62.6 % 62.6 % 62.6%62.6 \% (联合国人口司,2019 年)。

  2.2. 数据

2.2.1. 土地利用产品

本研究使用 2015 年的土地利用产品(CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC),以及从粮农组织(2015 年)获得的“一带一路”地区耕地统计数据。
气候变化倡议-土地覆盖(CCI-LC)产品包含空间分辨率为
图 1. “一带一路”地区 65 个国家的位置和分布(图 1 的基础图像来自 Esri 世界地形图。蓝色部分代表海洋,其余部分代表陆地)
从 1992 年到 2015 年,使用 MERIS、AVHRR、SPOTVGT 和 PROBA-V 数据集,距离 300 米。它使用联合国土地覆盖分类系统(LCCS)的 22 个类别。30 米分辨率的全球粮食安全支持分析数据产品(GFSAD30)使用三级分类系统:水、耕地和非耕地,这些分类基于 30 米分辨率的 Landsat ETM+/OLI 图像识别(Oliphant 等人,2019 年;Teluguntla 等人,2018 年)。MODIS 土地覆盖类型集合(MCD12Q1)使用 2001 年至 2018 年的 MODIS 数据,空间分辨率为 500 米,并使用国际地圈生物圈计划(IGBP)的 17 个类别分类系统(Friedl 等人,2010 年)。Finer 分辨率观测和监测-全球土地覆盖(FROM-GLC)使用 30 米分辨率的 Landsat TM/ETM+图像和包含 11 个类别的独特分类系统(Gong 等人,2013 年)。这四个土地覆盖产品在遥感器、分类方法、空间分辨率和分类方案上的差异导致耕地空间分布不一致。因此,我们在 2015 年使用四个土地覆盖产品在 B&R 地区进行数据融合和校正(表 1)。
为了避免像素位移引起的二次误差,所有数据均使用地理坐标系(WGS84)定义,无需投影。使用 CCI-LC 边界来统一每个网格位置,并最小化由于四个土地覆盖产品(CCI-LC、GFSAD30、MCD12Q1 和 FROMGLC)之间存在不同边界而引起的栅格错位。此外,具有不同分辨率的产品应重采样到相同的空间分辨率。在本研究中,我们将空间分辨率统一为
应与 CCI-LC 相同,并使用多数面积法整合离散土地覆盖产品(Poulter 等人,2015 年)。重采样的网格中的土地覆盖类别取决于原始网格中最大面积百分比(主要)贡献的类别(图 S1)。四个土地覆盖产品被重采样到大约 0.0027 0.0027 0.0027^(@)0.0027^{\circ} × 0.0027 × 0.0027 xx0.0027^(@)\times 0.0027^{\circ} 300 m × 300 m 300 m × 300 m 300mxx300m300 \mathrm{~m} \times 300 \mathrm{~m} )网格,并重新分配为两类:耕地和非耕地。

2.2.2. Landsat 30 米影像时间合成(用于 GEE)

该研究使用了来自 Landsat 7 ETM+和-8 OLI 传感器的正射校正地表反射率(SR)数据(L1T)Tier 1,在 GEE 中用于纠正土地覆盖产品之间的不一致区域。选择 2014 年至 2016 年覆盖研究区域的图像作为无云像素的来源。Landsat 系列卫星提供了最长的免费下载地球卫星图像历史,适合大规模空间分析(Pekel 等人,2016 年;Wulder 等人,2016 年)。尽管 Landsat-7 扫描线校正器的故障导致每个场景中大约有 22 % 22 % 22%22 \% 数据丢失(Markham 等人,2004 年),但它弥补了东南亚和中国南方等地区由季节性降雨引起的数据空白(Irons,Dwyer 和 Barsi,2012 年)。使用 CFMask 波段从每张图像中移除由云、冰、雪和阴影引起的低质量观测(Zhu 和 Woodcock,2012 年)。总共使用了 12 个光学波段来组成图像集合。蓝色、绿色、红色、近红外(NIR)、短波红外(SWIR)1、SWIR 2 和热红外
表1。四个土地覆盖产品的概述。
  产品   传感器   创建者   时间   分类方法   空间分辨率   分类方案   总体精度(%)
CCI-LC MERIS FR/RR, AVHRR, SPOTVGT, PROBA-V ESA 1992-2015 非监督分类和机器学习 300 m   联合国粮农组织土地覆盖分类系统22类 74.1(Santoro 等人,2017 年)
GFSAD 30 Landsat ETM+/OLI USGS 2015   机器学习   30米   3类 94.0(Teluguntla 等人,2018 年)
MCD12Q1 MODIS   波士顿大学 2001-2019 监督分类和决策树 500 m   IGBP 17 类别 71.6 (Friedl et al. 2010)
FROMGLC Landsat TM/ETM+ CESSC 2010, 2015, 2017 监督分类   30 米   11 类 63.7 (Gong 等人,2013)
Product Sensor Creator Time Classification method Spatial resolution Classification scheme Overall Accuracy(%) CCI-LC MERIS FR/RR, AVHRR, SPOTVGT, PROBA-V ESA 1992-2015 Unsupervised Classification and Machine learning 300 m FAO LCCS 22 classes 74.1 (Santoro et al. 2017) GFSAD 30 Landsat ETM+/OLI USGS 2015 Machine learning 30 m 3 classes 94.0 (Teluguntla et al. 2018) MCD12Q1 MODIS Boston University 2001-2019 Supervised classification and Decision tree 500 m IGBP 17 classes 71.6 (Friedl et al. 2010) FROMGLC Landsat TM/ETM+ CESSC 2010, 2015, 2017 Supervised classification 30 m 11 classes 63.7 (Gong et al., 2013)| Product | Sensor | Creator | Time | Classification method | Spatial resolution | Classification scheme | Overall Accuracy(%) | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | CCI-LC | MERIS FR/RR, AVHRR, SPOTVGT, PROBA-V | ESA | 1992-2015 | Unsupervised Classification and Machine learning | 300 m | FAO LCCS 22 classes | 74.1 (Santoro et al. 2017) | | GFSAD 30 | Landsat ETM+/OLI | USGS | 2015 | Machine learning | 30 m | 3 classes | 94.0 (Teluguntla et al. 2018) | | MCD12Q1 | MODIS | Boston University | 2001-2019 | Supervised classification and Decision tree | 500 m | IGBP 17 classes | 71.6 (Friedl et al. 2010) | | FROMGLC | Landsat TM/ETM+ | CESSC | 2010, 2015, 2017 | Supervised classification | 30 m | 11 classes | 63.7 (Gong et al., 2013) |
波段(TIR)1 与多个植被指数(见公式(1)至(5))相结合,包括归一化植被指数(NDVI)、增强型植被指数(EVI)、归一化烧伤指数(NBR 2)、地表水指数(LSWI)和绿色叶绿素植被指数(GCVI),用于分类(Dong 等人,2016 年;Oliphant 等人,2019 年;Teluguntla 等人,2018 年;Tian 等人,2019 年;Zhang 等人,2018 年)。地形数据,如海拔和坡度,在土地覆盖分类过程中非常有帮助(Benediktsson、Swain 和 Ersoy,1990 年)。因此,使用了来自 GEE 的 30 米航天飞机雷达地形任务(SRTM)数字高程数据,以及从该数字高程模型派生的坡度,以协助农田校正。
[
N D V I = N I R R E D N I R + R E D E V I = 2.5 × N I R R E D N I R + 6 × R E D 7.5 × B L U E + 1 G C V I = N I R G R E E N 1 L S W I = N I R S W I R 1 N I R + S W I R 2 N B R 2 = S W I R 1 S W I R 2 S W I R 1 + S W I R 2 N D V I = N I R R E D N I R + R E D E V I = 2.5 × N I R R E D N I R + 6 × R E D 7.5 × B L U E + 1 G C V I = N I R G R E E N 1 L S W I = N I R S W I R 1 N I R + S W I R 2 N B R 2 = S W I R 1 S W I R 2 S W I R 1 + S W I R 2 {:[NDVI=(NIR-RED)/(NIR+RED)],[EVI=2.5 xx(NIR-RED)/(NIR+6xx RED-7.5 xx BLUE+1)],[GCVI=(NIR)/(GREEN)-1],[LSWI=(NIR-SWIR1)/(NIR+SWIR2)],[NBR2=(SWIR1-SWIR2)/(SWIR1+SWIR2)]:}\begin{gathered} N D V I=\frac{N I R-R E D}{N I R+R E D} \\ E V I=2.5 \times \frac{N I R-R E D}{N I R+6 \times R E D-7.5 \times B L U E+1} \\ G C V I=\frac{N I R}{G R E E N}-1 \\ L S W I=\frac{N I R-S W I R 1}{N I R+S W I R 2} \\ N B R 2=\frac{S W I R 1-S W I R 2}{S W I R 1+S W I R 2} \end{gathered}
]
B&R 区域(如东南亚和华南)的一些地区多云,影响了 Landsat 影像的使用。为确保足够的覆盖范围并减少云层的影响,我们使用了三个时期(时期 1:1-120 天,时期 2:121-240 天,时期 3:241-365 天),2015 年 12 个波段的方差,以及多年(2014-2016 年)Landsat-7 和-8 的 SR 影像,用于整个 B & R B & R B&RB \& R 区域的影像合成(Oliphant 等人,2019 年;Teluguntla 等人,2018 年)。对于每个时期,使用 12 个波段(蓝光、绿光、红光、近红外、短波红外 1、短波红外 2、热红外 1、NDVI、EVI、GCVI、LSWI 和 NBR 2)进行合成,采用该时期像素的中值。使用上述波段和指数可以表示每个时期作物生长的物候信息。因此,对于 B&R 区域,由三个时期合成的 12 个中值光学波段,2015 年 12 个光学波段的方差
高程和坡度结果形成了一个 50 波段图像合成(图 S2)。

3. 农用地产品融合与校正方法

使用空间分析技术进行作物地数据融合和校正的方法包括六个阶段:(1) 统一四个土地覆盖产品中作物地的定义;(2) 根据气候特征将整个 B&R 地区划分为不同的子区域;(3) 对四个土地覆盖产品进行一致性评估,以生成完全一致和不一致的区域;(4) 从完全一致的区域中提取训练样本,并根据双标准差范围准则( 2 σ 2 σ 2sigma2 \sigma 准则)对训练样本进行净化;(5) 使用 Landsat 合成影像和 GEE 中的 RF 算法,结合在阶段 2 中生成的训练样本,对整个 B & R B & R B&RB \& R 地区的 inconsistent areas 进行校正;以及 (6) 使用 FAO(2015)作物地统计数据和在 Google Earth 中对测试样本进行视觉解释(图 2)。

3.1. 统一作物地的定义

不同土地覆盖产品中作物土地定义的深度和广度不同(表2),导致作物土地面积和空间分布不一致。在进行数据融合和校正之前统一作物土地定义可能会提高训练样本的准确性。
以下规则用于确定作物土地的范围:(1)在四个土地覆盖产品中选择了所有作物土地类别(如雨养和灌溉作物土地、复杂作物土地和镶嵌作物土地),(2)将作物比例超过 50%的类别定义为作物土地,其余的则定义为非作物土地。图 S 3 显示了四个作物土地产品(CCILC、GFSAD30、MCD12Q1 和 FROM-GLC)在统一作物土地和非作物土地定义下的空间分布。

3.2. 研究区分层

气候因素和各种作物导致该区域空间面积的光谱特征显著不同(Brown、Beurs 和 Marshall 2012;Portmann、Siebert 和 Döll 2010)。
图 2. 四种作物地产品(CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC)的数据融合与校正流程图。
表 2. 根据四种土地覆盖产品的分类系统对作物地的定义比较。
  产品   类别描述   规则
CCI-LC   旱地耕地   耕地
灌溉或洪水后耕地
拼接耕地(>50%)/自然植被(树木、灌木、草本覆盖)( < 50 % < 50 % < 50%<50 \%
拼接自然植被(树木、灌木、草本覆盖)(>50%)   非-
/耕地(<50%)耕地
GFSAD30 耕地(耕地和耕地撂荒地)   耕地
MCD12Q1 耕地(至少60%的面积是耕地)   耕地
耕地/自然植被镶嵌体(小规模种植40-60%与自然树木、灌木或草本植被的镶嵌体。)   耕地
FROMGLC 耕地(水稻、温室、其他)   耕地
Product Classes Description Rules CCI-LC Cropland, rainfed Cropland Cropland, irrigated or post-flooding Mosaic cropland (>50%)/natural vegetation (tree, shrub, herbaceous cover) ( < 50% ) Mosaic natural vegetation (tree, shrub, herbaceous cover) (>50%) Non- /cropland (<50%) cropland GFSAD30 Cropland (Cropland and cropland fallows) Cropland MCD12Q1 Croplands (At least 60% of area is cultivated cropland) Cropland Cropland/Natural Vegetation Mosaics (Mosaics of small-scale cultivation 40-60% with natural tree, shrub, or herbaceous vegetation.) Cropland FROMGLC Cropland (Rice, Greenhouse, Other) Cropland| Product | Classes Description | Rules | | :--- | :--- | :--- | | CCI-LC | Cropland, rainfed | Cropland | | | Cropland, irrigated or post-flooding | | | | Mosaic cropland (>50%)/natural vegetation (tree, shrub, herbaceous cover) ( $<50 \%$ ) | | | | Mosaic natural vegetation (tree, shrub, herbaceous cover) (>50%) | Non- | | | /cropland (<50%) cropland | | | GFSAD30 | Cropland (Cropland and cropland fallows) | Cropland | | MCD12Q1 | Croplands (At least 60% of area is cultivated cropland) | Cropland | | | Cropland/Natural Vegetation Mosaics (Mosaics of small-scale cultivation 40-60% with natural tree, shrub, or herbaceous vegetation.) | Cropland | | FROMGLC | Cropland (Rice, Greenhouse, Other) | Cropland |
因此,使用了柯本-盖革气候图来提高修正不一致区域的准确性和处理速度。该图基于全球长期月降水量和温度站数据(Peel 等人,2007 年)。表 S1 展示了如何根据月降水量和温度计算气候类型。
我们使用了柯本-盖革气候类型中的第一类(如热带、干旱、温带、寒冷和极地区域),以及政治行政区划边界来对子区域进行适当调整。我们使用行政区划边界,因为我们认为同一国家内可能存在相似的作物和种植系统。
具有相同气候类型第一类的相邻区域被合并为新的子区域。B&R 地区最终被划分为 11 个子区域(详细情况请参见图 S4)。后续步骤,如选择训练样本和修正不一致区域,也在新划分的区域中分别进行。

3.3. 土地覆盖产品的致性分析

对四种作物地产品进行了一致性评估,以从现有产品中提取可靠信息用于融合和校正。对重采样和重分类的土地覆盖产品(CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC)进行了栅格叠加。值 1-3 表示不一致区域,其中 1-3 种作物地产品将像元识别为作物地。值 4 和 0 表示完全一致区域(图 3)。前者表示所有四种作物地产品都将像元分类为作物地,而后者表示所有四种作物地产品都将像元分类为非作物地。我们假设四种作物地产品(CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC)的完全一致区域可以被视为真正的作物地或非作物地。不一致区域是不确定的,需要校正,如第 3.5 节所示。
图 3. B&R 地区四种作物地产品 CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC 的一致程度。 1 4 1 4 1-41-4 的值分别表示 1-4 种作物地产品被分类为作物地,0 的值表示四种作物地产品被分类为非作物地。

3.4. 提取训练样本

传统的作物地映射方法需要大量的训练样本。在映射长时间序列和大规模土地覆盖产品时,这可能会耗费大量时间。此外,样本质量直接影响监督分类的精度。本研究设计了一种新的样本提取和过滤方法。首先,从先前识别的完全一致区域(四个被分类为作物地或非作物地的作物地产品)中提取初始训练样本。其次,使用随机抽样方法来减少每个子区域中初始训练样本的密度,以便最终训练样本均匀分布在整个研究区域。第三,在训练样本的中心建立了 90 m × 90 m 90 m × 90 m 90mxx90m90 \mathrm{~m} \times 90 \mathrm{~m} 区域。使用 GEE 计算样本区域内所有图像波段均值和方差。第四,根据统计原理,在按标准差降序排列后,大约 5 % 5 % 5%5 \% 的样本被去除,以减少混合像元的影响。 最后,使用 2 σ 2 σ 2sigma2 \sigma 标准,基于 95 % 95 % 95%95 \% 置信概率进一步移除异常值(详情请参见图 S 5),并将最优的耕地和非耕地训练样本导入 GEE 以纠正不一致区域。表 S2 显示了
B&R 地区的每个子区域中选择的耕地和非耕地样本数量。

3.5. 纠正不一致区域

为了纠正 3.3 节中产生的不一致区域,使用了 GEE 平台的随机森林分类器来解释覆盖 B & R B & R B&RB \& R 地区的 50 波段无云影像集合。随机森林分类器是一种机器学习分类器,集成了多棵决策树(Breiman 2001)。一些研究表明,随机森林分类器比许多其他分类器更准确,且对噪声不敏感(Pelletier 等人 2016;Rodriguez-Galiano 等人 2012)。例如,它通过聚合过程有效地避免过拟合,分类速度相对较快,并且比分类和回归树更容易使用(Breiman 2001)。
通过反复实验和先前对波段组合的研究,我们选择了 12 个波段作为 RF 分类器的输入。它们包括蓝光、绿光、红光、近红外、短波红外 1、短波红外 2 和热红外 1,以及 NDVI、EVI、GCVI、LSWI 和 NBR2。使用随机选择的 63%的训练数据来为每棵树创建 300 棵树,并且每棵树使用 50 波段数量的平方根作为分裂。样本区域的尺度设置为 90 米以减轻
混合像元。所有校正都针对不一致区域,因为应用了一个覆盖完全一致区域的掩膜。最后,校正后的产品结合了四个作物产品(CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC)的完全一致区域以及不一致区域的校正结果。

3.6. 准确性评估

3.6.1. 耕地面积评估

FAO(2015)统计数据用于评估四个耕地产品和我们的校正产品在国家尺度上的耕地面积准确性。FAO 统计数据的来源基于国家人口普查、人工估算和农业生产者问卷调查(FAO(2015))。尽管 FAO 统计数据的质量因国家而异,但该数据集仍然是全球最全面的农业数据,并且每年更新(Vancutsem 等人,2012 年)。已采用几种程序来提高其质量(世界银行、FAO 和联合国统计委员会,2011 年)。一些研究使用 FAO 统计数据作为参考数据,以评估国家尺度的土地覆盖产品准确性(Pérez-Hoyos 等人,2017 年;Vancutsem 等人,2012 年)。在本研究中,每个国家的耕地面积来自 FAO(2015)统计数据中定义的“耕地”类别。
各国的耕地面积分别使用四种耕地产品和校正后的耕地产品进行了计算。然后确定了每个国家的耕地面积比例。使用 FAO(2015 年)各国的耕地面积统计数据,计算了统计数据中的耕地比例以及与四种耕地产品(CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC)和我们的校正产品耕地比例的偏差( Δ e Δ e Delta e\Delta e )。通过计算均方根误差(RMSE),反映了使用耕地产品估算的耕地比例与 FAO 耕地统计数据之间的差异。偏差( Δ e Δ e Delta e\Delta e )和 RMSE 的公式如下:
e i = x i y i e i = x i y i e_(i)=x_(i)-y_(i)\mathrm{e}_{i}=x_{i}-y_{i}
R M S E = i = 1 N ( x i y i ) 2 N R M S E = i = 1 N x i y i 2 N RMSE=sqrt((sum_(i=1)^(N)(x_(i)-y_(i))^(2))/(N))R M S E=\sqrt{\frac{\sum_{i=1}^{N}\left(x_{i}-y_{i}\right)^{2}}{N}}
其中 x i x i x_(i)x_{i} 是使用耕地产品计算的国家 i i ii 的耕地面积比例, y i y i y_(i)y_{i} 是通过统计数据估计的国家 i i ii 的耕地面积比例, N N NN 是选择的国家数量。
对农作物产品中耕地面积比例与联合国粮农组织统计数据进行线性回归,以反映其拟合程度。较大的决定系数 R 2 R 2 R^(2)R^{2} 表明农作物产品与联合国粮农组织统计数据之间的拟合程度更高:
y ˙ i = a x i + b R 2 = i = 1 N ( y ˙ i y ¯ ) 2 i = 1 N ( y i y ¯ ) 2 y ˙ i = a x i + b R 2 = i = 1 N y ˙ i y ¯ 2 i = 1 N y i y ¯ 2 {:[y^(˙)_(i)=ax_(i)+b],[R^(2)=(sum_(i=1)^(N)(y^(˙)_(i)-( bar(y)))^(2))/(sum_(i=1)^(N)(y_(i)-( bar(y)))^(2))]:}\begin{gathered} \dot{y}_{i}=a x_{i}+b \\ R^{2}=\frac{\sum_{i=1}^{N}\left(\dot{y}_{i}-\bar{y}\right)^{2}}{\sum_{i=1}^{N}\left(y_{i}-\bar{y}\right)^{2}} \end{gathered}
其中 y ˙ i y ˙ i y^(˙)_(i)\dot{y}_{i} 表示线性回归后的预测值, x i x i x_(i)x_{i} 表示斜率, a a aa 表示截距, b b bb 表示联合国粮农组织统计数据的平均耕地面积比例。

3.6.2. 空间分布精度评估不一致区域

使用遥感数据制作的产品的空间分布精度必须在进一步利用产品前进行评估(Congalton and Green 2019)。为了进行空间分布精度评估,我们使用了来自四个耕地产品和我们的校正产品的不一致区域的测试样本的目视解译结果作为独立验证数据,以严格评估空间分布精度。不一致区域的精度评估代表了产品的下限,使用这种方法更容易找到不同产品质量的原因。由于四个耕地产品和我们的校正产品在完全一致区域内的耕地空间分布相同,因此这些应该是可靠的。产品的最终精度可能高于我们在这里评估的精度。
准备测试样本包括以下步骤。首先,将四个耕地产品(CCILC、GFSAD30、MCD12Q1 和 FROM-GLC)以及我们的校正产品叠加,以识别不一致的区域。其次,使用分层随机抽样从多数据产品的不一致区域获取测试样本(Olofsson 等人,2014 年)。样本单元的大小约为 0.0027 × 0.0027 ( 300 m × 300 m ) 0.0027 × 0.0027 ( 300 m × 300 m ) 0.0027^(@)xx0.0027^(@)(300mxx300m)0.0027^{\circ} \times 0.0027^{\circ}(300 \mathrm{~m} \times 300 \mathrm{~m}) 。最后,3112
为进行空间分布评估,选取了用于测试的样本,包括 1945 个非耕地样本和 1154 个耕地样本(图 7)。使用来自 Google Earth 的高分辨率遥感图像(2014-2016 年)对测试样本进行了目视解译。使用多数面积法确定每个样本的土地覆盖类别。为了提高目视解译结果的可靠性,我们仅使用两位解译员都同意的测试样本进行精度评估。利用解译结果,生成了误差矩阵以及耕地和非耕地的生产者精度(PA)、用户精度(UA)和总体精度(OA),以评估四个耕地产品和我们的校正产品在不一致区域的空间分布精度(Story 和 Congalton 1986;Olofsson 等人 2014;Congalton 等人 2014;Congalton 和 Green 2019)。
O A = S d n × 100 % U A = X i j X j × 100 % PA = X i j X i × 100 % O A = S d n × 100 % U A = X i j X j × 100 %  PA  = X i j X i × 100 % {:[OA=(S_(d))/(n)xx100%],[UA=(X_(ij))/(X_(j))xx100%],[" PA "=(X_(ij))/(X_(i))xx100%]:}\begin{aligned} & O A=\frac{S_{d}}{n} \times 100 \% \\ & U A=\frac{X_{i j}}{X_{j}} \times 100 \% \\ & \text { PA }=\frac{X_{i j}}{X_{i}} \times 100 \% \end{aligned}
其中 S d S d S_(d)S_{d} 是正确分类的测试样本总数, n n nn 是测试样本总数,是第 i i ii 行第 j j jj 列的观测值,在混淆矩阵中; S d S d S_(d)S_{d} 是第 n n nn 行的边缘总和,是第 i i ii 列的边缘总和。
混淆矩阵; X i X i X_(i)X_{i} 是第 i ; X j i ; X j i;X_(j)i ; X_{j} 行的边缘总和,是第 j j jj 列的边缘总和。

  4. 结果

本节总结了从校正后的耕地产品中获得的结果。首先,展示整个校正后的产品(图 4),并详细描述了 B&R 地区的耕地面积和空间分布(图 7)。其次,展示了四个耕地产品(CCI-LC、GFSAD30、MCD12Q1 和 FROM-GLC)以及我们校正后的产品的一致性分析。第三,通过将耕地产品计算的耕地比例与来自粮农组织的耕地统计数据进行比较,展示了国家级耕地面积评估。第四,使用测试样本展示了不一致区域的空间分布评估。

4.1. B&R 地区校正后的耕地结果

本研究为 B&R 地区生成了 2015 年的校正后耕地产品(图 4)。校正后的产品耕地总面积为 121 , 918 , 169 121 , 918 , 169 121,918,169121,918,169 个像素,占整个 B & R B & R B&RB \& R 地区的 14.94 % 14.94 % 14.94%14.94 \% 。耕地主要位于东欧平原、西西伯利亚平原、安纳托利亚半岛、中国东北平原、华北平原、秦岭山脉南部、印度半岛和中南半岛。此外,一些耕地还位于尼罗河、锡尔河和阿姆河盆地、东南亚和其他地区。
图 4. B&R 地区校正后耕地产品地图。
另外,一些耕地还位于尼罗河、锡尔河和阿姆河盆地、东南亚和其他地区。
按面积从大到小排序,前十个拥有最大耕地面积的国家是俄罗斯、印度、中国、乌克兰、哈萨克斯坦、土耳其、波兰、泰国、巴基斯坦和伊朗。它们分别占“一带一路”地区总耕地面积的20.81%、19.11%、18.15%、5.79%、5.39%、2.94%、2.46%、2.36%、2.22%和 1.62 % 1.62 % 1.62%1.62 \% 。相比之下,阿曼、黑山、阿拉伯联合酋长国、文莱、科威特、不丹、卡塔尔、新加坡、巴林和马尔代夫是耕地面积最小的十个国家。按耕地比例从大到小排序,前十个国家是摩尔多瓦、乌克兰、匈牙利、孟加拉国、印度、波兰、立陶宛、罗马尼亚、泰国和捷克共和国。这些国家的耕地分别占其土地的83.93%、73.90%、70.15%、68.58%、66.00%、56.57%、 55.18 % , 51.43 % , 50.65 % 55.18 % , 51.43 % , 50.65 % 55.18%,51.43%,50.65%55.18 \%, 51.43 \%, 50.65 \% 49.27 % 49.27 % 49.27%49.27 \% 。耕地比例最小的国家是巴林、也门、科威特、阿拉伯联合酋长国、卡塔尔、沙特阿拉伯、不丹、阿曼、蒙古和马尔代夫。这些国家的耕地分别占其土地的3.34%、1.98%、1.02%、0.91%、 0.88 % , 0.69 % , 0.46 % , 0.38 % , 0.14 % 0.88 % , 0.69 % , 0.46 % , 0.38 % , 0.14 % 0.88%,0.69%,0.46%,0.38%,0.14%0.88 \%, 0.69 \%, 0.46 \%, 0.38 \%, 0.14 \% 0.00 % 0.00 % 0.00%0.00 \%

4.2. 耕地产品一致性分析

一些同质区域显示出高度的土地一致性,包括欧洲平原的大部分地区、印度半岛和华北平原,以及安纳托利亚半岛、中国东北平原和中南半岛的一些地区(图5)。在这些地区,简单的地理景观元素产生了集中的土地利用分布,以及四个土地利用产品和我们的校正产品相对较高的总体精度。土地利用一致性较低的区域主要出现在生态系统过渡区和人类活动广泛的地区,如东南亚、中国西南部和西北部、伊朗和帕米尔高原的部分地区以及北亚,在这些地区,土地利用经常与其他土地覆盖类型混合(图5)。在东南亚,由于全年降雨量丰富,难以获得高质量的、无云的遥感图像。在中国西南部和西北部以及伊朗和帕米尔高原的一些地区,山脉产生了复杂的地形元素和显著的景观格局破碎化。 这会导致遥感图像中出现许多混合像元,并显著影响作物地提取结果。西西伯利亚平原和部分
图 5. B&R 地区的 CCI-LC、GFSAD30、MCD12Q1、FROM-GLC 和校正后的作物地产品的一致程度。1-5 的值代表被分类为作物地的 1 到 5 种作物地产品。
中国东北和北部是主要粮食产区向农牧过渡区的过渡地带。这些地区的复杂景观或雨季会导致遥感解译精度较低,以及四种作物地产品和我们校正产品之间的一致程度较低。

4.3. 作物地产品的统计评估和比较

耕地面积是根据耕地占土地面积的百分比确定的。将四个耕地产品和我们的校正产品与粮农组织(2015 年)的耕地统计数据进行比较,以评估耕地产品的准确性。这些产品之间的偏差程度有所不同(图 6)。例如,在区域尺度 B & R B & R B&RB \& R 上,校正产品确定的耕地覆盖范围与粮农组织统计数据最接近,偏差为 0.30 % 0.30 % -0.30%-0.30 \% 。其次是 GFSAD30,偏差为 0.86 % 0.86 % 0.86%0.86 \% 。CCI-LC 产生较高的耕地估计,偏差为 2.78 % 2.78 % 2.78%2.78 \% ,而 MCD12Q1 和 FROM-GLC 则产生较低的估计,偏差分别为 3.23 % 3.23 % -3.23%-3.23 \% 4.98 % 4.98 % -4.98%-4.98 \% 。耕地面积偏差较大的国家包括白俄罗斯、立陶宛、波兰、土耳其、柬埔寨和菲律宾,而耕地面积偏差较小的国家包括
埃及、土库曼斯坦、沙特阿拉伯、俄罗斯、蒙古和中国。比较五个耕地产品和 FAO(2015)的耕地统计数据表明,MCD12Q1 在统计上最为一致,其次是校正后的耕地产品。其他三个耕地产品的过高或过低估计程度有所不同。对于 CCI-LC 和 GFSAD 30,最大的统计偏差出现在东欧和北亚,那里的耕地面积被高估。校正后的耕地产品在一些地区高估了耕地面积。例如,保加利亚为 13.04%,白俄罗斯为 18.80%。然而,这比 CCI-LC 的 19.12%以及 GFSAD 30 的 24.35 % 24.35 % 24.35%24.35 \% 19.40 % 19.40 % 19.40%19.40 \% 22.77 % 22.77 % 22.77%22.77 \% 分别有显著改进。由于东南亚的雨季,一些地区可用的无云遥感图像很少。与 CCI-LC 一样,其他四个产品在这个地区也表现出明显的低估趋势。MCD12Q1 和 FROMGLC 最不准确。例如,对于印度尼西亚,MCD12Q1 和 FROMGLC 的低估程度分别为 17.41 % 17.41 % 17.41%17.41 \% 16.54 % 16.54 % 16.54%16.54 \% 。 相比之下,校正后的耕地产品对越南和印度尼西亚的估计分别低5.67%和 5.12 % 5.12 % 5.12%5.12 \%
RMSE 和 R 2 R 2 R^(2)R^{2} 值评估了四个耕地产品和我们的校正产品中耕地面积估计的离散程度和拟合度。
图 6. 耕地产品耕地比例的离散程度和相关分析统计。虚线是 x : y x : y x:yx: y 的 1:1 线,实线是“一带一路”地区 65 个国家的耕地产品和统计的线性回归线(RMSE:均方根误差, R 2 R 2 R^(2)R^{2} :决定系数)。
与 FAO(2015)统计数据相比。结果如图 6 所示,其中虚线是一条反映离散程度的线。CCI-LC、GFSAD30、MCD12Q1、FROM-GLC 和校正后的耕地产品 RMSE 值分别为 14.55%、14.65%、8.97%、9.01%和 11.39%。通常,较高的 RMSE 值表明耕地产品与统计数据之间存在显著差异。如图 6(c)、6(d)和 6(e)以及 8(e)所示,MCD12Q1、FROM-GLC 和校正后的耕地数据产生的结果接近 FAO 统计数据。MCD12Q1 的离散程度最低,数据点主要分布在 1:1 线附近。然而,与 CCI-LC 和 GFSAD 30 相关的离散程度相对较高(图 6(a 和 b)),因为几个数据点明显偏离了 1:1 线。这表明 CCILC 和 GFSAD 30 高估了耕地面积,特别是在东欧。这导致了较高的总体 RMSE 值。通常,较大的决定系数意味着与统计数据的拟合度更好。 与 FAO(2015)统计数据相比,CCI-LC、GFSAD30、MCD12Q1、FROM-GLC 和校正后的耕地产品相关系数 R 2 R 2 R^(2)R^{2} 的值分别是 0.76 , 0.70 , 0.79 , 0.72 0.76 , 0.70 , 0.79 , 0.72 0.76,0.70,0.79,0.720.76,0.70,0.79,0.72 ,和 0.77。我们可以从中推断出,MCD12Q1 的拟合度最高,而 GFSAD30 的拟合度最低。
由于同一对象可能具有不同的光谱和混合像元,因此通过解释遥感图像获得的耕地面积比统计数据的精度更高(Lu 等人,2016 年)。尽管 MCD12Q1 在某些国家内实现了更高的耕地面积精度,但由于大多数国家的农作物用地百分比低于联合国粮农组织(2015 年)的耕地统计数据,因此整个“一带一路”地区的耕地面积被显著低估。CCI-LC 和 GFSAD 30 明显高估了东欧的耕地。这导致了高 RMSE 值和低 R 2 R 2 R^(2)R^{2} -值。由于 GFSAD30、MCD12Q1 和 FROM-GLC 已被重采样,它们提供的耕地面积与原始产品存在偏差。因此,使用统计数据验证耕地面积不能完全反映特定耕地产品的精度。校正后的耕地产品的 RMSE 值为 11.39 % 11.39 % 11.39%11.39 \% R 2 R 2 R^(2)R^{2} 值为 0.77,表明校正后的耕地面积与整个“一带一路”地区的联合国粮农组织耕地统计数据具有良好的吻合度。

4.4. 不一致区域的空間分布评估和耕地产品的比较

表 3 显示了四种作物产品和我们的校正产品在不一致区域基于测试样本的目视解译结果的制作者精度、用户精度和总体精度。校正作物产品的精度最高,总体精度(OA)为 77.54%。其次是 GFSAD 30、MCD12Q1、FROM-GLC 和 CCI-LC。校正作物产品还产生了作物类别最高的用户精度(UA,65.16%)和制作者精度(PA,86.72%)。CCI-LC 和 GFSAD 30 的用户精度(分别为 41.68%和 54.26%)以及 MCD12Q1 和 FROM-GLC 的制作者精度(分别为 50.30%和 41.65%)较低。这表明 MCD12Q1 和 FROM-GLC 低估了作物面积,而 CCI-LC 和 GFSAD 30 高估了作物面积。例如,FROM-GLC 低估了欧洲平原、西西伯利亚和东南亚平原的作物面积(图 7)。相反,CCI-LC 和 GFSAD 30 表现出较高的制作者精度和较低的用户精度,这表明大量非作物区域被错误分类为作物。这两种产品都高估了欧洲平原和北亚平原的作物面积(图 7)。 CCI-LC 在青藏高原和云贵高原也高估了耕地,而校正后的耕地产品则减少了这两个产品的高估程度。总之,这些结果表明校正后的产品可以提高不一致地区耕地识别的准确性。

  5. 讨论

在大区域范围内绘制耕地一直是一项极具挑战性的工作,特别是在同时实现高精度和快速生产方面(Herold 等人,2008 年;Teluguntla 等人,2018 年)。在本研究中,我们开发了一种基于空间分析技术的数据融合方法。首先,对输入产品进行一致性分析以提取训练样本。然后,使用 2 σ 2 σ 2sigma2 \sigma 标准对样本进行过滤。使用 GEE 平台及其 RF 分类器校正不一致区域。合理地划分研究区域有助于识别具有相似种植模式和气候环境的区域。根据以往的数据融合研究,GWR 是
图 7. 四种作物地产品和我们的校正产品的空间分布。根据测试样本的目视解译结果,CCI-LC 和 GFSAD 30 显着高估了欧洲平原(A)和云贵高原(D)的作物地面积,而 MCD12Q1 和 FROM-GLC 在西伯利亚平原(B)和东南亚(C)则明显低估了作物地面积。
表 3. 根据目视解译的测试样本,四种作物地产品和我们的校正产品在不一致区域的精度误差矩阵。
  作物地产品   生产者精度   用户精度   总体精度
CCI-LC   耕地 79.86% 41.68% 50.48%
73.17%   非-   农用地 32.96%
GFSAD 30   农用地 80.21% 54.26% 67.03%
83.35%   非-   农用地 59.43%
MCD12Q1   农用地 50.30% 54.66% 65.63%
71.54%   非-   农用地 74.96%
FROM-GLC   耕地 41.65% 52.20% 63.82%
68.78%   非耕地   非耕地 77.10%
  校正后的耕地   农用地 86.72% 65.16% 77.54%
90.06%   非-   非农用地 72.19%
Cropland products Producer's accuracy User's accuracy Overall accuracy CCI-LC Cropland 79.86% 41.68% 50.48% 73.17% Non- cropland 32.96% GFSAD 30 Cropland 80.21% 54.26% 67.03% 83.35% Non- cropland 59.43% MCD12Q1 Cropland 50.30% 54.66% 65.63% 71.54% Non- cropland 74.96% FROM-GLC Cropland 41.65% 52.20% 63.82% 68.78% Non- cropland 77.10% Corrected cropland Cropland 86.72% 65.16% 77.54% 90.06% Non- cropland 72.19% | Cropland products | | Producer's accuracy | User's accuracy | Overall accuracy | | :--- | :--- | :--- | :--- | :--- | | CCI-LC | Cropland | 79.86% | 41.68% | 50.48% | | 73.17% | Non- | cropland | 32.96% | | | GFSAD 30 | Cropland | 80.21% | 54.26% | 67.03% | | 83.35% | Non- | cropland | 59.43% | | | MCD12Q1 | Cropland | 50.30% | 54.66% | 65.63% | | 71.54% | Non- | cropland | 74.96% | | | FROM-GLC | Cropland | 41.65% | 52.20% | 63.82% | | 68.78% | Non- | cropland | 77.10% | | | Corrected cropland | Cropland | 86.72% | 65.16% | 77.54% | | 90.06% | Non- | cropland | 72.19% | |
对训练样本的质量、数量和空间同质性敏感(Chen 等人,2012 年;Hu 等人,2018 年;Lu 等人,2014 年),而融合决策规则的构建方法受输入产品准确性的影响,并且随着输入数量的增加可能会耗费更多时间(Fritz 等人,2011b;Fritz 等人,2015 年;Lu 等人,2017 年)。此外,输入产品排名的先验知识和适当的
缺乏足够的验证,权重确定非常困难(Fritz 等人,2011b;Fritz 等人,2015)。本研究中使用的方法在不依赖外部训练样本、先验知识或土地利用统计数据的情况下提高了作物地制图精度。因此,当在大时空范围内制图作物地时,这种方法可能是合适且灵活的。
我们的方法使用了信息提取和质量控制技术,为一个大区域提供了有效、高精度的作物地制图。结合训练样本、更新技术和 GEE 平台提供的多源遥感数据,它有可能在未来产生长时间序列的全球土地覆盖产品。尽管输入产品中可能在小范围内存在错误分类,本研究充分利用了它们提供的信息,并通过输入产品的综合评估和空间统计提取了具有均匀分布的足够训练样本,以清除大多数异常值和混合样本。与传统的样本收集方法不同
广泛的实地调查(Oliphant 等人,2019 年)、高分辨率遥感图像的目视解译(Yu 和 Gong,2012 年)以及使用众包数据(如 Geo-wiki)(Fritz 等人,2009 年),本研究中的训练样本易于更新,以生成覆盖大范围的时间序列产品。此外,与从单个土地覆盖产品中提取训练样本的现有方法(Huang 等人,2018 年;Jia 等人,2014 年;Radoux 等人,2014 年;Sexton 等人,2013 年;Wessels 等人,2016 年;Zhang 和 Roy,2017 年)不同,在本文中我们集成了多源土地覆盖产品。
各种来源的联合国粮农组织统计数据(包括国家人口普查、人工估算和农业生产者问卷调查),缺乏足够的工具,以及收集数据统计方法的变化,已被指出会导致数据质量差和不确定性(联合国粮农组织 2015;佩雷斯-霍约斯等人 2017;世界银行、联合国粮农组织和联合国统计委员会 2011)。尽管联合国粮农组织统计数据有时被认为在某些目的或地区是不够的,但它们仍然被认为是许多地区(如中国,中国国家统计局 2015)耕地面积的高度可靠的估计。数据集的真实局限性在于每个国家基础统计数据的可用性。
基于测试样本的目视解译结果,不一致区域的精度评估验证了,校正后的耕地产品在 B&R 地区的精度高于 CCI-LC、GFSAD 30、MCD12Q1 和 FROM-GLC。先前研究表明,景观异质性(如耕地与林地、灌木和草本植被的混合)是现有耕地产品之间不一致的主要原因(Fritz 等 2011a;Herold 等 2008)。校正后的耕地产品在不一致区域的精度至少提高了 10.52 % 10.52 % 10.52%10.52 \% 。此外,预计其精度至少为 77.54 % 77.54 % 77.54%77.54 \% 。在整个区域内,校正后的耕地产品总体精度约为 84 % 84 % 84%84 \% ,其空间分布与融合决策规则构建方法相似(Chen 等 2019;Lu 等 2017;Zhong 等 2019)。
这项研究得出一个结论是,高分辨率产品可能会导致过度制图问题,尤其是在一个区域包含耕地、牧场和草地时。例如,由于将耕地和牧场混淆,GFSAD 30 明显高估了亚洲北部和东欧的耕地。GFSAD 30 在异质地区比低分辨率产品绘制了更多的耕地。然而,GFSAD 30 在一些地区低估了耕地,因为它不完整地提取了黄土高原的山地耕地,特别是在甘肃和河南省(Teluguntla 等人,2018 年)。此外,GFSAD 30 使用的耕地定义包括连续的种植园,如用于种植咖啡和茶的那些种植园(Teluguntla 等人,2018 年;Oliphant 等人,2019 年)。这导致在东南亚识别出额外的耕地。已经证明,CCI-LC 在一些国家产生了巨大的高估(Pérez-Hoyos 等人,2017 年)。除了亚洲北部和东欧,与校正产品相比,CCI-LC 还将西南中国的耕地(如青藏高原和云贵高原)高估了(Pérez-Hoyos 等人,2017 年)。
先前研究表明,由于混合类别的定义和 MODIS 的粗分辨率,MCD12Q1 在异质地区通常具有较低的植被覆盖度(OA)(Fritz 等人,2011a;Pérez-Hoyos 等人,2017;Sakti、Takeuchi 和 Wikantika,2017;Yang 等人,2017)。例如,由于将耕地和自然植被镶嵌体混淆,MCD12Q1 在中国东南丘陵地区显示出大面积的林地(Yang 等人,2017)。然而,MCD12Q1 将大面积的耕地和自然植被镶嵌体分类为非耕地。在这些地区,耕地的碎片化增加了使用粗分辨率遥感影像提取耕地的难度。因此,在异质地区绘制耕地时,适当的混合类别定义和高分辨率遥感数据的应用可能是有用的(Herold 等人,2008)。FROM-GLC 分类方案缺乏“镶嵌耕地”的定义,FROM-GLC 是基于 20 年的 Landsat 影像而不是单一年份生成的。在一些过渡区(如东欧、西西伯利亚、西南和西北)存在低估。
中国和东南亚)导致所有产品中最低的 OA 值( Gong 等人, 2013; Liang 等人 2019)。与输入产品相比,校正后的耕地产品更好地反映了过渡区的耕地分布(图 8)。尽管四个耕地产品和我们的校正产品与耕地实际变形存在一些偏差,但校正后的耕地产品通过从现有的耕地产品中提取准确信息来纠正不一致区域,从而提高了异质地区的耕地精度。
GEE 强大的云计算能力使其能够快速方便地计算卫星图像堆栈( Azzari 和 Lobell 2017 年)。许多研究集中于使用高分辨率图像绘制准确的耕地分布,并提出了使用 GEE 云计算的有效方法( Dong 等人 2016 年; Teluguntla 等人 2018 年; Tian 等人 2019 年)。由 GEE 生成的无云 50 波段 2014-2016 年 Landsat 图像集合提供了各种作物的光谱特征,用于过滤训练样本并识别耕地。这提高了在异质地区识别耕地的准确性。
未来可以采用多种策略来提高精度。首先,输入的农田产品具有不同的空间分辨率,这使得充分利用其农田信息变得困难。这在高分辨率产品重采样到异质区域时尤其如此。其次,GFSAD 30 农田的定义包括连续种植园,如咖啡、茶、橡胶、可可和油棕,这会增加不恰当训练样本选择的风险(Oliphant 等人,2019 年;Teluguntla 等人,2018 年)。第三,校正后的农田产品在一些同质区域(如印度)略微高估了农田面积,因为制图农田的容易导致农田样本过多。由于 GEE 强大的云计算能力、多源遥感图像以及基于像素的分类方法的集成,未来可以使用基于对象分割来减少“盐和胡椒噪声”的影响。最后,样本清理方法可以改进,通过聚类分析和其他无监督学习方法自动提取高质量的训练样本。有大量的
图 8. 四个作物地产品和校正产品之间的放大窗口比较,其中 (a) GFSAD 30 在中国黄土高原低估了作物地,特别是在甘肃和河南省;(b) CCI-LC 在中国西南部高估了作物地,如青藏高原和云贵高原;(c) MCD12Q1 在东南亚低估了作物地;以及 (d) FROM-GLC 在所有产品中总体精度最低。在许多地区,如中国,可以看到由原始图像边缘不连续处形成的假边界。
识别水稻和玉米范围的专题作物产品,例如。可以通过一致性评估和 GEE 平台进行训练样本提取,以补偿这些专题作物产品和作物地产品的低精度。

  6. 结论

现有的数据融合方法在跨大区域绘制耕地时,容易受到训练样本的质量、数量和空间同质性的影响,以及输入的耕地产品精度的影响。在本研究中,我们提出了一种方法,利用 GEE 平台融合现有的耕地产品,以获得 B & R B & R B&RB \& R 区域的更高质量耕地产品。首先,该方法根据气候特征对整个区域进行分层。然后,基于对四个耕地产品的连续性评估来提取训练样本,并去除异常值。最后,使用 GEE 平台对不一致区域进行校正后,生成了更高精度的校正耕地产品。该方法可以快速在大区域生成大量训练样本,并减少对先验知识和土地利用统计数据的依赖。在耕地面积和空间分布评估后,我们得出结论,校正的耕地产品表现出高度准确的空间分布,并且与 FAO(2015)的耕地统计相比,其一致性优于 CCI-LC、GFSAD 30、MCD12Q1 和 FROMGLC。 因此,可以快速生成 B & R B & R B&RB \& R 地区的优质耕地图。未来,将使用更多类型的土地覆盖产品来提高训练样本的准确性,并生成时间序列校正产品。随着土地覆盖产品的增加,训练样本的可靠性也会提高。高质量训练样本的易获取性可用于绘制新的土地覆盖产品。

  披露声明

作者声明他们没有已知的利益冲突或个人关系可能影响本报告中所述的工作。

  资助

本研究得到了中国科学院[XDA20040201];中华人民共和国科学技术部[2019QZKK0603];国家自然科学基金[41601095]的支持。

数据可用性声明

Google Earth Engine(https://code.earthengine.google。com/)是一个免费且开放的平台。本研究中生成或使用的数据、模型或代码,如有需要,可向通讯作者申请获取。

  参考文献

Allan, J. D. 2004. “景观与河流景观:土地利用对溪流生态系统的影响。”生态学、进化和系统学年评 35: 257-284。
Azzari, G., 和 D. B. Lobell. 2017. “基于 Landsat 的土地覆盖分类:遥感监测范式转变的机会.” 环境遥感 202: 64-74. doi:10.1016/j.rse.2017.05.025.
Bartholome, E., 和 A. S. Belward. 2005. “GLC2000:从地球观测数据获取全球土地覆盖的新方法.” 国际遥感杂志 26 (9): 1959-1977. doi:10.1080/01431160412331291297.
Benediktsson, J. A., P. H. Swain, 和 O. K. Ersoy. 1990. “神经网络方法与统计方法在多源遥感数据分类中的应用.” 电气与电子工程师协会地球科学与遥感交易 28 (4): 540-552. doi:10.1109/TGRS.1990.572944.
Bicheron, P., P. Defourny, C. Brockmann, L. Schouten, 和 O. Arino. 2008. “GLOBCOVER:产品描述和验证报告.”
Breiman, L. 2001. “随机森林. 机器学习.” 45 (1), 5-32.
Brown, M. E., K. M. D. Beurs, 和 M. Marshall. 2012. “利用卫星遥感 26 年来的植被、湿度和温度数据,研究气候变化对作物区物候的影响.” 环境遥感 126: 174-183. doi:10.1016/j.rse.2012.08.009.
Chen, D., M. Lu, Q. Zhou, J. Xiao, Y. Ru, Y. Wei, 和 W. Wu. 2019. “两种协同方法在混合耕地制图中的比较.” 环境遥感 11 (3): 213. doi:10.3390/rs11030213.
Chen, G., K. G. Zhao, G. J. McDermid, 和 G. J. Hay. 2012. “采样密度对地理加权回归的影响:以森林冠层高度和光学数据为例的研究.” 国际遥感 33 (9): 2909-2924. doi:10.1080/01431161.2011.624130.
陈军,陈杰,廖安,曹雪,陈立,陈雪,何晨,韩刚,彭松,和陆敏。2015年。“全球土地覆盖制图”

  1. 联系徐齐 ox\otimes xueq@igsnrr.ac.cn
    本文的补充数据可以在这里获取。
  2. 备注:CESSC,中国地球系统科学中心;ESA,欧洲空间局;FAO,联合国粮食及农业组织;IGBP,国际地圈生物圈计划;USGS,美国地质调查局;MERIS,中分辨率成像光谱仪;FR/RR,全分辨率和降分辨率;AVHRR,高级甚高分辨率辐射计;SPOT,地球观测卫星;SPOT-VGT,SPOT-植被;PROBA-V,在轨自主项目,其中 V 代表植被;MODIS,中分辨率成像光谱仪;TM,专题制图仪;ETM+,增强型专题制图仪;OLI,操作土地成像仪。