1985-2024年中国逐年30米分辨率最大值合成NDVI数据集
本数据集基于Google Earth Engine(GEE)平台,通过对Landsat系列卫星影像进行逐年最大值合成处理,生成1985年至2024年中国区域30米空间分辨率的年度NDVI数据集。
摘要:本数据集基于Google Earth Engine(GEE)平台,通过对Landsat系列卫星影像进行逐年最大值合成处理,生成1985年至2024年中国区域30米空间分辨率的年度NDVI数据集。数据经过辐射定标、大气校正和云掩蔽等预处理,并采用最大值合成法以削弱云和大气影响,保障数据质量的一致性。该数据集具有高时空一致性和长时间覆盖特征,适用于植被动态监测、生态环境评估及气候变化研究等领域,具有较强的科学价值和应用潜力。
关键词:GEE;归一化植被指数;NDVI;30米分辨率;最大值合成
引 言
在全球变化和可持续发展研究的宏观背景下,对地表植被动态进行长期、连续且精确的监测具有至关重要的数据科学意义。归一化植被指数(NDVI)作为量化植被覆盖度、光合作用强度及生物量的关键遥感指标,被广泛应用于生态系统健康状况评估、气候变化响应研究、农业生产估算及环境政策制定等领域。然而,传统的低分辨率NDVI产品(如NOAA AVHRR提供的8公里数据)难以精细刻画局地尺度的植被空间异质性,而更高分辨率的数据(如Landsat的30米分辨率)虽能弥补此缺陷,却长期受限于云污染、数据缺失以及海量数据处理的计算挑战,难以便捷地形成长时间序列的分析就绪产品。
本研究旨在构建一套1985年至2024年、空间分辨率为30米的逐年最大NDVI合成数据集。该工作的核心数据科学价值在于,它通过先进的云计算平台(Google Earth Engine)对长达四十年的Landsat系列卫星影像档案进行大规模并行处理,应用严格的云掩膜和大气校正算法,并采用年最大值合成法以有效消除残余噪声和季节性影响,从而生成无云、高质量、时间可比的数据。此数据集不仅延续了自上世纪80年代以来的高分辨率植被观测记录,更为基于长时间序列的机器学习与统计模型提供了稳定可靠的数据基础。
本工作的开展建立在众多先驱研究的基础之上,特别是对Landsat数据系统性处理与应用的开拓性工作,以及利用年最大值合成法生成无云植被指数产品的成熟方法论。相较于现有同类产品,本数据集以其更长的时序覆盖、一致的处理流程和高空间分辨率,展现出巨大的潜在重用价值。研究者可借此深入探究以下科学问题:城市扩张与土地利用变化的生态效应、极端气候事件(如干旱、洪涝)对植被的冲击与恢复力、以及全球变暖背景下物候特征的长期演变趋势等。该数据集的发布预期将为生态学、地理学、气候学及农学等多个交叉学科提供一项宝贵的基础数据资源,推动数据驱动下的环境科学研究迈向更深层次。
1 数据采集和处理方法
1.1 数据采集方法
数据采集主要依靠GEE(Google Earth Engine)平台,1985-2011年份使用LANDSAT/LT05/C02/T1_TOA数据集。2012-2013年使用LANDSAT/LE07/C02/T1_TOA数据集。由于LANDSAT7影像的扫描行校正器(Scan Line Corrector, SLC)的永久性故障。因此,自2003年5月31日之后获取的LANDSAT 7影像被称为 “SLC-off”数据,在SLC-off影像中,每一景图像都会出现平行的、交错的数据缺失条带。图像中间部分几乎完整,但越往边缘,条带缺失越严重,导致边缘部分约有22%的数据完全丢失。所以2012年和2013年的数据采用了核函数的方法进行了修补。2014-2018年使用LANDSAT/LC08/C02/T1_TOA数据集。2019-2024年使用LANDSAT/LC08/C02/T1_TOA和LANDSAT/LC09/C02/T1_TOA数据集。
1.2 数据处理
通过GEE(Google Earth Engine)平台编写代码,实现日期筛选,裁剪,导出功能。根据植物生长的特性,每年统一选取4月1日至10月31日作为最大值合成的起止时间。通过上传的矢量边界筛选影像范围。并逐年导出至谷歌云空间。投影统一采用WGS84投影。
下载后的数据使用ARCGIS 10.6软件根据各省边界进行裁剪,得到多年的分省的30米分辨率逐年最大值合成的归一化植被指数(NDVI)数据。

图1 30米分辨率NDVI最大值合成主要流程示意图
2 数据样本描述
本数据集包含1985-2024共40年的30米分辨率的NDVI的TIFF影像,其中2012年,2013年使用了核函数方法修复,其余年份均为正常的最大值合成的结果,全国影像命名格式为年份加NDVI,例如2024_NDVI.tif,分省命名格式为省份+年份,例如anhui2024_NDVI.tif。

图2 30米分辨率NDVI最大值合成
3 数据质量控制和评估
本数据集采用了GEE(Google Earth Engine)平台官方的去云代码,筛选云量小于10%的优质影像,筛选了最适合植被生长的日期,并且对由于LANDSAT7影像的扫描行校正器(Scan Line Corrector, SLC)的永久性故障所出现平行的、交错的数据缺失条带进行了修复。由于2000年前LANDSAT5影像较少,西部地区新疆,西藏等地出现了影像缺失,无法下载。

图3 2012年修复前后对比

图4 2013年修复前后对比
其中本数据集1986-1999年与2004-2011年的年最大NDVI数据存在一些条带问题,影像的质量整体较好。2000-2003年间的影像质量较差,我们在保证植被生长季的前提下,对数据产品的影像进行筛选日期的处理方法,筛选掉因传感器故障而影像整体质量的部分影像,将植被主要生长日期定义在4月到10月之间。

图5 2001年筛选日期前后对比

图6 2007年NDVI整体与局部条带问题展示
本数据集在2013年与2024年间的影像可能会存在影像的色带颜色的差异,主要是因为一年内的影像通过筛选去云之后,无法保证在同一相近日期都有正常可用的影像,不同区域的NDVI达到最大值的日期不一定有正常的影像,有条状的色带色差为正常现象,能够确保值的准确性。

图7 2018年与2019年色带问题细节图
4 数据价值
本数据集(30米分辨率中国1985-2024年逐年NDVI最大值合成数据集)融合多源Landsat影像,通过严格的辐射定标、大气校正与智能化云处理,生成了长达40年、空间无缝的高精度时序数据。其核心创新在于采用了核函数修补法,有效消除由于LANDSAT7影像的扫描行校正器(Scan Line Corrector, SLC)的永久性故障所出现平行的、交错的数据缺失条带,确保了每个像元值都能表征年度最佳植被状态,在数据质量与一致性上超越了常见的低分辨率产品。覆盖中国全境且横跨改革开放以来关键40年的独特优势,使本数据集成为精准量化气候变化与人类活动(如重大生态工程、城市化)对生态系统长期影响的权威数据基础,在生态环境评估、农业管理、城市可持续发展及灾害监测等领域具有不可替代的重大应用价值。
如有数据需求,欢迎点击下方名片链接,关注我们并咨询获取~
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)