基于Sentinel-2时间序列的空间上下文和多任务学习在有机和传统农业系统检测中的作用

张开发
2026/4/8 7:03:44 15 分钟阅读

分享文章

基于Sentinel-2时间序列的空间上下文和多任务学习在有机和传统农业系统检测中的作用
大家读完觉得有帮助记得关注和点赞摘要有机农业是实现更可持续农业的关键要素。为了更好地理解有机农业的发展和影响需要全面的、具有空间显式的信息。然而在许多国家此类数据仍然稀缺。尽管遥感技术被广泛用于田块尺度的农业土地利用制图但其区分有机和传统农业系统的能力却很少受到关注。本研究提出了一种利用年内Sentinel-2时间序列区分有机和传统农业系统的方法。此外研究还考察了影响这种区分的两个因素在并发任务中联合学习作物类型信息的作用以及空间上下文的作用。采用基于时空视觉Transformer架构的视觉Transformer模型构建了两种农业系统的分类模型。该模型被扩展用于同时学习作物类型创建了一个多任务学习设置。通过改变输入模型的块大小我们测试了空间上下文对两个任务分类精度的影响。我们证明利用多光谱遥感数据区分有机和传统农业系统是可行的。然而分类性能在不同作物类型之间存在显著差异。对于几种作物如冬黑麦、冬小麦和春燕麦F1分数可达到0.8或更高。相比之下其他农业土地利用类别如永久草地、果园、葡萄园和啤酒花则无法可靠区分有机管理类别的F1分数为0.4或更低。联合学习农业系统和作物类型相对于单任务学习仅提供了有限的额外益处。相比之下纳入更广泛的空间上下文提高了农业系统和作物类型分类的性能。总体而言我们证明在多样化的农业地区利用多光谱遥感数据对农业系统进行分类是可行的。1 引言有机农业通常被视为实现农业可持续发展目标的关键工具。其益处包括减少温室气体排放、改善土壤健康和增强生物多样性。鉴于这些优势欧盟设定了到2030年将有机管理土地扩大到农业总面积25%的战略目标。这些政策转变促使人们对其潜在的环境和社会经济影响进行批判性审查。因此有机农业的空间显式数据对于评估政策措施、跟踪既定目标的进展以及模拟环境影响至关重要。然而关于不同农业系统即有机与传统的空间显式信息仍然稀少或不完整限制了与农业管理转变相关的影响的稳健评估。在欧盟内部有机农业由法规定义禁止使用合成农药和化肥等做法。因此有机系统必须用机械和生物控制措施、有机肥料以及支持养分管理和害虫防治的作物选择来替代合成投入。由于几个隐式或显式受监管的管理组成部分如冬季覆盖作物的使用、耕作强度和施肥会影响养分有效性、作物物候和最终产量它们的影响可以在植被指数轨迹和其他在遥感数据中可观测的光谱-时间指标中显现。因此遥感为填补当前关于有机农业空间和时间动态的知识空白提供了机会。这里一个特别有前景的数据源是欧洲空间局的Sentinel-2任务它提供了免费可用的多光谱图像具有高时间、空间和光谱分辨率。这些数据已经能够在田块尺度上详细监测作物类型、物候、冠层状况和生产力从而提供了评估管理引起的差异是否也能被检测到的机会。然而尚不清楚有机和传统系统是否产生足够独特和一致的光谱-时间特征以实现可靠区分。这一挑战部分源于特定农业系统的实践不会直接转化为独特的光谱特征。例如施肥响应高度依赖于作物和生长阶段并强烈依赖于物候时间使其对卫星观测的时间分辨率敏感。与农药相关的信号同样可能被环境变异性包括水分状况和植物垂直结构掩盖或混淆。然而初步研究表明有机和传统管理之间的差异在卫星数据的多个层面上都有体现包括作物光谱特性及其时间和空间模式。在一项针对德国玉米田的比较研究中Denis等人利用多光谱、高光谱和实地测量表明传统田块表现出更高的叶绿素和氮含量、更高的植株高度和更密的冠层覆盖度而有机田块则以更大的空间异质性为特征。作者得出结论管理诱导的植物性状是观察到的光谱差异的基础表明作物生理学的变异性转化为遥感影像中可检测的信号。类似地Atanasova等人基于Sentinel-2数据报告了保加利亚有机和传统管理的小麦田之间存在显著的光谱差异传统田块表现出更高的植被指数值这与生物量和产量差异有关。此外Zhou等人证明诸如土壤覆盖和耕作时间等管理实践可以在光学和雷达时间序列影像中区分表明管理事件本身可以在遥感数据中留下可检测的印记。虽然这些发现表明管理相关的差异可以反映在光谱、时间和结构特征中但它们仍然是高度特定于作物和上下文的并且尚不清楚这种差异是否能在区域和作物类型间泛化。此外可检测实践或条件的存在并不唯一表明有机管理因为传统管理的田块也可能采用更粗放或减少投入的实践这使得将观测到的信号归因于特定的农业系统变得复杂。用于像素级遥感分类的方法已从经典的机器学习方法如随机森林和支持向量机发展到深度学习架构包括U-Net、3D CNN和视觉Transformer。遥感已经采纳了相关学科的方法论例如视频处理其中时间序列技术经常被改编。在视频中空间上的变化通常大于时间上的变化数据通常被分解为空间和时间分量首先处理空间上下文然后添加时间动态。这反映在诸如U-TAE等架构中它们将卷积空间编码与基于注意力的时间聚合相结合并受到视频处理中常用的时空分解策略的启发。遥感不同因为固定空间位置上的时间变异性通常比空间变异性发挥更突出的作用。因此定义类别的属性主要被捕获在光谱-时间动态中而不是空间模式中这使得在将基于视频的方法应用于遥感数据时需要进行调整。虽然基于像素的时间序列分类捕获了光谱和时间动态但纳入空间上下文提供了额外的邻域信息可以消除光谱和时间上相似的类别的歧义并已被证明可以提高整体分类精度。Tarasiou等人引入的时空视觉Transformer提供了一种架构明确设计用于模拟卫星图像时间序列中的时间动态以及空间上下文。该模型首先优先考虑光谱-时间表示然后将它们置于其空间环境中。基于Denis等人的发现TSViT非常适合将空间信息整合到作物类型和农业系统分类任务中。作物类型和农业系统共同表征了农业景观各自影响着对方在光谱和时间遥感信号中的表达方式。作物类型和管理实践的光谱-时间特征预计难以解开然而一些管理方法可能是特定于作物的。多任务学习被理解为在单个模型中同时优化相关预测任务使得能够提取作物特定的光谱-时间模式同时也能捕获跨作物泛化的管理相关特征。先前的工作表明辅助任务可以引导模型朝着更稳健的特征学习方向发展。通过训练模型同时分类作物类型和农业系统可以评估这种协同效应在提高农业系统和作物类型区分方面的潜力。尽管有证据表明管理相关的差异可能反映在光谱-时间遥感数据中但对作物类型和空间上下文如何共同影响农业系统区分度的理解仍然有限。填补这些空白对于推进更全面的基于遥感的农业系统评估至关重要。因此本文旨在解决以下研究问题(i) 能否从年内多光谱Sentinel-2时间序列中区分农业系统以及不同作物类型的可分性如何变化(ii) 联合学习作物类型和农业系统是否比单任务模型性能更好(iii) 空间上下文对作物类型和农业系统分类精度有何影响2 数据与方法2.1 研究区与参考数据图1研究区位于德国放大图(1)30×30公里的网格系统标示了训练、验证和测试区块放大图(2)将区块细分为300×300米的斑块轮廓线表示农业用地超过15%的斑块用于训练和验证进一步将斑块细分为100×100米和20×20米的子块。背景Google Earth。研究区位于德国东南部的巴伐利亚州面积38,521平方公里与瑞士大小相当。它包含了德国近五分之一的农业面积其中约66%是耕地。巴伐利亚从北部相对温暖干燥的低地地区延伸到南部凉爽、高降水的阿尔卑斯和前阿尔卑斯地区涵盖了平坦的冰碛丘陵地带和多瑙河低地、东部的巴伐利亚森林和波西米亚森林的低山山脉以及北部的弗兰肯森林。因此巴伐利亚的特点是显著的气候和土壤梯度以及土壤类型、地形和生长条件的显著对比。对于该地区农业土地利用的参考数据来自欧盟为管理农业补贴计划而开发的综合管理和控制系统。该数据集提供了2022参考年份的田块级土地利用信息包含超过270个不同的作物类型标签。我们将其聚合为23个作物类型类别主要遵循Blickensdörfer等人提出的方案。除了作物类型我们还区分了两种农业系统传统农业和有机农业。有机管理遵循欧盟法律定义的规定并由于单独的补贴条款在IACS数据中明确标示。根据该数据研究区47.6%的面积用于农业用途其中9.24%为有机管理。永久草地、玉米、冬小麦和冬大麦占研究区农业面积的最大份额。有机管理占比最高的作物包括蚕豆、羽扇豆和春燕麦尽管每种作物占总面积的比例不到1%。其他有机占比相对较高的作物是向日葵、大豆和栽培草地。表1研究区各作物类型总面积、占农业面积比例和有机管理面积5028.132.793.92冬油菜6295.243.490.45向日葵368.750.2030.86耕作草地9029.915.0128.73永久草地41203.1422.8611.46蔬菜1300.020.7220.76豌豆1085.080.6026.67蚕豆425.720.2474.02羽扇豆71.610.0465.49大豆1006.260.5629.34啤酒花1753.840.970.97葡萄422.030.2312.02其他农业用地924.900.5123.07果园558.660.3118.46休耕地3720.972.0611.91表2数据集分布数据划分图块 [n]补丁 [n]训练数据37218815验证数据426079测试数据880000研究区被划分为30×30公里的规则网格共49个区块。其中37个用于训练4个用于验证8个用于测试。测试和验证区块规则地分布在研究区的外部边界区域之外以提高验证和测试样本的代表性。每个区块进一步细分为300×300米的斑块包含完整的2020年时间序列并存储为模型训练的中间输入。我们评估了空间上下文对农业系统和作物类型分类的影响。我们选择300×300米的斑块大小作为计算可行性和足够田块覆盖之间的折衷因为研究区50%的田块最大跨度约为200米。为了评估空间上下文的影响我们还进行了额外实验使用100×100米和20×20米的斑块。对于训练和验证我们仅使用根据参考数据农业用地超过15%的300×300米斑块而测试集没有应用此类限制。2.2 Sentinel-2数据我们获取了2019年11月至2021年2月期间研究区上空所有云量低于75%的可用Sentinel-2影像。图像预处理使用环境监测辐射校正操作框架进行包括辐射和几何校正、配准以及使用改进的Fmask算法进行云和阴影掩膜。使用ImproPhe算法的仅光谱设置将20米Sentinel-2波段锐化到10米空间分辨率。我们使用RBF滤波器集合将Sentinel-2观测值插值到等间隔的10天时间序列。核权重根据观测密度进行调整对最小核进行双倍加权以更好地保留急剧变化。包括了2019年11-12月和2021年1-2月的影像以减少时间序列开始和结束时的数据缺口仅保留2020年的插值影像。最终数据集包含36个时间步的10个光谱波段空间分辨率为10米。2.3 模型图2改编后的时空视觉Transformer概览。灰色网格线表示像素彩色框表示子块。(1) 输入块被排列成大小为S的n个子块。对于36个时间步的每个10个波段被嵌入长度为d的令牌。(2) 在时间Transformer阶段令牌跨时间步交互并与拼接的类令牌交互。(3) 在空间Transformer阶段类令牌仅与其对应的空间类令牌交互。通过独立的argmax层生成作物类型和管理系统的最终预测。本研究中使用的模型基于Tarasiou等人引入的时空视觉Transformer。下面我们总结核心架构描述我们的修改并指定模型训练设置。关于原始TSViT架构的详细阐述我们参考Tarasiou等人。TSViT由两个连续的编码器阶段组成使用多层Transformer块堆栈沿时间和空间维度处理输入。与其他Transformer架构一样TSViT将数据作为令牌序列处理意味着每次采集被转换为一个向量嵌入模型对其执行注意力操作。每个输入块被划分为不重叠的子块每个子块包含完整的时间序列。每次采集被嵌入到长度为d的向量中形成长度为T的序列。对于n个类别中的每一个一个可学习的长度为d的类令牌被附加产生大小为(T n) × d的表示。这些序列由时间编码器处理该编码器对时间上的依赖关系进行建模同时允许时间序列令牌和类令牌之间的交互。在此阶段之后仅保留类令牌而丢弃时间序列令牌。在随后的空间编码器中来自所有子块的类令牌被联合处理实现空间交互并定义模型的全局感受野。生成的令牌被投影到未归一化的类别分数。对于多任务适配我们在时间编码器之前拼接两个不同的类令牌集一个用于作物类型分类一个用于管理分类。在空间阶段类令牌仅在其各自的类别内交互遵循原始TSViT防止跨类令牌混合的限制。在空间编码器之后令牌按任务分组产生两组独立的未归一化类别分数。训练使用作物类型和管理的单独交叉熵损失进行这些损失被聚合为全局损失。2.4 训练设置遵循Tarasiou等人我们使用了2×2像素的子块将其转换为长度为150的令牌。时间编码器阶段由8个Transformer块组成空间编码器阶段由4个块组成每个块有8个注意力头。对于总块大小为2×2像素的实验省略了空间阶段。所有实验均使用固定的批量大小20进行对应于20个30×30像素的斑块。对于较小的空间范围通过将每个样本细分为不重叠的10×10或2×2像素块来保持批量大小恒定每个斑块分别产生9个或15个子块。这确保了每个批次在不同实验间包含相同总量的光谱和时间信息。为了减少背景类别的过度代表性仅使用农业用地超过15%的斑块进行训练和验证。相比之下测试集包含所有未经筛选的斑块导致背景类别比例更高。数据使用从1000个随机采样的斑块导出的5%和95%分位数进行归一化。模型训练采用AdamW优化器和余弦学习率调度学习率在2个预热周期内从5×10⁻⁵线性增加到1×10⁻⁴随后在第20周期余弦衰减到1×10⁻⁵。所有模型均训练40个周期各次运行设置相同以确保可比性。使用混合精度加速训练而不影响性能。所有实验均在NVIDIA RTX A6000 GPU上进行。用于进一步评估的模型基于每个周期后记录的最佳验证F1分数进行选择。对于多任务和单任务模型之间的比较多任务模型根据任务特定的F1分数进行选择对于农业系统分类选择最佳管理平均F1分数对于作物类型制图选择最佳作物类型平均F1分数。图3模型训练过程中每个周期后从验证数据集得出的平均F1分数。2.5 随机森林基线作为基线除了TSViT模型外我们还训练了一个随机森林模型因为它是最成熟的用于大区域作物类型分类的分类器之一。与基于块的TSViT不同随机森林在单个像素上训练。对于训练区域的每个田块随机抽取一个样本并对每个田块多边形应用15米的内向缓冲以避免边界效应。对于每个30×30公里的区块从背景类别中额外抽取了500个样本。2.6 精度度量所有模型均在空间独立的测试区块上进行评估。对于每个类别计算了F1分数、精确率和召回率。整体性能使用宏平均F1分数和总体精度进行评估。3 结果我们使用训练好的TSViT模型的预测比较了作物类型和农业系统分类的总体精度、平均和逐类F1分数。分析区分了30×30、10×10和2×2像素的输入块大小。对于每种空间范围我们对比了两种分类任务的多任务模型和单任务模型。总共评估了12个TSViT模型并与随机森林基线进行了比较。表3单个作物类型的分类结果、F1分数、召回率和精确率值作物类型30×3010×102×21×1随机森林多任务单任务多任务单任务多任务F1召回率精确率F1召回率冬小麦0.940.940.950.950.94冬大麦0.950.950.960.960.95冬黑麦0.830.860.810.840.85小黑麦0.830.820.830.840.83春燕麦0.760.750.770.760.73玉米0.970.960.970.970.96甜菜0.970.970.970.970.97冬油菜0.970.970.970.970.97向日葵0.810.790.830.860.86耕作草地0.760.750.760.760.77永久草地0.850.810.890.850.81蔬菜0.820.840.800.820.80蚕豆0.860.920.810.860.88大豆0.890.920.860.910.95啤酒花0.970.970.970.970.96葡萄0.750.670.850.750.68果园0.340.490.260.330.52背景0.960.970.950.960.97平均F1分数0.820.840.810.830.84总体准确率0.930.93所有基于TSViT的模型都达到了93%的总体精度除了2×2单任务模型。平均F1分数在分类任务和块大小内及之间仅略有变化最佳结果是30×30单任务模型获得的其次是30×30多任务和10×10单任务模型。2×2单任务模型表现最低。随机森林基线表现明显更差。在大多数作物类型中对于30×30和10×10输入单任务模型的性能略优于多任务配置。然而对于2×2块多任务模型在24个类别中的21个表现更好。七种作物类型在所有TSViT模型中始终达到0.9以上的F1分数证明了稳健的可分性。相比之下果园类别始终表现最低。背景类别在所有TSViT模型中都能可靠地与农业类别区分开。表4管理系统分类的精度指标管理系统30×3010×102×21×1随机森林多任务单任务多任务单任务多任务F1分数召回率精确率F1分数召回率常规0.930.910.950.930.91有机0.610.690.550.590.64背景0.960.970.950.960.97平均F1分数0.830.860.810.820.84总体准确率0.930.93对于农业系统分类10×10多任务和单任务模型达到了最高的总体精度。所有其他TSViT模型运行均达到93%的总体精度而随机森林基线达到80%。平均F1分数在30×30和10×10多任务模型中最高多任务模型相比单任务模型显示出微小但一致的优势。背景和传统类别在不同模型间保持稳定。有机类别表现出对空间上下文的依赖性F1分数从2×2单任务增加到30×30多任务。图4来自不同空间输入维度的模型运行的作物类型和管理系统预测IACS数据作为参考随机森林模型预测作为基线。图4展示了作物类型和农业系统分类输出的示例比较了TSViT多任务和单任务模型在三种空间输入维度上的表现以及IACS参考和随机森林基线。TSViT模型与参考数据高度视觉一致特别是对于30×30和10×10输入田块边界和内部结构得以保留。相比之下2×2模型在作物类型和农业系统分类中都表现出更明显的椒盐效应和空间不连贯的像素级误分类。视觉上从2×2到10×10的改进似乎大于从10×10到30×30的改进这与观察到的F1分数变化一致。对于农业系统分类任务2×2多任务模型显示出比其单任务对应模型更少的小尺度误分类除此之外多任务和单任务输出通常具有可比性。随机森林基线在作物类型上与参考基本一致但产生的田块结构连贯性较差对于管理形式它显著高估了传统类别并经常将农业区域误分类为背景。图5来自不同空间输入维度的模型运行的作物类型和管理系统预测IACS数据作为参考随机森林模型预测作为基线。有机管理分类的精度在不同作物类型间差异很大。对于五种作物在所有TSViT模型中均达到了0.8以上的F1分数而啤酒花、葡萄园和果园始终保持在0.2以下。羽扇豆和蔬菜在不同模型类型间表现出最大的变异性羽扇豆在30×30多任务设置中表现最佳而蔬菜始终倾向于单任务模型。随机森林在果园和羽扇豆上实现了比TSViT更高的F1分数但通常精确率较低。4 讨论在本研究中我们研究了TSViT模型基于Sentinel-2时间序列分类作物物种和区分传统与有机农业的潜力并评估了多任务学习和空间输入范围的影响。所有结果与随机森林基线进行了比较。农业系统分类据我们所知这是第一项使用深度学习框架系统评估多光谱卫星时间序列分类农业系统能力的研究。我们的结果表明虽然农业系统分类是可行的但性能在不同作物类型类别之间差异很大。对于冬黑麦、冬小麦、蚕豆、春燕麦和黑小麦等作物F1分数超过0.8表明管理引起的差异足够显著能够被基于遥感的模型捕获。相比之下特别是对于多年生作物如啤酒花、葡萄园和果园分类精度仍然很低表明管理效应较为细微。不同作物类型间分类精度巨大差异的根本原因仍不清楚。我们假设对于某些作物诸如施肥、农药施用或种植密度等管理实践会产生更显著因而更可检测的生长动态差异而对于其他作物这些效应则更为细微。这对于葡萄园和啤酒花等多年生作物似乎尤其相关。多年生系统在整个生长季节通常保持较高的生物量并且葡萄园和啤酒花田中主要的空间田块模式在不同农业系统间往往保持一致。此外本研究未明确考虑所有潜在的相关协变量如土壤类型、农场规模或精细尺度地形这可能进一步导致观察到的变异性。我们的结果也可以根据有机和传统农业之间作物特定的产量差距来解释。De Ponti等人表明谷物和豆类通常表现出更大的产量差异而多年生作物则显示出更大的产量减少变异性反映了多年生系统对管理的更异质响应。这一模式支持了我们的发现冬小麦、黑麦和黑小麦等谷物以及蚕豆等豆类显示出最高的农业系统分类精度而葡萄园和果园仍然难以区分。很可能驱动产量差距的相同管理因素如养分胁迫以及病虫害压力的差异也塑造了遥感可检测的光谱-时间信号。这一解释得到了Abdi等人的支持他们证明了管理引起的生理差异可以产生可检测的光谱变异性。因此有机和传统管理之间产量差距更大且更一致的作物在分类任务中更容易区分而那些产量差距较小或更可变的作物则较不可靠地分离。有机农业的发生率在不同作物类型间差异很大蚕豆和羽扇豆的有机占比超过70%而冬大麦、玉米和啤酒花仍低于农业总面积的3%。训练、验证和测试数据通常反映了这种分布尽管存在差异。然而性能模式不能仅用农业系统的占比来解释因为有机农业代表性高的类别中既有强结果也有弱结果。相反有机管理面积绝对量较大的类别通常受益于更大的样本可用性即使它们的相对份额较低。这表明作物特定的样本可用性除了类别不平衡之外也是模型性能的一个驱动因素。多任务学习的影响多任务学习并未提高整体分类精度。虽然多任务模型在农业系统分类上产生了略高的F1分数但它们在作物类型分类上始终表现不佳。然而多任务模型收敛更快这可能源于多任务设置中引入的更多可学习令牌。额外的可学习令牌可以通过提供明确的聚合点和稳定的表示锚点来简化优化从而在训练期间实现更快的收敛。这些结果表明作物类型和管理形式在很大程度上是可分离的任务可以独立学习。多任务模型是主要学习作物特定的管理差异还是跨作物的通用管理特征仍不清楚值得进一步研究。空间上下文的影响我们的结果证实了空间输入范围影响分类性能。更大的空间输入提高了作物类型和管理形式分类的平均F1分数。这些改进与早期的发现一致即上下文信息减轻了局部误分类类似于基于多数投票的后处理方法。尽管这些增益相对较小但与空间无关的随机森林基线的比较显示TSViT模型的性能明显更强再次强调了空间上下文的作用。然而空间上下文的精度益处并非在所有类别中都一致。羽扇豆、黑小麦和向日葵等作物类型从增加的空间范围中获益最多而永久草地和背景类别几乎没有改善。值得注意的是从2×2到10×10块的步骤产生了最大的增益而从10×10到30×30的改进相对较小表明在此景观中存在一个阈值超过该阈值额外的上下文带来的价值有限。值得注意的是2×2设置在架构上也不同因为它省略了空间Transformer阶段整体模型尺寸更小这可能有助于观察到的性能跃升。上下文效应在田块边缘尤为明显如果有足够的空间上下文混合光谱信号仍然可以被正确分类。然而过多的上下文也可能通过覆盖局部正确的预测而引入错误如永久草地所见其在30×30像素输入下表现更差。这些与边缘相关的效应并非在所有作物中都一致突显了捕获更广泛田块结构和保留精细尺度光谱细节之间的权衡。在农业系统分类中空间上下文的影响在总体精度上不太明显但在特定类别结果中更为明显尤其是有机类别。更大的块大小提高了精确率减少了假正例而召回率则趋于下降。这种权衡可能是由类别不平衡驱动的模型通过倾向于多数类来最小化损失从而提高了有机类别的精确率但降低了召回率。此外有机特定的信号可能在精细空间尺度上最强但在与周围上下文聚合时会被稀释。这些模式表明管理实践留下了精细尺度和田块尺度的特征它们的可检测性取决于块大小。作物特定的依赖性也很明显虽然冬黑麦、冬小麦和黑小麦对块大小基本不敏感但大豆、栽培草地和玉米等类别在更大的空间上下文中显示出明显的改进。这表明管理实践以超越简单空间平滑效应的方式影响着作物的空间-光谱特征。随机森林基线达到了80%的总体精度与在国家或大陆尺度上使用基于像素的分类器的类似研究相当。鉴于我们研究区域较小可能会预期更高的精度。我们将这种差异归因于研究设计的选择特别是相对较多的作物类型类别尤其是包含背景类别以及使用全覆盖验证方法这对基于像素的方法可能具有挑战性。逐类性能模式也与早期报告一致作物间差异很大。然而TSViT模型在几乎所有作物类型上都带来了比随机森林显著的性能提升具有更平衡的精确率和召回率行为。值得注意的是TSViT在栽培草地上实现了显著的改进与随机森林预测相比F1分数大幅提高。随机森林对有机类别相对较高的精确率表明存在与管理相关的光谱-时间信号这与Atanasova等人将物候变化与施肥实践联系起来的研究一致。然而TSViT模型在所有评估设置中都优于随机森林同时实现了更高的精确率和召回率以及更高的总体精度和平均F1。相比之下随机森林经常过度预测少数类导致召回率虚高但精确率显著降低。总之我们的发现表明空间上下文改善了作物类型和农业系统分类特别是在将输入大小从非常小的增加到中等块时。在更大尺度上增益减小在某些情况下过多的上下文甚至可能降低精度。农业系统分类从更大的空间上下文中受益主要是通过提高有机类别的精确率。TSViT模型始终优于随机森林特别是在平衡各类别的召回率和精确率方面。多任务学习提供了有限的益处但收敛更快表明在此设置中架构选择而非共享表示可能驱动了大部分性能增益。此外通过捕获长程依赖关系Transformer可以利用田块尺度的变异性这种变异性在有机系统中通常更高而在传统系统中由于合成投入而降低从而使管理相关的特征在局部像素邻域之外更易于学习。局限性德国不同地区的作物组成、管理强度和产量水平差异很大在巴伐利亚观察到的作物特定可分性在不同环境和农艺条件下是否成立仍不确定。特别是土壤类型和土地利用强度未被作为解释因素考虑可能导致低投入的传统系统和有机系统表现出重叠的光谱-时间特征。因此将分析扩展到多年和多区域数据集对于评估鲁棒性至关重要。这可能对有机系统尤其相关因为有机系统以独特且通常更长期的作物轮作为特征表明当考虑多年时间上下文时分类性能可能会提高。在方法论上应承认几个局限性。使用等间隔时间序列可能会掩盖短期的物候信号可能限制农业系统之间的区分未来的工作应探索非等间隔或物候感知的采样方案。此外尽管我们研究了高达30×30像素的空间上下文但由于空间Transformer阶段计算成本约呈二次方增长更大输入大小的潜在益处尚未测试。我们研究相对较小的空间范围进一步限制了地理泛化能力并强调了需要更大规模的评估最好是在国家尺度上以捕捉作物组成、田块结构和管理实践的区域差异。最后多任务学习观察到的有限优势表明在目前的数据集和模型配置下作物类型和农业系统信号可以很大程度上独立学习。这一发现如何转移到其他地区、传感器类型或建模策略仍然是一个悬而未决的问题。5 结论据我们所知本研究首次证明农业系统可以利用深度学习和Sentinel-2多光谱时间序列进行分类。结果表明管理相关的信号是可检测的并且对于几个主要作物类别特别是谷物和豆类可以实现稳健的分类这些作物表现出高度的可分性。因此这些作物在有机农业采用的业务监测方面具有巨大潜力。同时分类性能仍然高度依赖于作物。多年生和水果作物如果园、葡萄园、啤酒花和永久草地被证明更具挑战性表明管理效应在其光谱-时间模式中不太显著或不太一致地表达。总体而言我们的发现证实了早期的迹象即利用遥感区分有机和传统管理是可行的并通过提供作物分辨的评估扩展了这种理解。未来的工作应纳入多年观测和作物轮作信息以进一步加强分类性能并提高跨区域和生产系统的泛化能力。

更多文章