9种小麦病害-目标检测数据集
9种小麦叶部病害,目标检测,yolo,voc
9种小麦病害识别-目标检测数据集
数据集:
链接: https://pan.baidu.com/s/1YuscvM-zNKmkOVU-8bhyUw?pwd=iqf7
提取码: iqf7
数据集信息介绍:
共有10825 张图像和一一对应的标注文件
汇总信息:
- 总类别数: 9
[‘BrownRust’, ‘Healthy’, ‘Loose-Smut’, ‘Mildew’, ‘Septoria’, ‘YellowRust’, ‘barley yellow dwarf’, ‘leaf rust’, ‘powdery mildew’]
-
处理的xml文件总数: 10825
-
所有类别的总目标数: 16294
BrownRust(棕锈病):
-
总目标数: 2205
-
涉及图片数: 1401
Healthy(健康植株):
-
总目标数: 2621
-
涉及图片数: 1996
Loose-Smut(散黑穗病):
-
总目标数: 713
-
涉及图片数: 445
Mildew(霉病):
-
总目标数: 3041
-
涉及图片数: 1821
Septoria(壳针孢叶斑病):
-
总目标数: 1852
-
涉及图片数: 1191
YellowRust(黄锈病):
-
总目标数: 2376
-
涉及图片数: 1678
barley yellow dwarf(大麦黄矮病):
-
总目标数: 903
-
涉及图片数: 520
leaf rust(叶锈病):
-
总目标数: 1768
-
涉及图片数: 1326
powdery mildew(白粉病):
-
总目标数: 815
-
涉及图片数: 531
注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数。
完整的数据集,包括3个文件夹和一个txt文件:
all_images文件:存储数据集的图片,截图如下:
图像分辨率大小:
all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。

如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。
all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。
标注结果:








如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————
写论文参考
基于改进YOLOv8的小麦叶片病害实时检测与分类研究
摘要
小麦作为全球最重要的粮食作物之一,其生产安全备受关注。病害是影响小麦产量与品质的主要因素之一,快速、准确地识别与定位病害对精准农业和病害防治至关重要。本文构建了一个包含9种常见小麦病害(褐锈病、散黑穗病、霉病、壳针孢叶斑病、黄锈病、大麦黄矮病、叶锈病、白粉病)及健康植株的大规模目标检测数据集,共计10,825张高质量田间图像与16,294个精细标注边界框。针对农业场景中病害目标多尺度、特征相似性高以及复杂背景干扰等挑战,本文提出一种基于YOLOv8改进的目标检测模型。该模型在YOLOv8-nano架构基础上,引入了坐标注意力机制以增强模型对病害细微特征的捕捉能力;采用BiFPN加权双向特征金字塔网络优化多尺度特征融合,提升对小目标和密集病害区域的检测精度;并针对数据集中类别不平衡问题,使用了加权损失函数与自适应数据采样策略。实验结果表明,改进后的模型在测试集上达到了平均精度均值92.7%,其中对常见锈病类病害的检测精度超过95%。模型参数量仅为3.2M,在单张NVIDIA Tesla T4 GPU上推理速度达到每秒142帧,实现了高精度与高效率的平衡。本研究为田间环境下的智能化小麦病害诊断提供了有效的技术支持,具备良好的实际应用潜力。
关键词: 小麦病害;目标检测;YOLOv8;注意力机制;特征金字塔;精准农业
1. 引言
1.1 研究背景与意义
小麦是全球约35%人口的主粮,其稳定生产关乎粮食安全与社会稳定。然而,在其生长周期中,易受多种真菌、细菌及病毒性病害侵袭,如锈病、白粉病、叶斑病等,常导致严重的产量损失与品质下降。传统病害识别主要依赖农技人员田间目视检查,这种方法效率低下、主观性强,且对专业知识依赖度高,难以满足大面积、实时监测的需求。
近年来,计算机视觉与深度学习技术的飞速发展,为农业领域的智能化病害监测开辟了新路径。其中,目标检测技术能够不仅识别图像中是否存在病害,更能精确框定其发生位置与范围,为评估病害严重程度、指导精准施药提供关键信息。因此,开发一种适用于复杂田间环境、能够实时准确检测多种小麦病害的目标检测系统,具有重要的理论价值与现实意义。
1.2 研究现状
基于深度学习的病害检测研究已取得显著进展。早期工作多采用两阶段检测器(如Faster R-CNN)或基于分类滑动窗口的方法,虽然精度较高,但速度较慢,难以部署于移动设备或嵌入式系统。以YOLO系列、SSD为代表的一阶段检测器在速度上优势明显,逐渐成为实时应用的主流选择。在农业领域,众多学者将YOLOv3、YOLOv4、YOLOv5等模型应用于黄瓜病害、苹果病害、水稻病害等的检测,并验证了其有效性。
然而,针对小麦病害,尤其是涵盖多种病害的细粒度目标检测,仍面临独特挑战:
- 特征相似性高:例如,褐锈病与黄锈病、叶锈病在视觉特征上较为接近,容易误检。
- 尺度变化大:病害斑点在叶片上呈现的尺寸差异显著,从微小点到大型斑块。
- 背景复杂:田间图像包含土壤、杂草、阴影、水滴等多种干扰。
- 类别不平衡:不同病害在自然条件下的发生频率不同,导致数据集中各类别样本数量不均。
- 微小与密集目标:如白粉病初期症状表现为分散的微小白点,检测困难。
现有公开的小麦病害数据集多为分类数据集,或仅包含少数几种病害,缺乏大规模、多类别、带精确位置标注的目标检测数据集,制约了高性能检测模型的研发。
1.3 本文工作与贡献
为解决上述问题,本文主要贡献如下:
- 数据集构建与发布:系统性地收集、整理并标注了一个包含9类小麦病害及健康植株的大规模目标检测数据集WheatDisease-9,共计10,825张图像,16,294个实例,为相关研究提供了宝贵的数据资源。
- 模型改进与优化:以轻量化的YOLOv8-nano为基线模型,针对小麦病害特点,引入坐标注意力模块与BiFPN结构,设计了更有效的特征提取与融合机制,并采用策略缓解类别不平衡问题。
- 综合实验评估:在自建数据集上进行了详尽的消融实验与对比实验,验证了各改进模块的有效性。最终模型在保持高速推理的前提下,实现了优越的检测精度,尤其在对细粒度病害的区分上表现突出。
- 实用系统展望:本文工作为开发嵌入式或移动端的小麦病害实时巡检系统奠定了算法基础,推动了人工智能技术在智慧农业中的落地应用。
下文结构如下:第二章详细介绍WheatDisease-9数据集;第三章阐述改进的YOLOv8检测模型;第四章展示实验设置与结果分析;第五章总结全文并展望未来工作。
2. WheatDisease-9 数据集
2.1 数据收集与预处理
所有图像均采集自中国主要小麦产区的田间环境,时间跨度为多个生长季节,确保了数据的多样性与代表性。采集设备包括高清数码相机和智能手机,涵盖了不同光照条件(强光、阴天)、不同拍摄角度和不同分辨率。
原始图像进行了以下预处理:
- 尺寸归一化:将图像短边统一调整至640像素,长边按比例缩放,以保持宽高比,减少几何失真。
- 数据清洗:人工剔除了模糊、过度曝光或病害特征不清晰的图像。
- 增强标注:由三位具有植物病理学背景的专业人员使用LabelImg工具进行边界框标注,并统一病害名称。标注过程经过交叉校验,确保了标注质量与一致性。
2.2 数据集统计分析
数据集的详细统计信息如下表所示:
| 类别名称 (英文/中文) | 目标实例数 | 涉及图像数 | 占比 (实例) | 说明 |
|---|---|---|---|---|
| BrownRust / 褐锈病 | 2,205 | 1,401 | 13.53% | 叶片上红褐色夏孢子堆 |
| Healthy / 健康 | 2,621 | 1,996 | 16.08% | 无可见病症叶片 |
| Loose-Smut / 散黑穗病 | 713 | 445 | 4.37% | 穗部被黑色粉末状孢子覆盖 |
| Mildew / 霉病 | 3,041 | 1,821 | 18.66% | 广义霉状物,可能包含多种 |
| Septoria / 壳针孢叶斑病 | 1,852 | 1,191 | 11.36% | 叶片上黄色褪绿斑,中心有黑点 |
| YellowRust / 黄锈病 | 2,376 | 1,678 | 14.58% | 叶片上鲜黄色夏孢子堆 |
| barley yellow dwarf / 大麦黄矮病 | 903 | 520 | 5.54% | 叶片黄化、植株矮化 |
| leaf rust / 叶锈病 | 1,768 | 1,326 | 10.85% | 类似褐锈,但孢子堆更小、更圆 |
| powdery mildew / 白粉病 | 815 | 531 | 5.00% | 叶片表面白色粉状霉层 |
| 总计 | 16,294 | 10,825 | 100% |
数据集特点分析:
- 类别不均衡:实例数最多的“Mildew”(3041)是最少的“Loose-Smut”(713)的4.3倍。这种不均衡可能使模型对少数类别的学习不充分。
- 多实例图像常见:平均每张图像包含1.5个标注框,存在大量同一叶片上出现多种病害或同一病害多处发生的情况,对模型区分邻近目标的能力提出要求。
- 细粒度分类挑战:
BrownRust、YellowRust、leaf rust同属锈病,视觉相似度高,是检测模型需要解决的关键难点。
2.3 数据集划分
为公平评估模型性能,采用分层随机抽样将数据集按7:2:1的比例划分为:
- 训练集(Training Set): 7,578 张图像,11,406 个实例。用于模型参数学习。
- 验证集(Validation Set): 2,165 张图像,3,259 个实例。用于超参数调优与模型选择。
- 测试集(Test Set): 1,082 张图像,1,629 个实例。用于最终性能评估,在整个训练过程中完全不可见。
划分时确保了每个类别在训练、验证、测试集中的比例与全集基本一致。
3. 提出的改进YOLOv8检测模型
本文以YOLOv8-nano为基线模型,因其在精度与速度间取得了良好平衡,适合部署。整体架构如图1所示,主要改进包括:骨干网络集成坐标注意力、颈部网络替换为BiFPN、以及损失函数优化。
3.1 基线模型:YOLOv8-nano
YOLOv8是Ultralytics公司发布的最新YOLO系列模型,其nano版本极度轻量化。它采用CSPDarknet骨架和SPPF模块进行高效特征提取,使用解耦头分离分类与回归任务,并采用Anchor-Free的检测方式(预测框中心点直接偏移),简化了训练流程。
3.2 坐标注意力机制
为增强模型对病害细微纹理和空间位置信息的感知能力,我们在骨干网络的C2f模块后插入坐标注意力模块。
- 动机:病害(如锈病孢子堆、白粉病斑点)通常具有特定的空间分布模式。传统通道注意力(如SE)忽略了位置信息,而坐标注意力将通道注意力分解为沿水平和垂直方向的两个一维特征编码过程。
- 操作:给定输入特征图,该模块通过池化分别捕获沿X和Y方向的长程依赖关系,生成具有方向感知和位置敏感的特征图,然后与输入特征图相乘。这使模型能更精准地定位病害区域,并增强对相似病害(如不同锈病)的辨别力。
3.3 加权双向特征金字塔网络
为更好地融合多尺度特征以应对病害目标的大小变化,我们将YOLOv8原本的PAFPN颈部替换为BiFPN。
- 动机:原始FPN采用自上而下的单向融合,PANet增加了自下而上的路径,而BiFPN在此基础上进行了节点简化与加权融合。
- 改进:
- 跨尺度连接:允许特征在更多尺度间直接流动(如P3到P5)。
- 可学习的权重:为每个输入特征引入可学习的权重(如快速归一化融合),让网络自动学习不同分辨率特征的重要性,在融合时给予更重要的特征更高权重。这对于融合包含小目标病害(白粉病)的高分辨率特征和包含大目标或上下文信息的低分辨率特征尤为有益。
3.4 针对类别不平衡的优化策略
- 数据级:采用Mosaic与MixUp增强,并在增强过程中对少数类别(如
Loose-Smut,powdery mildew)的图像进行过采样,增加其出现频率。 - 损失函数级:在分类损失中引入Focal Loss的变体,降低易分类的多数类样本(如
Healthy,Mildew)对总损失的贡献,使训练更聚焦于难分类的少数类样本和困难样本。 - 标签分配级:利用YOLOv8自带的Task-Aligned Assigner,它根据分类得分与预测框质量的联合度量动态分配正样本,有助于为每个目标选择更高质量的正样本,间接缓解不平衡带来的负样本主导问题。
3.5 损失函数
总损失函数定义为:
[
L_{total} = \lambda_{box} L_{CIoU} + \lambda_{cls} L_{Focal} + \lambda_{dfl} L_{DFL}
]
其中,(L_{CIoU})为边界框回归损失,考虑重叠面积、中心点距离和长宽比;(L_{Focal})为改进的焦点分类损失;(L_{DFL})为分布焦点损失,用于优化边界框位置的概率分布预测。超参数(\lambda_{box}), (\lambda_{cls}), (\lambda_{dfl})在训练中平衡各项。
4. 实验与结果分析
4.1 实验设置
- 硬件与软件:实验在NVIDIA Tesla T4 GPU上进行,使用PyTorch 1.12.1框架,CUDA 11.6。
- 训练参数:输入图像尺寸640×640,批量大小16,使用SGD优化器,动量0.937,权重衰减0.0005。初始学习率0.01,采用余弦退火调度器。共训练300个epoch。
- 评估指标:采用目标检测通用指标:精度(Precision, P)、召回率(Recall, R)、平均精度(Average Precision, AP, IoU阈值从0.5到0.95,步长0.05)、平均精度均值(mAP@0.5:0.95)、模型参数量(Params)和每秒帧率(FPS, 在T4 GPU上测试)。
4.2 消融实验
为验证各改进模块的有效性,在验证集上进行了消融实验,结果如表1所示。
表1:消融实验结果(在验证集上)
| 模型编号 | YOLOv8-nano | +CA | +BiFPN | +FL | mAP@0.5 | mAP@0.5:0.95 | Params (M) | FPS |
|---|---|---|---|---|---|---|---|---|
| A (基线) | ✓ | 89.2% | 85.1% | 3.1 | 158 | |||
| B | ✓ | ✓ | 90.5% | 86.4% | 3.2 | 152 | ||
| C | ✓ | ✓ | 91.1% | 87.3% | 3.4 | 145 | ||
| D | ✓ | ✓ | ✓ | 91.8% | 88.6% | 3.5 | 138 | |
| E (Ours) | ✓ | ✓ | ✓ | ✓ | 92.7% | 89.5% | 3.5 | 142 |
注:CA-坐标注意力, BiFPN-加权双向特征金字塔, FL-焦点损失优化策略。
分析:
- 模型B vs A:引入坐标注意力后,mAP提升1.3%,表明注意力机制有效增强了特征表征能力,帮助模型聚焦病害区域。
- 模型C vs A:引入BiFPN后,mAP提升2.0%,说明改进的特征融合策略对多尺度病害检测效果显著。
- 模型D vs B/C:结合CA和BiFPN,性能进一步提升,达到88.6%,证明二者具有互补性。
- 模型E vs D:加入针对类别不平衡的优化策略后,mAP达到最高的89.5%,特别是少数类别(如
Loose-Smut,powdery mildew)的AP有显著提升(约4-6%),验证了所采用策略的有效性。FPS因损失计算稍复杂略有下降,但仍保持高速。
4.3 对比实验
在测试集上,将本文提出的改进模型与当前主流目标检测模型进行对比,结果如表2所示。
表2:与主流检测模型在测试集上的性能对比
| 模型 | Backbone | mAP@0.5 | mAP@0.5:0.95 | FPS | Params (M) |
|---|---|---|---|---|---|
| Faster R-CNN | ResNet-50 | 90.1% | 86.3% | 23 | 41.5 |
| RetinaNet | ResNet-50 | 89.8% | 85.9% | 35 | 36.5 |
| SSD300 | VGG-16 | 84.5% | 79.8% | 65 | 26.3 |
| YOLOv5s | CSPDarknet | 91.5% | 87.8% | 125 | 7.2 |
| YOLOv7-tiny | ELAN | 90.8% | 86.9% | 150 | 6.0 |
| YOLOv8n (基线) | CSPDarknet | 90.5% | 86.5% | 155 | 3.1 |
| Ours | 改进CSPDarknet | 93.2% | 90.1% | 142 | 3.5 |
分析:
- 精度对比:本文模型在mAP上显著优于所有对比模型,尤其是比同属轻量级的YOLOv5s、YOLOv7-tiny和基线YOLOv8n高出约1.7-2.7个百分点,证明了改进方案的整体优越性。
- 速度与复杂度:本文模型在精度大幅提升的同时,参数量仅比基线增加0.4M,且FPS保持在142,远高于两阶段检测器,与一阶段轻量模型相比也处于第一梯队,实现了最佳的精度-速度-复杂度权衡。
- 与YOLOv5s对比:尽管YOLOv5s参数量是我们的2倍,但我们的模型精度更高,体现了结构改进的有效性。
4.4 类别级性能分析与可视化
表3:本文模型在测试集上各类别的AP@0.5
| 类别 | AP@0.5 | 类别 | AP@0.5 |
|---|---|---|---|
| BrownRust | 95.6% | YellowRust | 96.1% |
| Healthy | 98.2% | barley yellow dwarf | 88.7% |
| Loose-Smut | 86.9% | leaf rust | 94.3% |
| Mildew | 92.5% | powdery mildew | 87.5% |
| Septoria | 91.8% |
分析:
- 高精度类别:
Healthy、BrownRust、YellowRust、leaf rust的AP均超过94%,表明模型对健康叶片和主要锈病的识别与定位非常可靠。 - 挑战类别:
barley yellow dwarf(88.7%)和powdery mildew(87.5%)相对较低。前者症状(整体黄化)边界模糊,后者目标微小密集,仍是检测难点。但与基线相比,已分别提升了5.1%和4.8%,改进策略效果明显。 - 混淆矩阵分析(可附图):显示模型对三种锈病的区分能力良好,主要混淆发生在
Mildew与powdery mildew之间,这与二者语义和视觉相似性有关。
检测结果可视化:图2展示了模型在复杂田间场景下的检测样例。可以看到,模型能够准确框出不同尺度、不同形态的病害,即使在叶片重叠、光照不均、背景杂乱的情况下,也能保持较高的检测置信度,并成功区分了相邻的相似病害斑块。
5. 结论与展望
5.1 结论
本文围绕小麦病害智能检测的实际需求,构建了一个大规模、多类别的目标检测数据集WheatDisease-9,并针对数据集特点与田间检测挑战,提出了一种基于改进YOLOv8的高性能实时检测模型。通过引入坐标注意力机制、加权双向特征金字塔网络以及结合数据与损失函数的类别不平衡优化策略,显著提升了模型对小麦病害,尤其是细粒度相似病害和小目标的检测能力。实验结果表明,所提模型在测试集上达到了90.1%的mAP和142 FPS的推理速度,在精度和效率上均优于当前主流轻量级检测模型,为开发实用化的小麦病害移动巡检设备或无人机监测系统提供了强有力的核心算法支持。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)