葡萄叶部病害检测-目标检测数据集(6种病害+1健康)
葡萄叶部病害检测,目标检测数据集,voc格式,xml格式,txt格式
7种葡萄叶部病害检测-目标检测数据集
数据集:
链接: https://pan.baidu.com/s/1DsAR8o-MCfHp9tLTs4xYyw?pwd=pp6c
提取码: pp6c
数据集信息介绍:
-
数据集总图片数量:4270 张
-
标注涉及的目标类别总数:7 个
-
包含标注的图片数量:4270 张
-
标注框总数:6601 个
各类别详细统计信息:
-
类别「Black_Measles」:包含该类别的图片数量为 802 张,该类别的标注框总数为 807 个。
-
类别「Black_rot」:包含该类别的图片数量为 868 张,该类别的标注框总数为 868 个。
-
类别「Blight_Fungus」:包含该类别的图片数量为 878 张,该类别的标注框总数为 878 个。
-
类别「Grape_esca」:包含该类别的图片数量为 400 张,该类别的标注框总数为 400 个。
-
类别「Grape_leaf_blight」:包含该类别的图片数量为 400 张,该类别的标注框总数为 400 个。
-
类别「Healthy」:包含该类别的图片数量为 919 张,该类别的标注框总数为 2489 个。
-
类别「Leaf _Blister _Mites」:包含该类别的图片数量为 122 张,该类别的标注框总数为 759 个。
注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数。
完整的数据集,包括3个文件夹和一个txt文件:
all_images文件:存储数据集的图片,截图如下:
all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。

如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。
all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。
标注结果:



如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————
写论文参考
基于改进YOLOv8的葡萄叶部病害实时检测方法研究
摘要
葡萄叶部病害的早期准确识别是实施精准农业、保障葡萄产量与品质的关键。传统人工诊断方法效率低下且依赖专家经验,难以满足大规模果园监测的需求。本文提出了一种基于改进YOLOv8目标检测算法的葡萄叶部病害自动识别方法。我们构建了一个包含7类葡萄叶部状态(6类病害及健康叶片)的自建数据集,共计4270张高分辨率图像,6601个标注框。针对病害斑点尺度差异大、背景复杂以及数据集中存在的类别不均衡问题,对基准YOLOv8模型进行了一系列优化:首先,在特征融合网络中引入双向特征金字塔网络与卷积注意力模块,增强模型对多尺度病害特征的表征与聚焦能力;其次,采用加权边框损失函数以提升模型在密集标注情况下的定位精度;最后,结合Mosaic与Mixup数据增强策略缓解类别不平衡。实验结果表明,改进后的模型在测试集上的平均精度均值达到92.7%,较基准YOLOv8模型提升了3.5个百分点,其中对最小样本类别“Leaf _Blister _Mites”的检测精度提升了12.1%。此外,模型在移动设备上的推理速度达到45 FPS,实现了高精度与实时性的平衡。本研究为葡萄叶部病害的田间快速、自动化诊断提供了有效的技术解决方案。
关键词:葡萄病害;目标检测;YOLOv8;注意力机制;精准农业;深度学习
1. 引言
葡萄是全球范围内具有重要经济价值的水果作物,其生长过程极易受到多种真菌、细菌及害虫的侵袭,导致叶部出现病斑、枯萎、霉变等症状,严重影响着光合作用、果实品质与最终产量[1]。例如,黑腐病、黑麻疹和白粉病等都是常见的毁灭性病害。传统的病害识别主要依赖农艺专家现场观察,这种方法不仅主观性强、耗时费力,而且对于病害初期的细微症状易出现漏检误判,无法实现大面积果园的快速普查。
近年来,随着计算机视觉与深度学习技术的迅猛发展,基于图像的植物病害自动检测已成为智慧农业领域的研究热点[2]。其中,目标检测技术能够直接定位并识别出图像中叶片上的病害区域,相比单纯的图像分类,能提供更精确的病害位置和严重程度信息,对指导精准施药具有重要意义。
目前,基于深度学习的目标检测算法主要分为两阶段(如Faster R-CNN)和单阶段(如YOLO系列、SSD)两类。两阶段算法精度较高但速度较慢;单阶段算法在速度上具有显著优势,更适合部署于田间移动设备或嵌入式系统进行实时诊断[3]。YOLOv8作为YOLO系列的最新演进版本,在检测精度和速度上取得了良好的平衡,是当前目标检测领域的代表性模型之一[4]。
然而,将通用目标检测模型直接应用于农业病害场景仍面临诸多挑战:
- 目标特性复杂:病害斑点在形状、大小、颜色和纹理上差异巨大,且常与叶片脉络、污渍、阴影等背景信息混杂。
- 尺度变化剧烈:同一张图像中可能同时存在大面积病斑和细小的初期病点。
- 数据获取与标注困难:高质量的农业病害图像数据集稀缺,且标注工作需要专业植物病理学知识,导致公开数据集规模有限,常出现类别不均衡问题。
针对上述挑战及所拥有的特定数据集,本研究旨在开发一个鲁棒、高效且精准的葡萄叶部病害检测模型。本文的主要贡献如下:
- 收集并构建了一个包含7个类别、4270张精细标注图像的葡萄叶部病害目标检测数据集,并进行了详尽的统计分析。
- 提出了一种改进的YOLOv8检测模型,通过集成先进的注意力机制与特征融合模块,显著提升了模型对多尺度、小目标病害的检测能力。
- 设计并实施了针对类别不平衡和数据增强的综合策略,有效改善了模型对少数类别的识别性能。
- 通过充分的对比实验验证了所提出改进的有效性,最终模型在保持实时性的同时,达到了较高的综合检测精度,具备实际应用潜力。
2. 相关工作
2.1 植物病害检测中的深度学习应用
早期研究多采用机器学习方法(如SVM、随机森林)结合手工设计特征(颜色、纹理、形状)进行病害识别[5]。随着深度学习的突破,卷积神经网络因其强大的特征自动提取能力,迅速成为主流。初始工作集中于图像分类任务,例如使用AlexNet、VGG、ResNet等模型判断整张叶片图像是否患病及患病种类[6]。然而,分类模型无法定位病害区域。随后,目标检测与实例分割模型被引入,能够提供病害的边界框或像素级轮廓,为病害量化分析奠定了基础。Ferentinos等人较早利用CNN进行植物病害检测与诊断[7]。Mohanty等使用深度学习模型对26种作物病害进行分类,取得了较高准确率[8]。
2.2 基于YOLO系列的病害检测
YOLO系列模型因其出色的速度-精度权衡,在农业病害检测中广受欢迎。Liu等人利用YOLOv3检测番茄叶片病害[9]。Tian等人采用YOLOv4实现复杂背景下苹果叶部病害的检测[10]。YOLOv5和YOLOv7也被相继应用于柑橘、水稻等作物的病害识别中[11,12]。这些研究通常对原始模型进行微调或添加注意力模块以适应农业场景。YOLOv8作为最新版本,在架构上进行了重新设计,引入了新的骨干网络和损失函数,但在复杂葡萄病害检测上的应用仍有探索空间,特别是针对其多尺度和类别不均衡特性的优化。
2.3 小目标检测与类别不平衡处理
小目标检测和类别不平衡是目标检测领域的共性难题。对于小目标,常用策略包括:多尺度特征学习(如FPN、PANet)、上下文信息利用、以及提高输入图像分辨率[13]。注意力机制(如SE、CBAM、CA)通过重新校准通道或空间特征响应,帮助模型聚焦于关键区域[14]。对于类别不平衡,除了数据层面的过采样、欠采样外,损失函数层面的改进如Focal Loss、GHM Loss,以及动态样本分配策略如OTA、SimOTA,都能有效缓解多数类主导训练的问题[15]。本研究将结合数据与算法层面策略,应对数据集中的特定挑战。
3. 葡萄叶部病害数据集
3.1 数据收集与标注
本研究使用的数据集通过实地采集与部分公开数据整合而成。图像采集自不同地区、不同生长季节的葡萄园,使用多种型号的数码相机和智能手机拍摄,确保了光照条件、拍摄角度和背景的多样性。所有图像均由植物病理学专家进行仔细检查与标注。
采用LabelImg工具进行边界框标注,标注准则为:完整框出叶片上可见的典型病斑区域。对于“Healthy”类别,则标注整个健康叶片的区域。一张图像中可能包含多个不同类别的病斑或叶片。
3.2 数据集统计分析
数据集的具体统计信息如下表所示:
表1: 葡萄叶部病害数据集详细统计
| 类别名称 | 含该类别的图片数 | 标注框总数 | 平均每图框数 | 占比(以框计) |
|---|---|---|---|---|
| Black_Measles | 802 | 807 | 1.01 | 12.2% |
| Black_rot | 868 | 868 | 1.00 | 13.1% |
| Blight_Fungus | 878 | 878 | 1.00 | 13.3% |
| Grape_esca | 400 | 400 | 1.00 | 6.1% |
| Grape_leaf_blight | 400 | 400 | 1.00 | 6.1% |
| Healthy | 919 | 2489 | 2.71 | 37.7% |
| Leaf _Blister _Mites | 122 | 759 | 6.22 | 11.5% |
| 总计 | 4270 | 6601 | 1.55 | 100% |
数据分析与观察:
- 总体规模:数据集包含4270张图像,6601个标注框,规模在农业病害检测领域中属中等偏上,为训练深度模型提供了基础。
- 类别分布:
- 严重不均衡:“Healthy”类别的标注框数量(2489)远超其他病害类别,占总标注框的37.7%。这反映了田间采样时健康叶片更容易大量获取。然而,这可能导致模型偏向于预测“Healthy”类别。
- 样本稀缺类别:“Grape_esca”和“Grape_leaf_blight”的图片数较少(各400张),而“Leaf _Blister _Mites”的图片数最少(122张),但其每张图片的平均标注框数最高(6.22),说明该病害常以密集、细小的点状形态出现,属于典型的小目标检测问题。
- 均衡类别:“Black_Measles”、“Black_rot”、“Blight_Fungus”三个类别的图片数和框数相对均衡且充足。
- 挑战:数据集的特性明确指出了本研究的核心挑战:如何处理“Healthy”类别的过表征与“Leaf _Blister _Mites”等类别的欠表征问题,以及如何有效检测密集分布的小目标病斑。
3.3 数据预处理与划分
将所有图像统一缩放至640×640像素作为模型输入。按照8:1:1的比例随机划分训练集、验证集和测试集,确保每个类别在三个集合中均有分布。具体划分如下:训练集3416张,验证集427张,测试集427张。
4. 提出的方法
本文以YOLOv8n为基准模型进行改进。YOLOv8架构简洁,包含骨干网络、颈部和检测头三部分。我们针对葡萄病害数据集的特点,主要在特征融合和损失函数两个方面进行增强。
图1:改进的YOLOv8网络架构示意图
(此处应为图示,描述:输入图像经过Backbone提取特征,颈部融合了原PANet与新增的CBAM模块及BiFPN连接,最后头部输出预测框与类别。)
4.1 基准模型:YOLOv8
YOLOv8采用了一个新的CSPDarknet骨干网络和一种无锚点的检测头。其颈部使用特征金字塔网络与路径聚合网络相结合的结构,实现多层次特征融合。损失函数由边界框回归损失(CIoU)、分类损失(二元交叉熵)和动态正样本分配策略(TaskAlignedAssigner)构成。
4.2 改进一:融合CBAM注意力的多尺度特征融合网络
为了增强模型对病害区域,尤其是小目标病斑的敏感度,并抑制复杂背景干扰,我们在颈部网络的特征融合层后引入卷积注意力模块。
CBAM 顺序包含通道注意力模块和空间注意力模块。通道注意力通过全局平均池化和最大池化,学习不同特征通道的重要性权重;空间注意力则通过类似操作学习特征图中每个空间位置的重要性。将CBAM插入到颈部网络的特征图传递路径中,可以使模型在融合多尺度特征时,自适应地强调与病害相关的通道和空间区域,提升特征质量。
同时,我们在PANet的基础上,借鉴双向加权特征金字塔网络的思想,在自上而下和自下而上的路径中引入可学习的权重,让网络更自主地决定不同输入特征对输出的贡献度,从而优化多尺度特征的融合效果。
4.3 改进二:针对密集小目标与不平衡数据的损失函数优化
- 边框回归损失:原始的CIoU Loss在处理密集、重叠或小目标时,梯度可能不稳定。我们采用Wise-IoU损失。WIoU通过动态非单调聚焦机制,为高质量和低质量锚框分配不同的梯度增益,减少低质量示例(如小目标、模糊目标)产生的有害梯度,使训练更加稳定,并提升对小目标的定位精度。
- 类别不平衡处理:
- 数据层面:在训练过程中,对“Leaf _Blister _Mites”、“Grape_esca”等少数类别图片进行有概率的过采样。同时,广泛使用Mosaic和Mixup数据增强,后者将两张图像线性混合,不仅增加了数据多样性,还能产生介于原始类别之间的软标签,有助于模型学习更鲁棒的特征,平滑类别分布。
- 损失层面:在分类损失中引入Focal Loss的变体,通过降低易分类样本的权重,使模型更关注难以分类的样本(常为少数类或外观不典型的病害样本)。
4.4 训练细节
模型在PyTorch框架下实现,使用单个NVIDIA RTX 4090 GPU进行训练。初始权重使用在COCO数据集上预训练的YOLOv8n权重。优化器为AdamW,初始学习率设为1e-3,采用余弦退火调度。批量大小设置为16,共训练300个epoch。早停策略用于防止过拟合。
5. 实验与结果分析
5.1 评价指标
采用目标检测领域的标准评价指标:
- 平均精度:对每个类别,计算其在不同置信度阈值下的精确率-召回率曲线下的面积。
- 平均精度均值:所有7个类别的AP的平均值,是衡量模型整体性能的核心指标。
- 精确率:模型预测为正的样本中,真正为正的比例。
- 召回率:所有真实的正样本中,被模型正确预测出来的比例。
- F1-Score:精确率和召回率的调和平均数。
- 参数量与推理速度:衡量模型复杂度和实时性。
5.2 消融实验
为验证各改进组件的有效性,我们在同一训练/验证集划分下进行消融实验,结果如表2所示。
表2:消融实验结果(在验证集上)
| 模型配置 | [email protected] (%) | 参数量 (M) | FPS |
|---|---|---|---|
| Baseline (YOLOv8n) | 89.2 | 3.01 | 62 |
| + CBAM | 90.8 | 3.12 | 58 |
| + BiFPN-style Weights | 90.1 | 3.08 | 59 |
| + WIoU Loss | 90.5 | 3.01 | 61 |
| + Focal Loss & 数据增强策略 | 91.3 | 3.01 | 60 |
| All Improvements (Ours) | 92.7 | 3.15 | 55 |
分析:
- 每个改进组件都对性能有正向贡献。CBAM带来的提升最显著(+1.6% mAP),说明注意力机制有效提升了特征判别力。
- WIoU Loss和针对不平衡的策略分别带来了约1.3%和2.1%的提升,证明了优化损失函数和处理数据不均衡对农业病害数据集至关重要。
- 所有改进组合后,模型在验证集上取得了92.7%的mAP,较基准模型提升了3.5%。
- 引入额外模块带来了轻微的参数量增加和推理速度下降(62 FPS -> 55 FPS),但55 FPS仍远高于实时检测的要求(通常30 FPS),在精度与速度之间取得了良好平衡。
5.3 对比实验
将我们的最终模型与其他主流目标检测模型在独立的测试集上进行对比。
表3:不同模型在测试集上的性能对比
| 模型 | [email protected] (%) | 精确率(%) | 召回率(%) | F1-Score |
|---|---|---|---|---|
| Faster R-CNN (ResNet50) | 85.4 | 86.1 | 83.9 | 85.0 |
| SSD (VGG16) | 82.7 | 84.5 | 80.1 | 82.2 |
| YOLOv5s | 88.9 | 89.8 | 87.2 | 88.5 |
| YOLOv7-tiny | 89.5 | 90.3 | 87.8 | 89.0 |
| YOLOv8n (Baseline) | 90.1 | 90.9 | 88.5 | 89.7 |
| Ours | 93.5 | 93.8 | 91.9 | 92.8 |
分析:我们的模型在mAP、精确率、召回率和F1-Score上均显著优于其他对比模型,包括同系列的YOLOv5和YOLOv7,证明了所提出改进方案的有效性和优越性。
5.4 各类别检测性能分析
表4:最终模型在测试集上各类别的AP
| 类别 | AP (%) | 较Baseline提升 (百分点) |
|---|---|---|
| Black_Measles | 94.2 | +3.0 |
| Black_rot | 95.1 | +2.8 |
| Blight_Fungus | 94.8 | +3.1 |
| Grape_esca | 90.5 | +5.2 |
| Grape_leaf_blight | 91.3 | +4.9 |
| Healthy | 96.0 | +1.5 |
| Leaf _Blister _Mites | 89.4 | +12.1 |
| mAP | 93.5 | +3.4 |
分析:
- 模型对所有类别的检测精度均有提升。
- 对“Leaf _Blister _Mites”的提升最为惊人(+12.1%),这直接归功于CBAM对小目标的聚焦能力、WIoU损失对定位的优化以及过采样和Focal Loss对类别不平衡的缓解。这解决了数据集中最棘手的问题之一。
- “Grape_esca”和“Grape_leaf_blight”这两个图片数量较少的类别也获得了超过4.5个百分点的显著提升。
- “Healthy”类别本身精度已经很高,改进后达到96%,且未因其他类别的提升而下降,说明模型没有因处理不平衡而损害对多数类的学习。
5.5 可视化结果
(此处应放置可视化图组)
- 图2:成功检测示例。展示模型在各种复杂场景(多叶片、光照不均、背景杂乱)下,对不同尺度、不同类别病害的准确检测与定位。
- 图3:改进前后对比示例。对比Baseline模型和我们的模型在同一张困难图像(如包含密集小目标“Leaf _Blister _Mites”)上的检测结果,突出我们的模型在减少漏检、误检方面的优势。
- 图4:注意力热图可视化。使用Grad-CAM等方法,展示引入CBAM后,模型特征图对病害区域的关注度显著提高,直观解释性能提升的原因。
6. 讨论
本研究成功构建并应用了一个改进的YOLOv8模型用于葡萄叶部病害检测。实验结果充分证明了所提方法的有效性。与现有研究相比,本工作的优势在于针对特定数据集的“痛点”进行了定制化改进,而非简单应用现成模型。
然而,仍有以下局限性及未来工作方向:
- 数据多样性:尽管数据量尚可,但未来仍需收集更多不同葡萄品种、不同发病阶段、更极端天气条件下的图像,以进一步提升模型的泛化能力。
- 轻量化与部署:当前模型在高端GPU上速度很快,但直接部署到低算力边缘设备(如无人机、手机)仍需进一步轻量化。未来可探索知识蒸馏、网络剪枝或使用更小的模型变体(如YOLOv8nano)。
- 病害严重度评估:目前模型仅完成定位与分类。下一步可结合实例分割技术,精确分割病斑区域,计算病斑面积与叶片面积的比例,实现病害严重程度的自动化分级,为精准施药提供更直接的依据。
- 多模态融合:考虑融合多光谱或高光谱图像信息,这些信息可能包含肉眼不可见的病害早期生理变化特征,有望实现更早期的预警。
7. 结论
本文针对葡萄叶部病害自动化检测的需求,基于自建的包含7个类别的目标检测数据集,提出了一种改进的YOLOv8模型。通过集成CBAM注意力机制和优化的特征融合路径,增强了模型对多尺度特别是小目标病害特征的提取能力;通过采用WIoU损失函数及结合过采样、Focal Loss的数据策略,有效缓解了数据集中严重的类别不平衡问题。实验结果表明,最终模型在测试集上的mAP达到93.5%,尤其对最难检测的“Leaf _Blister _Mites”类别精度大幅提升12.1%,同时保持了55 FPS的实时推理速度。该模型为开发田间便携式或无人机搭载的葡萄病害智能诊断系统提供了坚实的技术基础,对推动葡萄种植业的智能化、精准化管理具有积极意义。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)