基于深度学习YOLOv10的药物识别检测系统（YOLOv10+YOLO数据集+UI界面+Python项目源码+模型）

算法魔法师

755人浏览 · 2025-07-26 10:15:36

算法魔法师 · 2025-07-26 10:15:36 发布

一、项目介绍

摘要

本项目基于前沿的YOLOv10目标检测算法，开发了一套高精度的药物识别检测系统，专门用于药品识别与分类。系统能够准确识别8种特定药物（包括5种特定药品和3种颜色分类）：Cipro 500、Ibuphil 600 mg、Ibuphil Cold 400-60、Xyzall 5mg以及蓝色(blue)、粉色(pink)、红色(red)、白色(white)药片。项目使用药物图像的专业数据集进行训练和评估，通过针对药物特征的网络优化和训练策略调整，本系统实现了对药品外观的高精度识别，为医药管理、智能药房、患者用药安全等场景提供了创新的技术解决方案。

项目意义

药物识别检测系统在医疗健康领域具有重要的应用价值和现实意义：

药品安全管理：可自动识别药品真伪，防止假药流通，保障患者用药安全，减少医疗事故。
智能药房应用：应用于自动发药机、智能药柜等设备，提高药品分拣效率和准确性，降低人工错误率。
患者用药辅助：帮助视力障碍患者或老年人识别药物，确保正确服药，特别适用于多药治疗场景。
医疗信息化：为电子病历系统提供药品自动识别功能，简化医护人员工作流程。
药品库存管理：自动化药品盘点和分类，提高药房管理效率，减少库存误差。
学术研究价值：探索YOLOv10在细小物体（药片）检测上的性能优化，为特定领域的小目标检测提供技术参考。

相比通用物体检测系统，本系统专注于药品这一特殊领域，通过针对性的数据采集和算法优化，能够克服药品外观相似、尺寸小、特征细微等技术难点，在医药专业场景中展现出更高的实用价值。

基于深度学习YOLOv10的药物识别检测系统（YOLOv10+YOLO数据集+UI界面+Python项目源码+模型）_哔哩哔哩_bilibili

基于深度学习YOLOv10的药物识别检测系统（YOLOv10+YOLO数据集+UI界面+Python项目源码+模型）

二、项目功能展示

系统功能

✅ 图片检测：可对图片进行检测，返回检测框及类别信息。

✅ 视频检测：支持视频文件输入，检测视频中每一帧的情况。

✅ 摄像头实时检测：连接USB 摄像头，实现实时监测。

✅参数实时调节（置信度和IoU阈值）

图片检测

该功能允许用户通过单张图片进行目标检测。输入一张图片后，YOLO模型会实时分析图像，识别出其中的目标，并在图像中框出检测到的目标，输出带有目标框的图像。

视频检测

视频检测功能允许用户将视频文件作为输入。YOLO模型将逐帧分析视频，并在每一帧中标记出检测到的目标。最终结果可以是带有目标框的视频文件或实时展示，适用于视频监控和分析等场景。

摄像头实时检测

该功能支持通过连接摄像头进行实时目标检测。YOLO模型能够在摄像头拍摄的实时视频流中进行目标检测，实时识别并显示检测结果。此功能非常适用于安防监控、无人驾驶、智能交通等应用，提供即时反馈。

核心特点：

高精度：基于YOLO模型，提供精确的目标检测能力，适用于不同类型的图像和视频。
实时性：特别优化的算法使得实时目标检测成为可能，无论是在视频还是摄像头实时检测中，响应速度都非常快。
批量处理：支持高效的批量图像和视频处理，适合大规模数据分析。

三、数据集介绍

数据集概述

本项目构建了一个专业级的药物检测数据集，主要特性如下：

总规模：451张高分辨率药物图像
- 训练集：316张
- 验证集：90张
- 测试集：45张
类别分布：
- 特定药品（5类）
  - Cipro 500
  - Ibuphil 600 mg
  - Ibuphil Cold 400-60
  - Xyzall 5mg
  - 其他特定药品
- 颜色分类（3类）
  - blue（蓝色）
  - pink（粉色）
  - red（红色）
  - white（白色）
数据来源：
- 真实药品在受控环境下的专业拍摄
- 医疗机构提供的药品样本图像
- 模拟药房环境的拍摄数据
标注格式：
- 采用YOLO格式的txt标注文件
- 每个文件包含对应图像中所有药品的类别和精确边界框信息
- 同时记录药品的完整外观特征和文字标识

数据集特点

专业性强：
- 所有图像均由专业人员按照药品拍摄规范采集
- 包含药品的正面、反面、侧面等多角度图像
- 特别关注药品标识文字、刻痕、颜色等关键特征
挑战性高：
- 包含大量小尺寸目标
- 存在外观相似的药品（如不同剂量的同种药品）
- 模拟真实场景中的重叠、遮挡情况
- 不同光照条件下的药品图像（特别是对颜色识别的影响）
标注精细：
- 边界框精确贴合药品边缘
- 对药品上的文字、标识等关键特征进行特别标注
- 区分药品的正反面不同外观
- 记录药品在泡罩包装中的状态
场景多样：
- 单一药品特写图像
- 多药品混合场景
- 不同背景条件下的药品图像
- 模拟药柜、药盒等实际应用场景
质量控制严格：
- 每张图像经过药学专业人员审核
- 标注结果由多名标注员交叉验证
- 定期进行数据集质量评估和更新

数据集配置文件

数据集采用YOLO格式：

train: F:\药物检测数据集\train\images
val: F:\药物检测数据集\valid\images
test: F:\药物检测数据集\test\images

nc: 8
names: ['Cipro 500', 'Ibuphil 600 mg', 'Ibuphil Cold 400-60', 'Xyzall 5mg', 'blue', 'pink', 'red', 'white']

数据集制作流程

数据采集规划：
- 与药学专家合作确定关键药物类别和特征
- 制定详细的拍摄规范和场景清单
- 设计覆盖所有目标类别的采集方案
专业图像采集：
- 使用专业摄影设备
- 在标准化光照箱中进行主体拍摄
- 采用多角度拍摄方案
- 控制拍摄距离保持比例一致性
- 模拟实际应用场景
数据预处理：
- 统一调整为标准尺寸
- 白平衡和色彩校正
- 生成多尺度版本以适应不同检测需求
- 去除个人隐私信息（如手部特征等）
专业标注流程：
- 第一阶段：由药学专业人员进行药品识别和分类
- 第二阶段：标注团队使用Label Studio进行边界框标注
- 第三阶段：质量团队验证标注准确性
- 特殊处理：
  - 对药品文字标识区域进行额外标注
  - 记录药品的特殊特征（刻痕、印记等）
  - 标注遮挡程度等级
数据增强策略：
- 几何变换：随机旋转、缩放
- 颜色扰动：模拟不同光照条件下的药品外观
- 高级增强：
  - 模拟药瓶反光效果
  - 添加合理程度的运动模糊
  - 生成部分遮挡样本
- 合成数据：在合理范围内生成药品排列组合图像
数据集划分与验证：
- 采用分层抽样确保各类别比例一致
- 保证同一药品的不同角度分布在同一个子集中
- 最终由药学专家进行临床相关性验证
- 通过基线模型测试数据集质量
持续维护计划：
- 定期添加新药品类别
- 根据用户反馈扩展困难样本
- 更新标注标准以适应新发现的识别需求
- 版本控制管理数据集变更

四、项目环境配置

创建虚拟环境

首先新建一个Anaconda环境，每个项目用不同的环境，这样项目中所用的依赖包互不干扰。

终端输入

conda create -n yolov10 python==3.9

激活虚拟环境

conda activate yolov10

安装cpu版本pytorch

pip install torch torchvision torchaudio

pycharm中配置anaconda

安装所需要库

pip install -r requirements.txt

五、模型训练

训练代码

from ultralytics import YOLOv10

model_path = 'yolov10s.pt'
data_path = 'datasets/data.yaml'

if __name__ == '__main__':
    model = YOLOv10(model_path)
    results = model.train(data=data_path,
                          epochs=500,
                          batch=64,
                          device='0',
                          workers=0,
                          project='runs/detect',
                          name='exp',
                          )

根据实际情况更换模型
yolov10n.yaml (nano)：轻量化模型，适合嵌入式设备，速度快但精度略低。
yolov10s.yaml (small)：小模型，适合实时任务。
yolov10m.yaml (medium)：中等大小模型，兼顾速度和精度。
yolov10b.yaml (base)：基本版模型，适合大部分应用场景。
yolov10l.yaml (large)：大型模型，适合对精度要求高的任务。

--batch 64：每批次64张图像。
--epochs 500：训练500轮。
--datasets/data.yaml：数据集配置文件。
--weights yolov10s.pt：初始化模型权重，yolov10s.pt 是预训练的轻量级YOLO模型。

训练结果

六、核心代码

import sys
 
import cv2
import numpy as np
from PyQt5.QtWidgets import QApplication, QMessageBox, QFileDialog
from PyQt5.QtCore import QThread, pyqtSignal
from ultralytics import YOLOv10
from UiMain import UiMainWindow
import time
import os
 
 
class DetectionThread(QThread):
    frame_received = pyqtSignal(np.ndarray, np.ndarray, list)  # 原始帧, 检测帧, 检测结果
    finished_signal = pyqtSignal()  # 线程完成信号
 
    def __init__(self, model, source, conf, iou, parent=None):
        super().__init__(parent)
        self.model = model
        self.source = source
        self.conf = conf
        self.iou = iou
        self.running = True
 
    def run(self):
        try:
            if isinstance(self.source, int) or self.source.endswith(('.mp4', '.avi', '.mov')):  # 视频或摄像头
                cap = cv2.VideoCapture(self.source)
                while self.running and cap.isOpened():
                    ret, frame = cap.read()
                    if not ret:
                        break
 
                    # 保存原始帧
                    original_frame = frame.copy()
 
                    # 检测
                    results = self.model(frame, conf=self.conf, iou=self.iou)
                    annotated_frame = results[0].plot()
 
                    # 提取检测结果
                    detections = []
                    for result in results:
                        for box in result.boxes:
                            class_id = int(box.cls)
                            class_name = self.model.names[class_id]
                            confidence = float(box.conf)
                            x, y, w, h = box.xywh[0].tolist()
                            detections.append((class_name, confidence, x, y))
 
                    # 发送信号
                    self.frame_received.emit(
                        cv2.cvtColor(original_frame, cv2.COLOR_BGR2RGB),
                        cv2.cvtColor(annotated_frame, cv2.COLOR_BGR2RGB),
                        detections
                    )
 
                    # 控制帧率
                    time.sleep(0.03)  # 约30fps
 
                cap.release()
            else:  # 图片
                frame = cv2.imread(self.source)
                if frame is not None:
                    original_frame = frame.copy()
                    results = self.model(frame, conf=self.conf, iou=self.iou)
                    annotated_frame = results[0].plot()
 
                    # 提取检测结果
                    detections = []
                    for result in results:
                        for box in result.boxes:
                            class_id = int(box.cls)
                            class_name = self.model.names[class_id]
                            confidence = float(box.conf)
                            x, y, w, h = box.xywh[0].tolist()
                            detections.append((class_name, confidence, x, y))
 
                    self.frame_received.emit(
                        cv2.cvtColor(original_frame, cv2.COLOR_BGR2RGB),
                        cv2.cvtColor(annotated_frame, cv2.COLOR_BGR2RGB),
                        detections
                    )
 
        except Exception as e:
            print(f"Detection error: {e}")
        finally:
            self.finished_signal.emit()
 
    def stop(self):
        self.running = False
 
 
class MainWindow(UiMainWindow):
    def __init__(self):
        super().__init__()
 
        # 初始化模型
        self.model = None
        self.detection_thread = None
        self.current_image = None
        self.current_result = None
        self.video_writer = None
        self.is_camera_running = False
        self.is_video_running = False
        self.last_detection_result = None  # 新增：保存最后一次检测结果
 
        # 连接按钮信号
        self.image_btn.clicked.connect(self.detect_image)
        self.video_btn.clicked.connect(self.detect_video)
        self.camera_btn.clicked.connect(self.detect_camera)
        self.stop_btn.clicked.connect(self.stop_detection)
        self.save_btn.clicked.connect(self.save_result)
 
        # 初始化模型
        self.load_model()
 
    def load_model(self):
        try:
            model_name = self.model_combo.currentText()
            self.model = YOLOv10(f"{model_name}.pt")  # 自动下载或加载本地模型
            self.update_status(f"模型 {model_name} 加载成功")
        except Exception as e:
            QMessageBox.critical(self, "错误", f"模型加载失败: {str(e)}")
            self.update_status("模型加载失败")
 
    def detect_image(self):
        if self.detection_thread and self.detection_thread.isRunning():
            QMessageBox.warning(self, "警告", "请先停止当前检测任务")
            return
 
        file_path, _ = QFileDialog.getOpenFileName(
            self, "选择图片", "", "图片文件 (*.jpg *.jpeg *.png *.bmp)")
 
        if file_path:
            self.clear_results()
            self.current_image = cv2.imread(file_path)
            self.current_image = cv2.cvtColor(self.current_image, cv2.COLOR_BGR2RGB)
            self.display_image(self.original_image_label, self.current_image)
 
            # 创建检测线程
            conf = self.confidence_spinbox.value()
            iou = self.iou_spinbox.value()
            self.detection_thread = DetectionThread(self.model, file_path, conf, iou)
            self.detection_thread.frame_received.connect(self.on_frame_received)
            self.detection_thread.finished_signal.connect(self.on_detection_finished)
            self.detection_thread.start()
 
            self.update_status(f"正在检测图片: {os.path.basename(file_path)}")
 
    def detect_video(self):
        if self.detection_thread and self.detection_thread.isRunning():
            QMessageBox.warning(self, "警告", "请先停止当前检测任务")
            return
 
        file_path, _ = QFileDialog.getOpenFileName(
            self, "选择视频", "", "视频文件 (*.mp4 *.avi *.mov)")
 
        if file_path:
            self.clear_results()
            self.is_video_running = True
 
            # 初始化视频写入器
            cap = cv2.VideoCapture(file_path)
            frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
            frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
            fps = cap.get(cv2.CAP_PROP_FPS)
            cap.release()
 
            # 创建保存路径
            save_dir = "results"
            os.makedirs(save_dir, exist_ok=True)
            timestamp = time.strftime("%Y%m%d_%H%M%S")
            save_path = os.path.join(save_dir, f"result_{timestamp}.mp4")
 
            fourcc = cv2.VideoWriter_fourcc(*'mp4v')
            self.video_writer = cv2.VideoWriter(save_path, fourcc, fps, (frame_width, frame_height))
 
            # 创建检测线程
            conf = self.confidence_spinbox.value()
            iou = self.iou_spinbox.value()
            self.detection_thread = DetectionThread(self.model, file_path, conf, iou)
            self.detection_thread.frame_received.connect(self.on_frame_received)
            self.detection_thread.finished_signal.connect(self.on_detection_finished)
            self.detection_thread.start()
 
            self.update_status(f"正在检测视频: {os.path.basename(file_path)}")
 
    def detect_camera(self):
        if self.detection_thread and self.detection_thread.isRunning():
            QMessageBox.warning(self, "警告", "请先停止当前检测任务")
            return
 
        self.clear_results()
        self.is_camera_running = True
 
        # 创建检测线程 (默认使用摄像头0)
        conf = self.confidence_spinbox.value()
        iou = self.iou_spinbox.value()
        self.detection_thread = DetectionThread(self.model, 0, conf, iou)
        self.detection_thread.frame_received.connect(self.on_frame_received)
        self.detection_thread.finished_signal.connect(self.on_detection_finished)
        self.detection_thread.start()
 
        self.update_status("正在从摄像头检测...")
 
    def stop_detection(self):
        if self.detection_thread and self.detection_thread.isRunning():
            self.detection_thread.stop()
            self.detection_thread.quit()
            self.detection_thread.wait()
 
        if self.video_writer:
            self.video_writer.release()
            self.video_writer = None
 
        self.is_camera_running = False
        self.is_video_running = False
        self.update_status("检测已停止")
 
    def on_frame_received(self, original_frame, result_frame, detections):
        # 更新原始图像和结果图像
        self.display_image(self.original_image_label, original_frame)
        self.display_image(self.result_image_label, result_frame)
 
        # 保存当前结果帧用于后续保存
        self.last_detection_result = result_frame  # 新增：保存检测结果
 
        # 更新表格
        self.clear_results()
        for class_name, confidence, x, y in detections:
            self.add_detection_result(class_name, confidence, x, y)
 
        # 保存视频帧
        if self.video_writer:
            self.video_writer.write(cv2.cvtColor(result_frame, cv2.COLOR_RGB2BGR))
 
    def on_detection_finished(self):
        if self.video_writer:
            self.video_writer.release()
            self.video_writer = None
            self.update_status("视频检测完成，结果已保存")
        elif self.is_camera_running:
            self.update_status("摄像头检测已停止")
        else:
            self.update_status("图片检测完成")
 
    def save_result(self):
        if not hasattr(self, 'last_detection_result') or self.last_detection_result is None:
            QMessageBox.warning(self, "警告", "没有可保存的检测结果")
            return
 
        save_dir = "results"
        os.makedirs(save_dir, exist_ok=True)
        timestamp = time.strftime("%Y%m%d_%H%M%S")
 
        if self.is_camera_running or self.is_video_running:
            # 保存当前帧为图片
            save_path = os.path.join(save_dir, f"snapshot_{timestamp}.jpg")
            cv2.imwrite(save_path, cv2.cvtColor(self.last_detection_result, cv2.COLOR_RGB2BGR))
            self.update_status(f"截图已保存: {save_path}")
        else:
            # 保存图片检测结果
            save_path = os.path.join(save_dir, f"result_{timestamp}.jpg")
            cv2.imwrite(save_path, cv2.cvtColor(self.last_detection_result, cv2.COLOR_RGB2BGR))
            self.update_status(f"检测结果已保存: {save_path}")
 
    def closeEvent(self, event):
        self.stop_detection()
        event.accept()
 
 
if __name__ == "__main__":
    app = QApplication(sys.argv)
 
    # 设置应用程序样式
    app.setStyle("Fusion")
 
    # 创建并显示主窗口
    window = MainWindow()
    window.show()
 
    sys.exit(app.exec_())

七、项目源码

基于深度学习YOLOv10的药物识别检测系统（YOLOv10+YOLO数据集+UI界面+Python项目源码+模型）_哔哩哔哩_bilibili

基于深度学习YOLOv10的药物识别检测系统（YOLOv10+YOLO数据集+UI界面+Python项目源码+模型）

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。