YOLOv8 在工业缺陷检测中的应用与优化

为什么选择 YOLOv8

YOLOv8 是当前工业目标检测领域的主流模型之一。相较于 YOLOv5/v7，它在 anchor-free 设计、损失函数和 backbone 结构上都有显著改进，特别适合工业缺陷检测中目标尺度多变、缺陷形态不固定的场景。

工业缺陷检测面临着以下核心挑战：

我们在 YOLOv8 原有的 PAN-FPN 基础上，增加了一个小目标检测专用层。通过引入高分辨率特征图（P2 层），模型能够更好地捕捉微小缺陷的细粒度特征。实验表明，这一改进将小缺陷（小于 10 像素）的检出率从 76% 提升至 91%。

在 backbone 的 C2f 模块中嵌入 CBAM（Convolutional Block Attention Module），让模型自适应关注缺陷区域。通过通道注意力和空间注意力的双重加权，模型对缺陷特征的敏感度显著提升。

原始的 CIoU 损失对小目标不够友好。我们将其替换为 WIoU（Wise-IoU）v3，引入动态聚焦机制，根据样本质量自动调整梯度分配策略。这一改动使得模型在训练后期收敛更加稳定，mAP 提升了 2.3 个百分点。

在某钢材表面缺陷检测项目中，经过上述优化后，模型在 1280x1280 输入下的 mAP@0.5 从 87.4% 提升至 94.6%，单帧推理时间保持在 38ms（NVIDIA T4 GPU）。

针对工业场景样本稀缺问题，我们采用了以下数据增强组合：

为满足产线实时性要求，我们在部署阶段进行了 TensorRT 量化加速。通过 FP16 精度推理，模型推理速度从 38ms 进一步降低至 22ms，同时精度损失不到 0.5%。

YOLOv8 在工业缺陷检测中展现出了强大的基础能力，但直接拿来用往往达不到产线要求。通过多尺度增强、注意力机制、损失函数改进和 TensorRT 加速这一套组合拳，我们成功将模型从"能看"提升到"能用"，再到"好用"。