训练结果解析

Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
78/99     0G     0.0313    0.03745   0.004692        123            640

 Class     Images  Instances          P          R      mAP50   mAP50-95:
 all        128        929      0.938       0.89      0.957      0.742
  • Epoch:训练轮数,此处显示为68/99,表示已经训练68轮,总轮数设置为99轮。
  • GPU_mem:GPU显存占用情况,此处显示为0G,表示显存占用很低。如果显存不足会显示为2G/11G等。
  • box_loss:边界框回归loss,此处为0.03343,表示边界框预测的loss值。
  • obj_loss:对象ness loss,此处为0.03745,表示是否包含对象的loss值。
  • cls_loss:分类loss,此处为0.005675,表示对象分类预测的loss值。
  • Instances:训练图片中的目标实例数,此处为182,表示一共182个实例。
  • Size:图片大小,此处为640,表示使用640x640的图片进行训练。
  • Class: 类别,此处显示为all,代表总体指标。
  • Images:测试集图片数,此处显示为128,表示一共128张测试集图片。
  • Instances:测试集目标实例数,此处显示为929,表示一共929个测试集实例。 
  • P:Precision,精度,此处显示为0.918,表示模型在测试集上的预测精度为91.8%。
  • R:Recall,召回率,此处显示为0.9,表示模型在测试集上的召回率为90%。
  • mAP50:mAP@IoU=0.5, 此处显示为0.95,表示模型在IoU=0.5时的mAP为95%。  
  • mAP50-95: mAP@IoU=0.5:0.95,此处显示为0.718,表示模型在IoU=0.5:0.95范围内的mAP为71.8%。
Exception ignored in tp_clear of: <class 'memoryview'> Traceback (most recent call last): File "F:\scoop\apps\miniconda3\current\envs\main\lib\concurrent\futures\process.py", line 697, in submit w = _WorkItem(f, fn, args, kwargs) BufferError: memoryview has 1 exported buffer

在std.py 530行打个断点,就可以过了?

yolo v5 导出 Android 手机上可以运行的 TFLite 模型

https://www.sunzhongwei.com/yolo-v5-export-tflite-model-run-on-android

查看CUDA版本

nvidia-smi

nvcc --version和nvidia-smi的版本可能會不一樣,前者是runtime api對應的版本,後者是driver api的版本。

通常需要和runtime的版本匹配,driver的版本可以向下兼容。

CUDA-toolkit https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html https://www.codenong.com/cs106685050/ https://developer.nvidia.com/cuda-toolkit-archive

cuDNN https://developer.nvidia.com/rdp/cudnn-archive#a-collapse51b

OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.

import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

UserWarning: Failed to load image Python extension: [WinError 127] 找不到指定的程序。 warn(f"Failed to load image Python extension: {e}")