模型量化是指将深度学习模型中的浮点参数和操作转换为定点表示,如 FLOAT32 转
换为 INT8 等。量化能够降低内存占用,实现模型压缩和推理加速,但会造成一定程度的
精度损失。
尝试新模型
yolov5s_relu——relu激活函数模型
yolov5s_i8——fp浮点量化成i8八位整形的模型
模型量化是指将深度学习模型中的浮点参数和操作转换为定点表示,如 FLOAT32 转
换为 INT8 等。量化能够降低内存占用,实现模型压缩和推理加速,但会造成一定程度的
精度损失。
尝试新模型
yolov5s_relu——relu激活函数模型
yolov5s_i8——fp浮点量化成i8八位整形的模型