mdz/pytorch/yolo11/readme.md

384 lines
20 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# yolo11
![version](https://img.shields.io/badge/icraft_ver-3.7.1-gold?style=flat&logo=) ![author](https://img.shields.io/badge/author-sx-blue)<br>![metrics](https://img.shields.io/badge/metrics-OK-green?style=flat&logo=) ![speed](https://img.shields.io/badge/speed-OK-green?style=flat&logo=fastapi)<br>![FPGA_ops](https://img.shields.io/badge/FPGA_ops-ImageMake%20%7C%20DetPost%20%7C%20Nms-lightgreen?style=flat)<br>![Bitstream](https://img.shields.io/badge/Bitstream-v0%20%7C%20v1-6959CD?style=flat&logo=bit)<br><a href="../../index.md#cv-det-1" target="_blank"><img alt="模型清单" src="https://img.shields.io/badge/cv--det-模型清单-cornflowerblue?logo=quicklook"></a><br>![OS](https://img.shields.io/badge/OS-Windows%20%7C%20Ubuntu-green)
# 下载
✨ 一键下载开发流程中所需的各种文件,包括编译使用的量化校准集、运行时工程的依赖库,以及输入输出文件。
💡 推荐使用linux版下载脚本其wget包含断网自动重连功能不会出现下载文件遗漏情况。
## windows
📌 第一次使用请在C盘根目录下新建`icraft_auth.txt`,保存下载站账号密码,以换行符分隔
需要事先下载windows版本wget
(若点击以下链接后未直接下载,请选择 ***1.20.3*** 版本下的对应系统链接进行下载)
[x86系统wget下载](https://eternallybored.org/misc/wget/1.20.3/32/wget.exe) [x64系统wget下载](https://eternallybored.org/misc/wget/1.20.3/64/wget.exe)
使用时需要将wget.exe的路径作为命令行参数传入注意不是exe的父文件夹目录而是包含wget.exe的完整绝对路径
不下载Deps`./download.ps1 "PATH_TO_WGET_EXE"`
如果您是第一次使用我们的模型库,请下载包括工程依赖库的所有文件:`./download.ps1 "PATH_TO_WGET_EXE" -d`
💡 下载过程中可能因网络问题出现中断情况,需 **自行重新运行** 下载脚本。
## linux
📌 第一次使用,请在/usr根目录下新建`icraft_auth.txt`,保存下载站账号密码,以换行符分隔
为确保文件格式正确,请在运行脚本前安装格式转换工具`dos2unix`,并执行格式转换命令:
```shell
sudo apt-get install dos2unix
dos2unix /usr/icraft_auth.txt
dos2unix ./download.sh
```
如果您是第一次使用我们的模型库,请下载包括工程依赖库的所有文件:`./download.sh -d`
如果之前已经在使用别的模型时下载过Deps依赖库可以直接将其中的thirdparty部分复制到路径`3_deploy/Deps`,只需下载量化校准集和输入输出文件即可:`./download.sh`
🌟 Tips
- 若想要直接获取原始weights和导出保存的模型可分别前往 [weights](https://download.fdwxhb.com/data/04_FMSH-100AI/100AI/04_modelzoo/modelzoo_pub/weights/) 和 [fmodels](https://download.fdwxhb.com/data/04_FMSH-100AI/100AI/04_modelzoo/modelzoo_pub/compile/fmodels/) 网页上根据框架及模型名寻找并下载。
# 0. 文件结构说明
AI部署模型需要以下几部分文件
- 0_yolo11 >模型原始工程,需要自行下载
- weights >存放原始权重,需要自行下载
- 1_scripts >若干脚本用于保存Icraft编译器需要的模型、编译后仿真等功能
- 2_compile >Icraft编译器编译模型时所需要的文件
- 3_deploy >将Icraft编译器编译出的模型部署到硬件时需要的c++工程
# 1. python工程准备
## 1. **模型来源:**
- codehttps://github.com/ultralytics/ultralytics.git
- branchmaster
- commit_id31aaf0e
- weightshttps://github.com/ultralytics/assets/releases/download/v0.0.0/yolo11s.pt
## 2. **保存模型**
**目的将模型保存成可以被Icraft编译器编译的形态**
1根据模型来源中的地址https://github.com/ultralytics/assets/releases/download/v0.0.0/yolo11s.pt 下载原始weights存放于 `/weights`文件夹中
<div style="background-color: #FFFFCC; color: #000000; padding: 10px; border-left: 5px solid #FFA500;">
注意:
* 有时开源的weights url可能会变更。如果上述weights url失效请根据原工程相应的branch以及commit版本寻找正确的下载链接
* 若上述weights url永久失效请联系本模型库相关人员获取权限下载
</div>
2根据模型来源中的地址下载指定commit id版本的源代码文件夹名称要设置为0_yolo11
```shell
# 在此模型根目录
mkdir 0_yolo11
git clone -b master https://github.com/ultralytics/ultralytics.git 0_yolo11
cd 0_yolo11
git checkout 31aaf0e
```
3进入1_scripts执行保存模型脚本
```shell
# 在此模型根目录
cd 1_scripts
python 1_save.py
```
**1_scripts提供脚本说明**
- **环境要求:**Icraft编译器对**导出框架模型时**使用的**框架版本**有要求。即以下脚本中所有导出模型的脚本 `1_save.py `,必须在要求的框架版本下执行,其他脚本不限制。要求的版本:
- **pytorch**支持pytorch1.9.0、pytorch2.0.1两个版本的原生网络模型文件(.pt格式以及pytorch框架保存为onnxopset=17格式的模型文件.onnx格式
- **paddle**仅支持PaddlePaddle框架保存为onnxopset=11格式的模型文件.onnx格式不支持框架原生网络模型文件
- **darknet**支持Darknet框架原生网络模型[GitHub - pjreddie/darknet: Convolutional Neural Networks](https://github.com/pjreddie/darknet)
- 0_infer.py >可以推理一张图并得到最终结果,模型原始权重会从 `/weights `中寻找,需要您预先下载
- 1_save.py >保存模型保存好的用于Icraft编译器的模型会存放在 `/2_compile/fmodel`
<div style="background-color: #FFFFCC; color: #000000; padding: 10px; border-left: 5px solid #FFA500;">
保存模型时的修改点:
1. 将reorg操作用卷积等效 `<br>`
2. 将IKeypoint类中ImplicitAImplicitM的乘和加常数的操作融合到self.m的卷积参数中 `<br>`
3. 将IKeypoint forward中concat算子之后的操作去掉并添加identity作用的conv算子 `<br>`
</div>
- 2_save_infer.py >用修改后保存的模型做前向推理,验证保存的模型与原模型是否一致
# 2.使用Icraft编译器编译模型
目的: 使用[Icraft编译器](https://gitee.com/mxh-spiger/icraft-introduction.git)将上一步保存好的**框架模型**转化为**硬件可部署模型**
- **1相关命名说明**
1**fmodel**frame model >用于Icraft编译器的框架模型
2**imodel**icraft model >用Icraft编译器编译出的模型
3**qtset**Quantitative Calibration Set >Icraft编译器所需的量化校准集
- **2确认已安装正确的icraft版本**
检查方法打开cmd运行`icraft --version`
若已正常安装则会显示当前icraft版本例如
```
Icraft 版本:
* 3.7.1
CLI 版本:
3.7.0.0-a90988f(2412231401)
```
- 3**执行编译:**
**在 `/2_compile`目录下执行编译:**
```shell
icraft compile config/nafnet_A_selfattn_8.toml
```
如果过程顺利,将得到 icraft model`.json` graph`.raw`param的格式保存
其中包括编译各阶段产生的中间结果模型和最终用于片上部署的BY模型直接被保存到: 3_deploy/modelzoo/yolo11/imodel
# 3. 仿真
通过配置3_deploy/modelzoo/yolo11/cfg/中yaml文件的sim字段为True实现模型仿真。
```json
imodel:
...
sim: true
...
```
# 4. 部署模型
## 部署环境检查
* 以root账户登录片上系统terminalssh或串口皆可模型库默认的模型存放路径为以下目录如果没有请预先创建
```
/home/fmsh/ModelZoo/
```
* 检查板上环境是否正确:
1. 查看环境变量,指令:
`icraft --version`
看打印信息是否如下:
```shell
Icraft 版本:
* v3.7.1
CLI 版本:
3.7.0.0-a90988f(2412231401)
```
2. 若是,在任意目录下输入`icraft-serve`即可打开server
3. 检查icraft和customop安装包版本是否为`arm64`
```shell
# 检查icraft安装包版本
dpkg -l | grep icraft
# 检查customop安装包版本
dpkg -l | grep customop
```
如果依次显示如下信息,则安装版本正确:
```shell
ii icraft 3.7.1 arm64 This is Icraft for arm64
ii customop 3.7.1 arm64 This is Icraft CustomOp for arm64
```
4. 如果环境配置有误,请参考[Part 1_1 2.3.1 片上系统环境 编译环境准备](https://gitee.com/mxh-spiger/tutorial-runtime/blob/tt3.7.1/docs/Part%201_1%20quick-start.md#1%E7%BC%96%E8%AF%91%E7%8E%AF%E5%A2%83%E5%87%86%E5%A4%87-2)进行部署环境配置。
5. 根据此模型使用的硬算子,选择合适的位流,并在板上安装,所用硬算子及可选位流版本可参见本说明文档起始处的状态徽章,位流下载及安装说明请参考[1/4) 其他下载资源](https://gitee.com/mxh-spiger/icraft-introduction/tree/icraft_v3.7.1/#4%E5%85%B6%E4%BB%96%E4%B8%8B%E8%BD%BD%E8%B5%84%E6%BA%90)。
## c++ runtime:
目的编译c/c++可执行程序在AI硬件上执行模型前向推理
模型库以ubuntu操作系统为例
1. **编译环境准备**
- os: ubuntu20.04
- cmake>=3.10
- compiler: aarch64-linux-gnu-g++/aarch64-linux-gnu-gcc
2. **编译c++程序**
```shell
#在3.1所需的linux编译环境中
cd 3_deploy/modelzoo/yolo11/build_arm
cmake ..
make -j
```
4. **执行程序**
```
cd /home/fmsh/ModelZoo/modelzoo/yolo11/build_arm
chmod 777 *
./yolo11s ../cfg/yolo11s.yaml
```
在io/output中查看结果
# 5. 精度测试
<div style="background-color: #FFFFCC; color: #000000; padding: 10px; border-left: 5px solid #FFA500;">
由于精度测试需要遍历一个数据集中的所有图片因此需要使用上位机作为主控操作系统demo中是按windows作为上位机操作系统来做的使用网口连接板子运行时输入数据会通过上位机经由网口传到片上进行推理。
</div>
## 1. 环境准备
若已准备好环境请跳过此部分
**1. 网口调试环境准备**(如果已经准备好网口调试环境则看下一条)
1. 安装ssh
2. 查看或配置板子ip
- 使用串口连接板子
- `vim /etc/rc.local`
- 查看或设置ip
```
#!/bin/bash
ifconfig eth0 192.168.125.171 netmask 255.255.255.0
systemctl start sshd
```
3. 修改本地网络适配器配置
参考配置
- ipv4地址`192.168.125.2`
- 子网掩码:`255.255.255.0`
- 默认网关:`192.168.125.1`
- 连接速度与双工100mbps全双工
4. 使用网口或串口进入板上系统打开server
上位机:
```cmd
ssh root@192.168.125.171
```
板上:
确保位于root账户下执行
```shell
icraft-serve
```
* 请确保在root账户下执行上述命令
* 设备成功打开示意图
```
root@U:~# icraft-serve
[02/22/24 02:02:00.388] [I] Using port : 9981
[02/22/24 02:02:00.388] [I] synchronous mode
[02/22/24 02:02:00.388] [I] [irpc::port::tcp::_waitNewConn] wait for new connection
```
如果能正确运行则可以继续下一步。
**2.编译环境准备**
请参考[2.1Windows编译环境准备](https://gitee.com/mxh-spiger/tutorial-runtime/tree/rt3.0.0)进行精度测试环境配置。
- os: windows
- [cmake3.28](https://github.com/Kitware/CMake/releases/download/v3.28.1/cmake-3.28.1-windows-x86_64.msi)
- [visualstudio2022](https://visualstudio.microsoft.com/zh-hans/thank-you-downloading-visual-studio/?sku=Community&channel=Release&version=VS2022&source=VSLandingPage&passive=false&cid=2030)
## 2. 测试说明
1. **如果使用了detpost硬算子**(如果未使用则忽略此条)
- 1修改customop toml
customop toml 即 config\customop\xxmodel.toml
需要将该文件中的 `thr_f`配置成0.001
```toml
[ImageMake]
no_imkpad = 0
[DetPost]
thr_f = 0.001 # 阈值
cmp_en = 1 # 是否做阈值比较
groups = 3
anchor_num = 3
position = 5
```
- 2重新进行模型编译
```shell
icraft compile config/nafnet_A_selfattn_8.toml
```
由于测精度程序由上位机控制生成的imodel不用再复制到板子中
2. **数据集准备**
* 测试数据集下载:[coco2017val](http://images.cocodataset.org/zips/val2017.zip)
* 模型测试使用COCO2017数据集的Val部分测试图片存放于 `3_deploy\modelzoo\yolov5_7.0\io\input``3_deploy\modelzoo\yolov5_7.0\io\cocoval_2017.txt`
* 如需测试其他数据集,需自行将图片存放于 `3_deploy\modelzoo\yolov5_7.0\io\input`,并准备对应的input.txt
3. **修改运行时的yaml配置文件**
运行时需要配置一些模型路径,输入数据,后处理参数等,其配置文件在 `3_deploy/modelzoo/yolo11/cfg/`
测试时使用:`yolo11s_test.yaml`
需要修改:
* imodel中参数修改精度测试所用模型文件路径`dir`根据所使用板子ip设置`ip`。
* dataset中参数更改自己的精度测试数据集路径。
* param中参数如果模型没有重训则无需更改若重训则需要修改对应部分参数。
4. **编译、执行运行时程序**
c++运行时:
```shell
cd 3_deploy/modelzoo/yolo11
mkdir build_win
cd build_win
cmake ..
cmake --build . --config Release
./Release/yolo11s.exe ../cfg/yolo11s_test.yaml
```
注意如果使用visualstudio打开sln进行调试需要右键工程-属性-调试-环境中配置 `./Release/yolo11s.exe ../cfg/yolo11s_test.yaml`
5. **使用metrics测试脚本将保存的测试结果计算出精度指标**
metrics测试脚本使用与配置说明
- 精度测试脚本存放于:[https://gitee.com/mxh-spiger/benchmark](https://gitee.com/mxh-spiger/benchmark)
- 本模型使用 `./box_mAP/calAP.py`
- txtDir字段设置为片上系统预测结果存放路径
# 6. 模型性能记录
| yolo11 | input shape | hard time | 精度 |
| --------------- | ---------------- | --------- | ------------ |
| | [1, 3, 640, 640] | {'8bit': '9.37ms', '16bit': '20.44ms', 'mixed': '10ms'} | {'float': ['ap50-95:0.47'], 'parse': ['ap50-95:0.47'], 'int8': ['ems-channel', 'ap50-95:0.414'], 'int16': ['ems-channel', 'ap50-95:0.435'], 'mixed': ['ems-channel', 'ap50-95:0.427']} |