Merge branch ‘master’ of https://git.trustie.net/hy2021/Ascend-A3C
迁移强化学习模型A3C到ascend910平台,将Ascend平台训练结果的精度和论文在cpu上的训练结果进行对比。
推理性能对比:
A3C └─ ├─README.md ├─model 训练出的模型默认输出目录 ├─model_name.ckpt.data-00000-of-00001 ├─model_name.ckpt.index ├─model_name.ckpt.meta ├─log 训练pong游戏模型时的日志 ├─Pong_Conv 具体模型名称 ├─log.txt 日志 ├─W_X 第X线程下的模型结构 ├─pb_model 转换得到的pb模型 ├─a3c_pong_model.pb 具体pb模型 ├─om_model 转换得到的om模型 ├─a3c_pong_model.om ├─Ascend_Infer Ascend310平台上推理脚本 ├─A3C_Inferance.py 推理脚本 ├─acl_model.py 定义模型类,完成模型推理过程中资源管理 ├─constants.py 常量定义 ├─utils.py 常用操作定义 ├─envs.py gym环境类的重载 ├─Params.py 全局变量定义 ├─AcNet.py 核心网络结构 ├─envs.py gym环境类的重载 ├─model.py 模型结构 ├─workerm.py 每一个线程下工作单元worker结构 ├─train_cpu.py 启动训练脚本(cpu) ├─train_npu.py 启动训练脚本(npu) ├─model_Converter.py ckpt模型转换pb模型脚本 ├─om_converter.sh atc转换命令 ├─train_testcase.sh 训练命令
python train_npu.py --env_name PongDeterministic-v4 --threads_num 16 --model_name a3c_Pong_model python train_npu.py --env_name TutankhamDeterministic-v4 --threads_num 8 --MAX_GLOBAL_EP 7000 --lr 0.0005 --LSTM --model_name a3c_Tutankham_model_lstm python train_npu.py --env_name AlienDeterministic-v4 --threads_num 8 --MAX_GLOBAL_EP 22000 --model_name a3c_Alien_model_lstm --lr 0.0005 --LSTM --UPDATE_GLOBAL_ITER 512
python model_Converter.py --output_path ./pb_model --input_path ./mdoel --model_name model_Pong_Conv --type conv --env_name PongDeterministic-v4 python model_Converter.py --output_path ./pb_model --input_path ./mdoel --model_name model_Alien_Conv --type lstm --env_name AlienDeterministic-v4
./om_converter.sh
具体推理流程见推理部分
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
A3C模型
概述
迁移强化学习模型A3C到ascend910平台,将Ascend平台训练结果的精度和论文在cpu上的训练结果进行对比。
推理性能对比:
Requirement
代码路径解释
流程描述
1:使用A3C目录下的train脚本完成模型训练
2:使用A3C目录下model_Converter脚本完成ckpt模型转换pb模型
3:使用CANN(20.1.alpha001版)中的atc工具,pb模型转换为om模型
4:使用A3C/Ascend_Infer/A3C_Inferance.py脚本完成om模型部署推理
主要脚本解释
1: A3C/train.py
参数解释
示例
2:A3C/model_Converter.py
参数解释
示例
3: atc转换模型命令
4:Ascend310推理
具体推理流程见推理部分