科技资源

新一代信息技术

当前位置: 首页 > 科技资源 > 专利推介 > 新一代信息技术 > 正文

一种基于强化学习和启发式搜索的路径规划方法及系统

专利号：ZL202010800070.0

专利类型：发明授权

发明人：张秀玲; 康学楠; 李金祥

公开（公告）日：2022-10-4

转化方式：转让、许可、作价入股

联系人：周老师

联系电话：0335-8518633

本发明公开了一种基于强化学习和启发式搜索的路径规划方法及系统。该方法包括：S1：在马尔科夫决策过程框架下建立环境模型，所述环境模型的状态空间为S，动作空间为A，奖励函数为R，转移概率函数为P；S2：通过Dyna‑Q算法对所述环境模型进行采样更新，对每个状态‑动作对进行评估并确定目标点；S3：基于所述目标点，通过A*算法分别计算当前位置与起始点和所述目标点的欧式距离，确定初始路径；S4：对所述初始路径中每个状态‑动作对进行赋值；S5：根据每个状态‑动作对的评估值以及赋值，确定最优动作；S6：根据最优动作确定最优路径。本发明能够有效的加速强化学习的收敛速度，同时克服启发式搜索规划出次最优解等问题，从而更加快速、准确的规划路径。

上一篇：一种面向智能家居的边缘计算带宽资源分配方法及系统

下一篇：一种基于目标检测与动作识别的多目标视觉监管方法

【关闭】

河北省秦皇岛市河北大街西段438号燕山大学世纪楼1307

0335-8057035 0335-8067036

jszy@ysu.edu.cn

燕山大学
科技产业促进中心

发明人	张秀玲; 康学楠; 李金祥	公开（公告）日	2022-10-4
专利类型	发明授权	转化方式	转让、许可、作价入股
联系人	周老师	联系电话	0335-8518633