为了解决传统双深度Q网络(DDQN)算法在移动机器人路径规划中存在的特征利用率低、样本学习效率不足以及容易陷入局部最优的问题,本文提出了一种改进的DDQN算法。该算法整合了加权注意力机制、累积奖励双阶段采样和人工势场(APF)奖励。首先,在状态 ...