整体架构: 对比Rainbow和普通DQN的平均奖励: 对比Rainbow和普通DQN的平均步数: 超参数影响: 对拍标准A*算法: 效果: 百度ai-studio博客地址: 当A*Star遇见PARL——使用Rainbow模型切ACM题