Commit Graph

12 Commits

Author SHA1 Message Date
weixin_46229132
6a82010112 改成50_50_3场景 2025-04-12 22:55:01 +08:00
weixin_46229132
87ee65087f 修改100_100_6的dqn场景 2025-04-04 10:59:31 +08:00
weixin_46229132
0be9fa596a 修改dqn参数 2025-04-02 21:33:40 +08:00
weixin_46229132
db04a87ffd 修改dqn奖励 2025-04-01 17:46:23 +08:00
weixin_46229132
84f69f4293 离散情况 2025-03-29 21:28:39 +08:00
weixin_46229132
67c7a9d6c7 DQN让它先看答案 2025-03-20 14:05:15 +08:00
weixin_46229132
c5023fb360 添加价值评估的mask 2025-03-19 21:52:33 +08:00
weixin_46229132
3dba6e4a53 修改离散环境,连续不动给惩罚 2025-03-19 20:58:34 +08:00
weixin_46229132
4972306ca7 更新env_dis 2025-03-19 20:40:35 +08:00
weixin_46229132
c96c36d4cd 调整eval的输出 2025-03-19 10:58:43 +08:00
weixin_46229132
2362de4c54 修改dqn 2025-03-19 01:04:03 +08:00
weixin_46229132
f19e8fbdbf 加入dqn算法 2025-03-18 21:16:48 +08:00