Commit Graph

  • 6a82010112 改成50_50_3场景 main weixin_46229132 2025-04-12 22:55:01 +0800
  • d64ec83042 可视化reward weixin_46229132 2025-04-08 15:49:22 +0800
  • 90ad3e829d dqn 100_100_6 weixin_46229132 2025-04-05 11:06:08 +0800
  • c6c7cb47f1 跑完100_100_6的实验 weixin_46229132 2025-04-05 10:36:03 +0800
  • 87ee65087f 修改100_100_6的dqn场景 weixin_46229132 2025-04-04 10:59:31 +0800
  • 23aafc2998 修改划分列举方法 weixin_46229132 2025-04-03 17:24:54 +0800
  • adaf8cc50e dqn跑通一个场景 weixin_46229132 2025-04-03 14:20:27 +0800
  • 0be9fa596a 修改dqn参数 weixin_46229132 2025-04-02 21:33:40 +0800
  • 981681c1bd 修改dqn bug weixin_46229132 2025-04-01 20:45:13 +0800
  • db04a87ffd 修改dqn奖励 weixin_46229132 2025-04-01 17:46:23 +0800
  • 58952f1fdb 添加greedy算法 weixin_46229132 2025-04-01 10:24:52 +0800
  • 27829c5d48 修改场景 weixin_46229132 2025-03-31 14:23:29 +0800
  • dab8f4fd8f 调整奖励函数 weixin_46229132 2025-03-31 11:12:01 +0800
  • 84f69f4293 离散情况 weixin_46229132 2025-03-29 21:28:39 +0800
  • 3e6887c655 每一个加一个奖励 weixin_46229132 2025-03-29 16:53:03 +0800
  • f347ca8276 微调分区 weixin_46229132 2025-03-29 16:28:30 +0800
  • f05f8400fb ddpg求解env_part along 2025-03-29 12:00:26 +0800
  • 0cf336c96d ppo内层加入ga along 2025-03-29 11:43:04 +0800
  • ff2b914eb5 修复env_partion bug weixin_46229132 2025-03-29 10:48:47 +0800
  • 2c88915112 跑通PPO partition weixin_46229132 2025-03-28 21:37:31 +0800
  • 8d79e8cc66 mTSP代码 weixin_46229132 2025-03-28 19:57:44 +0800
  • 656e822528 format weixin_46229132 2025-03-28 15:13:23 +0800
  • a375832b6c 添加q-learning TSP weixin_46229132 2025-03-28 10:53:41 +0800
  • 1485fb2bd6 更新q_table weixin_46229132 2025-03-27 21:48:07 +0800
  • 6f8fcd15b7 加入q learning weixin_46229132 2025-03-27 20:50:46 +0800
  • 6f44d142bc 修改模拟退火bug weixin_46229132 2025-03-24 19:28:24 +0800
  • fe37f7ac0f 修改超参数设置 weixin_46229132 2025-03-24 17:09:51 +0800
  • 61be8ad37c 修改蒙特卡洛的输出 weixin_46229132 2025-03-24 16:11:38 +0800
  • 9599215e2e 模拟退火微调分割 weixin_46229132 2025-03-24 15:42:42 +0800
  • d9d1214f7c 小改 weixin_46229132 2025-03-22 21:44:06 +0800
  • 8e8d9a25df 修改GA bug weixin_46229132 2025-03-22 21:43:11 +0800
  • 17acfa5409 修改GA bug weixin_46229132 2025-03-22 17:24:45 +0800
  • c9db9244b3 添加遍历-遗传算法求解 weixin_46229132 2025-03-22 17:16:58 +0800
  • a9ee5ceec7 环境增加delay_time weixin_46229132 2025-03-22 09:47:52 +0800
  • 5b468deb9d SAC weixin_46229132 2025-03-21 16:04:42 +0800
  • 67c7a9d6c7 DQN让它先看答案 weixin_46229132 2025-03-20 14:05:15 +0800
  • f4fb963c06 修改env参数 weixin_46229132 2025-03-20 09:29:30 +0800
  • c5023fb360 添加价值评估的mask weixin_46229132 2025-03-19 21:52:33 +0800
  • 3dba6e4a53 修改离散环境,连续不动给惩罚 weixin_46229132 2025-03-19 20:58:34 +0800
  • 4972306ca7 更新env_dis weixin_46229132 2025-03-19 20:40:35 +0800
  • ff23b5e745 调整奖励 weixin_46229132 2025-03-19 16:31:23 +0800
  • d364a1e4df 修ppo bug weixin_46229132 2025-03-19 15:23:55 +0800
  • 6dc285d3f8 加入PPO代码 weixin_46229132 2025-03-19 15:12:52 +0800
  • 7ca5ce08b1 修改环境 weixin_46229132 2025-03-19 14:22:24 +0800
  • e35dd10326 验证阶段加输出,更新奖励 weixin_46229132 2025-03-19 11:29:02 +0800
  • c96c36d4cd 调整eval的输出 weixin_46229132 2025-03-19 10:58:43 +0800
  • 2362de4c54 修改dqn weixin_46229132 2025-03-19 01:04:03 +0800
  • f19e8fbdbf 加入dqn算法 weixin_46229132 2025-03-18 21:16:48 +0800
  • 343008bc9f 简化初始化迷宫的方式 weixin_46229132 2025-03-18 17:27:49 +0800
  • 55e45fe14e 小改ddpg main weixin_46229132 2025-03-18 14:45:50 +0800
  • b3812a3193 format ddpg_main weixin_46229132 2025-03-18 14:30:41 +0800
  • 19f8b6246a test weixin_46229132 2025-03-18 14:29:16 +0800
  • 75e5237272 修改DDPG weixin_46229132 2025-03-14 16:06:59 +0800
  • ab51727253 添加ddpg代码 weixin_46229132 2025-03-14 15:27:05 +0800
  • 4fdb8aa152 env代码小调整 weixin_46229132 2025-03-14 11:17:12 +0800
  • dfec68e122 修改蒙特卡洛采样法 weixin_46229132 2025-03-14 11:01:02 +0800
  • b3b5e597b8 添加requirements.txt weixin_46229132 2025-03-14 10:10:09 +0800
  • c1eb9d9528 就用cpu训练网络 weixin_46229132 2025-03-14 09:45:46 +0800
  • 64935bf92f 添加人工操作,修改环境bug weixin_46229132 2025-03-14 09:42:56 +0800
  • db890f83cf 改网络的激活函数 weixin_46229132 2025-03-14 09:22:40 +0800
  • 3086413171 修改car_pos weixin_46229132 2025-03-13 21:28:30 +0800
  • ee914ff930 调整奖励 weixin_46229132 2025-03-13 15:55:14 +0800
  • aecd86b245 修改env数据结构 weixin_46229132 2025-03-13 15:09:58 +0800
  • 1f18d9d96f 修改算法的输出,把可视化模块单独分离出来 weixin_46229132 2025-03-13 11:18:58 +0800
  • b1851ac489 修改bug weixin_46229132 2025-03-13 10:46:28 +0800
  • d53eda2570 修PPObug weixin_46229132 2025-03-12 16:09:19 +0800
  • fe4e754cc4 添加greedy求解代码 weixin_46229132 2025-03-12 11:33:35 +0800
  • 3818343085 PPO能够跑起来了 weixin_46229132 2025-03-11 19:43:04 +0800
  • 4474a33cba 添加yaml文件 weixin_46229132 2025-03-11 16:40:20 +0800
  • 1058f37be6 添加PPO代码 weixin_46229132 2025-03-11 16:01:07 +0800
  • e7a4395340 保存当前状态 weixin_46229132 2025-03-11 15:46:11 +0800
  • 01c6a71b4f 使用遗传算法求解多旅行商问题 weixin_46229132 2025-03-09 16:53:01 +0800
  • 34725a8edf first commit weixin_46229132 2025-03-06 20:44:30 +0800
  • 1be980dd0e Initial commit along 2025-03-06 20:42:08 +0800