马尔可夫链并不要求事件独立,而是假设当前状态的下一个转移分布和早期路径无关,是RL的基石。股市新手,但直觉可以用来近似
来源:
dancingpig
于
2025-09-04 10:33:35
[
旧帖
] [
给我悄悄话
] 本文已被阅读:次