abcdRL

概览 🗺
概览 🗺
- 简介 🎟 简介 🎟
  目录
  - 🗽 设计哲学
  - ✅ 已实现算法
- 特点 🤖
- 模块设计 🏗
教程 🧭
教程 🧭
- 安装 🛠
参考 📎
参考 📎
- 参考资料 💾

abcdRL (简单四步实现一个强化学习算法)

abcdRL 是一个模块化单文件强化学习代码库🗄，提供“有但不严格🚥”的模块化🏗设计，和清晰的单文件📜算法实现。

Adam

阅读📖代码时，在单文件📜代码中，快速了解算法的完整实现细节；改进🖌算法时，得益于轻量🍃的模块化设计，只需专注于少量的模块。

Note

abcdRL 主要参考了 vwxyzjn/cleanRL 的单文件设计哲学和 PaddlePaddle/PARL 的模块设计。

🗽 设计哲学

要“拷贝📋”，~~不要“继承🧬”~~
要“单文件📜”，~~不要“多文件📚”~~
要“功能复用🛠”，~~不要“算法复用🖨”~~
要“一致的逻辑🤖”，~~不要“一致的接口🔌”~~

✅ 已实现算法