Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
介紹
Reinforcement Learning 基礎知識
基本 Reinforcement Learning 技術
粗麻布簡介
價值與政策反覆運算的融合
獎勵塑造
勘探
普遍化
部分可觀察的 MDP
選項
後勤
TD Lambda的
策略梯度
深度 Q 學習
博弈論專題
摘要和後續步驟
最低要求
- 精通Python
- 對大學微積分和線性代數的理解
- 對概率和Statistics的基本理解
- 具有在 Python 和 Numpy 中創建機器學習模型的經驗
觀眾
- 開發人員
- 數據科學家
21 時間: