书目信息 |
| 题名: |
深度强化学习实践
|
|
| 作者: | 拉潘 著 ;林然 , 王薇 译 | |
| 分册: | ||
| 出版信息: | 北京 机械工业出版社 2021 |
|
| 页数: | 17, 617页 | |
| 开本: | 24cm | |
| 丛书名: | 智能系统与技术丛书 | |
| 单 册: | ||
| 中图分类: | TP181 | |
| 科图分类: | ||
| 主题词: | 机器学习--ji qi xue xi--算法 | |
| 电子资源: | ||
| ISBN: | 978-7-111-68738-2 | |
| 000 | 01806oam2 2200325 450 | |
| 001 | 011025150647 | |
| 005 | 20221025150647.0 | |
| 010 | @a978-7-111-68738-2@dCNY149.00 | |
| 100 | @a20201004d2021 em y0chiy50 ea | |
| 101 | 1 | @achi@ceng |
| 102 | @aCN@b110000 | |
| 105 | @aa z 000yy | |
| 106 | @ar | |
| 200 | 1 | @a深度强化学习实践@Ashen du qiang hua xue xi shi jian@dDeep reinforcement learning hands-on@f(俄) 马克西姆·拉潘(Maxim Lapan) 著@g林然,王薇译@zeng |
| 210 | @a北京@c机械工业出版社@d2021 | |
| 215 | @a17, 617页@c图@d24cm | |
| 225 | 2 | @a智能系统与技术丛书@Azhi neng xi tong yu ji shu cong shu |
| 305 | @a译自原书第2版 | |
| 306 | @a本书中文简体字版由Packt Publishing授权机械工业出版社独家出版 | |
| 314 | @a马克西姆·拉潘,一位深度学习爱好者和独立研究者。林然,在2016年加入Thoughtworks之后,主要担任全栈软件开发工程师。王薇,北京邮电大学硕士。 | |
| 330 | @a本书介绍了强化学习的基础知识,以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAIGym库以及PyTorch库。接着分别介绍几种强化学习方法:交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法,并研究可以使用策略梯度方法解决的实际问题:使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法:黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGoZero、离散优化、多智能体强化学习。 | |
| 410 | 0 | @12001 @a智能系统与技术丛书 |
| 510 | 1 | @aDeep reinforcement learning hands-on@zeng |
| 606 | 0 | @a机器学习@Aji qi xue xi@x算法 |
| 690 | @aTP181@v5 | |
| 701 | 0 | @c(俄)@a拉潘@Ala pan@g(Lapan, Maxim)@4著 |
| 702 | 0 | @a林然@Alin ran@4译 |
| 702 | 0 | @a王薇@Awang wei@4译 |
| 801 | 0 | @aCN@c20221025 |
| 905 | @a河南城建学院图书馆@dTP181@eM088 | |
| 深度强化学习实践=Deep reinforcement learning hands-on/(俄) 马克西姆·拉潘(Maxim Lapan) 著/林然,王薇译.-北京:机械工业出版社,2021 |
| 17, 617页:图;24cm.-(智能系统与技术丛书) |
| ISBN 978-7-111-68738-2:CNY149.00 |
| 本书介绍了强化学习的基础知识,以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAIGym库以及PyTorch库。接着分别介绍几种强化学习方法:交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法,并研究可以使用策略梯度方法解决的实际问题:使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法:黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGoZero、离散优化、多智能体强化学习。 |
| ● |
| 相关链接 |
|
|
|
正题名:深度强化学习实践
索取号:TP181/M088
 
预约/预借
| 序号 | 登录号 | 条形码 | 馆藏地/架位号 | 状态 | 备注 |
| 1 | 1584976 | 215849768 | 自科库301/301自科库 102排9列4层/ [索取号:TP181/M088] | 在馆 |