• 首页
  • 本馆介绍
  • 公告通知
  • 最新文献
  • 馆藏检索
  • 电子资源
  • 读者导购
  • 参考咨询
  • CALIS
  • 我的图书馆
  • 登录
  • 详细信息显示
  • 放入我的书架
  • 预约/预借图书
  • 作者相关作品
  • 分类相关作品
  • 丛书相关作品
  • 出版社相关作品

书目信息

  • 表格格式
  • 工作单格式
  • 卡片格式
题名:
深度强化学习实践
    
 
作者: 拉潘 著 ;林然 , 王薇 译
分册:  
出版信息: 北京   机械工业出版社  2021
页数: 17, 617页
开本: 24cm
丛书名: 智能系统与技术丛书
单 册:
中图分类: TP181
科图分类:
主题词: 机器学习--ji qi xue xi--算法
电子资源:
ISBN: 978-7-111-68738-2
 
 
 
 
 
000 01806oam2 2200325 450
001 011025150647
005 20221025150647.0
010    @a978-7-111-68738-2@dCNY149.00
100    @a20201004d2021 em y0chiy50 ea
101 1  @achi@ceng
102    @aCN@b110000
105    @aa z 000yy
106    @ar
200 1  @a深度强化学习实践@Ashen du qiang hua xue xi shi jian@dDeep reinforcement learning hands-on@f(俄) 马克西姆·拉潘(Maxim Lapan) 著@g林然,王薇译@zeng
210    @a北京@c机械工业出版社@d2021
215    @a17, 617页@c图@d24cm
225 2  @a智能系统与技术丛书@Azhi neng xi tong yu ji shu cong shu
305    @a译自原书第2版
306    @a本书中文简体字版由Packt Publishing授权机械工业出版社独家出版
314    @a马克西姆·拉潘,一位深度学习爱好者和独立研究者。林然,在2016年加入Thoughtworks之后,主要担任全栈软件开发工程师。王薇,北京邮电大学硕士。
330    @a本书介绍了强化学习的基础知识,以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAIGym库以及PyTorch库。接着分别介绍几种强化学习方法:交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法,并研究可以使用策略梯度方法解决的实际问题:使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法:黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGoZero、离散优化、多智能体强化学习。
410  0 @12001 @a智能系统与技术丛书
510 1  @aDeep reinforcement learning hands-on@zeng
606 0  @a机器学习@Aji qi xue xi@x算法
690    @aTP181@v5
701  0 @c(俄)@a拉潘@Ala pan@g(Lapan, Maxim)@4著
702  0 @a林然@Alin ran@4译
702  0 @a王薇@Awang wei@4译
801  0 @aCN@c20221025
905    @a河南城建学院图书馆@dTP181@eM088
    
    深度强化学习实践=Deep reinforcement learning hands-on/(俄) 马克西姆·拉潘(Maxim Lapan) 著/林然,王薇译.-北京:机械工业出版社,2021
    17, 617页:图;24cm.-(智能系统与技术丛书)
    
    
    ISBN 978-7-111-68738-2:CNY149.00
    本书介绍了强化学习的基础知识,以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAIGym库以及PyTorch库。接着分别介绍几种强化学习方法:交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法,并研究可以使用策略梯度方法解决的实际问题:使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法:黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGoZero、离散优化、多智能体强化学习。
●
相关链接 在E读中查询图书 在当当中查询图书 在豆瓣中查询图书


正题名:深度强化学习实践     索取号:TP181/M088         预约/预借

序号 登录号 条形码 馆藏地/架位号 状态 备注
1 1584976   215849768   自科库301/301自科库 39排4列2层/ [索取号:TP181/M088] 在馆    
河南城建学院图书馆 欢迎您!
大连网信软件有限公司© 版权所有