书目信息 |
题名: |
强化学习
|
|
作者: | 龚超 著 | |
分册: | ||
出版信息: | 北京 化学工业出版社 2024.08 |
|
页数: | 234页 | |
开本: | 21cm | |
丛书名: | 人工智能超入门丛书 | |
单 册: | ||
中图分类: | TP18-49 | |
科图分类: | ||
主题词: | 人工智能--ren gong zhi neng--普及读物 | |
电子资源: | ||
ISBN: | 978-7-122-45282-5 |
000 | 01619nam 2200313 450 | |
001 | 94124 | |
005 | 20250820074617.99 | |
010 | @a978-7-122-45282-5@dCNY69.80 | |
099 | @aCAL 012024078618 | |
100 | @a20240726d2024 em y0chiy50 ea | |
101 | 0 | @achi |
102 | @aCN@b110000 | |
105 | @aak z 000yy | |
106 | @ar | |
200 | 1 | @a强化学习@Aqiang hua xue xi@d= Introduction to reinforcement learning@e人工智能如何知错能改@f龚超 ... [等] 著@zeng |
210 | @a北京@c化学工业出版社@d2024.08 | |
215 | @a234页@c图@d21cm | |
225 | 2 | @a人工智能超入门丛书@Aren gong zhi neng chao ru men cong shu |
304 | @a题名页题其余责任者: 王冀, 梁霄, 贵宁 | |
314 | @a龚超, 工学博士, 清华大学日本研究中心主任助理, 中日创新中心主任研究员, 深圳清华大学研究院下一代互联网研发中心核心成员, 海口经济学院雅和人居工程学院客座教授。 | |
330 | @a本书包含强化学习方向的基础知识, 如动态规划、时序差分等, 让读者在开始学习时对强化学习有初步的认识 ; 之后, 通过对马尔可夫决策过程及贝尔曼方程的解读, 逐渐过渡到强化学习的关键内容 ; 同时, 本书也重点解析了策略迭代与价值迭代两种核心算法, 也对蒙特卡洛方法、时序差分算法、深度强化学习及基于策略的强化学习算法进行了深度剖析。本书内容结构完整、逻辑清晰、层层递进, 并配有相关实例与代码, 让读者在阅读学习过程中能够加深理解。 | |
410 | 0 | @12001 @a人工智能超入门丛书 |
510 | 1 | @aIntroduction to reinforcement learning@zeng |
517 | 1 | @a人工智能如何知错能改@Aren gong zhi neng ru he zhi cuo neng gai |
606 | 0 | @a人工智能@Aren gong zhi neng@j普及读物 |
690 | @aTP18-49@v5 | |
701 | 0 | @a龚超@Agong chao@4著 |
801 | 0 | @aCN@c20250909 |
905 | @a河南城建学院图书馆@dTP18-49@eG382-2@f1 | |
强化学习= Introduction to reinforcement learning:人工智能如何知错能改/龚超 ... [等] 著.-北京:化学工业出版社,2024.08 |
234页:图;21cm.-(人工智能超入门丛书) |
ISBN 978-7-122-45282-5:CNY69.80 |
本书包含强化学习方向的基础知识, 如动态规划、时序差分等, 让读者在开始学习时对强化学习有初步的认识 ; 之后, 通过对马尔可夫决策过程及贝尔曼方程的解读, 逐渐过渡到强化学习的关键内容 ; 同时, 本书也重点解析了策略迭代与价值迭代两种核心算法, 也对蒙特卡洛方法、时序差分算法、深度强化学习及基于策略的强化学习算法进行了深度剖析。本书内容结构完整、逻辑清晰、层层递进, 并配有相关实例与代码, 让读者在阅读学习过程中能够加深理解。 |
● |
相关链接 |
![]() |
![]() |
![]() |
正题名:强化学习
索取号:TP18-49/G382-2
 
预约/预借
序号 | 登录号 | 条形码 | 馆藏地/架位号 | 状态 | 备注 |
1 | 1628050 | 216280502 | 自科库301/ [索取号:TP18-49/G382-2] | 在馆 |