书目信息 |
题名: |
智能控制与强化学习
|
|
作者: | 王鼎 , 赵明明 , 哈明鸣 著 | |
分册: | ||
出版信息: | 北京 人民邮电出版社 2024.03 |
|
页数: | 236页 | |
开本: | 23cm | |
丛书名: | ||
单 册: | ||
中图分类: | TP273 , TP181 | |
科图分类: | ||
主题词: | 智能控制--zhi neng kong zhi , 机器学习--ji qi xue xi | |
电子资源: | ||
ISBN: | 978-7-115-63395-8 |
000 | 01663nam0 2200325 450 | |
001 | 2433387018 | |
010 | @a978-7-115-63395-8@dCNY139.80 | |
100 | @a20240327d2024 em y0chiy0120 ea | |
101 | 0 | @achi |
102 | @aCN@b110000 | |
105 | @aak a 000yy | |
106 | @ar | |
200 | 1 | @a智能控制与强化学习@Azhi neng kong zhi yu qiang hua xue xi@e先进值迭代评判设计@d= Intelligent control and reinforcement learning@eadvanced value iteration critic design@f王鼎 ... [等] 著@zeng |
210 | @a北京@c人民邮电出版社@d2024.03 | |
215 | @a236页@c图@d23cm | |
304 | @a题名页题: 王鼎, 赵明明, 哈明鸣, 任进著 | |
320 | @a有书目 | |
330 | @a本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题, 以实现稳定学习、演化学习和快速学习为目标, 建立一套先进的值迭代评判学习控制理论与设计方法。首先, 对先进值迭代框架下迭代策略的稳定性进行全面深入的分析, 建立一系列适用于不同场景的稳定性判据, 从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次, 基于迭代历史信息, 提出一种新颖的收敛速度可调节的值迭代算法, 有助于加快学习速度、减少计算代价, 更高效地获得非线性系统的最优控制律。结合人工智能技术, 对无模型值迭代评判学习控制的发展前景也进行了讨论。 | |
510 | 1 | @aIntelligent control and reinforcement learning@eadvanced value iteration critic design@zeng |
517 | 1 | @a先进值迭代评判设计@Axian jin zhi die dai ping pan she ji |
586 | @a | |
606 | 0 | @a智能控制@Azhi neng kong zhi |
606 | 0 | @a机器学习@Aji qi xue xi |
690 | @aTP273@v5 | |
690 | @aTP181@v5 | |
701 | 0 | @a王鼎@Awang ding@4著 |
701 | 0 | @a赵明明@Azhao ming ming@4著 |
701 | 0 | @a哈明鸣@Aha ming ming@4著 |
801 | 0 | @aCN@c20240327 |
905 | @dTP273@eW152@f1@sTP273/W152@S@Z | |
智能控制与强化学习:先进值迭代评判设计= Intelligent control and reinforcement learning:advanced value iteration critic design/王鼎 ... [等] 著.-北京:人民邮电出版社,2024.03 |
236页:图;23cm |
ISBN 978-7-115-63395-8:CNY139.80 |
本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题, 以实现稳定学习、演化学习和快速学习为目标, 建立一套先进的值迭代评判学习控制理论与设计方法。首先, 对先进值迭代框架下迭代策略的稳定性进行全面深入的分析, 建立一系列适用于不同场景的稳定性判据, 从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次, 基于迭代历史信息, 提出一种新颖的收敛速度可调节的值迭代算法, 有助于加快学习速度、减少计算代价, 更高效地获得非线性系统的最优控制律。结合人工智能技术, 对无模型值迭代评判学习控制的发展前景也进行了讨论。 |
● |
相关链接 |
正题名:智能控制与强化学习
索取号:TP273/W152
 
预约/预借
序号 | 登录号 | 条形码 | 馆藏地/架位号 | 状态 | 备注 |
1 | 21610536 | 216105364 | 自科库301/301自科库 38排3列5层/ [索取号:TP273/W152] | 在馆 |