妙思文献管理集成系统WWW检索

书目信息

表格格式
工作单格式
卡片格式

题名：	智能控制与强化学习
作者：	王鼎，赵明明，哈明鸣著
分册：
出版信息：	北京人民邮电出版社 2024.03
页数：	236页
开本：	23cm
丛书名：
单册：
中图分类：	TP273 ， TP181
科图分类：
主题词：	智能控制--zhi neng kong zhi , 机器学习--ji qi xue xi
电子资源：
ISBN：	978-7-115-63395-8

000	01663nam0 2200325 450
001	2433387018
010		@a978-7-115-63395-8@dCNY139.80
100		@a20240327d2024 em y0chiy0120 ea
101	0	@achi
102		@aCN@b110000
105		@aak a 000yy
106		@ar
200	1	@a智能控制与强化学习@Azhi neng kong zhi yu qiang hua xue xi@e先进值迭代评判设计@d= Intelligent control and reinforcement learning@eadvanced value iteration critic design@f王鼎 ... [等] 著@zeng
210		@a北京@c人民邮电出版社@d2024.03
215		@a236页@c图@d23cm
304		@a题名页题: 王鼎, 赵明明, 哈明鸣, 任进著
320		@a有书目
330		@a本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题, 以实现稳定学习、演化学习和快速学习为目标, 建立一套先进的值迭代评判学习控制理论与设计方法。首先, 对先进值迭代框架下迭代策略的稳定性进行全面深入的分析, 建立一系列适用于不同场景的稳定性判据, 从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次, 基于迭代历史信息, 提出一种新颖的收敛速度可调节的值迭代算法, 有助于加快学习速度、减少计算代价, 更高效地获得非线性系统的最优控制律。结合人工智能技术, 对无模型值迭代评判学习控制的发展前景也进行了讨论。
510	1	@aIntelligent control and reinforcement learning@eadvanced value iteration critic design@zeng
517	1	@a先进值迭代评判设计@Axian jin zhi die dai ping pan she ji
586		@a
606	0	@a智能控制@Azhi neng kong zhi
606	0	@a机器学习@Aji qi xue xi
690		@aTP273@v5
690		@aTP181@v5
701	0	@a王鼎@Awang ding@4著
701	0	@a赵明明@Azhao ming ming@4著
701	0	@a哈明鸣@Aha ming ming@4著
801	0	@aCN@c20240327
905		@dTP273@eW152@f1@sTP273/W152@S@Z

智能控制与强化学习：先进值迭代评判设计= Intelligent control and reinforcement learning：advanced value iteration critic design/王鼎 ... [等] 著.-北京：人民邮电出版社，2024.03

236页：图；23cm

ISBN 978-7-115-63395-8：CNY139.80

本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题, 以实现稳定学习、演化学习和快速学习为目标, 建立一套先进的值迭代评判学习控制理论与设计方法。首先, 对先进值迭代框架下迭代策略的稳定性进行全面深入的分析, 建立一系列适用于不同场景的稳定性判据, 从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次, 基于迭代历史信息, 提出一种新颖的收敛速度可调节的值迭代算法, 有助于加快学习速度、减少计算代价, 更高效地获得非线性系统的最优控制律。结合人工智能技术, 对无模型值迭代评判学习控制的发展前景也进行了讨论。

●

序号	登录号	条形码	馆藏地/架位号	状态	备注
1	21610536	216105364	自科库301/301自科库 71排2列1层/ [索取号:TP273/W152]	在馆