书目信息 |
题名: |
大模型算法
|
|
作者: | 余昌叶 著 | |
分册: | ||
出版信息: | 北京 电子工业出版社 2025.04 |
|
页数: | 230页 | |
开本: | 24cm | |
丛书名: | 通用智能与大模型丛书 | |
单 册: | ||
中图分类: | TP391 | |
科图分类: | ||
主题词: | 计算机应用--ji suan ji ying yong--信息处理 | |
电子资源: | ||
ISBN: | 978-7-121-50072-5 |
000 | 01838nam 2200301 450 | |
001 | 90555 | |
005 | 20250815203619.38 | |
010 | @a978-7-121-50072-5@dCNY109.00 | |
099 | @aCAL 012025049840 | |
100 | @a20250520d2025 ekmy0chiy50 ea | |
101 | 0 | @achi |
102 | @aCN@b110000 | |
105 | @aa z 000yy | |
106 | @ar | |
200 | 1 | @a大模型算法@Ada mo xing suan fa@e强化学习、微调与对齐@dLarge model algorithms@ereinforcement learning, fine-tuning, and alignment@f余昌叶著 |
210 | @a北京@c电子工业出版社@d2025.04 | |
215 | @a230页@c图@d24cm | |
225 | 2 | @a通用智能与大模型丛书@Atong yong zhi neng yu da mo xing cong shu |
314 | @a余昌叶, 资深算法工程师, 哈尔滨工业大学优秀毕业生。曾就职于腾讯等多家一线互联网企业, 拥有十年行业经验。主要研究方向为大模型、强化学习、推荐系统及图像处理。具备扎实的数学功底与深厚的算法理论基础, 主导并完成多项核心技术项目的工程化落地。已获六项国家发明专利, 曾荣获科研类全国航空航天模型锦标赛亚军等专业奖项, 以及腾讯卓越研发奖 (团队)、腾讯知识奖等多项企业级荣誉。 | |
330 | @a本书系统地讲解了大模型技术及其后训练 (Post-Training) 相关的各类算法、实践。全书以大语言模型 (LLM) 为核心, 内容广泛且深入, 绝大部分同样适用于视觉语言模型 (VLM) 和多模态语言模型 (MLLM) 。本书共10章, 第1章介绍SFT, 第2章介绍对齐算法宏观架构, 第3章介绍强化学习核心算法, 第4章介绍PPO算法, 第5章介绍RLHF, 第6章介绍DPO算法, 第7章介绍免训练的对齐和优化方法, 第8章介绍对齐算法的衍生和进化, 第9章和第10章是两个案例实践。 | |
410 | 0 | @12001 @a通用智能与大模型丛书 |
510 | 1 | @aLarge model algorithms@ereinforcement learning, fine-tuning, and alignment@zeng |
517 | 1 | @a强化学习、微调与对齐@Aqiang hua xue xi 、 wei tiao yu dui qi |
606 | 0 | @a计算机应用@Aji suan ji ying yong@x信息处理 |
690 | @aTP391@v5 | |
701 | 0 | @a余昌叶@Ayu chang ye@4著 |
801 | 0 | @aCN@c20250909 |
905 | @a河南城建学院图书馆@dTP391@eY745@f1 | |
大模型算法:强化学习、微调与对齐=Large model algorithms:reinforcement learning, fine-tuning, and alignment/余昌叶著.-北京:电子工业出版社,2025.04 |
230页:图;24cm.-(通用智能与大模型丛书) |
ISBN 978-7-121-50072-5:CNY109.00 |
本书系统地讲解了大模型技术及其后训练 (Post-Training) 相关的各类算法、实践。全书以大语言模型 (LLM) 为核心, 内容广泛且深入, 绝大部分同样适用于视觉语言模型 (VLM) 和多模态语言模型 (MLLM) 。本书共10章, 第1章介绍SFT, 第2章介绍对齐算法宏观架构, 第3章介绍强化学习核心算法, 第4章介绍PPO算法, 第5章介绍RLHF, 第6章介绍DPO算法, 第7章介绍免训练的对齐和优化方法, 第8章介绍对齐算法的衍生和进化, 第9章和第10章是两个案例实践。 |
● |
相关链接 |
![]() |
![]() |
![]() |
正题名:大模型算法
索取号:TP391/Y745
 
预约/预借
序号 | 登录号 | 条形码 | 馆藏地/架位号 | 状态 | 备注 |
1 | 1624517 | 216245178 | 自科库301/ [索取号:TP391/Y745] | 在馆 |