书目信息 |
题名: |
大语言模型原理、训练及应用
|
|
作者: | 魏新宇 , 白雪冰 , 周博洋 编著 | |
分册: | ||
出版信息: | 北京 机械工业出版社 2024.09 |
|
页数: | 272页, [4] 页图版 | |
开本: | 26cm | |
丛书名: | AIGC与大模型技术丛书 | |
单 册: | ||
中图分类: | TP391 | |
科图分类: | ||
主题词: | 自然语言处理--zi ran yu yan chu li | |
电子资源: | ||
ISBN: | 978-7-111-76235-5 |
000 | 02133nam 2200301 450 | |
001 | 91207 | |
005 | 20250816174840.25 | |
010 | @a978-7-111-76235-5@dCNY99.00 | |
100 | @a20240926d2024 em y0chiy50 ea | |
101 | 0 | @achi |
102 | @aCN@b110000 | |
105 | @aafk z 000yy | |
106 | @ar | |
200 | 1 | @a大语言模型原理、训练及应用@Ada yu yan mo xing yuan li 、 xun lian ji ying yong@e基于GPT@f魏新宇, 白雪冰, 周博洋编著 |
210 | @a北京@c机械工业出版社@d2024.09 | |
215 | @a272页, [4] 页图版@c图 (部分彩图)@d26cm | |
225 | 2 | @aAIGC与大模型技术丛书@AAIGC yu da mo xing ji shu cong shu |
300 | @a机工IT | |
314 | @a魏新宇, 微软全球黑带AI技术专家。曾任英伟达资深解决方案架构师、红帽首席解决方案架构师 (RHCA Level5)。畅销书作者, 著有《OpenShift在企业中的实战: PaaS DevOps微服务》《云原生应用构建: 基于OpenShift》《金融级I架构与运维》等书。白雪冰, 微软 (中国) 有限公司高级架构师。曾任IBM中国软件开发中心 (CSDL) 架构师。目前主要从事基于语音识别、计算机视觉、自然语言处理、智能搜索以及OpenAl和其他大语言模型等技术, 构建企业级解决方案的工作。周博洋, 微软 (中国) 有限公司高级架构师。曾任Juniper、Cisco系统架构师 ; 主要研究生成式AI算法及训练和推理方法的优化。负责Azure OpenAl业务的推广, 同时负责Azure Machine Learning和GPU业务在国内的解决方案整合工作, 拥有扎实的全栈技术能力, 对Al Infrastructure和A|算法优化有独到的见解。 | |
330 | @a本书是一本系统介绍大语言模型原理、训练及应用的书, 共7章, 主要内容包括: 认识大语言模型、大语言模型训练、GPU池化 —— 构建大语言模型算力基础、GPT的优化与编排、GPT的行业应用与开发、Copilot的应用与开发、语言模型小型化及在边缘端的部署。本书详尽阐述了大语言模型的起源、定义及其与传统深度学习方法间的关键差异, 深入探讨了主流训练框架如何为大语言模型提供动力, 并介绍了优化策略以及高效建立算力基础设施所要考虑的因素。内容涵盖从基础概念介绍到复杂系统编排, 再到具体行业应用与开发等多个层面。 | |
410 | 0 | @12001 @aAIGC与大模型技术丛书 |
606 | 0 | @a自然语言处理@Azi ran yu yan chu li |
690 | @aTP391@v5 | |
701 | 0 | @a魏新宇@Awei xin yu@4编著 |
701 | 0 | @a白雪冰@Abai xue bing@4编著 |
701 | 0 | @a周博洋@Azhou bo yang@4编著 |
801 | 0 | @aCN@c20250909 |
905 | @a河南城建学院图书馆@dTP391@eW600@f1 | |
大语言模型原理、训练及应用:基于GPT/魏新宇, 白雪冰, 周博洋编著.-北京:机械工业出版社,2024.09 |
272页, [4] 页图版:图 (部分彩图);26cm.-(AIGC与大模型技术丛书) |
机工IT |
ISBN 978-7-111-76235-5:CNY99.00 |
本书是一本系统介绍大语言模型原理、训练及应用的书, 共7章, 主要内容包括: 认识大语言模型、大语言模型训练、GPU池化 —— 构建大语言模型算力基础、GPT的优化与编排、GPT的行业应用与开发、Copilot的应用与开发、语言模型小型化及在边缘端的部署。本书详尽阐述了大语言模型的起源、定义及其与传统深度学习方法间的关键差异, 深入探讨了主流训练框架如何为大语言模型提供动力, 并介绍了优化策略以及高效建立算力基础设施所要考虑的因素。内容涵盖从基础概念介绍到复杂系统编排, 再到具体行业应用与开发等多个层面。 |
● |
相关链接 |
![]() |
![]() |
![]() |
正题名:大语言模型原理、训练及应用
索取号:TP391/W600
 
预约/预借
序号 | 登录号 | 条形码 | 馆藏地/架位号 | 状态 | 备注 |
1 | 1625169 | 216251696 | 自科库301/ [索取号:TP391/W600] | 在馆 |