• 首页
  • 本馆介绍
  • 公告通知
  • 最新文献
  • 馆藏检索
  • 电子资源
  • 读者导购
  • 参考咨询
  • CALIS
  • 我的图书馆
  • 登录
  • 详细信息显示
  • 放入我的书架
  • 预约/预借图书
  • 作者相关作品
  • 分类相关作品
  • 丛书相关作品
  • 出版社相关作品

书目信息

  • 表格格式
  • 工作单格式
  • 卡片格式
题名:
深度剖析DeepSeek大模型
    
 
作者: 丁小晶 , 崔远 编著
分册:  
出版信息: 北京   机械工业出版社  2025.04
页数: XII, 312页
开本: 24cm
丛书名: AIGC与大模型技术丛书
单 册:
中图分类: TP18
科图分类:
主题词: 人工智能--ren gong zhi neng
电子资源:
ISBN: 978-7-111-77922-3
 
 
 
 
 
000 01962nam 2200289 450
001 92805
005 20250818141849.84
010    @a978-7-111-77922-3@dCNY119.00
100    @a20250327d2025 em y0chiy50 ea
101 0  @achi
102    @aCN@b110000
105    @aa z 000yy
106    @ar
200 1  @a深度剖析DeepSeek大模型@Ashen du pou xi DeepSeek da mo xing@e原理、开发与优化部署@f丁小晶, 崔远编著
210    @a北京@c机械工业出版社@d2025.04
215    @aXII, 312页@c图@d24cm
225 2  @aAIGC与大模型技术丛书@AAIGC yu da mo xing ji shu cong shu
300    @a机工IT
314    @a丁小晶, 资深大模型AI应用技术专家与管理者, 拥有超过15年的计算机及A1领域经验、5年团队管理经验的技术创新与项目管理复合型人才, 精通大模型技术及多语言编程, 致力于AI大模型的应用和创新。崔远, 毕业于兰州大学, 副教授, 主攻人工智能 (Al)、自然语言处理 (NLP) 和深度学习等计算机前沿技术, 并致力于教学研究, 承担多门专业核心课程的教学工作。曾获公派赴佐治亚理工学院 (GT) 和不列颠哥伦比亚大学 (UBC) 深造。主持市厅级课题3项, 发表专业论文8篇及专著1部。多次荣获校级“优秀教师”称号及“教学优秀奖”, 在学术和教育领域均取得显著成就。
330    @a本书共分为12章, 首先介绍大模型的基础知识与发展历程, 从神经网络的起源到大规模预训练模型的演化, 再到Transformer、BERT与GPT等模型架构的深入剖析, 帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术, 包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践, 介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术, 并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用, 如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。
410  0 @12001 @aAIGC与大模型技术丛书
606 0  @a人工智能@Aren gong zhi neng
690    @aTP18@v5
701  0 @a丁小晶@Ading xiao jing@4编著
701  0 @a崔远@Acui yuan@4编著
801  0 @aCN@c20250909
905    @a河南城建学院图书馆@dTP18@eD580-2@f1
    
    深度剖析DeepSeek大模型:原理、开发与优化部署/丁小晶, 崔远编著.-北京:机械工业出版社,2025.04
    XII, 312页:图;24cm.-(AIGC与大模型技术丛书)
    机工IT
    
    ISBN 978-7-111-77922-3:CNY119.00
    本书共分为12章, 首先介绍大模型的基础知识与发展历程, 从神经网络的起源到大规模预训练模型的演化, 再到Transformer、BERT与GPT等模型架构的深入剖析, 帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术, 包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践, 介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术, 并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用, 如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。
●
相关链接 在E读中查询图书 在当当中查询图书 在豆瓣中查询图书


正题名:深度剖析DeepSeek大模型     索取号:TP18/D580-2         预约/预借

序号 登录号 条形码 馆藏地/架位号 状态 备注
1 1626769   216267698   自科库301/ [索取号:TP18/D580-2] 在馆    
河南城建学院图书馆 欢迎您!
大连网信软件有限公司© 版权所有