妙思文献管理集成系统WWW检索

书目信息

表格格式
工作单格式
卡片格式

题名：	深入大型数据集
作者：	沃勒翰著；张若飞译
分册：
出版信息：	北京电子工业出版社 2021.02
页数：	XX, 300页
开本：	24cm
丛书名：
单册：
中图分类：	TP311.561
科图分类：
主题词：	软件工具--ruan jian gong ju--程序设计
电子资源：
ISBN：	978-7-121-40368-2

000	01555nam0 2200277 450
001	2260454564
010		@a978-7-121-40368-2@dCNY99.00
100		@a20210318d2021 em y0chiy50 ea
101	1	@achi@ceng
102		@aCN@b110000
105		@aa z 000yy
106		@ar
200	1	@a深入大型数据集@Ashen ru da xing shu ju ji@e并行与分布化Python代码@d= Mastering large datasets with Python@eparallelize and distribute your Python code@f(美) John T. Wolohan著@g张若飞译@zeng
210		@a北京@c电子工业出版社@d2021.02
215		@aXX, 300页@c图@d24cm
300		@a博文视点
314		@a责任者规范汉译姓: 沃勒翰
330		@a本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。
500	10	@aMastering large datasets with Python : parallelize and distribute your Python code@mChinese
517	1	@a并行与分布化Python代码@Abing xing yu fen bu hua Python dai ma
606	0	@a软件工具@Aruan jian gong ju@x程序设计
690		@aTP311.561@v5
701	1	@a沃勒翰@Awo le han@g(Wolohan, John T.)@4著
702	0	@a张若飞@Azhang ruo fei@4译
801	0	@aCN@c20220906
905		@a河南城建学院图书馆@dTP311.561@eW7051

深入大型数据集：并行与分布化Python代码= Mastering large datasets with Python：parallelize and distribute your Python code/(美) John T. Wolohan著/张若飞译.-北京：电子工业出版社，2021.02

XX, 300页：图；24cm

博文视点

ISBN 978-7-121-40368-2：CNY99.00

本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。

●

序号	登录号	条形码	馆藏地/架位号	状态	备注
1	1573203	215732036	自科库301/301自科库 51排4列5层/ [索取号:TP311.561/W7051]	在馆