书目信息 |
| 题名: |
深入大型数据集
|
|
| 作者: | 沃勒翰 著 ;张若飞 译 | |
| 分册: | ||
| 出版信息: | 北京 电子工业出版社 2021.02 |
|
| 页数: | XX, 300页 | |
| 开本: | 24cm | |
| 丛书名: | ||
| 单 册: | ||
| 中图分类: | TP311.561 | |
| 科图分类: | ||
| 主题词: | 软件工具--ruan jian gong ju--程序设计 | |
| 电子资源: | ||
| ISBN: | 978-7-121-40368-2 | |
| 000 | 01555nam0 2200277 450 | |
| 001 | 2260454564 | |
| 010 | @a978-7-121-40368-2@dCNY99.00 | |
| 100 | @a20210318d2021 em y0chiy50 ea | |
| 101 | 1 | @achi@ceng |
| 102 | @aCN@b110000 | |
| 105 | @aa z 000yy | |
| 106 | @ar | |
| 200 | 1 | @a深入大型数据集@Ashen ru da xing shu ju ji@e并行与分布化Python代码@d= Mastering large datasets with Python@eparallelize and distribute your Python code@f(美) John T. Wolohan著@g张若飞译@zeng |
| 210 | @a北京@c电子工业出版社@d2021.02 | |
| 215 | @aXX, 300页@c图@d24cm | |
| 300 | @a博文视点 | |
| 314 | @a责任者规范汉译姓: 沃勒翰 | |
| 330 | @a本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。 | |
| 500 | 10 | @aMastering large datasets with Python : parallelize and distribute your Python code@mChinese |
| 517 | 1 | @a并行与分布化Python代码@Abing xing yu fen bu hua Python dai ma |
| 606 | 0 | @a软件工具@Aruan jian gong ju@x程序设计 |
| 690 | @aTP311.561@v5 | |
| 701 | 1 | @a沃勒翰@Awo le han@g(Wolohan, John T.)@4著 |
| 702 | 0 | @a张若飞@Azhang ruo fei@4译 |
| 801 | 0 | @aCN@c20220906 |
| 905 | @a河南城建学院图书馆@dTP311.561@eW7051 | |
| 深入大型数据集:并行与分布化Python代码= Mastering large datasets with Python:parallelize and distribute your Python code/(美) John T. Wolohan著/张若飞译.-北京:电子工业出版社,2021.02 |
| XX, 300页:图;24cm |
| 博文视点 |
| ISBN 978-7-121-40368-2:CNY99.00 |
| 本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。 |
| ● |
| 相关链接 |
|
|
|
正题名:深入大型数据集
索取号:TP311.561/W7051
 
预约/预借
| 序号 | 登录号 | 条形码 | 馆藏地/架位号 | 状态 | 备注 |
| 1 | 1573203 | 215732036 | 自科库301/301自科库 51排4列5层/ [索取号:TP311.561/W7051] | 在馆 |