书目信息 |
题名: |
Apache Spark大数据分析
|
|
作者: | 伊利杰森 著 ;袁国忠 译 | |
分册: | ||
出版信息: | 北京 人民邮电出版社 2023.06 |
|
页数: | 236页 | |
开本: | 23cm | |
丛书名: | ||
单 册: | ||
中图分类: | TP274 | |
科图分类: | ||
主题词: | 数据处理软件--shu ju chu li ruan jian--机器学习 | |
电子资源: | ||
ISBN: | 978-7-115-61456-8 |
000 | 01623nam0 2200265 450 | |
001 | 490292 | |
010 | @a978-7-115-61456-8@dCNY79.80 | |
100 | @a20220906d2023 em y0chiy50 ea | |
101 | 1 | @achi@cswe |
102 | @aCN@b110000 | |
105 | @aa z 000yy | |
106 | @ar | |
200 | 1 | @aApache Spark大数据分析@AApache Sparkda shu ju fen xi@e基于Azure Databricks云平台@f(瑞典) 罗伯特·伊利杰森著@d= Beginning Apache Spark using Azure Databricks:@eunleashing large cluster analytics in the cloud@fRobert Ilijason@g袁国忠译@zeng |
210 | @a北京@c人民邮电出版社@d2023.06 | |
215 | @a236页@c图@d23cm | |
306 | @a由Apress Media, LLC授权出版 | |
330 | @aAzureDatabricks是一款基于云的大数据分析和机器学习平台, 用于实现基于ApacheSpark的数据处理, 为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。本书首先介绍了大规模数据分析相关的概念, 然后介绍了受管的Spark及其与Databricks的关系, 以及Databricks的版本差异和使用方法 (涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容)。此外, 书中还介绍了使用SQL和Python分别实现数据分析的过程, 数据提取、变换、加载、存储、优化技巧等高阶数据处理方法, 以及外部连接工具、生产环境集成等内容, 最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。 | |
510 | 1 | @aBeginning Apache Spark using Azure Databricks@eunleashing large cluster analytics in the cloud@zeng |
606 | 0 | @a数据处理软件@Ashu ju chu li ruan jian@x机器学习 |
610 | 0 | @aSpark |
690 | @aTP274@v5 | |
701 | 1 | @a伊利杰森@Ayi li jie sen@g(Ilijason, Robert)@4著 |
702 | 0 | @a袁国忠@Ayuan guo zhong@4译 |
801 | 0 | @aCN@c20220906 |
905 | @a河南城建学院图书馆@dTP274@eY489 | |
Apache Spark大数据分析:基于Azure Databricks云平台/(瑞典) 罗伯特·伊利杰森著= Beginning Apache Spark using Azure Databricks::unleashing large cluster analytics in the cloud/Robert Ilijason/袁国忠译.-北京:人民邮电出版社,2023.06 |
236页:图;23cm |
ISBN 978-7-115-61456-8:CNY79.80 |
AzureDatabricks是一款基于云的大数据分析和机器学习平台, 用于实现基于ApacheSpark的数据处理, 为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。本书首先介绍了大规模数据分析相关的概念, 然后介绍了受管的Spark及其与Databricks的关系, 以及Databricks的版本差异和使用方法 (涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容)。此外, 书中还介绍了使用SQL和Python分别实现数据分析的过程, 数据提取、变换、加载、存储、优化技巧等高阶数据处理方法, 以及外部连接工具、生产环境集成等内容, 最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。 |
● |
相关链接 |
![]() |
![]() |
![]() |
正题名:Apache Spark大数据分析
索取号:TP274/Y489
 
预约/预借
序号 | 登录号 | 条形码 | 馆藏地/架位号 | 状态 | 备注 |
1 | 1603094 | 216030943 | 自科库301/301自科库 99排6列2层/ [索取号:TP274/Y489] | 在馆 |