Front cover image for Spark快速大数据分析 : (第2版) = Learnig Spark : second edition

Spark快速大数据分析 : (第2版) = Learnig Spark : second edition

毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。 本书作者均来自Spark的母公司Databricks。他们将带你开始使用Spark,并了解如何利用它适应这个属于大数据和机器学习的新时代。第2版在第1版的基础上做了大量更新,涵盖Spark 3.0的新特性,并着重展示如何利用机器学习算法执行大数据分析。 学习使用Python、Java、Scala的结构化数据API 理解Spark SQL引擎的原理 掌握Spark应用的优化技巧 了解如何读写数据源:JSON、Parquet、CSV、Avro、ORC等 使用Structured Streaming分析批式数据和流式数据 使用Spark和Delta Lake构建湖仓一体的系统 使用MLlib开发机器学习流水线

eBook, Chinese, 2021
O'Reilly Media ; 人民邮电出版社, Beijing, Boston, 2021