Spark快速大数据分析

- 名称:Spark快速大数据分析
作者: [美]Holden Karau Andy Konwinski Patrick Wendell [加] Matei Zaharia
译者: 王道远
出版社:人民邮电出版社
出版年:2015.9
页数:232
ISBN:9787115403094
作品简介:
本书由Spark开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。
本书适合大数据时代所有需要进行数据分析的人员阅读。
作者简介:
Holden Karau是Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速数据处理》。
Andy Konwinski是Databricks联合创始人,Apache Spark项目技术专家,还是Apache Mesos项目的联合发起人。
Patrick Wendell是Databricks联合创始人,也是Apache Spark项目技术专家。他还负责维护Spark核心引擎的几个子系统。
Matei Zaharia是Databricks的CTO,同时也是Apache Spark项目发起人以及Apache基金会副主席。
王道远
英特尔亚太研发有限公司软件工程师,GitHub ID:adrian-wang。自Spark 1.0起致力于Spark项目的开发与测试工作,为Spark社区贡献了许多重要特性和改进。