本书系统介绍了Spark大数据处理框架以及相应的主流开发语言Scala。全书共14章,内容包括Scala基本概念和基本用法,Scala字符串和数组,Scala控制结构,Scala列表、元组、集合和映射,Scala函数,Scala面向对象编程,Spark大数据处理框架、Spark RDD编程,Windows环境下的Spark综合编程,用Spark SQL处理结构化数据,Spark Streaming流处理,Spark Structured Streaming流处理,Spark GraphX图计算,Spark ML机器学习。本书可作为高等院校计算机科学与技术、信息管理、软件工程、数据科学与大数据、人工智能等相关专业的大数据课程教材,也可供企业中从事大数据开发的工程师和科技工作者参考。