随着互联网技术的发展,在新经济的大时代背景下,各行各业都催生出众多的全新业态。伴随大数据、人工智能、区块链等技术的加持,这些业态划分也越来越精细,社会活动的整体效率也越来越高。然而,这一切都不开数据,特别是高质量的数据。本书围绕智能数据分析与应用处理业务背景及相关技术,以学习情境的方式介绍了:数据分析工具Beautiful Soup与XPath和数据采集工具Requests;根据数据规模大小和格式,可采用Excel、Tabula或Kettle进行数据处理;数据分析工具NumPy、Pandas和可视化工具Matplotlib,通过Matplotlib进行数据可视化,使得NumPy、Pandas的处理结果更容易观察、识别。通过基于机器学习算法模型的推荐系统的构建过程,介绍了主流的数据分析框架Spark;通过基于深度学习技术的人脸识别系统的构建过程,介绍了图像数据的采集、处理、分析,并应用到神经网络的整个过程,即从数据采集到应用的一个闭环过程。本书理论分析相对较少,侧重于动手实践,适用于应用型本科、高职高专大数据专业学生和希望快速进入大数据、机器学习、人工智能领域的读者。