本书在不涉及大量数学模型与复杂编程知识的前提下,从零开始逐步带领读者熟悉并掌握当下流行的基于Python 3的数据分析,以及支持单机、深度和分布式机器学习的开源程序库,如pandas、Scikitlearn、PyTorch、TensorFlow、PaddlePaddle、PySparkML等。全书分4部分。入门篇包括对全书核心概念的指南性介绍,以及在多种主流操作系统(Windows、macOS、Ubuntu)上配置基本编程环境的详细说明。基础篇涵盖Python 3的编程基础、基于pandas的数据分析,以及使用Scikitlearn解决大量经典的单机(单核/多核)机器学习问题。进阶篇介绍如何使用PyTorch、TensorFlow、PaddlePaddle搭建多种深度学习网络框架,以及如何基于PySpark的ML编程库完成一些常见的分布式机器学习任务。实践篇利用全书所讲授的Python编程、数据分析、机器学习知识,帮助读者挑战和参与Kaggle多种类型的竞赛实战,同时介绍如何使用Git在Gitee、GitHub平台上维护和管理日常代码与编程项目。 本书适合所有对人工智能领域,特别是机器学习、数据挖掘、自然语言处理等技术及其实践感兴趣的初学者。