本书首先介绍数据科学,然后指导读者安装和搭建数据分析编程环境所需的软件包。在机器 学习中,主要学习3项技术:监督学习、无监督学习和强化学习。我们也会用到基本的分类与回 归技术,如支持向量机、决策树以及逻辑回归等。 在前面章节的学习中,读者将学习到Python语言中用于处理大型数据集的基本函数、数据 结构,用于矩阵计算的NumPy包和Pandas包,如何使用Matplotlib绘制自定义图表,以及应用 Boosting算法XGBoost(梯度提升)进行预测分析等。 在后面的章节中,将会学习用于图像识别的卷积神经网络(CNN)、深度学习算法。读者将掌 握如何向神经网络馈入人类语言、让模型处理复杂的文本信息以及构建人类语言处理系统进行结 果预测等。 学习完本书,读者可以掌握和使用很多新的数据科学算法,并且有信心使用本课程以外的工 具或库进行操作。