目录
第 一篇 数据收集与清洗
第 1章 NumPy\t2
1.1 介绍和安装开发环境\t2
1.1.1 Python开发环境介绍\t2
1.1.2 安装Anaconda3\t3
1.1.3 Jupyter编辑平台\t5
1.2 安装NumPy\t6
1.3 NumPy数组\t7
1.3.1 NumPy ndarray对象\t7
1.3.2 创建NumPy数组的常用函数\t8
1.4 数组的索引与切片\t11
1.4.1 数组的索引\t11
1.4.2 数组的切片\t15
1.5 基本数学运算\t17
1.5.1 数组与标量的运算\t17
1.5.2 数组与数组的运算\t18
1.6 NumPy通用函数\t18
1.6.1 mean()函数\t18
1.6.2 average()函数\t19
1.6.3 sum()函数\t20
1.6.4 min()函数\t20
1.6.5 max()函数\t20
1.6.6 argmax()函数\t21
1.6.7 maximum()/minimum()函数\t21
1.6.8 median()函数\t22
1.6.9 var()函数\t23
1.6.10 std()函数\t23
1.6.11 sort()函数\t24
1.6.12 loadtxt()函数\t24
1.7 NumPy字符串处理\t26
1.7.1 add()函数\t26
1.7.2 multiply()函数\t26
1.7.3 center()函数\t27
1.7.4 capitalize()函数和title()函数\t27
1.7.5 lower()函数和upper()函数\t27
1.7.6 split()函数\t27
1.7.7 splitlines()函数\t27
1.7.8 strip()函数\t28
1.7.9 lstrip()函数和rstrip()函数\t28
1.7.10 join()函数\t28
1.7.11 replace()函数\t28
1.8 项目实训——苹果公司股票数据分析\t29
1.8.1 项目需求\t29
1.8.2 项目实施\t29
1.8.3 项目分析\t31
本章小结\t31
习题\t31
第 2章 pandas\t34
2.1 安装pandas\t34
2.2 Series对象的基本操作\t35
2.2.1 创建Series对象\t36
2.2.2 查询Series对象中的数据\t37
2.2.3 修改、删除Series对象中的数据\t38
2.3 DataFrame对象的基本操作\t40
2.3.1 创建DataFrame对象\t41
2.3.2 DataFrame对象的属性\t42
2.3.3 查询DataFrame对象中的数据\t43
2.3.4 修改DataFrame对象中的数据\t47
2.3.5 增加DataFrame对象中的数据\t47
2.3.6 删除DataFrame对象中的数据\t49
2.4 pandas读写数据\t51
2.4.1 读写CSV文件\t51
2.4.2 读写Excel文件\t54
2.4.3 读写JSON文件\t56
2.5 数据索引、排序和排名\t58
2.5.1 DataFrame的索引\t58
2.5.2 DataFrame的排序\t61
2.5.3 DataFrame的排名\t64
2.6 项目实训——链家房屋数据分析\t65
2.6.1 项目需求\t65
2.6.2 项目实施\t66
2.6.3 项目分析\t69
本章小结\t69
习题\t70
第3章 数据处理\t72
3.1 数据清洗\t73
3.1.1 处理重复数据\t73
3.1.2 处理缺失数据\t75
3.2 数据计算\t79
3.2.1 基本数学运算\t79
3.2.2 比较运算\t81
3.2.3 统计方法\t81
3.3 数据分组\t87
3.3.1 分组聚合\t87
3.3.2 透视表\t90
3.4 数据转置与数据位移\t91
3.4.1 数据类型转换\t91
3.4.2 数据转置\t98
3.4.3 数据位移\t100
3.5 数据合并\t100
3.5.1 堆叠合并\t101
3.5.2 主键合并\t104
3.5.3 重叠合并\t106
3.6 项目实训——电影数据分析\t106
3.6.1 项目需求\t106
3.6.2 项目实施\t107
3.6.3 项目分析\t110
本章小结\t111
习题\t111
第二篇 数据可视化与数据分析
第4章 数据可视化\t114
4.1 可视化介绍\t114
4.2 Matplotlib简介\t115
4.2.1 什么是Matplotlib\t115
4.2.2 Matplotlib的使用场景\t115
4.2.3 Matplotlib的安装\t115
4.3 Matplotlib绘图\t115
4.3.1 Matplotlib绘图的核心原理\t115
4.3.2 折线图\t116
4.3.3 柱状图\t128
4.3.4 直方图\t132
4.3.5 饼图\t136
4.3.6 散点图\t138
4.3.7 函数图\t142
4.3.8 3D绘图\t144
4.4 Seaborn绘图\t145
4.4.1 认识Seaborn\t145
4.4.2 折线图\t146
4.4.3 散点图\t147
4.4.4 直方图\t148
4.5 可视化分析报告\t152
4.5.1 报告需求\t152
4.5.2 报告内容说明\t152
4.5.3 业务实践\t152
4.5.4 报告分析\t154
4.6 项目实训——2014年度用户每月购买商品次数和购买商品数量分析报告\t154
4.6.1 报告需求\t154
4.6.2 报告内容说明\t154
4.6.3 项目实施\t154
4.6.4 报告分析\t155
本章小结\t156
习题\t156
第5章 数据分析\t158
5.1 数据分析介绍\t158
5.2 列表分析\t159
5.2.1 分析需求\t159
5.2.2 分析关注点\t159
5.2.3 分析思路\t159
5.2.4 列表分析结果\t164
5.3 协方差分析\t164
5.3.1 认识协方差分析\t164
5.3.2 协方差分析的意义\t164
5.3.3 协方差分析实施\t165
5.3.4 协方差分析结果\t166
5.4 直方图分析\t166
5.4.1 需求分析\t166
5.4.2 分析关注点\t166
5.4.3 分析思路\t166
5.4.4 直方图分析结果\t169
5.5 对比分析\t169
5.5.1 认识对比分析\t169
5.5.2 分析需求\t169
5.5.3 分析关注点\t169
5.5.4 分析思路\t169
5.5.5 对比分析结果\t174
5.6 项目实训——全国各省份“985”高校高考录取分数线分析\t174
5.6.1 需求分析\t174
5.6.2 分析关注点\t174
5.6.3 分析思路\t174
5.6.4 对比分析结果\t178
本章小结\t178
习题\t179
第三篇 人工智能应用
第6章 机器学习\t182
6.1 认识机器学习\t182
6.1.1 机器学习应用场景\t182
6.1.2 机器学习的组成\t183
6.1.3 训练过程\t185
6.1.4 算法汇总\t185
6.1.5 开发流程\t185
6.2 认识并安装Scikit-Learn\t186
6.2.1 Scikit-Learn简介\t186
6.2.2 Scikit-Learn基本概括\t186
6.2.3 模型选择\t186
6.2.4 数据划分\t187
6.2.5 常用模块\t188
6.2.6 安装sklearn\t188
6.3 回归模型\t188
6.3.1 广义线性模型\t189
6.3.2 树回归\t191
6.3.3 k近邻回归\t192
6.3.4 集成回归模型:Bagging\t193
6.3.5 集成回归模型:Boosting\t194
6.4 分类模型\t194
6.4.1 逻辑回归\t195
6.4.2 决策树\t196
6.4.3 支持向量机\t197
6.4.4 KNN\t198
6.4.5 朴素贝叶斯\t198
6.4.6 集成模型:Bagging\t199
6.4.7 集成模型:Boosting\t200
6.5 聚类模型\t201
6.5.1 聚类\t201
6.5.2 降维\t203
6.6 项目实训——手写数字识别\t204
6.6.1 实训需求\t204
6.6.2 项目分析\t204
6.6.3 数据集导入及处理\t204
6.6.4 划分训练集和测试集\t204
6.6.5 随机森林模型\t204
6.6.6 k近邻模型\t205
6.6.7 逻辑回归模型\t205
6.6.8 模型选择及分类\t205
6.6.9 项目结果分析\t206
本章小结\t206
习题\t206
第7章 深度学习\t208
7.1 神经网络\t208
7.1.1 认识神经网络\t208
7.1.2 神经网络基础\t211
7.2 深度学习框架Keras\t213
7.2.1 认识Keras\t213
7.2.2 Keras的安装\t214
7.2.3 Keras里的模块介绍\t215
7.2.4 Keras工作流程\t216
7.3 深度学习的应用\t216
7.3.1 Mnist手写数字数据集\t216
7.3.2 CNN\t219
7.3.3 RNN\t221
7.4 项目实训——CIFAR-10图像识别\t224
7.4.1 实训需求\t224
7.4.2 CIFAR-10数据集简介\t224
7.4.3 项目实践\t224
7.4.4 项目总结\t227
本章小结\t228
习题\t228
第8章 推荐系统\t229
8.1 认识协同过滤\t229
8.2 基于用户的协同过滤算法\t230
8.3 基于项目的协同过滤算法\t232
8.4 项目实训——电影推荐系统\t237
8.4.1 实训需求\t237
8.4.2 数据集介绍\t237
8.4.3 项目实施\t238
8.4.4 结果分析\t242
本章小结\t242
习题\t242