目 录
CONTENT
▲
第1章 人工智能及机器学习概述...................................1
1.1 人工智能概述 ............................................................................1
1.1.1.人工智能简史...............................................................2
1.1.2.人工智能是什么...........................................................4
1.1.3.人工智能的能力...........................................................5
1.2 机器学习概述 ............................................................................5
1.2.1.机器学习是什么...........................................................5
1.2.2.以监督学习为例...........................................................6
1.2.3.学习任务......................................................................7
1.2.4.机器学习要解决的基本问题.......................................7
1.2.5.机器学习如何优化模型...............................................7
1.2.6.机器学习工作流程.......................................................7
1.2.7.机器学习的各大流派...................................................8
1.2.8.机器学习算法选择.......................................................8
1.2.9.需要的知识...................................................................9
1.3 深度学习概述 ............................................................................9
1.4 机器学习与统计学 ....................................................................9
1.5 课后练习 ..................................................................................10
▲
第2章 机器学习基础知识...........................................11
2.1 数学基础 ..................................................................................11
2.1.1.数据的分类.................................................................12
2.1.2.基本统计学术语.........................................................12
2.1.3.回归............................................................................14
2.1.4.最小二乘法.................................................................14
2.1.5.判断拟合好坏.............................................................15
2.1.6.小结............................................................................17
2.2 读图 ..........................................................................................17
2.2.1.数值数据的分布.........................................................17
2.2.2.分类数据的分布.........................................................18
2.3 KNIME .....................................................................................21
2.3.1.KNIME简介..............................................................21
2.3.2.下载和安装.................................................................21
2.3.3.KNIME基本使用.......................................................21
2.3.4.小结............................................................................28
2.4 课后练习 ..................................................................................28
▲
第3章 线性回归.........................................................29
3.1 简单线性回归 ..........................................................................30
3.1.1.场景说明....................................................................30
3.1.2.KNIME建立工作流...................................................30
3.1.3.数据获取....................................................................30
3.1.4.观察数据....................................................................31
3.1.5.数据划分....................................................................33
3.1.6.模型训练....................................................................34
3.1.7.模型测试....................................................................37
3.1.8.损失函数....................................................................37
3.2 多元线性回归初步 ..................................................................38
3.2.1.任务及数据说明.........................................................38
3.2.2.建立基本的工作流.....................................................38
3.2.3.读取并观察数据.........................................................39
3.2.4.整合界面....................................................................49
3.3 多元线性回归进阶 ..................................................................51
3.3.1.优化模型....................................................................51
3.3.2.正向选择节点.............................................................55
3.3.3.反向消除....................................................................58
3.3.4.模型解释....................................................................58
3.3.5.特征归一化.................................................................59
3.3.6.使用KNIME具体实现归一化..................................59
3.3.7.相关系数....................................................................60
3.4 课后练习 ..................................................................................61
▲
第4章 逻辑回归.........................................................63
4.1 逻辑回归基本概念 ..................................................................63
4.1.1.分类问题....................................................................63
4.1.2.从线性回归到逻辑回归.............................................65
4.1.3.判定边界....................................................................66
4.1.4.KNIME工作流..........................................................66
4.1.5.读取数据....................................................................67
4.1.6.数据处理....................................................................67
4.1.7.模型训练及测试.........................................................68
4.1.8.模型评价....................................................................69
4.2 逻辑回归实战 ..........................................................................71
4.2.1.泰坦尼克号生存问题背景介绍..................................71
4.2.2.读取数据....................................................................72
4.2.3.数据处理....................................................................73
4.2.4.数据可视化及删除无关列.........................................75
4.2.5.模型训练和测试.........................................................82
4.2.6.模型评价....................................................................83
4.2.7.提交结果....................................................................85
4.2.8.模型解释....................................................................89
4.3 课后练习 ..................................................................................90
▲
第5章 模型优化.........................................................91
5.1 梯度下降 ..................................................................................91
5.1.1.损失函数....................................................................92
5.1.2.使用KNIME优化模型..............................................96
5.2 正则化 ......................................................................................98
5.2.1.准确性和健壮性.........................................................98
5.2.2.复杂的模型.................................................................98
5.2.3.欠拟合和过拟合.........................................................98
5.2.4.正则化防止过拟合...................................................100
5.2.5.使用KNIME设置正则化........................................100
5.3 模型评价 ................................................................................101
5.3.1.混淆矩阵..................................................................101
5.3.2.F1..............................................................................103
5.3.3.ROC曲线和AUC...................................................104
5.4 课后练习 ................................................................................106
▲
第6章 支持向量机....................................................107
6.1 支持向量机基本概念 ............................................................107
6.1.1.支持向量机是什么...................................................107
6.1.2.支持向量是什么.......................................................108
6.1.3.逻辑回归与支持向量机的比较................................108
6.1.4.核..............................................................................110
6.1.5.线性核模型调参.......................................................111
6.1.6.非线性核模型调参...................................................113
6.1.7.C与 γ...........................................................................114
6.2 SVM初战 ..............................................................................114
6.2.1..问题说明..................................................................114
6.2.2.建立工作流...............................................................114
6.2.3.数据观察..................................................................115
6.2.4.模型训练与测试.......................................................117
6.2.5.观察结果..................................................................118
6.3 支持向量机解决泰坦尼克号问题 ........................................119
6.3.1.归一化......................................................................119
6.3.2.核函数......................................................................120
6.3.3.新建工作流...............................................................120
6.3.4.C参数.......................................................................123
6.4 一个重要的问题 ....................................................................124
6.5 课后练习 ................................................................................124
▲
第7章 决策树...........................................................125
7.1 决策树简介 ............................................................................125
7.1.1.决策树的优点...........................................................125
7.1.2.决策树的缺点...........................................................126
7.1.3.防止过拟合...............................................................126
7.1.4.问题解析..................................................................126
7.1.5.奥卡姆剃刀...............................................................128
7.1.6.提前结束..................................................................128
7.1.7.剪枝..........................................................................130
7.1.8.组合算法..................................................................131
7.1.9.Adaboosting...............................................................133
7.2 使用决策树解决泰坦尼克号生存问题 ................................135
7.3 决策树高级应用实战――特征工程 ....................................137
7.3.1.数据探寻..................................................................137
7.3.2.特征工程..................................................................143
7.3.3.异常数据处理...........................................................146
7.4 决策树高级应用实战――模型建立与比较 ........................149
7.4.1.决策树......................................................................149
7.4.2.袋装..........................................................................153
7.4.3.随机森林..................................................................157
7.4.4.提升..........................................................................159
7.5 课后练习 ................................................................................160
▲
第8章 深入理解决策树.............................................161
8.1 决策树进阶 ............................................................................161
8.1.1.如何构建决策树.......................................................161
8.1.2.ID3算法决定什么是最好的....................................162
8.1.3.CART算法决定什么是最好的...............................164
8.1.4.KNIME设置............................................................165
8.2 数据不平衡问题优化 ............................................................165
8.2.1.多数数据降采样.......................................................166
8.2.2.少数数据过采样.......................................................168
8.2.3.SMOTE算法............................................................170
8.3 课后练习 ................................................................................172
▲
第9章 贝叶斯分析....................................................173
9.1 贝叶斯定理 ............................................................................173
9.1.1.基本术语..................................................................173
9.1.2.条件概率..................................................................174
9.1.3.全概率和贝叶斯.......................................................176
9.1.4.贝叶斯定理...............................................................176
9.1.5.贝叶斯定理在机器学习中的应用............................177
9.2 贝叶斯算法解决银行客户分类问题 ....................................178
9.2.1.工作流......................................................................178
9.2.2.贝叶斯算法的学习器节点.......................................178
9.3 情感分析案例 ........................................................................179
9.3.1.安装插件..................................................................179
9.3.2.建立工作流...............................................................180
9.4 课后练习 ................................................................................183
▲
第10章 深度学习.......................................................185
10.1 深度学习简介 ......................................................................185
10.1.1.深度学习的关键.....................................................186
10.1.2.我们的目标.............................................................186
10.1.3.深度学习图像识别原理概述..................................187
10.1.4.图像识别探析.........................................................187
10.2 卷积神经网络(CNN) .....................................................189
10.2.1.CNN基本原理......................................................189
10.2.2.常用CNN模型......................................................193
10.3 KNIME实现卷积神经网络 ................................................195
10.3.1.环境构建.................................................................195
10.3.2.安装所需的工具.....................................................195
10.3.3.步骤分析.................................................................198
10.4 深度学习开源应用举例 ......................................................199
10.5 深度学习工商业应用举例 ..................................................201
10.6 课后练习 ..............................................................................205
▲
参考文献.......................................................................206