CONTENTS
目 录
前言
第1章 机器学习基础1
1.1 认识机器学习1
1.1.1 机器学习概念1
1.1.2 机器学习与生活4
1.1.3 机器学习与知识6
1.2 机器学习应用基础6
1.2.1 事物与维度7
1.2.2 分布与关系9
1.2.3 描绘与预测12
1.2.4 现象与知识13
1.2.5 规律与因果13
1.3 机器学习应用系统14
1.3.1 数据层14
1.3.2 算法层18
1.3.3 应用层23
1.3.4 经验积累与应用26
1.4 无限三维嵌套空间假说26
1.4.1 一维空间26
1.4.2 二维空间26
1.4.3 三维空间27
1.4.4 突破三维空间27
1.4.5 五维空间28
1.4.6 六维空间29
1.5 分数维度空间30
1.5.1 分数维度30
1.5.2 自相似性31
1.5.3 无限迭代32
1.6 不确定论33
1.7 本章小结34
第2章 数据探索35
2.1 数据关系探索36
2.1.1 业务发现36
2.1.2 关系发现38
2.1.3 数据质量探索38
2.1.4 数据整合42
2.2 数据特征探索43
2.2.1 数据的统计学特征43
2.2.2 统计学特征应用50
2.2.3 变量相关性探索53
2.3 数据选择56
2.3.1 适当的数据规模57
2.3.2 数据的代表性57
2.3.3 数据的选取59
2.4 数据处理61
2.4.1 数据标准化62
2.4.2 数据离散化63
2.5 本章小结64
第3章 机器学习技术65
3.1 聚类分析65
3.1.1 划分聚类(K均值)66
3.1.2 层次聚类(组平均)70
3.1.3 密度聚类75
3.2 特性选择76
3.2.1 特性选择概念76
3.2.2 线性相关80
3.2.3 相关因子SRCF82
3.3 特征抽取91
3.3.1 主成分分析91
3.3.2 因子分析93
3.3.3 非负矩阵因子分解94
3.4 关联规则95
3.4.1 关联规则概念95
3.4.2 Apriori算法96
3.4.3 FP树频集97
3.4.4 提升(Lift)97
3.5 分类和预测98
3.5.1 支持向量机98
3.5.2 Logistic回归102
3.5.3 朴素贝叶斯分类106
3.5.4 决策树112
3.5.5 人工神经网络116
3.5.6 分类与聚类的关系119
3.6 时间序列120
3.6.1 灰色系统预测模型120
3.6.2 ARIMA模型预测126
3.7 深度学习127
3.7.1 图像深度学习:卷积神经网络127
3.7.2 自然语言深度学习:循环神经网络141
3.8 本章小结145
第4章 机器学习应用案例146
4.1 特性选择的应用146
4.1.1 数据整合146
4.1.2 数据描绘147
4.1.3 数据标准化148
4.1.4 特性选择探索148
4.2 分类模型的应用——算法比较154
4.2.1 数据整合154
4.2.2 数据描绘155
4.2.3 数据标准化156
4.2.4 特性选择探索156
4.2.5 分类模型160
4.3 算法的综合应用——肿瘤标志物的研究161
4.3.1 样本选取161
4.3.2 癌胚抗原临床特征主题分析165
4.3.3 癌胚抗原临床特征规则分析169
4.3.4 癌胚抗原临床特征规则的比较分析173
4.3.5 癌胚抗原相关因子分析174
4.3.6 不同等级癌胚抗原组差异分析177
4.4 本章小结180
第5章 机器学习应用系统开发181
5.1 IMRS的设计思路181
5.1.1 IMRS核心功能设计182
5.1.2 IMRS主要功能184
5.1.3 IMRS的模块设计和应用实现185
5.1.4 IMRS的评估方法194
5.2 机器学习应用系统:IMRS技术设计199
5.2.1 对数据源的分析200
5.2.2 IMRS的总体设计203
5.3 IMRS异常侦测模型的开发210
5.3.1 异常侦测模型的功能展示211
5.3.2 技术开发要点214
5.4 IMRS特征抽取模型的开发221
5.4.1 特征抽取模型的功能展示221
5.4.2 技术开发要点221
5.5 IMRS的算法开发232
5.5.1 相关因子算法SRCF的实现232
5.5.2 朴素贝叶斯分类算法的实现237
5.6 本章小结241
第6章 机器学习系统应用(一):结构数据挖掘242
6.1 分布探索243
6.1.1 两维度聚类模型应用243
6.1.2 高维度聚类模型应用248
6.2 关系探索249
6.2.1 关联规则的应用249
6.2.2 特性选择的应用252
6.3 特征探索257
6.3.1 不稳定心绞痛的特征总结258
6.3.2 动脉硬化性心脏病的临床特征262
6.4 异常探索264
6.4.1 生理指标的异常侦测264
6.4.2 异常侦测模型的比较267
6.5 推测探索268
6.6 应用系统的高级应用269
6.6.1 异常侦测的高级用法270
6.6.2 关联规则的高级应用274
6.7 本章小结278
第7章 机器学习系统应用(二):非结构数据挖掘280
7.1 文本挖掘技术280
7.1.1 文本分词算法280
7.1.2 文本相似性算法283
7.1.3 文本聚类算法287
7.1.4 文本分类算法290
7.2 文本数据挖掘在医学上的应用293
7.2.1 医学自然文本挖掘的应用293
7.2.2 医学自然文本挖掘的方法294
7.2.3 医学自然文本挖掘的相关技术295
7.2.4 医学自然文本挖掘系统的实现295
7.3 文本分词的实现296
7.3.1 专业语料库与分词算法的结合297
7.3.2 专业分词库的自完善297
7.4 文本智能搜索298
7.4.1 文本相似性搜索298
7.4.2 文本相关性搜索299
7.5 文本聚类与分类的应用299
7.5.1 文本聚类应用300
7.5.2 文本分类应用302
7.6 文本主题提取应用303
7.7 本章小结305
第8章 基于机器学习的人工智能应用306
8.1 基于大数据和机器学习的人工智能306
8.1.1 广义大数据306
8.1.2 人工智能307
8.1.3 基于大数据的人工智能应用308
8.1.4 基于小数据的人工智能应用311
8.2 人工智能的应用:智能医学诊断系统314
8.2.1 智能诊断推理机314
8.2.2 临床智能诊断的实现319
8.2.3 临床智能诊断的应用321
8.2.4 临床智能诊断的验证:基于群体特征的个案临床评估323
8.3 混沌人工智能325
8.3.1 混沌理论325
8.3.2 人类大脑的混沌性327
8.3.3 大脑混沌性的应用328
8.3.4 人工智能大脑展望332
8.4 本章小结333