第1章 绪论 001
第2章 数据基本表述 005
2.1 数据基本知识 005
2.2 度量中心趋势 006
2.3 度量离散程度 010
2.4 正态分布 011
2.5 本章小结 012
第3章 数据常规预处理 013
3.1 数据清理 013
3.1.1 缺失值处理 013
3.1.2 噪声数据处理 015
3.2 数据标准化 016
3.2.1 数据中心化处理 017
3.2.2 数据的无量纲化处理 018
3.2.3 标准化处理 018
3.3 本章小结 019
第4章 线性回归分析 021
4.1 线性回归模型 021
4.1.1 一元线性回归 021
4.1.2 多元线性回归 022
4.2 小二乘法原理 023
4.2.1 计算方法的推导 023
4.2.2 总体参数估计量的性质 027
4.3 多重共线性问题 028
4.3.1 问题的提出 028
4.3.2 多重共线性的影响 029
4.3.3 多重共线性的诊断 031
4.3.4 解决多重共线性的方法 033
4.4 模型效果评价指标 035
4.4.1 测定系数 035
4.4.2 均方根误差 037
4.5 本章小结 038
第5章 偏小二乘线性回归模型 039
5.1 基本思路与算法原理 039
5.1.1 基本思路 039
5.1.2 算法原理 040
5.1.3 交叉有效性 043
5.2 算法的基本性质 044
5.3 主要分析技术 048
5.3.1 主成分分析 048
5.3.2 典型相关性分析 051
5.3.3 T2椭圆图辅助分析 054
5.3.4 变量投影重要性辅助分析技术 055
5.4 本章小结 056
第6章 偏小二乘在中医药领域应用的思路 057
6.1 中医药实验数据 057
6.1.1 数据来源 057
6.1.2 数据特点 061
6.2 总体思路与分析策略 061
6.2.1 总体思路与目标 061
6.2.2 分析策略 063
6.3 本章小结 065
第7章 优化偏小二乘的数据预处理方法 066
7.1 问题的提出 066
7.2 基于降噪稀疏自编码器的偏小二乘缺失值处理 067
7.2.1 降噪稀疏自编码器 067
7.2.2 优化模型的建立 070
7.2.3 实验设计与结果分析 071
7.3 基于非径向数据包络分析的偏小二乘噪声处理 074
7.3.1 非径向数据包络分析 074
7.3.2 优化模型的建立 076
7.3.3 实验设计与结果分析 080
7.4 本章小结 083
第8章 优化偏小二乘辅助特征选择研究 084
8.1 问题的提出 084
8.2 特征选择方法 084
8.2.1 相关定义 085
8.2.2 特征选择的过程 086
8.2.3 方法的类型 087
8.3 基于特征相关的偏小二乘特征选择 088
8.3.1 基于相关性的特征选择方法 088
8.3.2 优化模型的建立 089
8.3.3 实验设计与结果分析 091
8.4 基于L1正则项的偏小二乘特征选择 094
8.4.1 LASSO方法 094
8.4.2 优化模型的建立 098
8.4.3 实验设计与结果分析 102
8.5 基于灰色关联的偏小二乘特征选择 111
8.5.1 灰色关联分析 111
8.5.2 优化模型的建立 112
8.5.3 实验设计与结果分析 116
8.6 本章小结 118
第9章 偏小二乘成分提取的非线性优化模型 120
9.1 问题的提出 120
9.2 融合受限玻尔兹曼机的偏小二乘优化模型 121
9.2.1 受限玻尔兹曼机 121
9.2.2 优化模型的建立 124
9.2.3 实验设计与结果分析 126
9.3 融合稀疏自编码器的偏小二乘优化模型 129
9.3.1 自编码器 129
9.3.2 稀疏自编码器的构造 131
9.3.3 优化模型的建立 131
9.3.4 实验设计与结果分析 134
9.4 融合深度置信网络的偏小二乘优化模型 137
9.4.1 深度置信网络 137
9.4.2 优化模型的建立 139
9.4.3 实验设计与结果分析 141
9.5 本章小结 144
第10章 偏小二乘回归的非线性优化模型 146
10.1 问题的提出 146
10.2 融合模型树的偏小二乘优化 146
10.2.1 模型树 147
10.2.2 非线性模型的建立 149
10.2.3 实验设计与结果分析 151
10.3 融合随机森林的偏小二乘优化 154
10.3.1 随机森林 154
10.3.2 非线性模型的建立 156
10.3.3 实验设计与结果分析 159
10.4 融合softmax的偏小二乘优化 162
10.4.1 softmax 162
10.4.2 非线性模型的建立 163
10.4.3 实验设计与结果分析 166
10.5 本章小结 170
第11章 总结与展望 173
11.1 偏小二乘的优势 173
11.2 偏小二乘的不足 174
11.3 偏小二乘的展望 176
附录A 专业术语 178
附录B 优化偏小二乘的多功能数据分析系统使用指南 179
附录C 中医药实验数据表 202