译者序
前言
第1章绪论1
1.1机器感知1
1.2一个例子1
1.3模式识别系统7
1.3.1传感器7
1.3.2分割和组织8
1.3.3特征提取8
1.3.4分类器9
1.3.5后处理10
1.4设计循环11
1.4.1数据采集11
1.4.2特征选择11
1.4.3模型选择12
1.4.4训练12
1.4.5评价12
1.4.6计算复杂度12
1.5学习和适应12
1.5.1有监督学习13
1.5.2无监督学习13
1.5.3强化学习13
1.6本章小结13
全书各章概要13
文献和历史评述14
参考文献15
第2章贝叶斯决策论16
2.1引言16
2.2贝叶斯决策论——连续特征18
2.3最小误差率分类20
2.3.1极小化极大准则21
2.3.2NeymanPearson准则22
2.4分类器、判别函数及判定面23
2.4.1多类情况23
2.4.2两类情况24
2.5正态密度25
2.5.1单变量密度函数25
2.5.2多元密度函数26
2.6正态分布的判别函数28
2.6.1情况1:Σi=σ2I28
2.6.2情况2:Σi=Σ30
2.6.3情况3:Σi=任意32
2.7误差概率和误差积分35
2.8正态密度的误差上界36
2.8.1Chernoff界36
2.8.2Bhattacharyya界37
2.8.3信号检测理论和操作特性38
2.9贝叶斯决策论——离散特征40
2.9.1独立的二值特征41
2.10丢失特征和噪声特征43
2.10.1丢失特征43
2.10.2噪声特征44
2.11贝叶斯置信网44
2.12复合贝叶斯决策论及上下文49
本章小结50
文献和历史评述51
习题52
上机练习63
参考文献65
第3章最大似然估计和贝叶斯参数估计67
3.1引言67
3.2最大似然估计68
3.2.1基本原理68
3.2.2高斯情况:μ未知70
3.2.3高斯情况:μ和Σ均未知 71
3.2.4估计的偏差72
3.3贝叶斯估计73
3.3.1类条件密度73
3.3.2参数的分布73
3.4贝叶斯参数估计:高斯情况74
3.4.1单变量情况:p(μ|)74
3.4.2单变量情况:p(x|)76
3.4.3多变量情况77
3.5贝叶斯参数估计:一般理论78
3.5.1最大似然方法和贝叶斯方法何时有区别 81
3.5.2无信息先验和不变性82
3.5.3Gibbs算法83
3.6充分统计量83
3.7维数问题87
3.7.1精度、维数和训练集的大小90
3.7.2计算复杂度90
3.7.3过拟合92
3.8成分分析和判别函数94
3.8.1主成分分析94
3.8.2Fisher线性判别分析96
3.8.3多重判别分析99
3.9期望最大化算法102
3.10隐马尔可夫模型105
3.10.1一阶马尔可夫模型105
3.10.2一阶隐马尔可夫模型106
3.10.3隐马尔可夫模型的计算106
3.10.4估值问题107
3.10.5解码问题111
3.10.6学习问题113
本章小结114
文献和历史评述115
习题115
上机练习127
参考文献130
第4章非参数技术132
4.1引言132
4.2概率密度的估计132
4.3Parzen窗方法134
4.3.1均值的收敛性137
4.3.2方差的收敛性137
4.3.3举例说明137
4.3.4分类的例子140
4.3.5概率神经网络141
4.3.6窗函数的选取143
4.4n近邻估计143
4.4.1n近邻估计和Parzen窗估计144
4.4.2后验概率的估计145
4.5最近邻规则146
4.5.1最近邻规则的收敛性147
4.5.2最近邻规则的误差率148
4.5.3误差界149
4.5.4近邻规则150
4.5.5近邻规则的计算复杂度151
4.6距离度量和最近邻分类153
4.6.1度量的性质154
4.6.2切空间距离155
4.7模糊分类157
4.8RCE网络160
4.9级数展开逼近161
本章小结163
文献和历史评述164
习题165
上机练习171
参考文献175
第5章线性判别函数177
5.1引言 177
5.2线性判别函数和判定面177
5.2.1两类情况 177
5.2.2多类的情况 179
5.3广义线性判别函数 180
5.4两类线性可分的情况 183
5.4.1几何解释和术语 183
5.4.2梯度下降算法184
5.5感知器准则函数最小化186
5.5.1感知器准则函数 186
5.5.2单个样本校正的收敛性证明187
5.5.3一些直接的推广 190
5.6松弛算法192
5.6.1下降算法 192
5.6.2收敛性证明 194
5.7不可分的情况 195
5.8最小平方误差方法196
5.8.1最小平方误差及伪逆196
5.8.2与Fisher线性判别的关系 198
5.8.3最优判别的渐近逼近199
5.8.4WidrowHoff 算法或最小均方算法 201
5.8.5随机逼近法 202
5.9HoKashyap算法203
5.9.1下降算法 204
5.9.2收敛性证明 205
5.9.3不可分的情况206
5.9.4一些相关的算法 207
5.10线性规划算法209
5.10.1线性规划209
5.10.2线性可分情况209
5.10.3极小化感知器准则函数210
5.11支持向量机 211
5.12推广到多类问题216
5.12.1Kesler构造法217
5.12.2固定增量规则的收敛性217
5.12.3MSE算法的推广 218
本章小结220
文献和历史评述220
习题221
上机练习226
参考文献229