文字识别：原理、方法和实践

定　价：¥128.00

作　者：	丁晓青，王言伟等著
出版社：	清华大学出版社
丛编项：
标　签：	计算机/网络人工智能

购买这本书可以去

ISBN：	9787302454625	出版时间：	2017-04-01	包装：	平装
开本：	16	页数：	610	字数：

内容简介

　　本书基于模式识别和信息熵理论，全面、系统和深入地分析介绍了各种汉字、多文种文字识别的理论和方法，以及解决复杂多变的多文种文字和文档识别中关键问题的有效算法和具体实践。本书可以作为相关专业研究生的参考书，也可以供从事模式识别、文字和文档识别等计算机信息处理研究的科研人员和从事相关产品开发的工程技术人员阅读参考。

作者简介

　　作者：丁晓青王言伟等

图书目录

目录第1章绪论1.1引言1.2文字和汉字1.2.1文字的代码表示1.2.2汉字的字体字形1.2.3汉字的特点 1.2.4中文信息处理1.3文字识别和汉字识别1.4文字识别研究历程1.5文字识别分类1.5.1按照不同文种文字和文档的识别技术分类1.5.2按照获取图像方式和识别对象不同分类1.5.3单个字符识别和文档篇章识别1.6文字识别与笔迹鉴别1.7汉字识别的基本方法——基于视觉感知的汉字识别方法1.8关于本书参考文献第2章模式识别和模式识别信息熵理论2.1引言：模式与模式识别2.2基于贝叶斯统计决策的模式识别2.3模式识别统一信息熵理论2.3.1特征和类别及其相关信息熵2.3.2后验熵：*优贝叶斯分类器误识率的上限2.3.3模式识别的学习与识别信息过程2.3.4互信息：决定模式识别性能的鉴别熵2.4正态分布条件下的模式识别信息熵系统2.5*大互信息鉴别分析（互信息鉴别子空间模式识别） 2.5.1*大互信息子空间线性鉴别分析方法2.5.2*大互信息线性鉴别分析与线性鉴别分析LDA2.6特征选择的信息熵准则2.6.1基于错误概率的类别可分性准则2.6.2基于有效互信息的类别可分性准则2.7从信息熵分析看提高识别性能的途径2.8汉字集合和汉字文本的信息熵2.8.1汉字集合的信息熵2.8.2汉字文本的信息熵和汉字的极限熵2.9本章小结参考文献第3章汉字识别的特征提取3.1引言3.2汉字字符图像规一化预处理3.2.1线性规一化3.2.2非线性规一化3.2.3基于整体密度均衡的非线性规一化3.3汉字识别中的特征抽取3.3.1结构特征3.3.2统计特征3.4汉字识别特征提取研究的发展历程3.4.1基于图像变换的印刷汉字识别特征和系统 3.4.2基于形态学汉字结构分析的两级印刷汉字识别特征和系统3.4.3汉字笔画密度微结构全局特征及多字体汉字识别系统3.4.4基于汉字笔画方向网格特征的鲁棒汉字识别系统3.5笔画方向线素特征3.5.1方向线素特征的形成方法3.5.2网格化方向线素特征3.5.3对原模糊分块方法的改进——低通采样方向线素特征3.5.4实验和结果3.6基于Gabor滤波器的高性能汉字识别方向特征3.6.1Gabor变换理论分析3.6.2适用于汉字识别的Gabor滤波器组设计及实验验证3.6.3对Gabor滤波器组输出的非线性变换3.6.4分块特征的抽取3.6.5实验及结果3.7汉字识别梯度方向特征抽取方法3.7.1梯度方向特征3.7.2梯度方向特征的快速算法3.8不同笔画方向特征的识别性能实验比较3.9本章小结参考文献第4章特征的鉴别分析和分布整形4.1引言4.2线性鉴别分析4.2.1优化准则4.2.2变换形式和*优解4.2.3变换的分解形式4.2.4启发式讨论4.2.5实验与结果4.2.6小结 4.3正则化线性鉴别分析4.3.1小样本带来的问题4.3.2利用正则化估计协方差阵4.3.3实验结果4.4异方差鉴别分析4.4.1基于极大似然估计的异方差线性鉴别分析4.4.2基于Chernoff准则的异方差线性鉴别分析4.4.3基于Mahalanobis准则的异方差线性鉴别分析4.4.4实验结果4.4.5小结4.5特征统计分布整形变换4.5.1特征分布的整形4.5.2正态性检验4.5.3BoxCox变换4.5.4方向线素及梯度特征的整形4.5.5实验与结果4.6本章小结参考文献第5章模式识别分类器设计/统计模式分类方法5.1引言5.2贝叶斯判决理论5.3正态分布下的贝叶斯分类器5.3.1正态分类模型5.3.2*小距离分类器MDC5.3.3线性距离分类器LDC 5.3.4二次鉴别函数分类器QDF5.3.5二次鉴别函数5.3.6QDF误差分析5.4改进二次鉴别函数分类器MQDF5.4.1修正二次鉴别分类MQDF5.4.2QDF修正形式的贝叶斯估计推导5.4.3实验与结果5.5系统实现与应用5.5.1非限定脱机手写汉字识别系统5.5.2多字体印刷中、日、韩文识别系统5.6分类器的置信度分析5.6.1分类器的置信度和广义置信度5.6.2基于距离的分类器的广义置信度估计5.6.3多层前向神经网络分类器广义置信度估计5.6.4从广义置信度求置信度的方法5.6.5使用ACT估计后验概率5.6.6置信度分析在字符识别中的应用5.6.7小结5.7分类器集成5.7.1集成的3个层次5.7.2基于线性回归的多分类器集成5.7.3利用线性回归提高后验概率估计的准确性5.7.4后验概率的估计误差与误识率的关系5.7.5实验结果5.7.6小结5.8本章小结参考文献第6章无约束手写汉字识别分类器鉴别学习6.1引言6.2基于*小错误率的鉴别学习6.2.1*小错误率学习6.2.2基于MCE的多模板距离分类器参数鉴别学习6.2.3基于MCE的MQDF分类器参数鉴别学习6.2.4基于MCE的正交混合高斯模型的鉴别学习6.3基于启发式的鉴别学习方法6.3.1矫正学习6.3.2镜像学习方法6.3.3样本重要性加权学习方法6.4本章小结参考文献第7章联机手写汉字识别7.1引言7.1.1联机手写汉字识别方法回顾7.2描述结构的统计模型——SSM7.2.1基元间关系的描述7.2.2结构统计模型SSM的定义及概率分析7.2.3SSM应用于联机手写汉字识别7.2.4实验与分析7.2.5小结7.3路径受控HMM和时空统一模型7.3.1路径受控HMM（PCHMM）7.3.2PCHMM在联机手写汉字识别中的应用7.3.3联机手写汉字识别的时空统一模型——STUM7.3.4实验与分析7.3.5小结7.4基于全局模式分析的统计结构特征7.4.1联机汉字笔迹的结构分析7.4.2联机手写汉字分类特征的分析与提取7.4.3小结7.5高性能联机手写汉字识别系统及其嵌入式系统7.5.1联机手写汉字识别系统7.5.2嵌入式联机手写识别系统7.6本章小结参考文献第8章利用上下文信息的汉字识别后处理8.1概述8.2汉字识别后处理模型8.2.1汉字文本识别的整体模型8.2.2利用多层语言知识的汉字识别整体模型8.2.3整体模型的全局优化8.2.4影响后处理性能的要素分析8.3统计语言模型8.3.1ngram模型的基本理论8.3.2基于字的语言模型8.3.3基于词的语言模型8.4候选集的有效性8.4.1候选集大小分析8.4.2混淆矩阵获取8.4.3扩充候选字集8.4.4词条近似匹配算法8.5文本识别后处理的实现8.5.1字bigram模型的上下文处理8.5.2字trigram模型的上下文处理8.5.3词bigram模型的上下文处理8.5.4字、词相结合的上下文处理8.4.5利用上下文信息的汉字识别实验系统8.6实验结果与分析8.6.1实验数据说明8.6.2语言模型的影响8.6.3候选字集的影响8.6.4文本识别混合后处理系统的影响8.7本章小结参考文献第9章脱机手写文档识别方法9.1引言9.2文本行识别研究概况9.3基于过切分的脱机手写中文文本行识别方法9.3.1脱机手写中文文本行识别方法9.3.2基于分段的文本行识别搜索方法9.3.3文本行切分识别中的语言模型自适应9.3.4脱机手写中文文本识别系统9.4基于HMM的无切分民族文字文档识别方法9.4.1无切分识别方法的主要思想9.4.2无切分文档识别方法中的特征提取9.4.3无切分文档识别方法中的模型训练9.4.4无切分文档识别方法中的模型优化9.4.5无切分文档识别方法中的解码识别9.4.6无切分维文文档识别研究的相关实验9.4.7小结9.5本章小结参考文献第10章文档版面自动分析和理解10.1版面处理的概念10.2版面分析研究的历史和现状10.2.1版面分析研究的分类10.2.2版面分析工作的发展10.2.3版面分析的困难10.3基于多层次基元的版面分析模型10.3.1多层次可信度的定义10.3.2多层次可信度指导下的自底向上版面分析算法10.3.3连通域层次10.3.4行层次10.3.5区域层次10.3.6页面层次10.3.7实验结果10.4版面理解和重构10.4.1版面理解和重构的需求10.4.2文档结构模型10.4.3版面理解10.4.4版面重构10.4.5原文重现的电子出版物制作系统10.5本章小结参考文献第11章蒙藏维多文种识别11.1引言11.1.1蒙藏维文识别11.1.2民族文字识别的现状11.1.3藏文及其识别11.1.4维吾尔文及其识别11.1.5蒙古文及其识别11.2蒙藏维文识别的基本策略11.2.1基本识别单元选择11.2.2基本框架和关键技术11.3多文种民族文字识别中的字符规一化11.3.1基于基线分块的民族字符规一化策略11.3.2规一化点阵大小选择11.3.3位置规一化11.3.4基于三次B样条函数的字符图像插值11.3.5笔画宽度调整11.4民族文字识别中的特征提取与特征变换11.4.1改进型方向线素特征11.4.2基于视觉特性的方向特征11.4.3基于线性鉴别分析的特征变换11.4.4实验结果11.5民族文字识别中的级联分类器设计11.5.1预分类11.5.2基于鉴别学习MQDF的主分类器11.5.3辅助分类11.5.4实验结果11.6藏文文本切分和藏文识别后处理11.6.1藏文文本切分11.6.2拼写规则与统计方法相结合的藏文识别后处理11.7多民族语言文字识别系统的实现——THOCR统一平台民族文字识别系统11.7.1统一平台多民族文字识别系统特点11.7.2维汉英混排民族文字的识别11.7.3蒙藏维多文种统一平台识别系统性能11.7.4蒙藏维文档识别的跨文种翻译理解11.8本章小结参考文献附录A常用缩略语表附录B文字识别相关研究成果附录C文字识别相关成果主要奖励附录D已授权文字识别相关发明专利附录E文字识别相关的博士论文附录F本书中算法研究相关数据库索引