自然语言计算机形式分析是横跨语言学、计算机科学和数学的一个交叉研究领域,是自然语言计算机处理的关键。自然语言是信息主要的负荷者,在当今信息网络时代,计算机已经日益普及,普通计算机用户可以使用的语言资源正以惊人的速度飞快增长。互联网主要是由自然语言构成的,它已经成为了极为丰富的语言信息资源;移动通信也是以自然语言为媒介的,它已经渗透到日常生活的各个领域。因此,自然语言计算机形式分析对于国家的信息化建设,对于互联网和移动通信的安全具有重要作用。本书对自然语言处理中的各种理论和方法进行了系统的总结和梳理。首先讨论了自然语言处理的学科定位;接着介绍了语言计算的一些先驱研究;然后以主要的篇幅讨论自然语言处理中的各种形式模型,包括基于短语结构语法的形式模型、基于合一运算的形式模型、基于依存和配价的形式模型、基于格语法的形式模型、基于词汇主义的形式模型、语义自动处理的形式模型、系统功能语法、语用自动处理的形式模型、概率语法、Bayes公式与动态规划算法、N元语法和数据平滑、隐Markov模型(HMM)、语音自动处理的形式模型、统计机器翻译的形式模型;同时还讨论了自然语言处理系统的评测问题;最后从哲学的角度讨论了自然语言处理中的理性主义和经验主义,探索理性主义方法和经验主义方法相结合的途径。本书说理透彻、语言流畅、实例丰富、深入浅出,适合从事自然语言处理研究的科研人员、大学师生阅读,也可以作为人工智能、计算语言学等课程的教学参考书。