计算机语料库是可以用计算机处理的电子文本库,是提高自然语言处理系统性能的重要工具,又是新兴的语料库语言学的研究基础,它对信息产业、词典出版、外语教学与研究等领域的发展影响巨大,因而日益受到重视。本书介绍如何收集建立计算机语料库和在诸多领域如何开发利用语料库,可作为英语、计算机、中文信息处理、信息与网络管理等专业的研究生和高年级本科生相关课程的教材,也可作为相关专业的研究生和毕业生选择与确定科研与毕业论文题目的参考书,亦可供信息产业的技术和管理人员、高校相关专业的教师学习参考。本书前言前言在信息产业界、语言工程界、词典出版界、外语教学与研究界,计算机语料库的巨大作用正日益显现,越来越得到普遍重视。计算机语料库是自然语言处理中统计方法的基础。基于语料库的统计方法,已经成为提高语言自动处理系统性能的突破口。计算机语料库又是新兴的语料库语言学的研究基础。近年来语料库语言学发展十分迅速,硕果累累。本书讲述什么是语料库,什么是计算机语料库,语料库有哪些种类,目前世界上有哪些著名的语料库,语料库在历史上起过什么作用,对语言学研究有何用途,对语言工业有何用途,对英语教学有何用途,如何设计和收集建立语料库,如何开发利用语料库,如何上网利用现成的语料库。本书是为英语教育、英语语言学、计算机信息处理、信息与网络管理等专业研究生编写的教材,也可供拟报考以上专业研究生的高年级本科生、高校的中青年教师、从事或有志从事有关信息技术工作的人员参考。相关专业的硕士研究生与博士研究生,在选择与确定毕业论文的题目和科研项目时,也可以参考本书。全书分为上下两篇。上篇介绍计算机语料库的建设与加工,下篇讨论计算机语料库的开发与应用。其中上篇第1章是对计算机语料库的用途与意义的总述;第2~7章介绍语料库的分类与发展;第8~13章讨论语料库的设计、建设、标注与加工方法。下篇第14章介绍开发语料库的主要软件,特别是索引软件的功能;第15~24章探讨语料库在语言学、应用语言学、词汇学、英语教学、辞书编撰等方面的应用;第25~27章介绍语料库在自然语言处理方面的应用;第28章讨论计算机语料库的发展趋势。附录1~4供感兴趣的读者进一步参考,附录5列出了一些有用的网址。书中的一些重点内容用黑体显示,以方便读者阅读和查找相关内容。为了避免误译,书中的外国人名一般使用原文。本书的出版得到北京市高等教育精品教材建设立项项目和北京邮电大学语言学院配套经费的资助;书中引用了多位作者的研究成果,作者一并深表谢意。虽然积累素材近10年,但本书是作者在繁重教学之余挤时间写成的,因时间仓促,书中难免有疏漏之处,衷心欢迎批评指正。