本书在国家社科重大招标项目“大规模英汉平行语料库的建立与加工”的框架下,汇报大数据背景下大规模平行语料库的加工、检索和应用若干问题的研究进展。第一,深度探讨大数据背景下大规模平行语料库的加工问题。本书以大数据作为背景,对面向大规模英汉平行语料库加工的元信息标记、词法标注、句法标注与双语对齐的语言学原理、标注规范和自动加工方法进行阐释。第二,从大数据视角探讨“大规模英汉平行语料库检索平台”的设计开发及其应用问题。第三,基于大规模英汉平行语料库开展了某些句法结构及其汉译的研究,主要以科技文体英文被动结构为例,考察其语言特征及其在汉语中的对译形式,试图从结构形式、句法、语义和文体四个维度揭示被动结构由英语向汉语的翻译转换过程所呈现的趋势和特征。