绪论
第一章 逻辑:组合范畴语法的源流
1.1 古典范畴语法
1.1.1 范畴和运算
1.1.2 形式化描述
1.2 Lambek演算
1.2.1 函项运算与逻辑演绎
1.2.2 对代词的分析获得新的推导规则
1.2.3 Lambek句法演算(Syntactic calculus)
1.2.4 Lambek演算的形式化表示
1.3 蒙太格语法
1.4 组合范畴语法的创生
1.5 组合范畴语法的构造与组合规则
1.5.1 范畴
1.5.2 组合规则
1.5.3 组合投射原则
1.5.4 自然语言的组合性
1.5.5 组合算子的普适性
本章小结 逻辑对于自然语言语法和处理的意义何在?
第二章 语言:汉语CCG的表述与演绎
2.1 基本语句
2.2 与名词短语相关的范畴分析
2.2.1 单位词与数量短语
2.2.2 形容词、量词与方位词短语
2.2.3 同位语
2.3 与动词相关的范畴分析
2.3.1 动词短语
2.3.2 控制动词与情态动词
2.3.3 “被”字句
2.3.4 “把”字句
2.4 标点与并列的范畴分析
2.4.1 并列现象
2.4.2 标点符号
2.5 句子层面的范畴分析
2.5.1 代词脱落(pro-drop)
2.5.2 关系从句的范畴分析
2.5.3 “的”字句
2.6 形式语义分析
2.6.1 基于CCG的语法与语义界面理论
2.6.2 CCG的语法与语义并行推理举例
本章小结 回归自然语言的研究
第三章 计算:汉语CCGBank的构建
3.1 介绍
3.1.1 短语结构语法
3.1.2 宾州中文树库(PCTB)
3.1.3 CCG语料库
3.2 汉语CCGBank转换系统的架构与设计
3.2.1 总体框架
3.2.2 数据处理模块
3.2.3 转换模块
3.2.4 应用模块
3.3 汉语CCGBank核心转换算法
3.3.1 预处理阶段
3.3.2 标记阶段
3.3.3 二分阶段
3.3.4 赋范畴阶段
3.3.5 修复阶段
3.3.6 举例
3.4 汉语CCGBank的统计与分析
3.4.1 范畴统计
3.4.2 词例统计
3.4.3 规则例统计
本章小结 语言学的数字化发展
第四章 应用:CCG应用述评
4.1 面向大规模自然语言处理的形式文法综述
4.1.1 语法形式化
4.1.2 大规模NLP中的典型形式语法
4.2 CCG适用于计算语言学中的特性
4.2.1 词汇形式化以及适度上下文相关特性
4.2.2 组合性以及句法与语义接口的融洽性
4.3 CCG的应用
4.3.1 生成和实现(Generation and realization)
4.3.2 问答(question answering)
4.3.3 OpenCCG
4.3.4 语义计算
4.4 人工智能时代CCG的处境与发展
4.4.1 钟摆再一次摆向经验主义
4.4.2 深度学习的软弱性
4.4.3 CCG的未来之路
本章小结 CCG对语言本质的探索
结语
参考文献
附录A 宾州中文树库(PCTB)的标记集
A.1 词性标记Part-Of-Speechtags(33)
A.2 句法标记Syntactic tags(23)
A.2.1 短语标记Tags for phrase(17)
A.2.2 复合动词标记Tags for verb compounds(6)
A.3 功能标记Functional tags(26)
A.4 空范畴标记Empty categories (null elements)(7)
附录B “的”在汉语CCGBank中的范畴
附录C 斯蒂德曼访谈