1 导言:当统计学遇见语料库语言学
1.1 本章概述
1.2 什么是统计学?科学、语料库语言学和统计学
1.3 基本统计术语
1.4 创建语料库和研究设计
1.5 探索数据和数据可视化
1.6 应用和实例:小说中的形容词多于学术论文中的形容词吗?
1.7 练习
2 词汇:频率、离散和多样性
2.1 本章概述
2.2 形符、类符、词元和词素
2.3 频率表中的词
2.4 海螺问题:离散
2.5 哪些词很重要?平均减小频率
2.6 词汇多样性:类符形符比、标准化类符形符比、移动平均类符形符比
2.7 应用和实例:英国人一直都在讨论天气吗?
2.8 练习
3 语义学和话语:搭配、主题词和人工编码的可靠性
3.1 本章概述
3.2 搭配和关联度量
3.3 搭配图和搭配网:探索交叉关联
3.4 主题词和锁词
3.5 评判者间一致性度量
3.6 应用和实例:英国报纸的读者如何看待移民?
3.7 练习
4 词汇语法:从简单计算到复杂建模
4.1 本章概述
4.2 分析一个词汇语法特征
4.3 交叉表、百分比和卡方检验
4.4 logistic回归
4.5 应用:That还是Which?
4.6 练习
5 语域变化:相关、聚类和因子
5.1 本章概述
5.2 变量之间的关系:相关
5.3 分类:凝聚层次聚类分析
5.4 多维分析
5.5 应用:新西兰英语中的语域
6 社会语言学和文体学:个体和社会变化
6.1 本章概述
6.2 个体风格和社会变化:社会语言变量始于哪里?
6.3 组件比较:T检验、方差分析、Mann-Whitney U检验、Kruskal-Wallis检验
6.4 个体风格:对应分析
6.5 语境:混合效应模型
6.6 应用:这个来自白宫的人是谁?
6.7 练习
7 历史变化:分析历时数据
7.1 本章概述
7.2 时间作为变量:测量和可视化
7.3 发现和解释差异:百分比变化和自主检验
7.4 归类十七:临近聚类分析
7.5 模拟话语中的变化:波峰和波谷及用法波动分析
7.6 应用:17世纪中的颜色词
7.7 练习
8 整合:统计思维的十个原则、元分析和效应量
8.1 本章概述
8.2 统计思维的十个原则
8.3 元分析:统计结果的统计整合
8.4 效应量:如何有意义地使用它
8.5 练习
结语
参考文献