注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书古籍/国学国学著作工具与案例

工具与案例

工具与案例

定 价:¥59.00

作 者: 刘华 著
出版社: 外语教学与研究出版社
丛编项: 语料库语言学
标 签: 暂缺

购买这本书可以去


ISBN: 9787521322835 出版时间: 2020-12-01 包装: 平装
开本: 16开 页数: 252 字数:  

内容简介

  汉语助研是作者自主开发的,面向语言研究者,特别是汉语和汉语教学研究者的一款软件。软件力图帮助语言研究者比较轻松地建设语料库,使用语言大数据进行语言研究。汉语助研系统是国内外一个全面综合了语料库建设、检索和统计功能的辅助汉语研究的软件系统,集成了基于语料库方法的汉语字、词、句、篇研究的各项辅助功能,系统能很好地贴合汉语研究各方面的统计需求,功能针对性、实用性强。 汉语助研系统基于真实问卷调查数据分析,符合汉语研究的各项需求,特别是贴合了汉语研究者文科生的动手特点,软件架构、界面设计和编码清晰简洁,将复杂的统计、计算过程隐藏于后台,前端一键式、步骤式操作,简单易用。

作者简介

  刘华,男,1975年生,博士,英国谢菲尔德大学访问学者,暨南大学教授、暨南杰青、博士生导师、博士后合作导师,广东省千百十省级培养对象,国家语委语言文字应用研究优秀中青年学者,北京成像技术高精尖创新中心(首都师范大学)、北京语言资源高精尖创新中心(北京语言大学)兼职研究员。

图书目录

理论篇
1 语料库语言学概述 / 2
1.1 语料库语言学的学科基础 / 2
1.1.1 语料库语言学的产生原因 / 2
1.1.2 语料库语言学的理论基础 / 2
1.2 语料库的定义、特点与分类 / 3
1.2.1 语料库的定义 / 3
1.2.2 语料库的特点 / 4
1.2.3 语料库的分类 / 5
1.3 语料库语言学的定义 / 6
1.3.1 前人论述 / 6
1.3.2 语料库语言学定义 / 7
1.4 语料库语言学的研究内容与方法 / 8
1.4.1 语料库语言学的研究内容 / 8
1.4.2 语料库语言学的研究方法 / 8
2 语料库的建设 / 10
2.1 概述 / 10
2.1.1 语料库建设的基本过程 / 10
2.1.2 语料库建设面临的问题 / 10
2.2 语料库建设的原则和规范 / 11
2.2.1 语料库总的建设原则 / 11
2.2.2 语料库的不规范性 / 12
2.3 语料库建设的平衡性与代表性 / 13
2.3.1 规模、语体、时间与空间 / 13
2.3.2 流通度 / 15
2.4 语料库建设的元数据与信息字段 / 19
2.4.1 元数据 / 19
2.4.2 信息字段 / 23
2.4.3 元数据、信息字段举例 / 24
2.5 语料库建设方法 / 27
2.5.1 总体设计 / 27
2.5.2 具体实施 / 27
3 语料库的加工标注 / 31
3.1 中文自动分词 / 32
3.1.1 词与自动分词 / 32
3.1.2 中文分词的特点和难点 / 32
3.1.3 常见的中文分词方法 / 34
3.2 中文词性标注 / 35
3.2.1 词性、词类与词性标注 / 35
3.2.2 词性标注难点 / 35
3.2.3 常见词性标注方法 / 36
3.3 自动句法分析 / 37
3.3.1 概述 / 37
3.3.2 句法分析分类 / 38
3.3.3 依存句法分析 / 39
3.4 语义分析 / 41
3.4.1 词语级语义分析 / 41
3.4.2 句子级语义分析 / 43
3.4.3 篇章级语义分析 / 44
4 术语说明 / 46
4.1 频次 频率 文本数 / 46
4.1.1 频次 / 46
4.1.2 频率 / 46
4.1.3 文本数 / 46
4.2 累加频率 覆盖率 使用率 高频词语 / 47
4.2.1 累加频率 / 47
4.2.2 覆盖率 / 47
4.2.3 使用率 / 47
4.2.4 高频词语 / 48
4.3 频序 频序比 频率差 / 48
4.3.1 频序 / 48
4.3.2 频序比 / 48
4.3.3 频率差 / 49
4.4 字种 字种数 词种 词种数 / 49
4.4.1 字种 / 49
4.4.2 字种数 / 49
4.4.3 词种 / 49
4.4.4 词种数 / 49
4.5 共用 独用 / 50
4.5.1 共用 / 50
4.5.2 独用 / 50
工具篇
5 网页批量下载 / 52
5.1 具有数字序列规律的网页下载 / 52
5.1.1 搜索网页 / 52
5.1.2 批量生成网址 / 54
5.1.3 创建工程 / 55
5.1.4 运行工程 / 57
5.2 具有时间序列规律的网页下载 / 58
5.3 无数字、无日期序列的规律网页下载 / 59
5.4 无任何规律网页的批量下载 / 60
6 网页信息抽取建库 / 65
6.1 网页内容解析原理 / 65
6.2 程序操作图示 / 67
6.2.1 打开待处理html 文件夹 / 67
6.2.2 展示待处理html 文件的文本内容 / 68
6.2.3 选择抽取字段的起止标记 / 69
6.2.4 选择抽取结果保存的文件夹和文件名 / 70
6.2.5 检查所有网页的抽取起止标记是否正确 / 71
6.3 语料库结果展示 / 71
7 例句检索 / 73
7.1 程序操作图示 / 73
7.1.1 打开、保存文件夹 / 73
7.1.2 选择检索模式 / 73
7.1.3 单击运行程序 / 74
7.2 检索结果展示 / 74
8 例句分析 / 75
8.1 程序操作图示 / 75
8.1.1 检索语料例句 / 75
8.1.2 打开、保存文件夹 / 75
8.1.3 选择例句集来源、输入前后标记 / 76
8.1.4 单击运行程序 / 76
8.2 统计结果展示 / 77
9 用字统计分析 / 78
9.1 程序操作图示 / 78
9.1.1 打开语料库文件夹 / 78
9.1.2 设置保存结果文件夹及名称 / 79
9.1.3 运行统计功能 / 80
9.2 统计结果展示 / 81
9.2.1 总的汉字使用的摘要报告 / 81
9.2.2 汉字分类使用情况 / 81
9.2.3 标点符号和汉字部件的使用情况 / 82
9.2.4 汉字字表的覆盖率情况 / 83
9.2.5 不同排序方式的字表 / 83
9.2.6 与其他字表对比的数据 / 85
10 用词用语统计分析 / 86
10.1 程序操作图示 / 86
10.2 统计结果展示 / 86
10.2.1 基本词语表 / 86
10.2.2 频次与词种数 / 87
10.2.3 高频词语用字统计 / 87
10.2.4 高频词语词长统计 / 88
10.2.5 覆盖率与词种数关系 / 88
10.2.6 词性及其频次的统计结果 / 89
10.2.7 词性及其词种数的统计结果 / 89
10.2.8 成语使用结果 / 89
10.2.9 与《汉语水平词汇与汉字等级大纲》(词汇大纲)对比 / 90
11 字词表对比分析 / 91
11.1 程序操作图示 / 91
11.1.1 选择对比项目和参数 / 91
11.1.2 打开、保存文件夹 / 91
11.1.3 单击运行程序 / 92
11.2 统计结果展示 / 92
11.2.1 频率差结果 / 92
11.2.2 频序比结果 / 93
11.2.3 共独用结果 / 94
12 字词表分布分析 / 95
12.1 程序操作图示 / 95
12.1.1 选择分布计算的大纲和项目 / 95
12.1.2 打开、保存文件夹 / 96
12.1.3 单击运行程序 / 96
12.2 统计结果展示 / 97
12.2.1 在《等级大纲》中的分布 / 97
12.2.2 在《新汉语水平考试大纲》中的分布 / 97
13 词语搭配抽取及分析 / 98
13.1 搭配抽取 / 99
13.1.1 程序操作图示 / 99
13.1.2 统计结果展示 / 99
13.2 搭配过滤 / 101
13.2.1 程序操作图示 / 101
13.3 搭配分析 / 102
13.3.1 程序操作图示 / 102
13.3.2 统计结果展示 / 102
14 词语按主题聚类 / 104
14.1 程序操作图示 / 104
14.1.1 打开、保存文件夹 / 104
14.1.2 选择聚类的底表和词语数 / 105
14.1.3 单击运行程序 / 105
14.2 统计结果展示 / 105
15 篇章风格统计分析 / 107
15.1 程序操作图示 / 108
15.1.1 打开、保存文件夹 / 108
15.1.2 输入特定字词 / 108
15.1.3 单击运行程序 / 108
15.2 统计结果展示 / 109
案例篇
16 国际汉语教学语料库建设 / 112
16.1 汉语口语教学语料库 / 112
16.1.1 话题库建设 / 112
16.1.2 话题分类、难度分级的常用会话资源库 / 113
16.2 商务汉语教材语料库 / 114
16.2.1 商务汉语教材语料库 / 114
16.2.2 商务汉语功能项目库 / 114
16.2.3 商务汉语功能项目分类语料库 / 115
16.3 中小学华文教材语料库 / 116
16.4 少儿汉语教材语料库 / 117
16.4.1 主题库 / 117
16.4.2 教材语料库 / 117
16.4.3 主题分类语料库 / 118
16.5 旅游汉语教材语料库 / 118
16.5.1 旅游汉语教材语料库 / 118
16.5.2 旅游汉语话题分类语料库 / 118
17 全球华语语料库建设及功能研究 / 120
17.1 全球华语语料库建设的必要性和意义 / 120
17.2 全球华语语料库建设 / 122
17.2.1 语料库建设的基本原则 / 122
17.2.2 语料来源与获取方法 / 124
17.2.3 语料库构成及比例 / 125
17.2.4 语料库信息字段及存储格式 / 126
17.3 全球华语语料库深加工 / 127
17.3.1 选取核心库 / 127
17.3.2 分词标注词性、人工校对 / 128
17.3.3 基本字词信息统计 / 128
17.3.4 音视频资源标注处理 / 128
17.3.5 华裔学习者作文和口语语料库偏误标注 / 129
17.4 全球华语语料库网络服务平台介绍 / 129
17.4.1 子语料库定制系统 / 129
17.4.2 网络版字词检索系统 / 129
17.4.3 网络版全文例句检索系统 / 129
17.4.4 音视频资源点播系统 / 130
17.5 结语 / 130
18 东南亚小学华文教材课文用字研究 / 132
18.1 语料和调查对象说明 / 132
18.2 各教材课文用字基本情况 / 133
18.2.1 字次与字种数 / 134
18.2.2 各教材前100 字共用独用情况 / 134
18.2.3 各教材课文用字在《等级大纲》(汉字大纲)中的分布情况 / 136
18.2.4 新加坡两套教材课文用字对比 / 138
18.2.5 越南、泰国、印尼五套教材课文用字对比 / 139
18.3 各教材课文用字分年级情况 / 140
18.3.1 各教材分年级字次和字种数基本情况 / 140
18.3.2 分年级课文用字的《等级大纲》(汉字大纲)分布情况 / 142
18.3.3 课文用字字种数按年级增量情况 / 144
18.4 东南亚小学华文教材和中国小学语文教材课文用字对比 / 145
18.4.1 基本情况 / 146
18.4.2 分段的共用独用调查 / 147
18.4.3 基于频序比的汉字使用对比分析 / 149
19 东南亚小学华文教材课文用词研究 / 151
19.1 马来西亚《华文》教材课文用词调查 / 151
19.1.1 基本情况 / 151
19.1.2 频次与词种数的关系 / 151
19.1.3 词语的覆盖率 / 152
19.1.4 高频词的词长分布 / 154
19.1.5 成语调查 / 155
19.1.6 课文用词与《等级划分》(词汇大纲)的比较 / 159
19.1.7 课文用词按年级统计情况 / 160
19.2 马来西亚《华文》教材课文用词与新课标小学《语文》对比 / 161
19.2.1 基本情况 / 161
19.2.2 频次与词种数的关系对比 / 162
19.2.3 词语的覆盖率对比 / 163
19.2.4 高频词的词长分布 / 166
19.2.5 成语的对比分析 / 167
19.2.6 按年级对比马-《华文》与人教新课标《语文》课文用词情况 / 168
19.2.7 高频词的频序比 / 170
19.3 东南亚不同层次小学华文教材对比 / 171
19.3.1 各层级教材课文用词基本情况对比 / 172
19.3.2 各层级教材课文用词按年级统计情况 / 178
19.3.3 各层级教材课文用词与《等级划分》(词汇大纲)的比较 / 187
19.4 结语 / 191
20 少儿汉语话题及话题词表构建 / 194
20.1 术语及语料库介绍 / 195
20.1.1 话题词表、话题种子词 / 195
20.1.2 词语聚类 / 195
20.1.3 话题词语、话题通用词、话题专类词 / 196
20.1.4 相关语料 / 196
20.2 少儿汉语话题与话题库的构建 / 199
20.3 少儿汉语话题词表的构建标准与方法 / 203
20.3.1 少儿汉语话题词表的构建理论 / 203
20.3.2 少儿汉语话题词表的选词标准 / 205
20.3.3 少儿汉语话题词表的分类 / 205
20.3.4 话题词表的构建方法 / 207

本目录推荐