第1章 概述
1.1 文本分析的意义
1.2 文本分析的目的
1.3 本书内容安排
第2章 文本分析的环境
2.1 Python运行环境
2.2 文本分析的常用库
2.3 Anaconda
第3章 Python基础
3.1 Pvthon基本概念
3.2 Python脚本创建与运行
3.3 Python核心数据类型
3.4 Python控制结构
3.5 Python函数
3.6 正则表达式
第4章 文本预处理
4.1 几种常见的中文文本语料库
4.2 文本清洗
4.3 文本分词
4.4 删除停用词与词频统计
第5章 文本特征选择与向量化
5.1 基本概念
5.2 词袋模型
5.3 TF—IDF模型
5.4 IG模型
5.5 卡方检验
第6章 特征抽取
6.1 特征抽取的意义
6.2 奇异值分解(SvD)
6.3 主成分分析(PCA)
6.4 潜在狄利克雷分布(LDA)
6.5 非负矩阵分解(NMF)
6.6 案例分析
第7章 词向量
7.1 词向量基本概念
7.2 Word2Vec
7.3 采用Gensim工具训练词向量
7.4 词向量在文本分析中的应用
第8章 文本分类
8.1 文本分类基本概念
8.2 文本分类类型
8.3 分类模型评估
8.4 基于传统机器学习的文本分类模型
8.5 特征抽取在文本分类中的应用
8.6 特征选择结合特征抽取在文本分类中的应用
第9章 情感分析
9.1 情感分析概述
9.2 情感分析层次
9.3 基于情感词的文本情感分析
9.4 基于机器学习的文本情感分析
参考文献