《文本挖掘技术及其应用》包括四个部分。第一部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在R软件上详细介绍了文本挖掘,包括R 软件的简介与安装,文本挖掘所需的基本R包,Facebook、微博、Twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在MS SQL Sever上介绍如何实现文本挖掘,第一章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在MS SQL Sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。