第一章 互联网中的数据概述
第一节 从IT走向DT
第二节 时代背景
第三节 相关概念的界定
第四节 数据的影响
第五节 互联网数据处理技术的发展
第二章 互联网web页面数据的获取
第一节 网络爬虫技术概述
第二节 爬虫的内核技术
第三节 主题爬虫技术
第四节 动态Web页面获取技术
第五节 微博信息内容获取技术
第六节 反爬虫技术与反反爬虫技术
第七节 爬虫技术的展望
第三章 数据处理技术基础
第一节 数据产生及特性
第二节 数据技术体系
第三节 数据采集与存储
第四节 数据分析与挖掘
第五节 数据可视化
第六节 可视化典型案例
第四章 信息处理与分析应用
第一节 语音识别简介
第二节 连续语音识别技术
第三节 多语言语音识别技术
第五章 数据分析的模型与算法
第一节 数据分析技术概述
第二节 特征选择与特征提取
第三节 文本的向量空间模型
第四节 文本的概率模型
参考文献