项目一 大数据采集认知\t001
任务1.1 开始大数据采集认知\t002
1.1.1 任务描述\t002
1.1.2 知识准备\t002
1.1.3 任务效果\t007
任务1.2 了解大数据采集平台\t007
1.2.1 任务描述\t007
1.2.2 知识准备\t008
1.2.3 任务实施\t009
1.2.4 任务效果\t021
任务1.3 认识大数据预处理\t021
1.3.1 任务描述\t021
1.3.2 知识准备\t022
1.3.3 任务实施\t022
1.3.4 任务效果\t033
任务1.4 了解大数据预处理常用工具\t034
1.4.1 任务描述\t034
1.4.2 任务实施\t035
1.4.3 任务效果\t042
项目小结\t043
习题\t044
项目二 使用Apache Flume采集日志数据\t045
任务2.1 Windows环境下的Apache Flume环境搭建\t046
2.1.1 任务描述\t046
2.1.2 知识准备\t046
2.1.3 任务实施\t060
2.1.4 任务效果\t067
任务2.2 Apache Flume数据采集案例\t067
2.2.1 任务描述\t067
2.2.2 任务实施\t068
项目小结\t071
习题\t072
项目三 使用Logstash采集日志数据\t074
任务3.1 Logstash工具安装\t075
3.1.1 任务描述\t075
3.1.2 知识准备\t075
3.1.3 任务实施\t089
3.1.4 任务效果\t093
任务3.2 Logstash数据采集工作\t094
3.2.1 任务描述\t094
3.2.2 任务实施\t095
3.2.3 任务效果\t097
项目小结\t097
习题\t098
项目四 使用爬虫工具完成网页数据获取\t099
任务4.1 使用Web Scraper完成列车时刻表数据采集工作\t100
4.1.1 任务描述\t100
4.1.2 任务知识准备\t100
4.1.3 任务实施\t107
4.1.4 任务效果\t115
任务4.2 使用八爪鱼工具采集数据\t115
4.2.1 任务描述\t115
4.2.2 知识准备\t116
4.2.3 任务实施\t117
4.2.4 任务效果\t123
项目小结\t123
习题\t124
项目五 完成招聘数据预处理\t125
任务5.1 使用OpenRefine完成数据清洗任务\t126
5.1.1 任务描述\t126
5.1.2 任务实施\t126
5.1.3 任务效果\t137
任务5.2 使用Kettle完成数据集成任务\t138
5.2.1 任务描述\t138
5.2.2 任务实施\t138
5.2.3 任务效果\t158
项目小结\t159
习题\t159
项目六 数据可视化处理\t161
任务6.1 数据可视化认知\t162
6.1.1 任务描述\t162
6.1.2 知识准备\t162
6.1.3 任务效果\t167
任务6.2 熟悉Echarts数据可视化\t167
6.2.1 任务描述\t167
6.2.2 知识准备\t168
6.2.3 任务实施\t169
任务6.2.3 任务效果\t183
任务6.3 使用Tableau Desktop完成数据可视化任务\t183
6.3.1 任务描述\t183
6.3.2 知识准备\t183
6.3.3 任务实施\t187
6.3.4 任务效果\t197
项目小结\t198
习题\t198
项目七 数据标注\t199
预备知识\t200
任务7.1 安装Labelme图像标注工具\t201
7.1.1 任务描述\t201
7.1.2 知识准备\t202
7.1.3 任务实施\t203
任务7.2 使用Labelme标注工具完成数据标注任务\t206
7.2.1 任务描述\t206
7.2.2 知识准备\t206
7.2.3 任务实施\t207
项目小结\t221
习题\t221