第1章 数据预处理概述
1.1 数据预处理的背景与目的
1.2 数据预处理的流程
1.3 数据预处理的工具
第2章 Kettle的初步使用
2.1 Kettle的安装
2.2 Kettle的使用
第3章 基于Kettle的数据导人与导出
3.1 基于文件的数据导入与导出
3.2 基于数据库的数据导入与导出
3.3 基于CDC变*数据的导人与导出
第4章 数据清理
4.1 数据清理概述
4.2 数据排重
4.3 使用脚本组件进行数据清理
第5章 Kettle作业设计
5.1 作业的概念及组成
5.2 作业的执行方式
5.3 作业的创建及常用作业项
5.4 变量
5.5 监控
5.6 命令行启动
5.7 作业实验
第6章 构建数据仓库
6.1 构建维度表
6.2 构建事实表
第7章 基于Python的数据导入与导出
7.1 Pandas
7.2 文本文件的导入与导出
7.3 二进制文件的导人与导出
7.4 数据库的导入与导出
第8章 基于Python的数据整理
8.1 合并多个数据集
8.2 数据重塑
8.3 数据转换
参考文献