本书系统地介绍了数据预处理?数据仓库和数据挖掘的原理?方法及应用技术, 以及采用Mahout 对相应的挖掘算法进行实际练习?本书共有11 章, 分为两大部分?第1 ~7 章为理论部分?第1 章为绪论, 介绍了数据挖掘与知识发现领域中的一些基本理论?研究方法等, 也简单介绍了Hadoop 生态系统中的Mahout; 第2 ~7 章按知识发现的过程, 介绍数据预处理的方法和技术?数据仓库的构建与OLAP 技术?数据挖掘原理及算法(包括关联规则挖掘?聚类分析方法?分类规则挖掘)?常见的数据挖掘工具与产品?第8 ~11 章为实验部分, 采用Mahout 对数据挖掘各类算法进行实际练习? 本书应用性较强, 与实践相结合, 以小数据集为例详细介绍各种挖掘算法, 使读者更易掌握挖掘算法的基本原理及过程; 使用广泛的大数据平台———Hadoop 生态系统中的Mahout 对各种挖掘算法进行实际练习, 实战性强, 也符合目前数据处理与挖掘的发展趋势? 本书既便于教师课堂讲授, 又便于自学者阅读, 可作为高等院校高年级学生“数据挖掘技术” “数据仓库与数据挖掘” “数据处理与智能决策”等课程的教材?