1 绪论
1.1 数据挖掘的起源
1.2 数据挖掘的现状
1.3 数据挖掘的概念
1.3.1 数据挖掘的技术含义
1.3.2 数据挖掘的理论基础
1.3.3 数据的分类
1.3.4 训练集和测试集
1.3.5 学习
1.4 数据挖掘的功能
1.5 数据挖掘的过程
1.6 数据挖掘的分类
1.6.1 根据数据库类型分类
1.6.2 根据知识类型分类
1.6.3 根据技术分类
1.6.4 根据应用分类
1.7 数据挖掘的方法
1.7.1 决策树方法
1.7.2 神经网络方法
1.7.3 模糊集方法
1.7.4 遗传算法
1.7.5 统计分析方法
1.7.6 粗糙集方法
1.8 数据挖掘的应用分析
1.8.1 数据挖掘在体育竞技中的应用
1.8.2 数据挖掘在商业银行中的应用
1.8.3 数据挖掘在电信中的应用
1.8.4 数据挖掘在科学探索中的应用
1.8.5 数据挖掘在信息安全中的应用
1.9 数据挖掘的发展趋势与面对的问题
参考文献
2 数据
2.1 数据类型
2.1.1 属性与度量
2.1.2 数据集的类型
2.2 数据预处理
2.2.1 数据清理
2.2.2 数据集成
2.2.3 数据变换
2.2.4 数据归约
2.3 邻近性度量
2.3.1 一些概念
2.3.2 简单属性之间的邻近度
2.3.3 数据对象之间的相异度
2.3.4 数据对象之间的相似度
2.3.5 邻近性度量举例
参考文献
3 关联规则
3.1 关联规则概念
3.2 Apriori关联规则算法
3.2.1 发现频繁项目集
3.2.2 生成关联规则
3.3 提高Apriori算法的效率
3.3.1 基于划分的方法
3.3.2 基于散列的方法
3.3.3 基于采样的方法
3.3.4 基于事务压缩的方法
3.3.5 基于动态项目集计数的方法
3.4 关联规则挖掘的深人问题
3.4.1 多层次关联规则挖掘
3.4.2 多维关联规则挖掘
3.4.3 数量关联规则挖掘
参考文献
4 分类和预测
4.1 分类概念
4.2 分类规则
4.2.1 分类规则原理
4.2.2 分类规则算法步骤
4.2.3 分类规则模式
4.3 基于距离的分类器
4.4 决策树分类器
4.4.1 决策树基本算法
4.4.2 决策树分类举例
4.4.3 ID3算法
4.5 贝叶斯分类器
4.5.1 贝叶斯定理
4.5.2 贝叶斯定理在分类中的应用
4.5.3 朴素贝叶斯分类器
4.6 基于规则的分类器
4.6.1 规则的描述
4.6.2 规则的有效性
4.6.3 规则产生算法
4.6.4 分类决策
4.6.5 分类方法
参考文献
5 聚类分析
5.1 聚类分析概述
5.1.1 聚类分析在数据挖掘中的应用
5.1.2 聚类分析方法的概念
5.1.3 聚类分析方法的分类
5.1.4 距离与相似性度量
5.2 聚类方法
5.2.1 划分聚类方法
5.2.2 层次聚类方法
5.2.3 密度聚类方法
参考文献
6 粗糙集理论
6.1 国内外研究现状
6.2 粗糙集思想
6.3 信息系统
6.4 知识与不可分辨关系
6.5 不精确范畴、近似和粗糙度
6.6 区分矩阵
6.7 知识的约简和核
6.7.1 约简和核
6.7.2 相对约简和相对核
6.8 属性的重要性
6.8.1 基于知识依赖性的属性重要度
6.8.2 基于信息熵的属性重要度
6.9 决策规则的产生
6.10 粗糙集方法在数据挖掘中的应用范围
参考文献
7 属性约简算法
7.1 属性约简的典型算法
7.1.1 基本算法
7.1.2 启发式算法
7.1.3 遗传算法
7.1.4 复合系统的约简
7.1.5 扩展法则
7.1.6 动态约简
7.2 启发式属性约简算法分析
7.2.1 基于属性依赖度的约简算法
7.2.2 基于信息熵的约简算法
7.2.3 基于属性重要性和频度的约简算法
7.2.4 属性重要度的完备性分析
7.2.5 属性约简算法的综合分析
7.3 启发式属性约简算法研究
7.3.1 启发式属性约简算法(一)
7.3.2 启发式属性约简算法(二)
7.3.3 启发式属性约简算法(三)
7.3.4 启发式属性约简算法(四)
7.3.5 启发式属性约简算法(五)
参考文献
8 数据挖掘的应用
8.1 数据挖掘的应用举例
8.1.1 属性约简
8.1.2 分类规则
8.2 数据挖掘在农业中的应用
8.2.1 农作物灾害预测实例
8.2.2 农作物病害预测实例(一)
8.2.3 农作物病害预测实例(二)
8.2.4 农作物种植实例
8.2.5 水稻产量预测实例
8.3 数据挖掘在教学评价与教学中的应用
8.3.1 数据挖掘在教学评价中的应用
8.3.2 数据挖掘在教学中的应用
参考文献