1 绪论
1.1 什么是知识发现
1.2 知识发现的过程
1.3 新型数据流应用
1.4 数据流定义及特点
1.5 数据流知识发现
1.5.1 数据流频繁模式挖掘
1.5.2 数据流分类研究
1.5.3 数据流聚类
1.5.4 数据流离群点检测
1.5.5 数据流时序数据分析
1.6 海量数据管理与并行及分布式计算
1.7 小结
2 海量数据管理的关键技术
2.1 海量数据硬件平台模型
2.1.1 并行计算机体系结构
2.1.2 集群并行计算系统
2.1.3 虚拟化及云
2.2 海量数据系统模型
2.2.1 Hadoop框架
2.2.2 Google Filc System-GFS
2.2.3 Memcached
2.2.4 SimpleDB
2.3 海量数据计算的基本算法
2.3.1 Map/Reduce
2.3.2 BigTable
2.3.3 NFS
2.3.4 AFS
2.4 传统海量数据管理技术
2.4.1 并行数据划分
2.4.2 并行事务调度
N.4.3 并行事务并发控制算法
2.5 数据流管理系统
2.5.1 STREAM
2.5.2 Aurora
2.5.3 Medusa
2.5.4 Borealis
2.5.5 其他
2.6 基于CPU和GPU的并行计算
2.6.1 并行计算机和模型
2.6.2 MPI+OpenMP混合模型
2.6.3 基于GPU的并行计算模型
2.6.4 基于CUDA的并行计算模型
2.6.5 并行数据流分析
2.7 小结
3 数据流关联规则发现
3.1 关联规则挖掘概述
3.2 关联规则挖掘典型算法分析
3.2.1 基于规则中涉及的数据维数的挖掘算法
3.2.2 基于规则中涉及的抽象层次的挖掘算法
3.2.3 按变量类别不同而确定的挖掘算法
3.3 数据流上频集挖掘核心问题
3.3.1 概要数据处理方法
3.3.2 滑动窗口处理模型
3.3.3 挖掘算法分类
3.3.4 挖掘任务分类
3.4 基于前缀树的频繁闭项集挖掘PFIT算法
3.4.1 问题描述
3.4.2 前缀树结构描述
3.4.3 构建前缀树
3.4.4 挖掘前缀树
3.4.5 实验
3.5 高效益项集挖掘算法FHUI-Growth
3.5.1 关联规则效益度的定义及性质
3.5.2 一种快速挖掘高效益项集的算法
3.5.3 实验
3.6 基于概念格的关联规则挖掘算法
3.7 小结
4 数据流分类知识发现
4.1 数据分类模型与方法
4.1.1 数据流单分类器算法
4.1.2 数据流集成分类器算法
4.2 基于隐马尔可夫模型的流数据分类算法
4.2.1 基于隐马尔可夫模型的流数据分类算法
4.2.2 马尔可夫链
4.2.3 隐马尔可夫模型
4.3 基于隐马尔可夫模型的流数据分类算法
4.3.1 训练样本优化
4.3.2 HMM_SDC算法
4.3.3 实验
4.3.4 结论
4.4 小结
5 数据流聚类挖掘
5.1 引言
5.2 聚类分析
5.2.1 相关概念
5.2.2 聚类分析中的数据类型
5.2.3 主要聚类分析方法分类
5.2.4 常见聚类分析方法的分析
5.3 数据流聚类算法(methods and algorithms)
5.3.1 STREAM算法
5.3.2 CluStream算法框架
5.3.3 HPStream算法框架
5.3.4 E-Stream算法
5.3.5 DenStrearn算法
5.3.6 D-Stream算法
5.3.7 CFR算法
5.4 数据流滤波问题研究
5.4.1 受系统参数影响的状态空间模型
5.4.2 最小距离设计方法
5.4.3 SSUKF-JSIMM算法思想
5.4.4 SSUKF-JSIMM算法步骤
5.4.5 仿真实验
5.5 研究主题
5.5.1 一般性主题
5.5.2 面向具体应用领域的问题
5.6 小结
6 时序和序列数据流挖掘
6.1 时间序列及其应用
6.2 时间序列预测的常用方法
6.3 时间序列的相似性搜索
6.3.1 基于ARMA模型的时间序列相似性搜索
6.3.2 基于离散傅里叶变换的时间序列相似性查找
6.3.3 基于规范变换的查找方法
6.4 序列模式挖掘简介
6.5 序列模式挖掘算法
6.5.1 Apriori算法
6.5.2 基于划分的模式生长算法
6.5.3 基于序列比较的算法
6.6 支持约束的序列模式挖掘
6.6.1 约束的分类
6.6.2 支持约束的序列模式挖掘算法
6.7 周期模式挖掘
6.8 增量式序列模式挖掘
6.9 序列模式挖掘算法的比较分析
6.9.1 算法的定性比较
6.9.2 算法的时间和空间执行效率比较
6.9.3 算法适用范围分析
6.10 序列挖掘在生物信息领域的应用
6.10.1 蛋白质功能的计算方法简介
6.10.2 一种改进的蛋白质功能预测方法PP_WNP[36]
6.10.3 实验结果分析
6.10.4 结论
6.11 小结