第1章 数据挖掘研究进展 1
1.1 数据挖掘基本理论 1
1.2 数据挖掘存在的问题 8
1.3 数据挖掘研究现状 9
1.3.1 特征降维 9
1.3.2 智能分类 12
1.3.3 聚类分析 13
1.4 研究思路 15
第2章 特征降维方法研究 16
2.1 背景知识 16
2.1.1 线性判别分析 16
2.1.2 保局投影算法 18
2.2 基于多阶矩阵组合的LDA 19
2.3 标量化的线性判别分析算法 20
2.4 基于矩阵指数的线性判别分析算法 22
2.5 基于图的数据降维方法 24
2.6 融合全局和局部特征的特征提取方法 26
2.6.1 化问题 27
2.6.2 算法描述 28
2.6.3 复杂度分析 28
2.7 基于Fisher准则的半监督数据降维方法 29
2.8 特征提取新视角:基于Parzen窗估计的方法 31
2.8.1 Parzen窗 31
2.8.2 Parzen窗与LPP 32
2.8.3 Parzen窗与LDA 35
2.8.4 Parzen窗与PCA 38
2.8.5 推广性结论 41
第3章 基于数据分布特征的智能分类方法 42
3.1 背景知识 42
3.1.1 支持向量机 42
3.1.2 支持向量数据描述 43
3.1.3 流形判别分析 44
3.1.4 模糊理论 45
3.1.5 核心向量机 46
3.2 基于流形判别分析的全局保序学习机 46
3.2.1 GRPLM原理 48
3.2.2 大规模分类 51
3.3 基于散度差的保序分类算法 52
3.3.1 化问题 52
3.3.2 大规模分类 54
3.4 小流形类内离散度支持向量机 54
3.4.1 MCVSVM 55
3.4.2 小MWCS支持向量机 56
3.4.3 理论分析 58
3.5 基于核密度估计与熵理论的间隔学习机 59
3.5.1 核密度估计和熵理论 59
3.5.2 MEKLM原理 60
3.5.3 理论分析 63
第4章 基于决策边界的智能分类方法 66
4.1 支持向量数据描述 66
4.2 具有N-S磁极效应的间隔模糊分类器 67
4.2.1 N-S磁极效应 68
4.2.2 MPMMFC原理 68
4.2.3 理论分析 72
4.3 基于光束角思想的间隔学习机 73
4.3.1 光束角 74
4.3.2 BAMLM原理 74
4.3.3 CCMEB及BACVM 78
4.4 面向大规模数据的模糊支持向量数据描述 79
4.4.1 模糊支持向量数据描述 79
4.4.2 FSVDD-CVM 81
4.5 基于信度的BP神经网络 82
4.5.1 BP神经网络 83
4.5.2 基于信度的BP算法 85
第5章 天文数据挖掘研究进展 87
5.1 引言 87
5.2 大型巡天项目 87
5.3 天文数据的特点 90
5.4 天文学中的数据挖掘 91
5.4.1 天文数据挖掘的必要性 92
5.4.2 天文数据挖掘的主要任务 92
5.5 天文数据挖掘应用研究 94
5.6 光谱自动分类方法研究 96
第6章 基于支持向量机及其变种的恒星光谱分类方法 99
6.1 基于流形模糊双支持向量机的恒星光谱分类方法 99
6.1.1 双支持向量机 99
6.1.2 流形模糊双支持向量机 100
6.1.3 实验分析 102
6.1.4 结论 103
6.2 基于多类支持向量机的恒星光谱分类方法 103
6.2.1 多类支持向量机 104
6.2.2 实验分析 106
6.2.3 结论 107
6.3 基于流形判别分析和支持向量机的恒星光谱数据自动分类方法 107
6.3.1 基于流形判别分析的支持向量机 107
6.3.2 实验分析 110
6.3.3 结论 111
6.4 基于小类内散度、类间散度支持向量机的恒星光谱分类 111
6.4.1 MMSVM 111
6.4.2 实验分析 112
6.4.3 结论 114
6.5 基于模糊小类内散度支持向量机的恒星光谱分类 114
6.5.1 FMWSVM 114
6.5.2 实验分析 115
6.5.3 结论 117
第7章 稀有天体光谱自动发现方法 118
7.1 利用基于熵的单类学习机发现稀有光谱 118
7.1.1 熵理论 119
7.1.2 基于熵的单类学习机 119
7.1.3 基于核心向量机的OCLM 120
7.1.4 实验分析 121
7.1.5 结论 125
7.2 利用基于互信息的非平衡分类方法识别稀有光谱 125
7.2.1 背景知识 126
7.2.2 决策树的构造 127
7.2.3 剪枝方法 128
7.2.4 基于互信息的代价缺失决策树 128
7.2.5 实验分析 129
7.2.6 结论 133
7.3 基于模糊大间隔小球分类模型的恒星光谱离群数据挖掘方法 133
7.3.1 模糊大间隔小球分类模型 133
7.3.2 实验分析 136
7.3.3 结论 137
第8章 恒星光谱自动分类方法新发展 138
8.1 基于非线性学习机的大规模恒星光谱分类方法 138
8.1.1 非线性集成学习机 138
8.1.2 实验分析 140
8.1.3 结论 145
8.2 基于Fisher准则和流形学习的恒星光谱分类方法 145
8.2.1 基于Fisher准则和流形学习的分类方法 146
8.2.2 CFCM与传统降维方法的关系 150
8.2.3 实验分析 150
8.2.4 结论 153
8.3 利用带无标签数据的双支持向量机对恒星光谱分类 153
8.3.1 带无标签数据的双支持向量机 153
8.3.2 算法描述 155
8.3.3 实验分析 155
8.3.4 结论 157
第9章 天文大数据挖掘 158
9.1 研究背景 158
9.1.1 天文大数据 158
9.1.2 大数据处理技术 159
9.2 天文大数据处理的关键技术 161
9.2.1 天文大数据处理框架 161
9.2.2 天文大数据分布式存储技术 164
9.2.3 天文大数据并行化计算技术 168
9.2.4 天文大数据分析方法 169
9.2.5 天文大数据处理技术存在的问题与不足 171
9.3 天文大数据机器学习 172
9.3.1 研究背景和问题 172
9.3.2 天文大数据机器学习系统的特征 172
9.3.3 主要研究问题 173
9.3.4 研究进展 173
参考文献 175