注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术自然科学天文学/地球科学地球科学中的大数据分析与挖掘算法手册

地球科学中的大数据分析与挖掘算法手册

地球科学中的大数据分析与挖掘算法手册

定 价:¥149.00

作 者: 李国庆,刘莹,庞禄申 等 著
出版社: 人民邮电出版社
丛编项: 国之重器出版工程
标 签: 暂缺

购买这本书可以去


ISBN: 9787115478559 出版时间: 2018-08-01 包装: 平装
开本: 小16开 页数: 290 字数:  

内容简介

  本书以数据分析与挖掘思想为主线,深入剖析关联、分类、回归、聚类、顺序模式挖掘、深度学习以及异常检测等算法的原理、实现、相似算法、改进思路以及地学案例,具有很强的系统性、完整性以及落地性,可以作为各行业特别是地球科学领域中希望驾驭大数据并发掘其价值的科研人员和工程人员的参考书,读者既可以通过本书系统掌握大数据分析挖掘的思想方法,也可以将其作为算法工具书查阅。

作者简介

  对地观测和数字地球科学中心数据技术部主任。主要研究方向为高性能地学计算、网络化数据工程,承研项目40多项,在研项目6项,发表论文70多篇。IEEE和中国计算机学会的高级会员,中国计算机学会高性能计算专业委员会理事和中国软件协会数学软件分会理事。长期参与相关国际组织的工作,曾任国际对地观测卫星委员会(CEOS)网格任务组主席和应用工作组副主席、现任国际数据系统(WDS)科学委员会委员、国际科学数据委员会(CODATA)“灾害数据开放和互联”工作组主席,同时担任国际科联(ICSU)中国专家委员会、国际灾害风险集成研究计划(IRDR)中国专家委员会、国家综合地球观测组织(GEO)中国专家委员会的主要成员。

图书目录

目 录
第 1章 关联规则 001
1.1 Apriori算法 002
1.1.1 算法概要 002
1.1.2 算法原理 002
1.1.3 实例说明 004
1.1.4 算法优缺点 010
1.1.5 优化改进 010
1.1.6 大数据适应度分析 012
1.1.7 地球科学应用案例 013
1.2 FP-growth算法 015
1.2.1 算法概要 015
1.2.2 算法原理 015
1.2.3 实例说明 017
1.2.4 优化改进 019
1.2.5 大数据适应度分析 021
1.2.6 地球科学应用案例 024
参考文献 026
第 2章 分类 027
2.1 决策树算法 028
2.1.1 算法概要 028
2.1.2 算法原理 028
2.1.3 算法优缺点 031
2.1.4 优化改进 032
2.1.5 决策树衍生算法 033
2.1.6 大数据适应度分析 035
2.1.7 地球科学应用案例 037
2.2 贝叶斯分类算法 038
2.2.1 算法概要 038
2.2.2 算法原理 038
2.2.3 实例说明 040
2.2.4 算法优缺点 042
2.2.5 优化改进 042
2.2.6 大数据适应度分析 045
2.2.7 地球科学应用案例 046
2.3 神经网络分类算法 047
2.3.1 算法概要 047
2.3.2 算法原理 047
2.3.3 算法优缺点 051
2.3.4 优化改进 052
2.3.5 大数据适应度分析 053
2.3.6 地球科学应用案例 053
2.4 粗糙集分类 055
2.4.1 算法概要 055
2.4.2 算法原理 055
2.4.3 实例说明 062
2.4.4 算法优缺点 064
2.4.5 优化改进 064
2.4.6 大数据适应度分析 065
2.4.7 地球科学应用案例 066
2.5 支持向量机 066
2.5.1 算法概要 066
2.5.2 算法原理 067
2.5.3 实例说明 073
2.5.4 算法优缺点 074
2.5.5 优化改进 074
2.5.6 大数据适应度分析 076
2.5.7 地球科学应用案例 077
2.6 K-最近邻算法 078
2.6.1 算法概要 078
2.6.2 算法原理 078
2.6.3 算法优缺点 080
2.6.4 优化改进 080
2.6.5 大数据适应度分析 082
2.6.6 地球科学应用案例 085
2.7 Bagging算法 086
2.7.1 算法概要 086
2.7.2 算法原理 087
2.7.3 实例说明 090
2.7.4 优化改进 093
2.7.5 大数据适应度分析 094
2.7.6 地球科学应用案例 095
2.8 AdaBoost算法 096
2.8.1 算法概要 096
2.8.2 算法原理 097
2.8.3 训练过程 099
2.8.4 同类算法 100
2.8.5 大数据适应度分析 103
2.8.6 地球科学应用案例 103
参考文献 105
第3章 回归 115
3.1 线性回归 116
3.1.1 算法概要 116
3.1.2 算法原理 116
3.1.3 实例说明 119
3.1.4 算法优缺点 120
3.1.5 优化改进 121
3.1.6 大数据适应度分析 123
3.1.7 地球科学应用案例 123
3.2 逻辑回归 124
3.2.1 算法概要 124
3.2.2 算法原理 125
3.2.3 算法实现 127
3.2.4 SoftMax算法 129
3.2.5 大数据适应度分析 129
3.2.6 地球科学应用案例 130
参考文献 131
第4章 聚类 133
4.1 K-means算法 134
4.1.1 算法概要 134
4.1.2 算法原理 134
4.1.3 实例说明 135
4.1.4 算法优缺点 138
4.1.5 优化改进 138
4.1.6 大数据适应度分析 140
4.1.7 地球科学应用案例 141
4.2 K-medoids算法 142
4.2.1 算法概要 142
4.2.2 算法原理 142
4.2.3 实例说明 144
4.2.4 算法优缺点 147
4.2.5 优化改进 148
4.2.6 大数据适应度分析 149
4.2.7 地球科学应用案例 149
4.3 层次聚类算法 151
4.3.1 算法概要 151
4.3.2 距离度量 151
4.3.3 算法流程 153
4.3.4 改进优化 154
4.3.5 大数据适应度分析 158
4.3.6 地球科学应用案例 159
4.4 基于密度的聚类算法 160
4.4.1 算法概要 160
4.4.2 算法原理 160
4.4.3 实例说明 162
4.4.4 算法优缺点 164
4.4.5 优化改进 165
4.4.6 大数据适应度分析 166
4.4.7 地球科学应用案例 167
4.5 基于网格的聚类算法 168
4.5.1 算法概要 168
4.5.2 STING 168
4.5.3 CLIQUE 170
4.5.4 优化改进 173
4.5.5 大数据适应度分析 176
4.5.6 地球科学应用案例 177
参考文献 179
第5章 序列模式挖掘 183
5.1 GSP算法 184
5.1.1 算法概要 184
5.1.2 算法原理 184
5.1.3 实例说明 189
5.1.4 算法优缺点 191
5.1.5 GSP衍生算法 192
5.1.6 大数据适应度分析 194
5.1.7 地球科学应用案例 195
5.2 SPADE算法 196
5.2.1 算法概要 196
5.2.2 算法原理 197
5.2.3 实例说明 203
5.2.4 算法优缺点 206
5.2.5 优化改进 206
5.2.6 SPADE衍生算法 207
5.2.7 大数据适应度分析 209
5.2.8 地球科学应用案例 213
参考文献 215
第6章 深度学习 217
6.1 深度信念网 218
6.1.1 算法概要 218
6.1.2 算法原理 219
6.1.3 优化改进 225
6.1.4 大数据适应度分析 226
6.1.5 地球科学应用案例 227
6.2 卷积神经网络 228
6.2.1 算法概要 228
6.2.2 算法原理 228
6.2.3 实例说明 229
6.2.4 模型演化 231
6.2.5 优化改进 234
6.2.6 大数据适应度分析 235
6.2.7 地球科学应用案例 235
6.3 自动编码器算法 237
6.3.1 算法概要 237
6.3.2 算法原理 238
6.3.3 算法实现 240
6.3.4 衍生算法 241
6.3.5 优化改进 243
6.3.6 大数据适应度分析 244
6.3.7 地球科学应用案例 245
参考文献 245
第7章 异常检测 249
7.1 概述 250
7.2 基于统计的异常检测算法 251
7.2.1 算法原理 251
7.2.2 典型算法 251
7.3 基于距离的方法 252
7.3.1 算法原理 252
7.3.2 典型算法 252
7.4 基于深度的异常检测方法 256
7.4.1 算法原理 256
7.4.2 典型算法 257
7.5 基于密度的异常检测算法 258
7.5.1 算法原理 258
7.5.2 典型算法 258
7.6 基于偏离的异常检测算法 262
7.6.1 算法原理 262
7.6.2 典型算法 263
7.7 基于聚类的异常检测算法 265
7.7.1 算法原理 265
7.7.2 典型算法 265
7.8 大数据适应度分析 268
7.9 地球科学应用案例 269
参考文献 271
附录A 软件、源码及开发包 275

本目录推荐