注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术工业技术自动化技术、计算技术R数据挖掘入门

R数据挖掘入门

R数据挖掘入门

定 价:¥45.00

作 者: [日] 山本义郎,藤野友和,久保田贵文 著,朱建春 译
出版社: 人民邮电出版社
丛编项: 图灵程序设计丛书
标 签: 暂缺

购买这本书可以去


ISBN: 9787115478788 出版时间: 2018-03-01 包装: 平装
开本: 大32开 页数: 198 字数:  

内容简介

  本书使用R,结合大量实例,详细介绍了数据挖掘的理论和分析方法。全书分为3部分:* 1部分简单介绍了使用R进行数据挖掘的流程和数据挖掘的概要;* 2部分介绍了数据挖掘的10种常用方法,并在此基础上使用R实际进行数据挖掘;第3部分结合实际的数据挖掘事例介绍了如何使用这些方法。本书适合数据挖掘的初学者,以及正在从事数据分析相关工作,想了解更多分析方法的读者阅读。

作者简介

  山本义郎(作者)日本东海大学理学部数学系教授。著有《统计数据的可视化》《统计学序论》《概率统计序论 第 2版》(合著)。执笔本书* 2章、第6章、第9章、* 11章、* 12章、* 13章。藤野友和(作者)日本福冈女子大学国际文理学部讲师。著有《统计数据的可视化》(合著)。执笔本书* 1章、第3章、第4章、第8章。久保田贵文(作者)日本多摩大学经营信息学部副教授。执笔本书第5章、第7章、* 10章、* 14章。朱建春(译者)毕业于北京大学计算机系,曾在联想集团任职多年,是国内较早从事Windows掌上电脑和智能手机的系统和应用软件开发的IT工作者。后长期担任对日软件外包开发项目经理。

图书目录

第I部分 使用R进行数据挖掘的准备 1
* 1章 基于R的数据分析入门..............................................................3
1.1 R及RStudio的安装..................................................................................4
1.2 RStudio的基本操作...................................................................................6
1.3 R语言入门.................................................................................................10
1.3.1 作为计算器使用的方法........................................................................10
1.3.2 向量——R的基本数据结构................................................................11
1.3.3 向量变量的赋值和运算........................................................................12
1.3.4 数组和矩阵.............................................................................................13
1.3.5 因子型.....................................................................................................15
1.3.6 列表.........................................................................................................16
1.3.7 数据框.....................................................................................................17
1.4 获取外部数据............................................................................................18
1.5 数据汇总.....................................................................................................19
1.6 安装程序包.................................................................................................21
1.7 基于dplyr程序包的数据框操作..........................................................22
1.8 数据的可视化............................................................................................25
1.8.1 柱状图.....................................................................................................26
1.8.2 直方图.....................................................................................................29
1.8.3 箱形图.....................................................................................................30
1.8.4 散点图.....................................................................................................32
1.8.5 逐层绘制的图.........................................................................................34
* 2章 数据挖掘概述..................................................................................36
2.1 大数据和数据挖掘...................................................................................36
2.2.1 业务理解(Business Understanding)..............................................37
2.2 CRISP-DM................................................................................................37
2.2.2 数据理解(Data Understanding).......................................................38
2.2.3 数据准备(Data Preparation)............................................................38
2.2.4 建模(Modeling)..................................................................................39
2.2.5 评估(Evaluation)................................................................................39
2.2.6 运用(Deployment).............................................................................39
2.3.1 数据的种类和建模................................................................................40
2.3 数据挖掘的方法........................................................................................40
2.3.2 预测和判别.............................................................................................41
2.3.3 分类和聚类.............................................................................................41
2.3.4 维规约.....................................................................................................41
2.3.5 规则发现.................................................................................................41
第II部分 数据挖掘的方法 43
第3章 回归分析............................................................................................45
3.1 一元回归分析............................................................................................45
3.2 多元回归分析............................................................................................50
第4章 Logistic回归分析..........................................................................60
4.1 数据准备.....................................................................................................60
4.2 使用一个解释变量进行预测..................................................................61
4.3 使用两个及以上的解释变量进行预测................................................67
第5章 决策树分析.......................................................................................71
5.1 使用分类树的判别...................................................................................71
5.2 使用回归树的预测...................................................................................77
第6章 支持向量机.......................................................................................81
6.1 支持向量机的概念...................................................................................81
6.2 类别预测的例子........................................................................................83
6.3 数值预测的例子........................................................................................86
第7章 记忆基础推理..................................................................................89
7.1 k* 近邻法的概念....................................................................................89
7.2 变量的基准化和标准化..........................................................................94
第8章 聚类分析............................................................................................96
8.1 聚类分析的概念........................................................................................96
8.2 层次聚类分析............................................................................................97
8.3 执行层次聚类分析...................................................................................99
8.4 可视化进阶...............................................................................................103
8.5 非层次聚类分析......................................................................................107
8.6 执行非层次聚类分析.............................................................................107
第9章 自组织映射....................................................................................110
9.1 自组织映射的概念.................................................................................110
9.2 基于自组织映射的分析实例................................................................111
9.3 基于自组织映射的分类........................................................................120
* 10章 主成分分析.................................................................................129
10.1 主成分分析的概念...............................................................................129
10.2 对象数据的准备...................................................................................132
10.3 执行主成分分析...................................................................................135
* 11章 对应分析......................................................................................141
11.1 对应分析.................................................................................................141
11.2 多重对应分析........................................................................................144
* 12章 关联规则分析............................................................................149
12.1 关联规则及其评价指标......................................................................149
12.2 关联规则分析的实例..........................................................................151
12.3 关联规则分析的应用实例..................................................................159
第III部分 数据挖掘实战 165
* 13章 对各种预测方法的评估........................................................167
13.1 关于预测方法的评估..........................................................................167
13.2 类别预测的判别方法的比较.............................................................168
13.2.1 Logistic回归分析.............................................................................168
13.2.2 决策树分析........................................................................................173
13.2.3 支持向量机........................................................................................175
13.3 数值预测方法的比较..........................................................................176
13.3.1 多元回归分析....................................................................................176
13.3.2 决策树分析........................................................................................178
13.3.3 支持向量机........................................................................................180
* 14章 用股价数据生成综合指数...................................................181
14.1 获取股价数据........................................................................................181
14.2 根据股价数据生成综合指数.............................................................183
* 15章 SNS数据的分析......................................................................189
15.1 微博API.................................................................................................189
15.2 通过R获取微博信息.........................................................................192
15.3 分词及词频统计...................................................................................195
15.4 词云图.....................................................................................................197

本目录推荐