注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库用商业案例学R语言数据挖掘

用商业案例学R语言数据挖掘

用商业案例学R语言数据挖掘

定 价:¥69.00

作 者: 常国珍,曾珂,朱江 著;经管之家 编
出版社: 电子工业出版社
丛编项:
标 签: >计算机/网络 >数据仓库与数据挖掘 >数据库

购买这本书可以去


ISBN: 9787121319587 出版时间: 2017-08-01 包装: 平装
开本: 16开 页数: 460 字数:  

内容简介

  商业智能时代已经全面到来,分析型人才的岗位数量在就业市场中呈现井喷式增长。无论是从事产品研发的工程师,还是从事产品推广的市场人员、人力资源和财务会计人员,都需要掌握数据分析技术,否则很有可能被人工智能替代。《用商业案例学R语言数据挖掘》包括18章,涉及使用R语言做数据分析和数据挖掘的主要分析方法。其中,第1、2章为数据分析方法概述,第3章为R语言编程基础,第4章到第8章为统计学习方法,第9章到第16章为数据挖掘方法,第17章为特征工程,第18章为R文本挖掘。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的练习题。《用商业案例学R语言数据挖掘》作为CDA数据分析师系列丛书中《如虎添翼》和《胸有成竹》的姊妹篇,将前两本书的内容进行整合并做了重大拓展,而且秉承了该系列丛书的特点:内容精炼、重点突出、示例丰富、语言通俗。可以作为广大从业人员自学商业数据分析的读物,适合大中专院校师生学习和阅读,同时也可以作为高等院校商科、社会科学及相关培训机构的教材。

作者简介

暂缺《用商业案例学R语言数据挖掘》作者简介

图书目录

第1 章 商业数据分析基础 1
1.1 商业数据分析的本质 1
1.2 商业数据分析中心的建设 3
第2 章 数据分析的武器库 5
2.1 数据挖掘简介 5
2.2 R 语言简介 13
2.3 R 与RStudio 的下载和安装 15
2.4 在RStudio 中安装包 20
2.5 练习题 22
第3 章 R 语言编程 23
3.1 R 的基本数据类型 23
3.2 R 的基本数据结构 24
3.3 R 的程序控制 34
3.4 R 的函数 41
3.5 R 的日期与时间数据类型 42
3.6 在R 中读写数据 43
3.7 练习题 47
第4 章 R 描述性统计分析与绘图 48
4.1 描述性统计分析 48
4.2 制图的步骤 60
4.3 R 基础绘图包 63
4.4 ggplot2 绘图 74
4.5 练习题 79
第5 章 数据整合和数据清洗 80
5.1 数据整合 80
5.2 R 中的高级数据整合 96
5.3 R 中的抽样 101
5.4 R 的数据清洗 103
5.5 练习题 110
第6 章 统计推断基础 111
6.1 基本的统计学概念 111
6.2 假设检验与单样本t 检验116
6.3 双样本t 检验 119
6.4 方差分析(分类变量和连续变量关系检验) 121
6.5 相关分析(两连续变量关系检验) 127
6.6 卡方检验(二分类变量关系检验) 134
6.7 练习题 137
第7 章 客户价值预测:线性回归模型与诊断 139
7.1 相关性分析 139
7.2 线性回归 139
7.3 线性回归诊断 150
7.4 正则化方法 159
7.5 练习题 169
第8 章 Logistic 回归构建初始信用评级 170
8.1 Logistic 回归的相关关系分析 170
8.2 Logistic 回归模型及实现 171
8.3 最大熵模型与极大似然法估计 179
8.4 模型评估 187
8.5 练习题 193
第9 章 使用决策树进行信用评级 195
9.1 决策树建模思路 195
9.2 决策树算法 197
9.3 在R 中实现决策树 209
9.4 组合算法(Ensemble Learning) 214
9.5 练习题 234
第10 章 神经网络 235
10.1 神经元模型 235
10.2 人工神经网络模型 237
10.3 单层感知器 239
10.4 BP 神经网络 242
10.5 RBF 神经网络 246
10.6 神经网络设计与R 代码实现 253
10.7 练习题 261
第11 章 分类器入门:最近邻域与贝叶斯网络 263
11.1 分类器的概念 263
11.2 KNN 算法 264
11.3 朴素贝叶斯 269
11.4 贝叶斯网络 273
11.5 练习题 281
第12 章 高级分类器:支持向量机 282
12.1 线性可分与线性不可分 282
12.2 线性可分支持向量机 283
12.3 线性支持向量机 291
12.4 非线性支持向量机 297
12.5 R 中的支持向量机 303
12.6 练习题 306
第13 章 连续变量的维度归约 307
13.1 维度归约方法概述 307
13.2 主成分分析 308
13.3 因子分析 314
13.4 奇异值分解 320
13.5 对应分析和多维尺度分析 326
13.6 练习题 334
第14 章 聚类 336
14.1 聚类分析概述 337
14.2 聚类算法逻辑 337
14.3 层次聚类 339
14.4 k-means 聚类 342
14.5 基于密度的聚类 346
14.6 聚类模型的评估 349
14.7 高斯混合模型(Gaussian Mixture Model) 352
14.8 客户分群 364
14.9 练习题 379
第15 章 关联规则与推荐算法 380
15.1 长尾理论 380
15.2 关联规则 383
15.3 序贯模型 390
15.4 推荐算法与推荐系统 395
15.5 练习题 406
第16 章 时间序列建模 407
16.1 认识时间序列 407
16.2 简单时间序列分析 409
16.3 平稳时间序列分析ARMA 模型 419
16.4 非平稳时间序列分析ARIMA 模型 434
第17 章 特征工程(Feature Engineering)(博文视点官方网站下载) 446
17.1 特征工程概述 446
17.2 数据预处理(Data Preprocessing) 447
17.3 特征构造(Feature Construction) 460
17.4 特征抽取(Feature Extraction) 461
17.5 特征选择(Feature Selection) 466
第18 章 R 文本挖掘(博文视点官方网站下载) 471
18.1 文本挖掘 471
18.2 文本清洗 473
18.3 中文分词与文档模型 476
18.4 文本的特征选择及相关性度量 481
18.5 文本分类 487
18.6 主题模型 489
18.7 综合案例 495
附录A 数据说明(博文视点官方网站下载) 500

本目录推荐