注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络软件与程序设计R语言数据分析:基础、算法与实战

R语言数据分析:基础、算法与实战

R语言数据分析:基础、算法与实战

定 价:¥99.00

作 者: 孙玉林 编著
出版社: 化学工业出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787122436009 出版时间: 2023-09-01 包装: 平装
开本: 16开 页数: 276 字数:  

内容简介

  本书基于主流统计分析编程语言R,介绍了常用的数据分析方法及其实战应用,内容涵盖了R语言的使用、基于ggplot2包及其拓展包的数据可视化、数据的清洗与探索、数据分析、数据挖掘以及统计分析方法等。本书在讲解数据分析时,主要基于tidyverse系列包进行数据整理、操作与可视化,基于tidymodels系列包进行数据分析、统计分析、机器学习等算法的应用,其它的R包用于数据分析的辅助。使用R语言时,遵循更新更简洁的编程方式。本书内容循序渐进,讲解通俗易懂,同时配套源程序和数据文件,读者可以边学边实践。本书可供从事数据分析、数据可视化、机器学习的科研及技术人员阅读使用,也可作为高等院校中统计学、计算机科学等相关专业的教材。

作者简介

  无

图书目录

第1章 R语言与数据分析 001
1.1 R与RStudio安装 002
1.1.1 R语言安装 002
1.1.2 RStudio安装 003
1.1.3 R包安装 005
1.2 数据分析简介 007
1.2.1 数据分析的内容 007
1.2.2 数据分析工作流程 010
1.2.3 什么是数据分析师 012
1.2.4 数据分析师需要的技术和知识 012
1.3 R语言与数据分析 012
1.3.1 R语言为何适合数据分析 012
1.3.2 R语言常用数据分析包 013
1.4 本章小结 016
第2章 R语言快速入门 017
2.1 向量的数据类型 018
2.1.1 数值型 018
2.1.2 逻辑值型 020
2.1.3 字符型 020
2.1.4 因子型 022
2.2 矩阵与高维数组 023
2.2.1 矩阵 023
2.2.2 高维数组 025
2.3 数据框与列表 027
2.3.1 数据框 027
2.3.2 列表 030
2.4 条件判断与循环语句 032
2.4.1 条件判断语句 032
2.4.2 循环语句 033
2.5 编写自己的函数 035
2.6 本章小结 037
第3章 R语言数据管理与操作 039
3.1 数据导入与保存 040
3.1.1 数据导入 040
3.1.2 数据保存 042
3.2 处理缺失值 042
3.2.1 缺失值发现 043
3.2.2 缺失值填充 044
3.3 数据操作 046
3.3.1 数据并行计算 046
3.3.2 数据选择、过滤、分组 050
3.3.3 数据融合 059
3.3.4 进行长宽数据转换 061
3.4 其它数据处理 062
3.4.1 lubridate包处理时间数据 062
3.4.2 stringr包处理文本数据 066
3.5 本章小结 072
第4章 R语言数据可视化 073
4.1 R语言基础绘图系统 074
4.1.1 基础绘图系统可视化基本设置 074
4.1.2 基础绘图系统可视化实战 078
4.2 ggplot2包数据可视化 084
4.2.1 使用图层构建图像 085
4.2.2 ggplot2可视化进阶 092
4.3 R语言其它数据可视化包 100
4.3.1 GGally包数据可视化 100
4.3.2 ggChernoff包数据可视化 103
4.3.3 ggTimeSeries包数据可视化 104
4.3.4 pheatmap包数据可视化 106
4.3.5 igraph包数据可视化 108
4.3.6 wordcloud包数据可视化 111
4.3.7 ComplexUpset包数据可视化 112
4.4 本章小结 114
第5章 R语言数据分析 115
5.1 相关性分析 116
5.1.1 相关系数介绍 116
5.1.2 相关系数计算与可视化分析 117
5.2 方差分析 118
5.2.1 单因素方差分析 118
5.2.2 双因素方差分析 120
5.3 降维 123
5.3.1 常用数据降维算法 123
5.3.2 数据降维实战 125
5.4 回归分析 133
5.4.1 常用回归算法 133
5.4.2 回归评价指标 135
5.4.3 数据回归实战 136
5.5 分类 147
5.5.1 常用分类算法 147
5.5.2 分类评价指标 153
5.5.3 数据分类实战 154
5.6 聚类 165
5.6.1 常用数据聚类算法 165
5.6.2 聚类评价指标 168
5.6.3 数据聚类实战 168
5.7 时间序列预测 173
5.7.1 时序预测的相关模型 173
5.7.2 时间序列预测实战 176
5.8 本章小结 185
第6章 综合案例1:中药材鉴别 187
6.1 聚类算法鉴别药材种类 189
6.1.1 数据探索与可视化 189
6.1.2 数据降维与特征提取 192
6.1.3 数据聚类 193
6.2 分类算法鉴别药材的产地 195
6.2.1 数据导入与探索 195
6.2.2 选择数据中的重要特征 197
6.2.3 鉴别药材的产地 200
6.3 分类算法鉴别药材的类别 202
6.3.1 数据导入与探索 202
6.3.2 数据特征降维 204
6.3.3 预测药材的类别 205
6.4 分类算法预测药材的产地 210
6.4.1 数据导入与探索 210
6.4.2 数据特征降维 212
6.4.3 预测药材的产地 213
6.5 本章小结 220
第7章 综合案例2:抗乳腺癌候选药物分析 221
7.1 数据特征提取 224
7.1.1 数据可视化探索 225
7.1.2 特征选择 228
7.2 回归模型预测生物活性 232
7.2.1 利用随机森林提取的特征建立回归模型 232
7.2.2 利用Lasso回归提取的特征建立回归模型 235
7.3 分类模型预测二分类变量 236
7.3.1 通过递归特征消除提取特征建立分类模型 236
7.3.2 通过主成分降维提取特征建立分类模型 241
7.4 本章小结 244
第8章 综合案例3:文本内容数据分析 245
8.1 文本预处理 248
8.1.1 读取文本数据 248
8.1.2 文本数据清洗 249
8.2 特征提取与可视化 252
8.2.1 TF特征 253
8.2.2 TF-IDF特征 254
8.2.3 词云可视化 255
8.3 文本聚类 256
8.3.1 LDA主题模型聚类 256
8.3.2 K均值聚类 261
8.4 对文本进行分类 264
8.4.1 基于TF-IDF特征建立分类模型 264
8.4.2 基于TF特征建立分类模型 266
8.5 中文文本数据分析 268
8.5.1 《三国演义》文本数据预处理 269
8.5.2 对文本数据探索与特征提取 270
8.5.3 建立LDA主题模型 273
8.6 本章小结 276
参考文献 277

本目录推荐