注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络图形图像、多媒体、网页制作视频/音频/流媒体基于Rattle的可视化数据挖掘技术

基于Rattle的可视化数据挖掘技术

基于Rattle的可视化数据挖掘技术

定 价:¥39.00

作 者: 张冬慧
出版社: 清华大学出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787302474326 出版时间: 2017-07-01 包装:
开本: 页数: 字数:  

内容简介

  数据挖掘技术近年来发展异常迅猛,已成为大数据时代*热门的技术和研究热点,不仅产生了大量不同类型、功能强大的数据挖掘算法,而且推动了众多数据挖掘工具软件的发展。在这些软件中,R语言是数据挖掘领域*重要的软件之一。Rattle是一种用于数据挖掘的R语言的图形交互界面,或称为可视化数据挖掘工具。Rattle给出了从数据整理到模型评价的完整解决方案。本书主要介绍如何用Rattle包进行数据挖掘,全书共9章,通过大量精选实例,循序渐进、全面系统地讲述数据挖掘过程。本书不仅是从事数据挖掘和大数据分析工程技术人员开发相关系统的技术资料,也可作为学习数据挖掘和大数据分析等课程的参考用书。

作者简介

暂缺《基于Rattle的可视化数据挖掘技术》作者简介

图书目录


目 录第1章绪论11.1数据挖掘的认识11.1.1为什么要进行数据挖掘11.1.2数据挖掘过程11.1.3数据挖掘九大定律31.2R与Rattle31.2.1R语言31.2.2R语言的基本语法41.2.3R语言的优势101.2.4Rattle包101.3本章小结12 第2章入门指南132.1概述132.2认识Rstudio132.2.1Rstudio的界面132.2.2R脚本编辑区142.2.3R命令控制台152.2.4工作空间162.2.5结果展示区182.3认识Rattle202.3.1Rattle的安装与启动202.3.2选项卡212.3.3工具栏24基于Rattle的可视化数据挖掘技术目录2.3.4菜单栏242.3.5属性面板262.4本章小结26 第3章数据准备283.1概述283.2数据283.2.1术语283.2.2变量293.2.3数据集303.3可用数据303.4数据质量313.4.1数据质量概述313.4.2数据质量评估维度313.4.3影响数据质量的因素313.5数据匹配323.6数据仓库333.7数据访问343.8载入数据353.8.1载入CSV数据353.8.2载入数据库363.8.3载入SPSS类型数据383.8.4载入自带数据集383.8.5载入网页数据383.8.6载入其他格式的数据393.9本章小结39 第4章数据理解414.1概述414.2汇总数据414.2.1查看数据的简单信息414.2.2查看数据的细节信息434.2.3查看数据的分布信息434.2.4查看数据的缺失值444.3数据分布图464.3.1数值型变量分布图464.3.2分类变量分布图504.3.3散点图矩阵524.4相关分析534.4.1相关矩阵和相关图534.4.2缺失值的相关分析554.4.3相关树564.5主成分分析604.6交互式探索数据624.6.1安装GGobi634.6.2安装rggobi634.6.3实验指导644.7本章小结64 第5章数据检验665.1概述665.2KS正态性检验675.3Wilcoxon检验685.4t检验705.5F检验725.6本章小结73 第6章数据变换756.1概述756.2取值范围调整776.3缺失值填充796.4变量类型转换816.4.1数值变量离散化816.4.2分类变量指标化816.4.3分类变量合并836.4.4分类变量和数值变量互相转换836.4.5变量和数据的删除836.5离群点数据的处理846.6本章小结86 第7章数据建模877.1概述877.2聚类模型967.2.1背景967.2.2Kmeans聚类967.2.3Ewkm聚类1007.2.4层次聚类1017.2.5双向聚类1057.3关联规则挖掘1067.3.1背景1067.3.2基本术语1077.3.3关联规则分类1087.3.4Apriori算法1087.3.5实验指导1097.4传统决策树模型1147.4.1背景1147.4.2ID3算法1157.4.3C4.5算法1167.4.4实验指导1177.5随机森林决策树模型1207.5.1背景1207.5.2随机森林算法1217.5.3实验指导1227.6自适应选择决策树模型1267.6.1背景1267.6.2Boosting算法1277.6.3Adaboost算法1277.6.4实验指导1287.7SVM1317.7.1背景1317.7.2SVM算法1317.7.3实验指导1337.8线性回归模型1347.8.1背景1347.8.2一元线性回归方法1357.8.3实验指导1377.9神经网络模型1387.9.1背景1387.9.2人工神经网络模型1397.9.3实验指导1427.10本章小结143 第8章模型评估1478.1概述1478.2数据集1488.3混淆矩阵1498.3.1二分类混淆矩阵1498.3.2模型评价指标1508.3.3多分类混淆矩阵1518.4风险图1518.4.1风险图的作用1518.4.2实验指导1528.5ROC曲线1548.5.1ROC曲线的定义1548.5.2ROC曲线的作用1548.5.3实验指导1558.6其他模型评估图1568.7本章小结157 第9章模型部署1599.1概述1599.2模型的应用1599.3转换为PMML1619.4电商数据挖掘案例1629.4.1背景1629.4.2数据理解1629.4.3数据准备1639.4.4清洗数据1669.4.5探索数据1679.4.6数据建模1729.5本章小结174 参考文献175

本目录推荐