注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络家庭与办公软件大数据分析方法

大数据分析方法

大数据分析方法

定 价:¥48.00

作 者: 陆红 著
出版社: 中国财富出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787504764164 出版时间: 2017-04-01 包装: 平装
开本: 16开 页数: 160 字数:  

内容简介

  本书围绕大数据分析方法,阐述了大数据采集方法,大数据清洗方法,详细介绍了大数据存储方法,大数据分布式计算方法,大数据分析模型构建方法,大数据分析模型检验方法,大数据分析模型优化方法。全书提供了大量的案例,对程序进行了详细的分析和解读。本书的实用价值较高,对从事大数据分析的科研人员、研发人员具有一定的借鉴参考作用。

作者简介

  陆红,副教授,北京信息职业技术学院技术应用研究所所长,多年从事计算机领域研究,主要研究方向:大数据、人工智能、软件技术。主持多项省部级课题,其中一项获教育部科技成果奖。编写多部著作,发表多篇相关领域的学术论文。作为多个部委专家,主持完成多个部委信息化建设标准制定工作。主持完成多个部委信息化建设项目。

图书目录

1大数据采集处理方法1
1.1爬虫程序设计方案1
1.2爬虫程序实现方法5
1.3数据清洗20
2大数据存储方法27
2.1分布式文件系统存储大数据27
2.1.1HDFS体系结构27
2.1.2HDFS数据存储方式28
2.1.3HDFS读写方式28
2.2分布式数据库存储大数据32
2.2.1Hbase体系结构32
2.2.2配置Hbase33
2.2.3Hbase表操作38
2.2.4访问Hbase数据资源44
3大数据计算方法50
3.1分布式计算平台构建方法50
3.2分布式计算框架构建方法60
3.3分布式计算程序设计方法63
4大数据分析模型构建方法78
4.1准备训练数据78
4.2机器学习路径和算法设计方法82
4.3数据可视化辅助建模方法88
4.4构建大数据分析模型91
5大数据分析模型检验方法108
5.1回归诊断108
5.2交叉验证113
6大数据分析模型优化方法117
6.1Feature Scaling优化法117
6.2逐步回归优化法118
6.3PCA主成分分析优化方法120
6.4神经网络优化大数据分析模型127
参考文献151

本目录推荐