大数据技术基础实验

定　价：¥48.00

作　者：	欧中洪
出版社：	北京邮电大学出版社
丛编项：
标　签：	暂缺

购买这本书可以去

ISBN：	9787563558735	出版时间：	2019-12-01	包装：
开本：	其他	页数：		字数：

内容简介

　　《大数据技术基础实验》为“大数据技术基础”的实验教程，可以和《大数据技术基础》教材配套使用。该书主要分为五大部分：大数据存储技术实验教程（分布式文件系统和NoSQL数据库），大数据处理框架实验教程（MapReduce和Spark、实时处理框架Storm和Flink），大数据分析技术实验教程（Druid、Drill、Kylin），大数据可视化实验教程，大数据综合应用实验案例。该书围绕典型大数据应用系统所需的各个组成部分设计实验，指导读者开展大数据应用实践。《大数据技术基础实验》可作为计算机学科相关专业，尤其是数据科学与大数据技术专业的专业教材，也可作为大数据相关专业从业人员的参考用书。

作者简介

　　欧中洪，北京邮电大学计算机学院副院长，副教授；科技部现代服务业共性服务联盟副秘书长，中国通信标准化协会TC11 VR/AR子工作组副组长，中国互联网协会青年专家。长期从事大数据分析、人工智能与深度学习、云计算与分布式系统等方面的研究工作。研究成果曾被BBC News，ACM TechNews，The Registry等国际知名媒体报道。主持或承担国家重点研发计划、国家科技支撑计划、国家自然科学基金项目等多项，发表高水平学术论文60余篇，其中SCI检索20余篇。担任多个国际知名期刊的审稿人，多个国际知名学术会议的程序委员会主席或委员。

图书目录

第1章大数据存储：分布式文件系统及NoSQL数据库实验教程1
1.1HDFS常用操作1
1.2HBase的安装6
1.3HBase的Shell连接与数据操作7
1.4Redis数据库的安装和使用11
1.5MongoDB数据库的安装和使用17
1.6Neo4j数据库的安装和使用22
第2章大数据处理：MapReduce处理框架实验教程27
2.1实验目的27
2.2实验要求27
2.3预备知识27
2.4实验内容(5个实验)28
2.5实验作业64
2.6扩展资料65
2.7参考答案78
第3章大数据处理：分布式处理框架Spark实验教程79
3.1Spark安装79
3.2Sparkshell83
3.3Spark Scala87
3.4Spark Python99
3.5Spark MLlib103
第4章大数据处理：实时处理框架实验教程110
4.1Storm伪分布式部署及其基本操作110
4.2Flume安装及其基本操作124
4.3Kafka安装及其基本操作131
4.4Spark Streaming安装及其基本操作135
4.5Flink安装及其基本操作150
第5章大数据分析：分布式数据查询实验教程164
5.1Hive的数据导入与数据查询164
5.2Druid的安装171
5.3Druid的数据摄入与数据查询175
5.4Drill的部署181
5.5Drill命令行与PyDrill的基础使用183
第6章大数据分析：Kylin多维分析实验教程186
6.1Kylin的安装186
6.2Demo案例实战189
6.3多维分析的Cube创建实战193
6.4通过RESTful访问Kylin208
第7章大数据可视化实验教程215
7.1ECharts数据可视化215
7.2Plotly数据可视化218
7.3D3.js绘制知识图谱222
第8章大数据综合实验案例231
8.1案例简介231
8.2实验步骤232
8.3数据集下载232
8.4数据集导入数据仓库Hive233
8.5Hive数据分析237
8.6数据挖掘240
参考文献247