注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书工具书科技工具书Hadoop简明教程

Hadoop简明教程

Hadoop简明教程

定 价:¥39.80

作 者: 刘科峰
出版社: 机械工业出版社
丛编项:
标 签: 暂缺

ISBN: 9787111719915 出版时间: 2023-07-01 包装: 平装
开本: 16开 页数: 186 字数:  

内容简介

  本书以Hadoop 3.3.0为核心,涵盖Hadoop生态系统的常用组件,主要介绍各组件的架构原理、Shell命令、常用API及编程等,并配有较多例题。全书共7章,内容包含Hadoop概述、Hadoop伪分布式安装、Hadoop分布式文件系统HDFS、分布式计算框架MapReduce、分布式数据库HBase、数据仓库Hive和内存计算框架Spark,第2~7章还设计了相关实验。本书可以作为高等院校大数据、计算机、应用统计等相关专业的教材,也可作为Hadoop爱好者的入门教程或自学参考用书。本书配有电子课件,欢迎选用本书作教材的教师登录www.cmpedu.com注册后下载,或加微信13910750469索取。

作者简介

暂缺《Hadoop简明教程》作者简介

图书目录

前言第1章Hadoop概述1.1大数据简介1.2Hadoop简介1.3Hadoop特性1.4Hadoop核心组件1.4.1HDFS1.4.2MapReduce1.4.3YARN1.5Hadoop生态系统1.5.1HBase1.5.2Hive1.5.3Pig1.5.4Spark1.5.5ZooKeeper1.5.6Sqoop1.5.7Flume1.5.8Mahout1.5.9Ambari1.6本章小结习题第2章Hadoop伪分布式安装2.1Linux操作系统2.1.1概述2.1.2Linux的组成2.1.3Linux的内核版本与发行版本2.1.4Linux基本命令2.2CentOS的安装2.2.1安装VMware Workstation2.2.2在VMware上安装CentOS 72.2.3配置CentOS 72.3Hadoop伪分布式安装与配置2.3.1安装WinSCP2.3.2安装JDK2.3.3安装Hadoop2.4本章小结习题实验Hadoop伪分布式安装与配置第3章Hadoop分布式文件系统HDFS3.1HDFS的架构和原理3.1.1计算机集群结构3.1.2HDFS的假设前提和设计目标3.1.3HDFS的相关概念3.1.4HDFS体系结构3.1.5HDFS存储原理3.2HDFS Shell3.3HDFS Java API3.3.1搭建Linux操作系统下的Eclipse开发环境3.3.2HDFS Java API常用的类3.3.3HDFS Java API 编程3.4本章小结习题实验HDFS基本命令的使用和HDFS的Java编程第4章分布式计算框架MapReduce4.1认识MapReduce4.1.1分布式并行编程4.1.2MapReduce核心思想4.1.3MapReduce运行环境4.1.4Hadoop内置数据类型4.2MapReduce工作流程4.2.1MapReduce工作流程概述4.2.2Shuffle过程分析4.3MapReduce入门示例:WordCount4.3.1WordCount程序任务4.3.2准备被统计的文件4.3.3WordCount执行过程分析4.3.4WordCount编程实践4.4MapReduce应用实例4.4.1求平均值4.4.2简单查询功能的实现4.5本章小结习题实验简单排序的实现第5章分布式数据库HBase5.1概述5.1.1BigTable简介5.1.2HBase简介5.1.3HBase具有的特点5.2HBase数据模型5.2.1数据模型概述5.2.2数据模型的相关概念5.3HBase系统架构5.4HBase伪分布式安装5.4.1安装并配置环境变量5.4.2配置HBase参数5.4.3验证HBase5.5HBase Shell5.5.1HBase Shell常用命令5.5.2HBase Shell应用实例5.6HBase Java API5.6.1HBase Java API 简介5.6.2HBase Java API 编程5.7本章小结习题实验HBase编程实践第6章数据仓库Hive6.1概述6.1.1数据仓库简介6.1.2Hive简介6.1.3Hive与关系型数据库的区别6.1.4Hive系统架构6.2Hive伪分布式安装6.2.1MySQL的安装和配置6.2.2Hive的安装和配置6.3Hive编程基础6.3.1Hive的数据类型6.3.2数据库相关操作6.3.3表相关操作6.3.4表中数据的加载6.3.5HiveQL基本查询6.3.6Hive函数6.4Hive编程实例6.4.1雇员表统计6.4.2词频统计6.5本章小结习题实验Hive的编程实践第7章内存计算框架Spark7.1Spark基础知识7.1.1Spark简介7.1.2Spark生态系统7.1.3Spark运行架构7.2Scala基础知识7.2.1Scala简介7.2.2Scala安装7.2.3Scala编程7.3Spark伪分布式安装7.3.1Spark的安装模式7.3.2Spark的安装7.4RDD编程基础7.4.1Spark Shell的启动和退出7.4.2RDD创建7.4.3常用的RDD操作7.4.4RDD编程实例7.5IDEA的安装和使用7.5.1IDEA的安装7.5.2IDEA的使用7.5.3独立应用程序实例7.6本章小结习题实验Spark Shell交互式编程参考文献

本目录推荐