《大数据基础/新世纪高职高专大数据专业系列规划教材》的体系结构及知识点的分布按照学习思维逻辑由浅入深、循序渐进、以学代教的模式编排,编者建议学者按照项目编排顺序学习和开展实训,这样有利于较为全面地了解大数据技术及应用。《大数据基础/新世纪高职高专大数据专业系列规划教材》共9个项目,主要内容安排如下:项目1主要从理论方面介绍了大数据的基本特征、大数据的影响、大数据处理的基本流程以及大数据与云计算、物联网的关系。介绍了Hadoop生态系统中主要组件的功能以及Hadoop在各个行业中的应用。项目2完成了在VirtualBox下安装Ubuntu操作系统、Ubuntu的网络配置,以及安装和配置FTP软件FileZilla,利用FileZilla软件在Windows系统和Linux系统之间传输文件。项目3完成了Hadoop在虚拟机环境下的单机模式安装和伪分布模式安装,并介绍了伪分布模式下的单词统计实例。项目4介绍了HDFS的工作原理以及文件操作,通过读文件、写文件、判断文件是否存在三个案例的学习完成在Eclipse中编写程序、编译程序、部署程序。项目5介绍了HBase基本概念、体系架构,接着完成了单机模式和伪分布模式的安装与配置,后完成Eclipse环境中HBaseJavaAPI编程环境的配置以及使用JavaAPI提供的类实现数据库存储管理。项目6主要通过MapReduce编程模型的学习,完成英语单词统计和气象数据分析,深刻理解并学会运用MapReduce系统。项目7通过Hive的学习学会建数据库和表、管理数据库和表、Hive数据导入和导出等相关操作。后完成Hive在交易数据统计分析中的应用。项目8首先介绍了Flume的安装与配置以及利用Flume将日志采集到HDFS,然后介绍了Sqoop的功能以及利用Sqoop实现了关系数据库MySQL与Hadoop生态系统HDFS和Hive之间数据相互迁移。项目9介绍了数据可视化的概念和常用工具等,然后通过Echarts绘制简单图表示例的介绍读者一步一步绘制未来一周气温变化图和网站访问量统计图。