注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络家庭与办公软件流数据分析技术

流数据分析技术

流数据分析技术

定 价:¥38.00

作 者: 李静林,袁泉 著
出版社: 北京邮电大学出版社
丛编项: 普通高等教育“十三五”规划教材,数据科学与大数据技术专业教材丛书
标 签: 暂缺

购买这本书可以去


ISBN: 9787563559152 出版时间: 2020-01-01 包装: 平装
开本: 16开 页数: 180 字数:  

内容简介

  流数据分析技术是一种实时或准实时的,对动态数据集合甚至无界时间序列数据进行特征和态势认知的技术,目前已经广泛应用于互联网/移动互联网、物联网、气象、金融等多个领域,支撑运营管理、应用性能管理、监测与测控等多种服务,是大数据的重要研究方向之一。《流数据分析技术》以流数据的基本特征为核心内容,突出流数据与传统大数据的联系与区别,介绍流数据的基本处理方法和分析方法。重点内容包括:流数据与流式计算、流数据处理技术、流数据分析技术、流数据处理模型与处理框架等。《流数据分析技术》还介绍了流数据分析技术的一些新进展及流计算框架的新发展。《流数据分析技术》可作为计算机学科相关专业,特别是数据科学与大数据技术专业的教材。

作者简介

  李静林,博士、副教授,2004年获得北京邮电大学计算机应用技术博士学位。现任北京邮电大学网络与交换技术国家重点实验室交换与智能控制研究中心主任。主要研究方向为移动互联网、物联网、车联网等融合网络智能与服务计算。

图书目录

第1章 流数据与流计算
1.1 大数据
1.1.1 大数据的发展
1.1.2 大数据的概念
1.1.3 大数据思维
1.2 流数据
1.2.1 流数据的场景
1.2.2 流数据的特点
1.2.3 流数据的概念
1.3 流数据处理
1.3.1 批处理模型
1.3.2 流式处理模型
1.3.3 流式处理与窗口模型
1.3.4 流式处理与概要结构
1.3.5 批处理与流式处理的对比
1.4 流数据分析
1.4.1 频繁项挖掘算法
1.4.2 聚类算法
1.4.3 分类算法
1.4.4 回归算法
1.5 流数据机器学习
1.6 小结
本章知识点
扩展阅读
习题1
第2章 流数据概要结构构建技术
2.1 流数据处理的概要结构
2.2 抽样概要结构
2.2.1 抽样
2.2.2 伯努利抽样
2.2.3 水库抽样
2.2.4 简明抽样
2.3 草图概要结构
2.3.1 草图
2.3.2 计数草图
2.3.3 增广草图
2.3.4 布隆过滤器
2.3.5 FM基数估计草图
2.4 小波概要结构
2.5 直方图概要结构
2.5.1 直方图
2.5.2 等宽直方图
2.6 小结
本章知识点
扩展阅读
习题2
第3章 流数据频繁模式挖掘技术
3.1 频繁模式挖掘问题的定义
3.2 不同窗口模型的频繁模式挖掘
3.3 频繁项挖掘算法
3.3.1 黏性抽样算法
3.3.2 KPS算法
3.4 频繁模式挖掘算法
3.4.1 有损计数算法
3.4.2 有损计数算法扩展
3.5 频繁模式挖掘的其他相关问题
3.6 小结
本章知识点
扩展阅读
习题3
第4章 流数据聚类分析技术
4.1 聚类算法
4.2 流数据聚类的评价
4.2.1 内部度量
4.2.2 外部度量
4.3 不同窗口模型的聚类分析
4.4 基于划分的流数据聚类算法
4.4.1 STREAM算法
4.4.2 K-Center算法
4.5 基于层次的流数据聚类算法
4.6 基于密度的流数据聚类算法
4.7 基于网格的流数据聚类算法
4.8 其他流数据聚类算法
4.8.1 K-Median算法
4.8.2 BIRCH算法
4.9 小结
本章知识点
扩展阅读
习题4
第5章 流数据分类分析技术
5.1 。分类算法
5.2 流数据分类的评价
5.2.1 误差估计
5.2.2 性能评价指标
5.2.3 统计显著性
5.2.4 成本度量
5.3 基于贝叶斯的分类算法
5.4 基于决策树的分类算法
5.4.1 快速决策树算法
5.4.2 概念自适应快速决策树算法
5.5 其他流数据分类算法
5.5.1 VFDTc和UFFT算法
5.5.2 Hoeffding自适应树算法
5.6 小结
本章知识点
扩展阅读
习题5
第6章 流数据学习与时间序列分析技术
6.1 时间序列
6.1.1 时间序列的分类与特征
6.1.2 时间序列的表示与拟合
6.1.3 时间序列的预测
6.2 在线学习模型
6.3 流数据学习评价
6.3.1 误差
6.3.2 Regret界
6.4 模型学习算法
6.4.1 ARIMA算法
6.4.2 在线ARIMA算法
6.5 实例学习算法
6.5.1 岭回归与LASSO回归
6.5.2 FIMT算法
6.5.3 AMRules算法
6.6 最优化算法
6.6.1 SGD算法
6.6.2 FTRL算法
6.7 小结
本章知识点
扩展阅读
习题6
第7章 流数据处理模型与框架
7.1 流数据处理计算模型
7.2 流计算的状态与一致性
7.2.1 流计算的状态
7.2.2 流计算的一致性
7.3 流计算处理中的时间
7.4 流计算实现框架
7.5 Storm流处理框架
7.5.1 基于流的处理拓扑结构
7.5.2 记录级容错
7.5.3 Storm的系统架构
7.6 Spark流处理框架
7.6.1 基于RDD的微批处理结构
7.6.2 基于RDD依赖的容错
7.6.3 Spark的系统架构
7.7 Flink流处理框架
7.7.1 基于流水线的处理结构
7.7.2 基于分布式快照的容错
7.7.3 Flink的系统架构
7.8 小结
本章知识点
扩展阅读
习题7
参考文献

本目录推荐