注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库大数据分析理论与技术

大数据分析理论与技术

大数据分析理论与技术

定 价:¥78.00

作 者: 罗森林 潘丽敏 著
出版社: 北京理工大学出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787576309201 出版时间: 2022-02-01 包装: 平装
开本: 16开 页数: 字数:  

内容简介

  本书系统、全面地研究和论述大数据分析理论与技术,主要内容包括大数据分析基础认知、大数据分析核心架构、大数据分析计算模式、大数据与网络空间安全、大数据与自然语言处理、大数据与医学信息处理。本书可满足各类高校多样化人才长期培养的需求,可供从事网络空间安全、计算机科学与技术、软件工程、人工智能、信息与通信工程等相关学科专业的教学、科研、应用人员阅读和使用,对从事大数据分析相关研究的人员具有重要的实用和参考价值。此外,本书也可供其他非专业及相关研究人员参考使用,具有重要的指导意义。

作者简介

  罗森林,1968年出生,教授、博导。1992、1995年分获得哈尔滨电工学院电子工程系电磁测量及仪表专业学士和硕士学位;1998年获得北京理工大学电子工程系通信与电子系统博士学位;2000年10月于中国科学院计算技术研究计算机科学博士后流动站出站后到北京理工大学工作。北京市教学名师,信息与通信工程学科责任教授、信息对抗技术专业责任教授,信息系统及安全对抗实验中心(工信部)主任、信息安全与对抗技术研究所所长,深圳北理莫斯科大学电子与计算机专业责任教授,首批国家一流本科专业、*、北京市、国防特色专业和工信部重点专业建设负责人。出版著作15部(规划教材4部,北京市精品教材4部),累计出版5万册以上。发表学术论文200多篇,获批专利近30项,国内项信息安全与对抗技术竞赛(ISCC)发起人(2004起每年1届,18届累计参赛者超过7.2万人,每年参加院校数1000多所),在线开放课程7门次(6门次,累计学习者7.5万人次以上),获省部级以上荣誉近50项。国家网络安全产业园区专家咨询委员会委员,中国兵工学会理事会理事,中国兵器学会信息安全与对抗专业委员会总干事,广西信息安全学会理事长,中国计算机用户协会信息安全分会副理事长,中国人工智能学会人工智能与安全专业委员会常务委员,北京高校“习近平新时代中国特色社会主义思想”市级思想政治理论课授课教师,北京理工大学课程思政研究中心专家,北京理工大学教师发展指导专家等。

图书目录

第1章  大数据分析基础认知 001
1.1 引言 001
1.2 知识基础 001
1.2.1 基本概念 001
1.2.2 数据科学与其他学科的关系 004
1.3 历史现状 006
1.3.1 发展历史 006
1.3.2 研究现状 008
1.3.3 中国大数据研究与发展战略 010
1.4 主要应用 011
1.4.1 互联网行业主要应用 011
1.4.2 医疗行业主要应用 012
1.4.3 金融行业主要应用 014
1.4.4 交通行业主要应用 014
1.4.5 教育行业主要应用 014
1.5 存在问题 015
1.5.1 数据存储 015
1.5.2 信息安全 015
1.5.3 数据共享 017
1.6 发展趋势 018
1.6.1 大数据技术发展趋势 018
1.6.2 大数据应用发展趋势 019
1.7 小结 021
1.8 习题 022
第2章  大数据分析核心架构 023
2.1 引言 023
2.2 数据分析架构认知基础 023
2.2.1 软件架构 023
2.2.2 数据库及管理系统 026
2.2.3 并行计算 028
2.2.4 分布式计算 029
2.2.5 云计算 032
2.3 分析架构Hadoop 034
2.3.1 Hadoop基础知识 034
2.3.2 Hadoop系统架构 035
2.3.3 Hadoop典型案例 040
2.3.4 Hadoop编程接口 042
2.4 分布式文件系统HDFS 046
2.4.1 HDFS基础知识 046
2.4.2 HDFS系统架构 047
2.4.3 HDFS主要特征 049
2.4.4 HDFS编程接口 051
2.5 分析架构Spark 055
2.5.1 Spark基础知识 055
2.5.2 Spark系统架构 056
2.5.3 Spark主要特征 059
2.5.4 Spark典型案例 061
2.5.5 Spark编程接口 063
2.6 分布式数据库Hbase 066
2.6.1 Hbase基础知识 066
2.6.2 Hbase系统架构 067
2.6.3 Hbase主要特征 069
2.6.4 Hbase编程接口 071
2.7 数据仓库Hive 073
2.7.1 Hive基础知识 073
2.7.2 Hive系统架构 074
2.7.3 Hive主要特征 076
2.7.4 Hive编程接口 077
2.8 小结 079
2.9 习题 080
第3章  大数据分析计算模式 081
3.1 引言 081
3.2 数据分析挖掘认知基础 081
3.2.1 模式识别认知基础 081
3.2.2 数据挖掘认知基础 084
3.3 静态批处理MapReduce 087
3.3.1 基础知识 087
3.3.2 编程模型 088
3.3.3 体系结构 090
3.3.4 工作流程 092
3.3.5 容错机制 095
3.3.6 编程实例 095
3.3.7 典型案例 099
3.4 实时流计算Storm 100
3.4.1 基础知识 100
3.4.2 编程模型 101
3.4.3 体系结构 104
3.4.4 工作流程 104
3.4.5 容错机制 105
3.4.6 编程实例 106
3.4.7 典型案例 107
3.5 图计算Pregel 108
3.5.1 基础知识 108
3.5.2 编程模型 109
3.5.3 体系结构 111
3.5.4 工作流程 112
3.5.5 容错机制 113
3.5.6 编程实例 114
3.5.7 典型案例 116
3.6 数据可视化 118
3.6.1 可视化简介 118
3.6.2 可视化方法 119
3.6.3 可视化技术 122
3.6.4 可视化工具 124
3.6.5 可视化案例 125
3.6.6 可视化发展趋势 126
3.7 小结 127
3.8 习题 127
第4章  大数据与网络空间安全 129
4.1 引言 129
4.2 网络空间安全认知基础 129
4.2.1 信息网络知识基础 130
4.2.2 信息安全对抗的基本概念 132
4.2.3 信息安全对抗基础理论概述 134
4.3 网络空间安全大数据基础资源 137
4.3.1 用户数据 137
4.3.2 行业数据 137
4.3.3 流量日志数据 139
4.3.4 网络舆情数据 139
4.3.5 应用数据集 139
4.4 网络空间大数据安全分析 141
4.4.1 安全事件关联分析 141
4.4.2 网络异常检测分析 143
4.4.3 数据内容安全分析 146
4.4.4 安全态势感知分析 148
4.4.5 安全分析应用案例 152
4.5 网络空间大数据安全防护 156
4.5.1 大数据的威胁与攻击 156
4.5.2 大数据安全防护技术 160
4.5.3 大数据安全建设案例 166
4.6 小结 171
4.7 习题 171
第5章  大数据与自然语言处理 173
5.1 引言 173
5.2 自然语言处理认知基础 174
5.2.1 研究简史 174
5.2.2 基本概念 175
5.2.3 基本方法 175
5.2.4 面临困难 176
5.3 自然语言处理大数据基础资源 176
5.3.1 基础语料库 176
5.3.2 语言知识库 180
5.3.3 知识图谱 182
5.4 自然语言处理大数据分析技术 184
5.4.1 实体关系抽取 185
5.4.2 命名实体识别 190
5.4.3 情感分类 194
5.4.4 文本摘要 198
5.4.5 机器翻译 204
5.4.6 自动问答 206
5.5 自然语言处理大数据分析应用案例 210
5.5.1 IBM沃森大型问答系统 210
5.5.2 百度机器翻译系统 214
5.5.3 微软机器人小冰 216
5.5.4 BFS舆情分析系统 219
5.6 小结 227
5.7 习题 227
第6章  大数据与医学信息处理 229
6.1 引言 229
6.2 医学信息处理基础认知 229
6.2.1 基本概念 229
6.2.2 研究简史 230
6.2.3 基本方法 232
6.2.4 面临困难 233
6.3 医学信息处理大数据基础资源 234
6.3.1 基因数据资源 235
6.3.2 医学图像资源 236
6.3.3 电子健康记录 238
6.3.4 医学语音记录 240
6.4 医学信息处理大数据分析技术 241
6.4.1 基因序列分析 241
6.4.2 医学图像处理 245
6.4.3 电子病历分析 249
6.4.4 医学语音处理 252
6.5 医学信息处理大数据分析应用案例 254
6.5.1 精准医疗 255
6.5.2 糖尿病健康促进系统 259
6.5.3 老年健康综合评估系统 267
6.5.4 远程医疗 271
6.6 小结 273
6.7 习题 274
参考文献 275

本目录推荐