注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库数据科学:基本概念、技术及应用

数据科学:基本概念、技术及应用

数据科学:基本概念、技术及应用

定 价:¥129.00

作 者: [美]希拉格·沙阿(Chirag Shah)
出版社: 机械工业出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787111730453 出版时间: 2023-08-01 包装: 平装-胶订
开本: 16开 页数: 字数:  

内容简介

  本书以实用和可接受的方式详细介绍了数据科学领域,强调动手实践。独立于技术介绍数据科学的基本思想和相关技术,允许学生在没有强大的技术背景的情况下轻松地发展对该主题的坚定理解,并提供即使在工具和技术发生变化后仍然具有持续相关性的材料。使用流行的数据科学工具,如Python和R,这本书提供了许多实际应用的例子,实践范围从小数据到大数据。为教师和学生提供的一套在线材料,包括数据集、PPT、解决方案和课程建议等。

作者简介

  罗春华,2013年12月博士毕业于武汉大学经济与管理学院 ,2004.7-2014.5于华南师范大学任讲师,2014.5开始在杭州电子科技大学会计学院担任副教授,硕士生导师。

图书目录

目  录
前言
致谢
作者简介
第一部分 概念介绍
第1章 简介2
1.1 什么是数据科学2
1.2 数据科学在哪里4
1.2.1 金融4
1.2.2 公共政策5
1.2.3 政治6
1.2.4 医疗保健6
1.2.5 城市规划7
1.2.6 教育8
1.2.7 图书馆8
1.3 数据科学与其他领域如何关联9
1.3.1 数据科学与统计9
1.3.2 数据科学与计算机科学9
1.3.3 数据科学与工程10
1.3.4 数据科学与商业分析10
1.3.5 数据科学、社会科学与
   计算社会科学11
1.4 数据科学和信息科学之间的关系11
1.4.1 信息与数据12
1.4.2 信息科学用户12
1.4.3 iSchool中的数据科学12
1.5 计算思维13
1.6 数据科学技能15
1.7 数据科学工具20
1.8 数据科学中的伦理、偏见和
   隐私问题22
总结23
关键术语23
概念性问题24
实践问题24
注释26
第2章 数据28
2.1 引言28
2.2 数据类型28
2.2.1 结构化数据29
2.2.2 非结构化数据29
2.2.3 非结构化数据的挑战30
2.3 数据收集30
2.3.1 开放数据30
2.3.2 社交媒体数据31
2.3.3 多类型数据31
2.3.4 数据存储和呈现32
2.4 数据预处理36
2.4.1 数据清洗37
2.4.2 数据集成38
2.4.3 数据转换39
2.4.4 数据缩减39
2.4.5 数据离散化40
总结47
关键术语47
概念性问题48
实践问题48
延伸阅读及资源51
注释52
第3章 技术53
3.1 引言53
3.2 质性数据分析和量化数据分析54
3.3 描述性分析54
3.3.1 变量55
3.3.2 频率分布56
3.3.3 中心性度量61
3.3.4 离散分布62
3.4 诊断性分析65
3.5 预测性分析66
3.6 规范性分析67
3.7 探索性分析68
3.8 机理性分析68
总结70
关键术语71
概念性问题72
实践问题72
延伸阅读及资源74
注释74
第二部分 数据科学工具
第4章 UNIX78
4.1 引言78
4.2 UNIX安装79
4.3 连接UNIX服务器81
4.3.1 SSH81
4.3.2  FTP/SCPS/FTP83
4.4 基本命令84
4.4.1 文件和目录操作命令84
4.4.2 进程相关的命令85
4.4.3 其他有用命令86
4.4.4 快捷键87
4.5 在UNIX上编辑87
4.5.1  vi编辑器87
4.5.2  Emacs编辑器88
4.6 重定向和管道89
4.7 用UNIX解决小问题90
总结96
关键术语97
概念性问题97
实践问题97
延伸阅读及资源98
注释98
第5章 Python100
5.1 引言100
5.2 Python安装100
5.2.1 下载和安装Python101
5.2.2 通过控制台运行Python101
5.2.3 通过集成开发环境
    使用Python101
5.3 基本示例103
5.4 控制结构106
5.5 统计概要107
5.5.1 导入数据110
5.5.2 数据绘制110
5.5.3 相关性111
5.5.4 线性回归111
5.5.5 多元线性回归113
5.6 机器学习简介117
5.6.1 什么是机器学习117
5.6.2 分类118
5.6.3 聚类120
5.6.4 密度估计122
总结124
关键术语125
概念性问题125
实践问题125
延伸阅读及资源127
注释128
第6章 R129
6.1 引言129
6.2 R安装129
6.3 R入门131
6.3.1 基础131
6.3.2 控制结构132
6.3.3 函数134
6.3.4 导入数据134
6.4 图形和数据可视化135
6.4.1 安装ggplot2135
6.4.2 加载数据136
6.4.3 数据绘制136
6.5 统计和机器学习139
6.5.1 基本统计139
6.5.2 回归140
6.5.3 分类142
6.5.4 聚类144
总结146
关键术语147
概念性问题147
实践问题147
延伸阅读及资源148
注释148
第7章 MySQL150
7.1 引言150
7.2  MySQL入门151
7.2.1 获得MySQL151
7.2.2 登录MySQL151
7.3 创建和插入记录153
7.3.1 导入数据153
7.3.2 创建表154
7.3.3 插入记录154
7.4 检索记录154
7.4.1 阅读表详细信息155
7.4.2 从表中检索信息155
7.5  MySQL搜索156
7.5.1 字段值搜索156
7.5.2 带索引的全文检索157
7.6 使用Python访问MySQL158
7.7 使用R访问MySQL159
7.8 其他流行数据库介绍161
7.8.1  NoSQL161
7.8.2  MongoDB161
7.8.3 谷歌BigQuery161
总结162
关键术语162
概念性问题163
实践问题163
延伸阅读及资源164
注释164
第三部分 数据科学中的机器学习
第8章 机器学习和回归166
8.1 引言166
8.2 什么是机器学习167
8.3 回归171

本目录推荐